Skip to content

Commit

Permalink
Merge pull request #4 from berkedilekoglu/berke-development
Browse files Browse the repository at this point in the history
bug fix: epitopepredict
  • Loading branch information
berkedilekoglu authored Feb 25, 2024
2 parents 823c15d + ee7ee78 commit 07c5e58
Show file tree
Hide file tree
Showing 6 changed files with 31 additions and 5 deletions.
1 change: 0 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -23,7 +23,6 @@ numpy 1.19.5
scikit-learn 0.24.2
joblib 1.0.0
pandas 1.0.5
epitopepredict 0.5.0
tensorflow 2.4.0
keras 2.3.1
loguru 0.7.2
Expand Down
1 change: 0 additions & 1 deletion setup.py
Original file line number Diff line number Diff line change
Expand Up @@ -27,7 +27,6 @@
'scikit-learn',
'joblib',
'pandas',
'epitopepredict',
'tensorflow',
'keras',
'requests',
Expand Down
Binary file modified sumonet/utils/__pycache__/encodings.cpython-39.pyc
Binary file not shown.
Empty file.
25 changes: 25 additions & 0 deletions sumonet/utils/encoding_matrix/blosum62.csv
Original file line number Diff line number Diff line change
@@ -0,0 +1,25 @@
A,R,N,D,C,Q,E,G,H,I,L,K,M,F,P,S,T,W,Y,V,B,Z,X,*
4,-1,-2,-2,0,-1,-1,0,-2,-1,-1,-1,-1,-2,-1,1,0,-3,-2,0,-2,-1,0,-4
-1,5,0,-2,-3,1,0,-2,0,-3,-2,2,-1,-3,-2,-1,-1,-3,-2,-3,-1,0,-1,-4
-2,0,6,1,-3,0,0,0,1,-3,-3,0,-2,-3,-2,1,0,-4,-2,-3,3,0,-1,-4
-2,-2,1,6,-3,0,2,-1,-1,-3,-4,-1,-3,-3,-1,0,-1,-4,-3,-3,4,1,-1,-4
0,-3,-3,-3,9,-3,-4,-3,-3,-1,-1,-3,-1,-2,-3,-1,-1,-2,-2,-1,-3,-3,-2,-4
-1,1,0,0,-3,5,2,-2,0,-3,-2,1,0,-3,-1,0,-1,-2,-1,-2,0,3,-1,-4
-1,0,0,2,-4,2,5,-2,0,-3,-3,1,-2,-3,-1,0,-1,-3,-2,-2,1,4,-1,-4
0,-2,0,-1,-3,-2,-2,6,-2,-4,-4,-2,-3,-3,-2,0,-2,-2,-3,-3,-1,-2,-1,-4
-2,0,1,-1,-3,0,0,-2,8,-3,-3,-1,-2,-1,-2,-1,-2,-2,2,-3,0,0,-1,-4
-1,-3,-3,-3,-1,-3,-3,-4,-3,4,2,-3,1,0,-3,-2,-1,-3,-1,3,-3,-3,-1,-4
-1,-2,-3,-4,-1,-2,-3,-4,-3,2,4,-2,2,0,-3,-2,-1,-2,-1,1,-4,-3,-1,-4
-1,2,0,-1,-3,1,1,-2,-1,-3,-2,5,-1,-3,-1,0,-1,-3,-2,-2,0,1,-1,-4
-1,-1,-2,-3,-1,0,-2,-3,-2,1,2,-1,5,0,-2,-1,-1,-1,-1,1,-3,-1,-1,-4
-2,-3,-3,-3,-2,-3,-3,-3,-1,0,0,-3,0,6,-4,-2,-2,1,3,-1,-3,-3,-1,-4
-1,-2,-2,-1,-3,-1,-1,-2,-2,-3,-3,-1,-2,-4,7,-1,-1,-4,-3,-2,-2,-1,-2,-4
1,-1,1,0,-1,0,0,0,-1,-2,-2,0,-1,-2,-1,4,1,-3,-2,-2,0,0,0,-4
0,-1,0,-1,-1,-1,-1,-2,-2,-1,-1,-1,-1,-2,-1,1,5,-2,-2,0,-1,-1,0,-4
-3,-3,-4,-4,-2,-2,-3,-2,-2,-3,-2,-3,-1,1,-4,-3,-2,11,2,-3,-4,-3,-2,-4
-2,-2,-2,-3,-2,-1,-2,-3,2,-1,-1,-2,-1,3,-3,-2,-2,2,7,-1,-3,-2,-1,-4
0,-3,-3,-3,-1,-2,-2,-3,-3,3,1,-2,1,-1,-2,-2,0,-3,-1,4,-3,-2,-1,-4
-2,-1,3,4,-3,0,1,-1,0,-3,-4,0,-3,-3,-2,0,-1,-4,-3,-3,4,1,-1,-4
-1,0,0,1,-3,3,4,-2,0,-3,-3,1,-1,-3,-1,0,-1,-3,-2,-2,1,4,-1,-4
0,-1,-1,-1,-2,-1,-1,-1,-1,-1,-1,-1,-1,-1,-2,0,0,-2,-1,-1,-1,-1,-1,-4
-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,-4,1
9 changes: 6 additions & 3 deletions sumonet/utils/encodings.py
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,6 @@
import joblib
import numpy as np
import pandas as pd
import epitopepredict as ep

from sumonet.utils.data_pipe import Data
from typing import List
Expand All @@ -13,6 +12,10 @@ def get_min_max_scaler_path():

return os.path.join(script_directory, "scaler", "minmax_scaler.gz")

def get_blosum_matrix_path():

return os.path.join(script_directory, "encoding_matrix", "blosum62.csv")



def create_dict():
Expand Down Expand Up @@ -52,7 +55,7 @@ def __init__(self, encoderType: str='blosum62' ,scaler: bool=True) -> None:


self.encodings = create_dict() # Dictionary for one-hot encoding
self.blosum = ep.blosum62
self.blosum = pd.read_csv(get_blosum_matrix_path())
self.nlf = pd.read_csv('https://raw.githubusercontent.com/dmnfarrell/epitopepredict/master/epitopepredict/mhcdata/NLF.csv',index_col=0)

self.sequences = []
Expand All @@ -63,7 +66,7 @@ def get_sequence(self):

def set_encoder_type(self,encoderType):
self.encoderType = encoderType

def one_hot(self,data):

oneHot_data = np.zeros((len(data),len(data[0]),len(self.encodings)))
Expand Down

0 comments on commit 07c5e58

Please sign in to comment.