1. data_standardization.py, 对药物-细胞系数据进行0-1标准化处理,将样本进行分类(1-sensitive,0-resistant)
2. feature_selection_DataPreprocess.py, 对基因表达数据进行预处理,选择指定药物样本所包含的细胞系,得到训练数据,供特征选择使用。
使用svm-rfe进行特征选择,由于基因表达数据数据维度大(>10000),因此该算法非常耗时。
使用MRMR算法进行特征选择。
综合前两种特征选择算法,并加入模拟退火的思想进行改进。
使用svm分类器进行分类预测。
使用粒子群算法优化svm的两个参数(C,gamma)
Exp_drug_sensitive_normalize.py ----- 药物敏感性数据标准化
Exp_feature_selection_comparision.py ------ 特征选择对比
Exp_feature_selection_feature_number.py ------ 特征选择数量选择
Exp_svm-pso_comparision.py ------- TPSO-GA与PSO实验对比
Exp_svm_comparision.py ------- svm与WA-SVM实验对比
Exp_combat_image.py ------- 批次效应处理前后实验对比