-
Multi-class-classification-model下载
资源介绍
多类别分类模型
该项目的目的是使用细胞定位位点中的氨基酸序列对大肠杆菌蛋白质进行分类。 这可以用来预测蛋白质在折叠之前基于其化学组成如何与细胞结合。
资料说明
文件名: 。 该数据集改编自Kenta Nakai和Paul Horton,在其1996年题为。
这些蛋白质属于5类之一:
cp:细胞质
im:没有信号序列的内膜
pp:周质
imU:内膜,不可切割的信号序列
om:外膜
输入功能描述如下:
mcg:McGeoch的信号序列识别方法
gvh:von Heijne的信号序列识别方法
嘴唇:冯·海涅的信号肽酶II共有序列得分
chg:预测脂蛋白N端上存在电荷
aac:外膜和周质蛋白氨基酸含量的判别分析得分
alm1:ALOM跨膜区域预测程序的得分
alm2:从序列中排除假定的可裂解信号区域后,ALOM程序的得分
代码
我在Python 3中的代码可以在查看。