基于序列信息的蛋白质结构和功能类型预测

地区:上海市 宝山区

关键词:景德镇陶瓷学院

成果类型:其它

成果领域:生物与新医药

成果编号:A2021061000006035

成果描述:

该项目属于生物信息学领域。现有生物实验方法检测蛋白质功能和结构费事费力,而基于蛋白质结构信息的预测器的应用由于许多蛋白质结构不能精确测定受到限制,要解决这样的问题就必须发展新的基于蛋白质序列的分析理论、方法、技术和工具。主要研究内容包括:1)研究了多标签预测算法,并将设计的算法与模式识别、机器学习领域的新观点新方法相结合,设计了多种蛋白质结构及功能预测算法并建立了在线预测器;2)建立了蛋白质序列离散灰色模型,将灰色理论引入到蛋白质序列分析中,从序列表示和序列相似度等方面提出新的算法;3)建立了新的蛋白质可视化模型,使得从杂乱无章的海量数据中找出隐藏的规律成为可能。科学价值:1)蛋白质离散灰色模型的建立开启了灰色理论在生物信息学中的应用,所建立模型的参数具有描述蛋白质序列特性强的特点,能大大降低蛋白质伪氨基酸成分模型的维度;2)所设计的多标签算法具有计算时间少,将蛋白质预测由单标签扩展到多标签预测,使得预测器的实用性更强,基于多标签算法的在线预测器已被广泛用于药物设计、蛋白质功能和结构预测和系统生物学等研究中;3)所设计的蛋白质转换成图像方法,改变了现有一般可视化方法使用时需要投影,架起了现有图像模式识别方法与蛋白质序列分析之间的桥梁,使得图像模式识别最新的方法都可以用于蛋白质序列的分析中。根据SCI网络版数据库的检索结果,该项目发表的国际期刊论文被引用已逾2538次,其中他引已逾1960次,单篇论文SCI引用次数超过100次的有8篇,50-100次的论文有15篇,单篇论文最高SCI引用171次。根据Scholar Google的检索结果,被引用已达3070次,13篇论文被Web of Science评为高引用论文,3篇被中国科学技术研究所评为中国百篇最具影响国际学术论文。获省高校科技进步一等奖两项。项目负责人获得由中国科学院承办的第二届“SCOPUS寻找青年科学之星”新人奖(信息科学领域)。获得发明专利5项。培养青年教师5名,他们都取得了博士学位,都已成为团队科研的骨干。该团队在基于序列信息预测蛋白质结构和功能类型上处于国内先进水平。
需求匹配