报告人:华中科技大学黄胜友教授
题目:蛋白质复合物结构预测:从分子对接到AI整合建模
时间:11月26日(周二)上午10点
地点:计算机楼313会议室
报告摘要:
蛋白质是生命活动的执行者。“结构决定功能”,因此,确定蛋白质的相互作用及其复合物结构对于理解生命活动及药物开发至关重要。由于其清晰的物理原理和极低的计算成本,分子对接一直是蛋白质复合物结构预测中最重要的一种快速计算方法,然而,由于分子柔性和能量打分函数等方面的限制,其精度已达到瓶颈。近年来,人工智能模型如AlphaFold2在蛋白质单体结构预测中取得了巨大成功,但由于样本不足,其对蛋白质复合物结构预测的精度仍有待提高。因此,迫切需要新方法来突破现有蛋白质复合物结构预测的瓶颈。近年来,冷冻电镜已发展成为测定生物大分子结构最重要的实验方法,其实验数据中蕴含的信息正好契合了蛋白质复合物结构预测的需求。在本报告中,我将首先介绍基于分子对接的蛋白质复合物结构预测方法,然后将重点汇报我们基于人工智能从冷冻电镜实验密度图中挖掘复合物结构信息,及整合挖掘的实验信息来进行蛋白质复合物结构建模的研究。
报告人简介:
黄胜友,华中科技大学教授、博导,国家级领军人才,全国百篇优秀博士学位论文获得者。长期从事蛋白质相互作用计算及其复合物结构预测研究,共发表论文120余篇,近5年以通讯作者在Nature Biotechnology、Nature Machine Intelligence、Nature Communications等杂志发表论文40余篇,发展的HDOCK等蛋白质分子对接算法在国际蛋白质复合物结构预测CAPRI竞赛中多次排名第一。主持国家自然科学基金重点项目、国际合作项目等。现任中国生物学信息学学会(筹)“生物分子结构预测与模拟专业委员会”秘书长。
课题组网站:http://huanglab.phys.hust.edu.cn/。
报告人:复旦大学朱山风研究员
题目:GORetriever: reranking protein-description-based GO candidates by literature-driven deep information retrieval for protein function annotation
时间:11月26日(周二)上午10点
地点:计算机楼313会议室
报告摘要:
The vast majority of proteins still lack experimentally validated functional annotations, which highlights the importance of developing high-performance automated protein function prediction/annotation (AFP) methods. While existing approaches focus on protein sequences, networks, and structural data, textual information related to proteins has been overlooked. However, roughly 82% of SwissProt proteins already possess literature information that experts have annotated. To efficiently and effectively use literature information, we present GORetriever, a two-stage deep information retrieval-based method for AFP. Given a target protein, in the first stage, candidate Gene Ontology (GO) terms are retrieved by using annotated proteins with similar descriptions. In the second stage, the GO terms are reranked based on semantic matching between the GO definitions and textual information (literature and protein description) of the target protein. Extensive experiments over benchmark datasets demonstrate the remarkable effectiveness of GORetriever in enhancing the AFP performance. Note that GORetriever is the key component of GOCurator, which has achieved the first place in the latest critical assessment of protein function annotation (CAFA5: over 1,600 teams participated), held in 2023–24.
报告人简介:
朱山风,复旦大学类脑智能科学与技术研究院研究员,博士生导师。UniProt 国际科学顾问委员会委员, PLoS Computational Biology编委,牛津大学出版社Bioinformatics Advances 副主编。先后主持五项国家自然科学基金项目,以及多个国内外企业研发项目。主要研究方向为人工智能与生物医学大数据挖掘,特别是生物医学文本挖掘、蛋白功能预测、宏基因组、智慧医疗等。相关论文以第一或通讯作者在生物信息、人工智能、数据挖掘等相关旗舰国际会议和期刊发表,如 NeurIPS, KDD, ISMB, IJCAI, ACL, Nature Communications、Genome Biology, Bioinformatics, Nucleic Acids Research等。2014年-2022 年参加 BioASQ 大规模生物医学文本自动标注国际竞赛中八次取得第一名。2017、2020和2023 年分别参加 CAFA3、CAFA4和CAFA5 大规模蛋白功能自动标注国际竞赛获得第一名。2019年-2021年参加CAMI II大规模宏基因组数据解析国际竞赛在重叠群分箱算法中整体排名第一。