报告人:Limsoon Wong教授,新加坡国立大学
报告题目:
Single-cell RNA-seq dataset integration without loss of unique rare cell populations
日期和时间:2024年5月8日(周三),下午15:00 – 16:00
报告地点:计算机楼313
报告摘要:Typically, batch effect-correction methods for scRNA-seq data search aggressively for overlapping populations of identical cell types across the different batches as anchors relating the cell populations between batches. This has a lamentable consequence that cell populations exclusive to a single batch tend to be wrongly matched and mis-corrected into different cell types. This makes it harder in using scRNA-seq for applications such as detection of pre-malignant cells. In this short talk, I describe MapBatch, which adopts a different approach. The ensemble of autoencoder models in MapBatch, each independently trained on a different single batch to prevent batch effects from being learned and incorporated into the projections, collectively enable biological signals from rare cell populations exclusive to a batch to be easily retained while eliminating batch effects.
报告人简介:Professor Wong Limsoon(黄任祥教授) 1988 年在英国伦敦帝国大学获得工学学士学位,1994 年在美国宾夕法尼亚大学获得博士学位。黄教授目前是新加坡国立大学(National University of Singapore,NUS)计算机学院观音堂佛祖庙讲座教授,也曾是 NUS 杨潞龄医学院(Yong Loo Lin School of Medicine at NUS)病理学教授。
主要从事知识发现算法研究及其在生物与医学中的应用。在职业生涯的早期阶段,黄教授在数据库查询语言理论和有限模型理论方面进行了重要的研究工作,并在大数据集成系统方面进行了卓越的开发创新。黄教授发表了约 300 篇研究论文,包括相关领域引用最多的论文之一。
2013 年,黄教授因在数据库理论和生物信息学方面的杰出贡献而被授予 ACM Fellow,成为全世界计算机和信息技术领域中的标杆和领袖。2014 年,他还被授予ICDT 2014 年度时间考验奖以表彰其在自然嵌入查询语言方面的工作。同年,被新加坡政府授予公共行政奖章,以表彰其卓越效率、能力和勤勉。
报告人:李金艳教授,深圳理工大学
报告题目:“水挤水密”双疏水理论以及反向扩展
日期和时间:2024年5月8日(周三),下午16:00 – 17:00
报告地点:计算机楼313
报告摘要:我在这里讲述结构生物学之中的一个热点问题:怎样识别蛋白复合物中的绑定能量高位氨基酸子集。我们有两个解决方法。一是提出了“水挤水密”双疏水生物理论并利用最大二分子图数据挖掘算法找到绑定能量高位的氨基酸子集和包围它们的氨基酸O-环。由于这个粗犷式的解决方案不能给出哪些氨基酸的突变能够使得该蛋白复合物的亲和力极大加强,我们提出了一个对抗式和生成式联用的人工智能深度学习方法去预测那些需要进行突变的氨基酸位置同时推荐这些氨基酸应该改变成什么样的新氨基酸。这些理论和算法对蛋白药物以及mRNA疫苗设计优化将带来很多益处。这些成果已经在《Bioinformatics》(2007、2009、2010)和《Nature Machine Intelligence》(2024)上发表。
报告人简介:
李金艳,博士生导师、深圳理工大学计算机科学与控制工程学院杰出教授、中国科学院深圳先进技术研究院研究员、2022年国家高层次海外重点人才,入选全球前2%顶尖科学家榜单。曾全职在悉尼科技大学、南洋理工大学、资讯与通信研究院等澳大利亚和新加坡著名高校及科研单位从事教学和科研工作近30年。长期致力于数据挖掘和生物信息前沿课题相关研究和创新。提出了“显露模式”理论和挖掘算法、水挤水密“双疏水”生物假说、最大二分子图和闭模式之间的一到一映射关系。在机器学习和生物信息学领域的顶级期刊和国际会议上发表200多篇高质量学术论文,其中原创论文单篇引用达1500余次。主持澳大利亚和新加坡国家科研基金多项。曾荣获“亚洲技术革新金奖”、“数据科学创新奖”等。近期对生物序列大数据互参考“链式”压缩、基于对抗学习的蛋白亲和力突变预测以及高通量测序错误“字符串梯式”纠错提出了高性能算法。对病毒泛宏基因组序列的高效精准组装、多成分信使核糖核酸疫苗和多成分灭活疫苗的设计和优化尤为专注。荣膺国防科技大学应用数学学士学位、河北工业大学计算机工程硕士学位、墨尔本大学计算机科学与软件工程博士学位等。