首页 > 学术信息 > 正文

学术信息

中山大学中山眼科中心肖传乐博士学术报告通知

来源: 点击: 时间:2020年09月17日 14:51


报告题目:三代测序关键计算技术开发及应用

报告时间:2020年9月18日(星期五)上午11:0012:30

报告地点:校本部计算机楼313

报告人:肖传乐博士(中山大学中山眼科中心)

报告摘要:

三代测序技术具有读长长(约20kbp)、无PCR扩增偏好性和碱基修饰敏感性等特点,在动植物的基因组de novo组装和表观遗传检测研究中具有明显的优势。作为二代测序技术的有力补充或替代,已成为近年来研究的热点,研究成果常发表于CNS等国际顶级期刊。目前三代测序数据高测序错误率(12-15%)是三代数据分析面临的巨大挑战,高错误率引起的巨大计算资源消耗是阻碍三代测序广泛应用的重大瓶颈。首先,在三代测序基因组组装方面,我们提出了全局种子投票打分模型替代传统序列比对模型,开发了快速组装系统MECAT。MECAT在人数据集的组装速度是同类软件(Canu和FALCON)17-56倍,该研究成果于2017年发表在Nature Methods期刊,目前MECAT已组装了20余个中国特色植物基因组。其次,在Nanopore序列校正方面,针对Nanopore错误分布局部不均问题,我们提出了精度优先序列校正模型,大幅提高序列校正速度和精度,开发了Nanopore快速组装系统NECAT,该软件是同类软件(Canu)的20倍(Nature Communications,2020)。另外,在表观遗传学修饰检测方面,针对PacBio大型基因组DNA-6mA资源消耗问题,我们提出了基因组区域划分的并行检测方法。首次系统地揭示了人类DNA-6mA图谱的分布规律、基因表达调控模式、甲基化酶(N6AMT和ALKBH1)及其与癌症关系,该研究成果于2018年发表在Molecular Cell杂志上。此外,针对Nanopore表观修饰检测精度低及背景信号复杂的问题,我们建立了识别Nanopore表观修饰(5mC和6mA)的深度循环神经网络(RNN)模型,开发了相应的软件DeepMod,实现了全基因组单碱基水平高精度检测5mC和6mA,5mC和6mA的检测平均精度可分别高达99%90%,该成果于2019年发表在Nature Communications杂志上。

报告人简介:

肖传乐,生物信息学博士,广东省杰出青年基金获得者,中山大学中山眼科中心副研究员,眼科学国家重点实验室独立PI。长期致力于测序数据分析方法开发及应用研究,近年来针对三代测序基因组学和表观遗传学基础研究及应用的计算瓶颈问题建立了系列关键算法和支撑软件。主要研究方向有:(1)三代测序数据基因组计算方法开发:针对三代测序序列比对耗时问题,提出了长序列种子投票打分模型,并开发了快速组装系统MECAT大幅提高计算速度(Nature Methods,2017);针对Nanopore测序错误分布广及局部不均问题,提出了精度优先序列校正模型,大幅提高Nanopore序列校正速度和精度(Nature Communications,2020);2)三代测序表观遗传学方法开发及应用:针对三代测序PacBio的计算消耗大及背景噪声大问题,提出了PacBio甲基化并行计算模型,首次系统揭示了人类DNA-6mA甲基化图谱Molecular Cell,2018);并且建立了首个识别Nanopore电信号修饰的深度学习模型,其鉴定5mC和6mA的精度分别高达99%和90%(Nature Communications,2019);目前以第一或通讯作者在Nature MethodsMolecular Cell、Nature Communications等期刊发表高水平SCI论文二十余篇,先后开发NECAT、DeepMod、MECATMECAT2FANSe2等十余个生物信息学分析工具,Frontiers in Genetics专刊特邀编辑,Genome Biology、Nature Communications、Bioinformatics等专业期刊审稿人。

联系方式:0731-88836659 地址:湖南省长沙市岳麓区中南大学计算机楼

Copyright ? 2017-2019 中南大学计算机学院 All Rights Reserved.