中文 | English
生命科学学院门户网站

医学遗传学研究中心

夏昆课题组在《Nucleic Acids Res》合作发表生物信息学新成果
日期:2020-11-18

2020年11月12日,国际权威期刊《核酸研究》(Nucleic Acids Research,IF=11.501)在线发表了中南大学生命科学学院夏昆教授团队、中科院北京生科院孙中生教授团队、北医三院毛凤彪研究员团队合作的最新研究成果——《OncoVar: an integrated database and analysis platform for oncogenic driver variants in cancers》。该研究发布了全球迄今最全面的人类癌症驱动突变数据库及分析平台OncoVar (https://oncovar.org/)。

早期的体细胞突变可导致发育障碍,而该类突变的逐步积累可导致癌症。TCGA和ICGC等大型癌症测序项目为识别人类癌症的致病变异提供了前所未有的机会。然而,癌症的体细胞突变中存在着大量的无意义突变,如何从体细胞突变中鉴定癌症驱动突变,并进一步找到与之相关的癌症驱动基因和相关通路仍然是癌症基因组学研究中的关键挑战。

为了满足以上需求,研究团队开发了OncoVar(ONCOgenic driver VARiants)数据库,该数据库收集了来自TCGA及ICGC的所有体细胞突变,并在此基础上:1)注释了所有已知的癌症驱动突变,并包括了团队最近开发的人工智能算法AI-Driver(http://aidriver.maolab.org/)预测的驱动突变;2)建立了基于癌症驱动能力的基因分层系统,该分层系统整合了AI-DriverGene及所有已知的驱动基因集,将所有癌症相关基因按其致病性强弱由不致病到致病分成5类,并注释了相关的用药信息;3)鉴定了癌症驱动相关的致病通路;4)从泛癌及单独每个癌种的层面关联并可视化了"突变","基因"和"通路"的相关特征。此外, OncoVar还具有线上的突变批量注释和癌症特异性通路富集分析等功能.

OncoVar整合分析了TCGA中33种癌症类型的10,769个外显子组和ICGC中18种癌症类型的1,942个全基因组数据,确定了可信度较高的20,162个癌症驱动突变和814个驱动基因,涉及2,360个重要的功能通路。OncoVar数据库为不同癌症致病机制的研究、癌症的辅助诊断、临床意义的解释及辅助用药指导(如老药新用、 联合用药)奠定了基础,为癌症研究人员、 药物研发人员及临床医生提供了重要的查询和分析工具.

据悉,中南大学生命科学学院博士研究生王涛为第一作者,中南大学生命科学学院夏昆教授为共同通讯作者,中南大学生命科学学院为第一单位。

论文链接:https://doi.org/10.1093/nar/gkaa1033