中新网北京10月19日电 (记者 孙自法)近年来,何精随着基因测序技术和算法不断发展,准检组装质量中国大量物种基因组被陆续测序和组装,测评出款为相关研究和应用提供重要遗传信息。估基因此,因组研如何精准检测评估基因组组装质量高低、科研避免组装错误等非常关键,团队也备受关注。新工
记者19日从中国科学院植物研究所获悉,何精该所焦远年研究团队最新研究开发出一种不依赖参考基因组的准检组装质量中国组装质量评估新工具CRAQ(Clipping information for Revealing Assembly Quality),可以在单碱基水平检测和评估基因组序列的测评出款精准度,并提供相关纠错方案。估基这一基因组研究领域的因组研重要成果论文,近日在国际学术期刊《自然-通讯》上线发表。科研
论文通讯作者焦远年研究员指出,团队高质量的参考基因组序列对于基因注释和相关功能研究至关重要,也是大规模比较基因组学和表观遗传调控研究的重要前提。不过,目前多数基因组序列中仍然存在一些组装错误,给相关研究带来一定程度影响。而精准区分和鉴定高质量与低质量的基因组序列,不仅可以为基因组组装质量提供评估依据和进一步改进提供靶点,也可以为后期比较基因组和功能研究位点提供基因组序列质量认证。当前,虽然已有一些基因组组装质量评估的方法和指标,但其大多仅提供一个总体的评估值,没有针对特定区域或碱基的评估信息。
针对这一问题,该研究团队研发的CRAQ通过将原始测序序列比对到组装的基因组上,基于序列比对产生的有效“剪切对齐”信息,可精准地检测基因组中存在的组装错误。结合长读长测序片段和短读长测序片段与基因组比对的特征,CRAQ可以识别基因组内小规模的区域组装错误和大范围的结构组装错误,不同类别的错误数量经过统计和标准化处理后被转化为两个组装质量评估指标,以反映不同层面的基因组组装质量。
同时,CRAQ能够将组装错误与基因组内的高杂合区域或单倍型差异区分开来,并在单碱基分辨率下指示低质量组装区域和潜在错误断点的位置。在此基础上,CRAQ能帮助研究人员识别基因组中存在的嵌合片段,并将这些片段准确地拆分,以利于结合光学图谱或构象捕获技术进一步构建结构更加准确的参考基因组。
据研究团队介绍,为对CRAQ进行性能测试和评估,他们以人类参考基因组组装为基础构建一个模拟数据集并利用CRAQ和目前广泛使用的基因组质量评估工具进行测试和比较,结果表明,当缺乏完美参考基因组时,CRAQ表现最佳,并在检测杂合区域方面也表现出超过95%的召回率和精确度。研究团队还通过对一个真实的果蝇杂交的基因组数据集进行分析,发现CRAQ可以准确地将组装错误和杂合区域区分开来,而其他工具则无法检测出杂合区域。(完)
相关文章:
青岛“宝马”河北丰宁坝上全国马术文化节包揽大奖云南体育运动职业学院新增马术、安保专业汕头市马术协会会长丁铧菁:打造马术产业链的新潮商2015中国马术巡回赛大连站赛前活动精彩绽放2009国际马联盛装舞步挑战赛在青岛德瑞马术俱乐部开赛第二届大连雅航盛汇6月18日启幕 马术游艇将点燃夏日激情青岛农业大学:“马科”学专业不是“贵族专业”马匹诊疗受重视 高频X射线摄影机将现身 “CHF马展”全国速度赛马公开赛将在新疆那拉提开赛河北净化农村环境,238个行政村垃圾治理市场化甘肃省改建新建农村户厕156723座,人们生活品质进一步提高6匹新西兰纯血速度马首次亮相云南春城马术俱乐部IT行业发展迅猛 传智播客杭州校区PHP学科迎来就业高峰Central Pattana 尚泰推出"2025世界盛大庆典"四川马术有了自己的正式比赛 促进成都马术发展