西亚试剂优势供应上万种化学试剂产品,欢迎各位新老客户咨询、选购!

登录

¥0.00

联系方式:400-990-3999 / 邮箱:sales@xiyashiji.com

西亚试剂 —— 品质可靠,值得信赖

阿拉伯的人基因组多样性

在一份新发布的题为《阿拉伯泛基因组参考草案》的预印本中,来自阿联酋和其他几个国家的研究人员利用测序技术组合产生的长读数据构建了细胞核和线粒体泛基因组,PacBio HiFi长读“为碱基提供了高度精确的长读”。

泛基因组构建的新领域

阿拉伯人构成了文化多样化的社区,总人口约占全球人口的5%。不幸的是,他们在全球测序项目中代表性不足,HPRC全基因组计划和1000基因组计划都没有对任何阿拉伯人口进行采样。该出版物的作者说,缺乏阿拉伯人口的参考基因组限制了对遗传多样性和许多疾病的遗传基础的研究。

为了构建泛基因组,使用Hifiasm重新组装整个队列中所有样本的长序列读数(PacBio HiFi的平均中位数Q值为32.85,ONT的平均中位数Q值为17.39)。“这产生了高质量的连续(平均N50=106.81 Mb)从头组装,使用超过99%的序列构建单倍型分阶段二倍体基因组组装,其中88%的基因组长度(平均3.01 gigabase)比流行的人类参考GRCh38更大。”与其他泛基因组项目类似,使用Minigraph Cactus (v2.6.7)构建了一个泛基因组图,将86个长读程序集集成到一个图结构中。对于小变异分析,“结合Deepvariant (GRCh38)对HiFi数据进行联合调用分析,平均鉴定出4,421,702个单核苷酸变异(SNVs)和847,117个索引”。线粒体阿拉伯泛基因组(mtAPR)也从43个个体的高质量HiFi读数中构建。

然后,科学家们将他们的数据与现有的参考集进行了比较,发现平均有30.84 Mb和76.83 Mb的组装contigs分别与CHM13和GRCh38不一致,证实了这些参考文献中阿拉伯基因组多样性的代表性不足。

阿拉伯泛基因组令人兴奋的新发现

当将阿拉伯泛基因组图与HPRC和CPC泛基因组图进行比较时,作者发现每个个体基因组平均包含5,044,179个总变异和743,379个独特的小变异,其中1068万个小变异是新的阿拉伯泛基因组所特有的。每个样本也平均有8302个独特的结构变异(SVs),产生108709个阿拉伯泛基因组特有的SVs。

作者还研究了基因复制和数据的许多其他质量方面,并得出结论:“我们的研究为未来阿拉伯人群的基因研究和基因组医学倡议提供了宝贵的资源”,并且“将使探索与阿拉伯人群中独特或普遍的变异和序列相关的疾病成为可能。”

该出版物是HiFi WGS数据在群体遗传学和精确健康研究中公认的价值的另一个很好的例子,并指出了长读测序在构建群体特异性参考基因组时的额外好处。

来源:PacBio

溴化钾氢氧化铁碘化铵四苯硼钠甲酸铵