优艾设计网

现有物种的参考基因组都是可靠的吗??


随着优艾设计网_Photoshop交流现在基因组测序技术的飞速发展,数据库中的全基因组数据也越来越多,这些数据都是可靠的吗?如果有错误,那么错误来源可能是什么?
不知道wuli 优艾设计网_设计百科 2021-07-06 16:01


不一定全部可靠。
随着测序技术的迅速发展和测序成本的极速降低,越来越多基因组数据的出现,不可避免的有“鱼目混珠”现象发生。
近期,就有科研人员发现,现在生物界普遍使用的一个数据库genebank中存储的基因组草图并不是完全可靠的,不少动植物基因组中存在细菌,病毒或其他微生物污染,具体有在绵羊和奶牛的基因组草图中发现了淋球菌基因的存在,推测源自微生物污染。
这项研究值得科研人员们反思,大部分情况下,genebank上的基因组都被认为是完整可信的,但最近的研究不仅发现动植物基因组中可能存在微生物基因污染,甚至有些微生物本以为是完成图的基因组图谱也可能是引入了DNA插入错误的草图而已。
这些错误的发生可能源于测序过程中的外部污染,也可能是研究者们对数据组装工具的误用,甚至可能是基于不完整的草图进行分析时产生的错误。比如微生物基因组,大部分能得到的数据都是草图,其中还有多个gap,而后续分析往往基于此结果进行,这时候如果不深入分析,很可能会将误认为这些是基因水平转移导致的。
至于测序过程中的污染问题,可能发生于多个环节,从DNA提取到最终加接头测序,都有污染的可能。特别是针对一些昆虫等小型生物,进行基因组测序时需要的DNA量常常需要对这些生物的整个个体进行DNA抽提,这样发生污染的几率就会更高。


蓝色依依cc 2021-07-06 16:03


细思极恐呀。。。。。随着基因组测序技术的飞速发展以及测序成本的快速降低,全基因组数据也在急速增加。尽管参考基因组数据是非常有价值的资源,但是由于测序过程中的外源污染或者研究者对数据组装方法的误用,使得基因组数据面临很多问题。

近日,约翰霍普金斯大学的研究者在《Peer J》上发表一项研究,发现Genbank上存储的动植物基因组草图中存在细菌及病毒污染。这些物种间交叉污染会给微生物分析的发展造成很多问题,例如,即便在动物测序数据中出现部分基因序列可以证明生命起源,但实际上这部分序列可能是来自是微生物污染。该研究的另一个惊人的发现是,在奶牛和绵羊的基因组草图中发现了淋球菌!

尽管Genbank上存储的基因组被认为是完整的,但一些细菌的基因组其实是含有多处DNA插入错误的草图。从1995年,测序获得了第一个细菌全基因组——流感嗜血杆菌基因组,到现在,Genbank数据库上存储了大约2万7千个原核生物基因组以及1千6百个真核生物基因组。但绝大部分数据是基因组草图,序列中存在多处gap(漏洞),而后续分析都是基于这些不完整的基因组草图。如果不深入分析判断,很可能认为只是基因水平转移引起这些错误,因此需要更科学的、正确的分析基因组中出现的错误。

基因组测序的第一步是提取DNA,根据物种的不同,获取DNA的方式也是各式各样。对于动物,通常从血液中提取DNA,但是像昆虫这样的微小动物,需要从整个个体中提取测序所需的DNA。从DNA提取到测序,都存在污染的可能性。计算机对测序原始数据的过滤只能去除例如大肠杆菌一类实验室常见污染,对于其它种类的污染是很难去除的。

需要强调的是,不仅要对即将发表的基因组进行仔细筛查,还包括那些已经发表的数据。

转自:http://weibo.com/biodiscove优艾设计网_平面设计r%3 ... %23_0


我可能是个假马甲 2021-07-06 16:14

优艾设计网_设计圈
正常情况下应该基本可靠的吧,这些数据库都来自实验数据,一般情况下不会出什么差错。但偏差难免会有,比如如果测序的取材不当,或者一些工作者在测序中的失误造成的比必要的偏差现在可能也难以避免,我觉得这些数据库应该建立相应的验证机制。


0

上一篇:

下一篇:

精彩评论

暂无评论...
验证码 换一张
取 消

最新问答

问答排行榜