DNA是一种线性的聚合高分子,非常脆弱,在生物体外,其保存取决于保存条件。若保存条件不佳,DNA很容易就会断裂成片段,而甚者就会直接分解为其他物质。
DNA的脆弱性DNA的构成元素为碳、氢、氧、氮四种,它们以共价键结合成双螺旋结构,然后线性延长,成为一种极细的丝状结构。在生物体内,DNA紧密地缠绕在一个个圆墩状的组蛋白表面,细胞需要的时候才解开缠绕进行转录。但是一旦细胞的生命终止,这种保护机制就会慢慢地消失,而细胞中的各种酶由于丧失了原有的生理平衡甚至可能对组蛋白以及DNA本身造成威胁。这些酶会降解保护细胞的细胞膜、细胞核膜以及组蛋白,然DNA曝露于外界环境的伤害之下。
生命数亿年来与自然的基本抗争就是保护这串珍贵的丝状分子,确保生命必须的遗传信息不被外界环境所破坏,这种努力在活着的生命体当中无时不刻不再进行着,但是一旦脱离了生命体,DNA基本上就和自然当中的其他物质分子一样直接接收自然中熵的侵蚀。
从一起罪案说起波士顿绞杀手是1960年代发生在美国波士顿斯的13命连环谋杀案的凶手的外号。调查人员利用在犯罪现场从毯子上取下的DNA,经过分析发现与嫌疑杀手阿尔伯特·德萨尔沃家族成员非常接近。此结果将德萨尔沃与犯罪现场联系起来。于是官员们已经允许挖掘1973年去世的嫌疑犯德萨尔沃遗体,以测试他体内的DNA并确认是否匹配。上图:很不幸,这颗侏罗纪的琥珀当中的蚊子体内已经找不到DNA。时间太久远。
提取样本的方式,无论是对几十年前的尸体,还是几十万年前的化石,方式都是类似的。其中最重要的原则就是要尽可能避免外源性的DNA污染,因为操作的环境中有各种各样的生物以及操作人员自身脱落的组织,例如头发和上皮组织等,如果污染样本就可能造成错误的分析结果。
如果检测的对象是人类,那么其他生物的DNA污染都容易在后期通过DNA上的特殊标记排除,而如果是被操作人员的DNA污染,那么有时候往往研究人员也会被结果搞得一头雾水。这种事情在实验室并不少发生。基本上的原因就是操作规程不规范。
所以通常操作者需要使用清洁的钻取采样设备,从遗体或化石的内部获取样本(因为外表有很多其他生物的DNA污染)。在《Tutankhamun: The Truth Uncovered 》(图坦卡蒙:真相揭秘)这部纪录片中,观众就可以看到研究人员是如何从图坦卡蒙极其亲戚的木乃伊当中进行组织采样的,而最终结果揭示了图坦卡蒙的身世之谜。
进行DNA的比对,必然需要找到共有的“锚点”,以这些基准点来确定染色体片段的差异,这是基本逻辑。鉴于黑猩猩与人类的基因有超过98%的相似性,那么尼安德特人的DNA序列当中应该绝大部分位点都是能够对上的,这降低了匹配的难度,然后以人类的基因图谱作为模板,将尼安德特人的基因片段往上面一对比,即可发现相同基因段的差异。有的差异可能会很多,例如有数百个核苷酸位点的不同,但有的基因片段可能就完全相同,没有差异。
但得注意,这里所说的差异是在考虑单核苷酸多态性的基础上(SNP),因为即便是在单个人类个体当中,两套染色体的同一基因的序列也不是完全相同的,因为来自父母各一条的染色体,其上等位基因实际上是有些微差异的(这些差异给个体带来了遗传优势)。所以与尼安德特人进行对比,还要基于对现代智人内部所有基因的变体的研究结论的基础上——这个工作是复杂而耗时的。也就是说,要发现尼安德特人具有大部分现代人不具备的基因型,才能确定那个基因是尼安德特人特有的基因。而且非洲以外的族裔也含有尼安德特人的血缘,所以这时候就还要在,人类不同族裔之间进行分类分析。这远非一两个研究能够覆盖。所以如今对于尼安德特人基因组的研究仍然在进行。
此外,除了核DNA外,线粒体DNA(母系)也是另一个研究的领域。研究方法也是类似的。但线粒体DNA相对内容较少,可能研究工作内容的量级要低很多。不过在现代计算机分析技术,AI技术以及大数据技术的支持下,这些分析比数年前要容易多了。
总结DNA这种高分子生化分子的脆弱性,是由它的本质决定的。DNA是生命构造起来的,它具有生命需要的那种韧性和灵活性,也就是说既不要太容易破坏,也要能够容易解开,这种难易度应该在生化的可控范围内。于是DNA成为了与生命的肉体一样的脆弱性。尘归尘,土归土,原来作为生命中心的DNA也要回归无生命的自然的怀抱。在那些遗骸当中,我们仅能够祈求其残留的信息能够尽可能多地保存,让我们得以一窥远古生命的秘密。还好,尼安德特人离我们而去的时间还不太远,我们得抓紧时间研究。