因此,有研究通过比较现在中国南北方少数民族人群的基因组,来观察他们在遗传成分上的相似性和差异性。研究发现北方的少数民族(如:达斡尔族、赫哲族、鄂伦春族、锡伯族、蒙古族)和南方的少数民族(如:阿美族、泰雅族、布农族、拉祜族、苗族、傣族、土家族),在遗传成分上具有明显差异,也就是说典型的南北方人有着明显的遗传差异。
这就衍生出了新的问题:南方人和北方人的这种遗传差异和分化是从什么时候开始的?在不同的历史时期,这种差异是否发生变化?
为回答这个问题,付巧妹研究团队历时8年,获取距今近万年以来的南北两地人群的古DNA信息。那么,什么是古DNA,它与现代DNA有什么区别?
古DNA是指古代生物遗骸中残存的DNA片段,包括古代人类、动植物和微生物等。如果从现代人的血液里提取DNA,那么提取到的DNA片段是连续并且相对完整的。可是古DNA却并非如此。经过千年、万年以至数十万年的历史变迁,生物遗骸中的DNA长时间自然降解,还受到外界环境中微生物、水等因素的不断影响,变得十分破碎。此外,其中还充斥着大量微生物DNA的污染,有时还可能有现代人DNA的污染,属于目标个体DNA的含量极低,甚至不存在。
古DNA研究者的工作,就是要找到依然含有古DNA的生物遗骸样本;通过各种复杂实验从中提取出短的DNA片段,并将它们进行比对,还原出正确的顺序;然后测序评估数据,并在得到可靠数据的基础上进行相关生物信息分析和群体遗传学研究,比如探索古代和现代生物的谱系关系、追溯相关的祖先来源、遗传成分混杂和变化的模式等等。可以想见,这个实验与研究过程非常不易。尤其是针对中国南北方人群的大规模古DNA研究,在过程中存在许多难题和挑战。
一是古DNA研究材料少。可用于古DNA研究的人类化石、骨骼遗骸等相关材料非常稀少。尤其是南方材料更少,这是由于中国南方气候温暖潮湿,这种环境下有机质更容易被微生物降解,而土壤中丰富的腐殖质,造成土壤呈现酸性,又会严重降解骨骼中的无机质,有些骨骼已经被侵蚀得只剩下一个轮廓,甚至完全消失。在这项研究中,仅南方地区,付巧妹团队就曾经采集30多个遗址的257例古代人类样本,其中绝大多数完全不含人类古DNA。仅剩的少部分样本中的人类古DNA含量极低,使得以原有的技术条件根本难以获取有效的DNA数据以便开展研究。
二是古DNA获取难度大。样本的保存情况已无法改变,要提取到有效的古DNA,只能从实验技术入手。为了从保存极低含量古人类DNA的样品中成功获取可供分析的DNA片段,付巧妹团队进行了大量实验尝试、改进和验证,最终开发出一种高效的核DNA捕获技术。
这是一种什么样的技术呢?我们可以形象地把它比喻为“钓鱼”技术。利用人类DNA的相似性,团队利用现代人DNA设计出一种针对目标DNA的特异性、互相吸引的“探针”。这种DNA“探针”如同钓饵一般,可以将目标的古代人类DNA片段从DNA混合溶液中吸附、“钓取”出来。
应用这种共同创新的古DNA技术,团队最终成功捕获中国北方山东、内蒙古及南方福建、台湾等地11个遗址25个距今9500年至4200年间的个体和1个300年前个体的DNA。
3.古北方人对现代东亚人群产生显著的基因影响
这些古DNA数据告诉我们,在近万年前,已经明确出现两种含有不同遗传成分的人群——以距今9500年至7700年间山东个体为代表的古北方人,及以距今8400年至4200年间福建和毗邻岛屿个体为代表的古南方人,这两种不同的遗传成分被称为古北方人成分和古南方人成分。
通过比较不同时期欧亚其他人群与古南北方人群的远近遗传关系及相关遗传成分的比例,研究进一步发现,古北方人群与西伯利亚东部草原人群共享祖先成分,而古南方人群与东南亚人群共享祖先成分。同时,古北方人成分与古南方人成分在南北方人群之间发生了流动和变化,使得他们的遗传差异和分化程度逐渐缩小。
在新石器时代早期,也就是距今9500年至7500年间,古南方人成分主导着南方地区,古北方人成分主导着北方地区。直到新石器时代晚期,也就是距今5000年至3000年间,仍是如此。
不过,距今8300年至7700年间山东人群的基因组中已经发现有古南方人成分;同样的,8300年前的台湾海峡亮岛1号个体也发现含有少量的古北方人成分。这表明在新石器时代早期,南北两地的人群已经开始存在融合与互动,由此产生基因上的双向影响。