《分子人类学视野下的达斡尔族族源研究》:王迟早(复旦大学生命科学学院现代人类学教育部重点实验室)、石美森(中国政法大学刑事司法学院侦查学研究所)、李辉。文章原载于北方民族大学学报(哲学社会科学版)2018 年第 5 期。
一、引 言
达斡尔族原居黑龙江北岸,清初由于沙俄的入侵,不断内迁,现今主要分布在内蒙古呼伦贝尔市,黑龙江省齐齐哈尔市、黑河市,新疆塔城市等地。达斡尔族的族源问题,尤其是达斡尔族与古代契丹之间的亲缘关系,一直是学术界和社会各界的焦点。学术界从历史、语言、遗传特征等多角度对其族源进行了很多研究,目前主要以“契丹后裔说”“蒙古分支说” “蒙古同源说”三种观点为主。
第一种观点“契丹后裔说”是国内有关达斡尔族族源讨论的主流观点。这种说法源自清代官方文件《辽金元三史语解》及部分调查报告,经过民国时期郭克兴(达斡尔族)、陈洪漠及一批地方志编写者的积累,中华人民共和国成立后,出现了更为详尽的论证。20 世纪 50 年代,陈述先生从达斡尔族本族历史传说、语言材料、地理故迹、生产技术、组织制度等 12 个角度论证了达斡尔族于契丹的合理性。进入 20 世纪 80 年代,沈汇、刘风翁、孟志东(达斡尔族)等人从解读契丹小字音义的角度出发,进一步发展了契丹后裔说。世纪之交,中国协和医科大学的吴东 颖等人与吉林大学的许月等人分别采用线粒体遗传标记,从母系遗传角度证实了达斡尔族与古契丹存在一定程度的亲缘关系,进一步引发了学术界和社会各界经久不息的讨论。
第二种观点 “蒙古分支说”始自 20 世纪 30 年代,代表作为阿勒坦噶塔先生(达斡尔族) 所著《达斡尔蒙古考》,然而此书中的论证多为后世学者所否定,且成书之时,正值中华民国推行“五族共和” 的民族政策,因此著书过程中存在一定程度的主观构建历史的动因。达斡尔族长期和蒙古族共同生活,风俗习惯较为接近,特别地,达斡尔族的语言与蒙古语同属于阿尔泰语系蒙古语族,故 “蒙古分支说”也很流行。
第三种观点“蒙古同源说”是达斡尔族族源讨论中的一种微弱的声音。阿勇(达斡尔族)、巴达荣嘎(达斡尔族)都曾撰文论证达斡尔族与蒙古族的同源关系,但他们的观点被部分学者视为异说,认同者较少。
尽管目前民族史学界倾向于认为达斡尔族是契丹后裔,但相关的遗传学证据却十分薄弱。回顾吴东颖与许月等人的研究,我们发现他们均采用线粒体遗传证据、从母系遗传角度来论证达斡尔族与古契丹之间可能存在一定程度的亲缘关系。吴东颖等人的文章选取了云南本人、达斡尔族、蒙古族、鄂温克族等四个群体与契丹遗骨的线粒体序列比较,发现在这四个群体中,达斡尔族样本与契丹遗骨遗传关系最为接近。许月等人的研究发现,在他们选取的外蒙古人群、鄂伦春族、鄂温克族、达斡尔族、内蒙古人群和北方汉族六个群体中,达斡尔族样本与契丹遗骨遗传关系相对较近,但与契丹遗骨遗传关系最为接近的是外蒙古人群。需要特别指出的是,吴东颖等人曾提出的“契丹与达斡尔族有最近的亲缘关系”这一结论只是相对于其所选四个对比人群而言,而许月等人的研究所选取的数据集与之不同,因此二者的结论有所差别。
行文至此,不得不指出线粒体遗传标记的不足。线粒体遗传标记,男女都有,但是只能通过母亲传给自己的孩子,因此线粒体遗传标记只能说明母系遗传历史。而达斡尔族与当今世界上大多数群体一样属于父系社会,孩子继承的是父亲的姓氏,男孩成年后继续延续家业,女孩则外嫁。因此,随母系遗传的线粒体遗传标记在研究达斡尔族族源上存在先天的不足。另外,线粒体基因长度约为 1.6 万个碱基,早期的研究者更没有条件开展精细的单倍群和全序列的遗传分析,只是选取了若干高变区上的突变热点进行研究,用于比较的人群数量也十分有限。因此,相关研究的结论可能存在偏差,值得进一步深入探讨。
总之,目前已有的遗传学证据能够说明现代达斡尔族与古代契丹人、现代蒙古语族人群和通古斯语族人群共享一定的母系遗传成分。而这种共享成分,是源自现代达斡尔族对古代契丹人的直接继承关系达斡尔族姓氏,还是源自更古老时期的共同始祖人群的母系遗传成分,还有待进一步研究。我们认为,根据已有的母系线粒体遗传证据,还不足以完全证明达斡尔族就是契丹后裔。
民族风——达斡尔族服饰展
国外也有一些民族史研究者倾向于支持契丹后裔说,但分子人类学家们通常将达斡尔族划归到阿尔泰语系蒙古语族人群下开展研究。涉及东亚群体的多项研究多少涉及了达斡尔族,却未见以达斡尔族族源为核心学术问题的科技论文发表,且研究涉及的达斡尔族样本数量都没有超过 60 个,样本容量较小,采样地点亦多有局限。在一项基于 Y 染色体高通量测序数据的研究中,复旦大学的研究者意外地在达斡尔族中发现了与清代皇族爱新觉罗家族最近的父系遗传类型。结合历史学研究成果,研究者认为达斡尔族的早期历史与清朝皇族爱新觉罗家族的远古起源有很深的渊源。基于已发表文章数据推测,研究者认为爱新觉罗家族的父系 Y 染色体类型 -F8951 可能源自黑龙江中游一个与达斡尔族的始祖有亲缘关系的古代人群。至此,达斡尔族的起源又和满洲族的爱新觉罗家族联系了起来。
总之,达斡尔族的族源研究是民族史乃至民族遗传学领域的长期热点课题,但前期的研究普遍存在研究方法陈旧、样本数量较少等问题。
分子人类学是一门以 Y 染色体检测技术为核心的分子人类学分支学科,它通过 Y 染色体上记录的遗传信息追溯家族和群体的源流问题。Y 染色体的传承遵循严格的父子传递法则,换言之,任何一名男性只能从自己生物学上的父亲继承 Y 染色体。Y 染色体上存在丰富的遗传标记,包含近 6000 万个碱基对。主流的遗传标记是 Y 染色体单核苷酸多态性(Y-SNP)和 Y 染色体短串联重复序列(Y-STR),将 Y-SNP 与 Y-STR信息结合,亦为分子人类学研究中的常规方法。分子人类学的研究方法已多次运用在历史名人所属的基因类型鉴定上,如美国总统杰斐逊、法国国王路易十六、俄国末代沙皇罗曼诺夫、英国国王理查三世、曹操家族、爱新觉罗家族 等。蒙古语族人群特征基因 C3-星簇,汉语族人群三大超级祖父基因 Oα、Oβ、Oγ等的发现, 也是本学科的重要研究成果。
本文将从分子人类学的视角,系统地梳理斡尔族的整体族源与部分主要姓氏的家族遗传历史, 开展一次拓宽达斡尔族族源研究视野的探索。
二、样本采集及方法
本研究在知情同意的原则下,征集了无三代以内父系亲缘关系的 207 名达斡尔族男性志愿者的血液或唾液样本,并收集对应的姓氏和部落起源信息。样本范围覆盖了全国达斡尔族主要聚居地,包括内蒙古呼伦贝尔市鄂温克族自治旗、莫力达瓦达斡尔族自治旗、海拉尔区,黑龙江省齐齐哈尔市梅里斯达斡尔族区、富裕县,新疆塔城市等地。考虑到近年来达斡尔族人与其他民族通婚现象逐渐增多,我们尽量选取 30 周岁以上的成年男子参加采样,占样本总数的 70%以上。
我们测试了每个样本的 Y-STR 数据,具体方法见本实验以往公开发表的文章,并根据以往公开发表文献中大量 Y-STR 与 Y-SNP 的关联关系,推测了样本所属的 Y-SNP 类型。
三、结 果
(一) 达斡尔族整体族源情况
如图 1 所示,达斡尔族样本共有 29 种 Y-SNP 单倍群类型,显示了较高的遗传多样性。这些基因类型按其高频出现的群体和地域可以划归到如下几个大类。
首先,以往在蒙古语族人群发现的四个频率较高的父系类型(-F3796、-M407、-F1756 和 -M48)在达斡尔族中均有发现,共占达斡尔族样本总数的 29.47%。这大类遗传类型居于达斡尔族样本总数的首位,反映了达斡尔族与其他蒙古语族人群有着极为亲近的亲缘关系。具体来说,单倍群-F3796(原称 C3*-星簇)是现今蒙古语族人群最重要的父系遗传类型,在所有蒙古语族人群均较为高频,在本研究中共检出了30 例(14.49%)。单倍群-M407 是布里亚特人和卡尔梅克人的一种主要父系类型,在本研究中仅检出2例(0.97%)。单倍群-F1756(原称 C3* -),广泛分布于蒙古语诸族之中,但比例都很低,是蒙古语诸族的一种原始成分,在本研究中检出 5 例(2.41%)。单倍群-M48(原 称 C3c-M48)是通古斯语族人群的最主要核心父系类型,这个支系的一部分在某一个历史时期融入以西蒙古—卫拉特人群为中心的蒙古语族人群中,在本研究中检出 22 例(10.63%)。
此前的分子人类学调查中,单倍群 -F8951 主要出现在爱新觉罗家族中,在本次研究中检出 12 例(5.80%)。其基因谱系位置十分特殊,首先,单倍群 -F8951 为蒙古语族人群最重要的父系类型 -F3796 的兄弟支系(如图 1 所示),二者具有最近的亲缘关系。这两大父系类型大约在3500年前发生分化(本实验室未发表数据),这段遗传历史代表了全体蒙古语族人群最古老阶段的起源和形成历史。其次,在单倍群 -F8951内部发生了明显的分化,一支主要出现在爱新觉罗家族,另一支则主要出现在达斡尔族中,这种明显的分化代表了达斡尔人的祖先与爱新觉罗家族的祖先的分化历史。
汉族中高频分布的单倍群 -F444、-M117、O2a1c -、1a1a-M120、O1b* -M268在本次研究中共检出 37 例(17.87%),这可能是晚近时期基因交流的结果。其中单倍群 -F444、-M117、O2a1c- 分别约占中国汉族男性人口的 16%、11%、 14%,在本次研究中分别检出 7 例(3. 38%)、11 例(5. 31%)、16 例(7. 73%)。单倍群 1a1a-M120 的分布集中在中国北方地区,在本次研究中检测出 1 例(0.48%)。单倍群O1b*-M268在 长江中下游地区的汉族人群中占有较高的比例(本实验室未发表数据),在本次研究中检出 2 例 (0.97%)。单倍群 N1c-M178 在本次研究中检出 20 例(9.66%),该支系在亚欧大陆北部的分布极为辽阔,下游支系极为庞杂。东北亚群体中较为常见的单倍群 O1b2-M176、O1b2-F1942、N1a2a-M128 在本次研究中共检 出 10 例(4.83%)。
我们还发现了四个主要分布在中国南方及东南亚地区的单倍群 -M95、C2a1b-F845、-M7、O1a-M119,共检出30 例(14.49%)。达斡尔族虽经历过数次迁徙,但从未踏出亚洲北部地区,这部分南方特征单倍群融入达斡尔族的历史值得进一步研究。
其他东亚常见的单倍群O2b-F742、O2-M122+,M134-,KL1-、O2a1-KL1+,-、C2c1-、N1d-F2930、N1*- 在本次研究中亦有发现,共检测到 33 例(15.94%)。
主要分布于亚欧大陆西部的单倍群J2-M172、G2a-P15、R1a1-M459、R1b-M343 在本次研究中亦有少量发现,共检出 6 例(2.90%)。这大类单倍群在达斡尔族中频率很低,不占主流成分。
综上所述,达斡尔族父系遗传结构中不同类型的起源深刻反映了达斡尔族本身的起源和发展历史。首先,以单倍群 -F3796 等为代表的蒙古语族人群特征父系遗传类型的大量存在 显示达斡尔族与其他蒙古语族人群有极为亲近的亲缘关系。其次,以单倍群 -F444 等为代表的一类父系类型表明达斡尔族人中存在很多晚近时期从其他族群融入的成分。最后,大比例的单倍群 -F8951 的发现和测定,将达斡尔族的族源推向了比古代契丹(公元 10 ~ 12 世 纪)、古代蒙古帝国(公元 13 世纪)活跃时期更为古老的历史深度,进一步说,达斡尔族是全体蒙古语族人群中最古老的分支。
第四届“华冠达斡尔”民族服饰设计大赛
(二) 达斡尔族部分主要姓氏的基因族源
基于志愿者的姓氏,部落起源和 Y-STR、Y-SNP 信息,我们发现 8 个达斡尔族的主要父系基因类型均与特定姓氏有明显的关联。
敖姓、单姓、多姓多为敖拉哈拉的后人,因敖拉哈拉 17 世纪中叶以前分布在黑龙江北岸历史名城雅克萨以北、以东山区而名为“敖拉哈拉”,达斡尔语称呼山为“敖拉”。根据民族学的调查,敖拉哈拉不仅是达斡尔族中最古老的哈拉之一,也是达斡尔族中人口繁衍最多的哈拉。敖拉哈拉的样本构成了单倍群 C2a1b-F845、-F3796 的主要之一,同时也是单倍群 -M48 和 单倍群 -F8951 的所有样本之中除爱新觉罗家族之外的最核心组成部分。正如前文所述,单倍群 -F3796、-M48 在达斡尔族中的高频存在显示达斡尔族与其他蒙古语族人群有着极为亲近的亲缘关系,而单倍群 -F8951 的存在更将达斡尔族的起源历史追溯到全体蒙古语族人群的始祖人群开始分化的最古老阶段。对敖拉哈拉的起源进行更深入的研究,不仅可以揭示达斡尔族本身的早期起源历史,更能揭示爱新觉罗家族乃至全体蒙古语族人群早期起源的历史进程。遗憾的是,目前关于敖拉哈拉家族早期历史的研究还十分欠缺。
图 1: 本研究相关的父系 Y 染色体谱系树以及各单倍群在达斡尔族的频率分布
鄂姓多为鄂嫩哈拉后人(鄂嫩哈拉得名于黑龙江上游的鄂嫩河),鄂姓样本集中出现在单倍群 C2a1b-F845 和 -F3796 中。
安姓多为阿尔丹哈拉的后人(阿尔丹哈拉得名于今俄罗斯境内的勒拿河上游支流阿尔丹河),安姓样本亦为单倍群 -F3796 主要之一。
陶姓和乔姓多为托莫哈拉的后人(陶姓取托莫谐音,又因托莫本义“巧手、灵巧”,部分托莫哈拉后人取汉字谐音“乔”得姓)达斡尔族姓氏,托莫哈拉的样本亦集中出现在单倍群 -F3796 中。
孟姓多为莫日登哈拉后人(莫日登哈拉得名自黑龙江中游北岸的莫日登河),孟姓样本集中出现在单倍群 N1a1a-M178 中。
苏姓多为苏都尔哈拉后人(苏都尔哈拉得名于黑龙江左岸支流苏都尔河(12) ),苏姓样本集中出现在单倍群 N1a2a-M128 中。
郭姓多为郭布勒哈拉后人(“末代皇后” 婉容即为郭布勒哈拉之后,郭布勒哈拉源于地名“郭布勒阿彦”),郭姓样本集中出现在单倍群 -M95 中,但正如前文所述,单倍群 -M95 主要分布在中国长江流域以南、中南半岛、 印度东北部和东南亚岛屿地区。因此,郭布勒哈拉的族源历史着实引人深思。
郭布罗·婉容 ( 1906—1946 年)
何姓多为何斯尔哈拉之后(何斯尔哈拉得名于今黑龙江北岸支流何斯尔河),何斯尔哈拉样本集中出现在单倍群O2a1c-中。
另有金姓(精奇里哈拉)、吴姓(乌力斯哈拉)、沃姓(沃热哈拉)等亦为达斡尔族大姓,但这些姓氏的样本较少且散见于各单倍群中,未见集中出现在特定单倍群的情况。
综上所述,达斡尔族中的主要父系基因类型与姓氏呈现较为明显的关联现象。在达斡尔族的传说中,同一哈拉或穆昆的族人往往拥有一个共同的父系祖先。我们的研究结果也认为这种氏族起源的传说存在一定的可信性。莫日登哈拉的第一代始祖萨吉哈拉、鄂嫩哈拉的第一代始祖额穆盖等人可能并非传说中的人物,而是确有其人,这些传说中始祖的父系基因类型极有可能就是现今各自哈拉主流基因类型之一。反观汉族的大姓内部却很少有同源性,相关 Y 染色体研究只能在族源明确的小宗族内部开展。这进一步说明,达斡尔姓氏(对应哈拉或穆昆)在传承过程中经历的时间较短,受到非父替换的干扰较少(如改姓、收养外姓或过继等)。
尤为值得注意的是,单倍群 -F3796 和单倍群 -F8951 所揭示的达斡尔族内部的“哈拉”历史。
首先,单倍群 -F3796 内部集中出现了阿尔丹、敖拉哈拉、鄂嫩哈拉和托莫哈拉的后人,也有部分乌力斯哈拉、郭布勒哈拉和沃热哈拉等其他哈拉的后人,该单倍群所包括的氏族最为多样。而单倍群 -F3796 本身是包括达斡尔族在内的所有蒙古语族人群最重要的父系基因类型,因此阿尔丹哈拉、敖拉哈拉、鄂嫩哈拉、托莫哈拉这四个哈拉本身不仅极为亲近,也与其他蒙古语族人群具有共同的起源关系。
其次,单倍群-F8951除了在爱新觉罗家族中发现外,还集中出现在敖拉哈拉后人中,亦有鄂嫩哈拉和精奇里哈拉后人各 1 例。在前文,我们已经多次强调单倍群 -F8951 在追溯全体蒙古语族人群起源最古老阶段的意义。此单倍群在敖拉哈拉中的大量发现,进一步说明在达斡尔族的起源和演化历史中,敖拉哈拉占据了最重要、最核心的地位。对单倍群 -F8951 内部结构和分化历史进行进一步解析,将进一步阐明爱新觉罗家族、敖拉哈拉以及达斡尔族的早期起源和分化历史。
四、结语与讨论
本研究采用最先进的分子人类学研究方法,分析了较大的样本数量,研究了达斡尔族整体的父系族源情况,更深入到姓氏层面追溯了部分达斡尔族主要哈拉的家族遗传历史。
正如前文所述,关于达斡尔族的族源问题,主要涉及契丹和蒙古两大族群。在分子人类学领域,蒙古语族群体的族源问题已经研究得较为透彻。此前的研究在蒙古语族人群中发现了四个频 率较高、分布较为广泛的父系类型(-F3796、-M407、-F1756、- M48),本研究不仅在达斡尔族中发现了属于这四类父系基因类型的大量样本,亦发现了属于全体蒙古语族人群最重要的父系基因类型 -F3796 的兄弟支系-F8951 的大量样本。基于遗传学证据,我们认为现代达斡尔族的形成是以单倍群 -F8951 和 -F3796 等为凝聚核心,并在不同历史时期融合了其他东亚地区的父系遗传类型。我们倾向于支持“蒙古同源说”,即达斡尔族不仅与其他蒙古语族人群具有共同起源关系,而且是全体蒙古语族始祖人群的最古老分支的直系后裔。
另外,与蒙古族不同的是,契丹作为一个民族实体已经消亡。达斡尔族是否与古代契丹人有直接的继承关系,还需要与契丹古人样本的父系遗传类型进行直接的比对。随着 Y 染色体古 DNA 检测的技术与发展,相信达斡尔族与契丹的遗传关系能得到更为科学的解释。
在达斡尔族内部的家族史方面,我们发现了主要父系基因类型与姓氏相关联的现象,初步阐明了部分姓氏的遗传起源历史以及这些姓氏人群之间的亲缘关系,并且我们的研究从遗传上支持了敖拉哈拉处于达斡尔族最为古老和核心的奠基者哈拉的地位。需要特别指出的是,本研究基于遗传学证据,指出达斡尔族与其他蒙古语族人群具有同源关系,并不意味着达斡尔族与古代契丹人就毫无遗传继承关系。从分子人类学角度分析,达斡尔族起源于契丹或蒙古这两种观点并非完全对立,非此即彼。由于契丹早于蒙古兴盛于草原,因此蒙古之于契丹,极有可能也存在一定程度的遗传上的继承关系,进一步说,达斡尔族也可能继承了一部分契丹的遗传成分。总之,达斡尔族与蒙古语族人群的同源关系已十分明晰,但达斡尔族与古代契丹人的亲缘关系,还有待于科学证据的支持。
评论留言