1、样本全部来自23魔方祖源用户中已填写籍贯者;
2、基于常染色体基因位点的分析,与Y单倍群、MT单倍群无关,具体请看APP页面的“科学细节”;
3、不包括混血儿,包含父母为跨省通婚的个体,每个省的样本均包含汉族和少数民族;
4、样本较少的省份、自治区、直辖市没有纳入统计;
5、一些省份的样本有地域偏向,如江苏籍用户中就有很多南部样本(高于人口比例)。结果解读:
1、南北方汉族区分明显。北方省份北汉成分平均达80%以上。南方省份中,广东人平均南汉血统达80%左右。而其他南方省份大致有30%-70%不等的北汉成分,这与历史时期人口流动的单向性(北方南下的居多、南方北上的偏少)一致。
2、浙江北部汉族相对更接近北方汉族而远离广东汉族。这与以往的相关研究[1,2,3,4]基本一致。
3、四川汉族相对偏离北方汉族。但是我们的数据表明四川内部也有很大差异。广元等靠近陕西的地方,北汉成分可达60%左右。而自贡广安内江等地,南汉成分甚至达80%左右,并且是四川血统最“南”的地方(比泸州更南),推测这一带是湖南、广东(客家)移民最集中的地方。
4、相比北方省份而言,南方省份群体内部差异更大,同一个县的不同个体往往血统存在较大差异,这种现象尤其在山区丘陵较为显著,在平原地区就不那么显著。反映了群体之间的隔离。
5、维吾尔成分大体代表了一种北亚和印欧混合的组分(我们的维族样本偏北疆)。该成分在西北、山西(尤其山西北部)等地较多。而这些地区也是历史上匈奴、突厥、回鹘等民族较为活跃的。
6、藏缅成分是从彝族、纳西、藏族中“提取”出来的。这种成分与历史上的氐羌民族可能是比较接近的。该成分在川渝、北方相对集中。在甘肃尤为集中。
7、拉祜族的血统处于何种位置?前期研究我们发现拉祜族相对接近傣族,现在看不完全是。拉祜族作为藏缅语族使用人群,融合了不少侗傣成分,但也有不少原始藏缅成分,因此不像傣族成分那样过度集中于南方。
8、韩国成分大体上反映了一些与北方汉族共享的成分。该成分没有明显的东西偏向性。
9、内蒙古的蒙古族成分并不多,原因在于我们的蒙古族参照系为外蒙古人(并且进行了提纯),而内蒙古的蒙古族很多更接近北方汉、通古斯。
10、傣族成分相对来说与壮族比较接近但也有很大差异。目前仅发现一例傣族成分超过50%的用户。该成分在两广最为集中。其中,广东省该成分最高的是粤语汉族。
参考文献:
[1] Xu SH, Jin L, et al (2009) Genomic Dissection of Population Substructure of Han Chinese and Its Implication in Association Studies. American Journal of Human Genetics. 85:762-774.
[2] Chen J, Zheng H, et al (2009) Genetic structure of the Han Chinese population revealed by genome-wide SNP variation. American Journal of Human Genetics ,85 (6) :775.
[3] Chiang CWK, et al (2017) A comprehensive map of genetic variation in the world’s largest ethnic group-Han Chinese. bioRxiv preprint first posted online , doi:
http://dx.doi.org/10.1101/162982.[4]. 赵桐茂等(1987)免疫球蛋白同种异型Gm因子在四十个中国人群中的分布. 人类学学报, (1) :1-9.
1、样本全部来自23魔方祖源用户中已填写籍贯者;
2、基于常染色体基因位点的分析,与Y单倍群、MT单倍群无关,具体请看APP页面的“科学细节”;
3、不包括混血儿,包含父母为跨省通婚的个体,每个省的样本均包含汉族和少数民族;
4、样本较少的省份、自治区、直辖市没有纳入统计;
5、一些省份的样本有地域偏向,如江苏籍用户中就有很多南部样本(高于人口比例)。结果解读:
1、南北方汉族区分明显。北方省份北汉成分平均达80%以上。南方省份中,广东人平均南汉血统达80%左右。而其他南方省份大致有30%-70%不等的北汉成分,这与历史时期人口流动的单向性(北方南下的居多、南方北上的偏少)一致。
2、浙江北部汉族相对更接近北方汉族而远离广东汉族。这与以往的相关研究[1,2,3,4]基本一致。
3、四川汉族相对偏离北方汉族。但是我们的数据表明四川内部也有很大差异。广元等靠近陕西的地方,北汉成分可达60%左右。而自贡广安内江等地,南汉成分甚至达80%左右,并且是四川血统最“南”的地方(比泸州更南),推测这一带是湖南、广东(客家)移民最集中的地方。
4、相比北方省份而言,南方省份群体内部差异更大,同一个县的不同个体往往血统存在较大差异,这种现象尤其在山区丘陵较为显著,在平原地区就不那么显著。反映了群体之间的隔离。
5、维吾尔成分大体代表了一种北亚和印欧混合的组分(我们的维族样本偏北疆)。该成分在西北、山西(尤其山西北部)等地较多。而这些地区也是历史上匈奴、突厥、回鹘等民族较为活跃的。
6、藏缅成分是从彝族、纳西、藏族中“提取”出来的。这种成分与历史上的氐羌民族可能是比较接近的。该成分在川渝、北方相对集中。在甘肃尤为集中。
7、拉祜族的血统处于何种位置?前期研究我们发现拉祜族相对接近傣族,现在看不完全是。拉祜族作为藏缅语族使用人群,融合了不少侗傣成分,但也有不少原始藏缅成分,因此不像傣族成分那样过度集中于南方。
8、韩国成分大体上反映了一些与北方汉族共享的成分。该成分没有明显的东西偏向性。
9、内蒙古的蒙古族成分并不多,原因在于我们的蒙古族参照系为外蒙古人(并且进行了提纯),而内蒙古的蒙古族很多更接近北方汉、通古斯。
10、傣族成分相对来说与壮族比较接近但也有很大差异。目前仅发现一例傣族成分超过50%的用户。该成分在两广最为集中。其中,广东省该成分最高的是粤语汉族。
参考文献:
[1] Xu SH, Jin L, et al (2009) Genomic Dissection of Population Substructure of Han Chinese and Its Implication in Association Studies. American Journal of Human Genetics. 85:762-774.
[2] Chen J, Zheng H, et al (2009) Genetic structure of the Han Chinese population revealed by genome-wide SNP variation. American Journal of Human Genetics ,85 (6) :775.
[3] Chiang CWK, et al (2017) A comprehensive map of genetic variation in the world’s largest ethnic group-Han Chinese. bioRxiv preprint first posted online , doi:
http://dx.doi.org/10.1101/162982.[4]. 赵桐茂等(1987)免疫球蛋白同种异型Gm因子在四十个中国人群中的分布. 人类学学报, (1) :1-9.