中国有着纷繁复杂的汉语方言种类。语言学家将中国的汉语方言分为十个大的类别,称之为大区。同时,汉语各方言大区内部又分为许多次方言,称为方言片,方言片内部又可以有第三、第四层次的划分,分别称为方言小片、方言点。
作为一项具有全国代表性的综合调查,中国家庭追踪调查(ChinaFamilyPanelStudies,下文简称CFPS)样本覆盖的25个省、直辖市、自治区的人口约占全国总人口(不含港澳台地区)的95%(谢宇、胡婧炜、张春泥,2014),涵盖了全国大部分方言区和方言类型。CFPS在调查中,收集了受访者所使用的方言类型。为了便于用户使用CFPS中的方言变量,本章提供了基于汉语方言分类谱系构建的方言类型的标准编码。
CFPS样本中,有方言编码信息的样本主要来自两个方面:其一,是10岁以上在个人问卷中自答的“日常生活中使用的主要语言”为“本地话”的受访者;其二,是在与访员交谈过程中使用方言的受访者。由于CFPS的样本框覆盖全国95%的人口,其方言多种多样,而且CFPS调查采用的是当地访员,为了让受访者更好地理解调查问题,访问过程中,访员与受访者的交谈更可能采用当地方言进行。在问卷的“访员观察部分”,访员会记录下受访者使用的语言及具体方言类型。
以上采集到的通过文字描述的方言信息,CFPS已经提供了第一版方言编码方案:以方言学界实际上的学科标准《中国语言地图集》为编码标准,并根据Lavely和Lex(2012)按照1990年中国人口普查的县级市编码(GB2260-88)进行整理的方言分布信息,赋予受访者自答的方言类型或所在区县的方言类型编码。编码过程详见CFPS技术报告《CFPS-28中国家庭追踪调查方言编码》(武玲蔚、张文佳,2014)。
<<