原载《人口研究》2007年第3期

  「内容摘要」本文对以往出生性别比研究中的若干观点进行了学术评论,并讨论了个别经验统计分析中的方法问题。在此基础上,本文应用非线性分层模型将2000年全国人口普查1‰数据和1999年的地区级生育政策数据结合起来对出生性别比失调的影响因素进行了初步分析。结果表明,育龄妇女现有子女数量及性别和一些社会特征对出生性别比存在单独的影响,并且肯定了生育政策既存在对出生性别比的直接影响,也通过其与妇女以往生育结果以及其他社会特征之间的交互效应来影响出生性别比。

  关键词:出生性别比;生育政策;分层模型分析

  「作者简介」郭志刚,北京大学中国社会发展研究中心研究员、社会学系教授。北京:100871

  *本研究受教育部人文社会科学重点研究基地课题"家庭代际关系的人口社会学研究"(05JJD840002)和国家社会科学基金课题"人口学方法论研究"(05BRK007)的资助,在此鸣谢。

  1问题的提出

  我国出生性别比从1980年代以来出现偏高失调,并且愈演愈烈。早期研究中,还有相当多的人认为这种失调主要是由于出生女婴瞒报漏报的原因,后来随着不断采用新的调查数据对以往统计结果的核对,大部分人都已经认识到出生性别比失调并不是统计虚幻,而是社会现实。2000年全国人口普查数据表明,五普前一年内的全国出生性别比已经高达119.92,而国家统计局发布的2006年国民经济和社会发展统计公报提供的出生人口性别比为119.125.

  近年来对出生性别比失调原因的研究很多,争论也很大。周云、任强(2004)曾对这方面的研究文献做过归纳和梳理,涉及到的原因方方面面,即包括育龄夫妇本人的生理状况、以往生育史,也包括个人社会经济特征(教育、职业,户籍类型,流动迁移状况等等),还包括所在的家庭类型,并涉及到居住地的自然和社会地理特征(地形地势和城乡),以及更为宏观层次的社会经济状况。至于社会经济特征如何能影响到出生子女的性别,主流认识是某些特征人群有更大的倾向做产前胎儿性别鉴定、然后做选择性的人工流引产。

  一个争论热点是计划生育政策或计划生育工作是不是出生性别比失调的原因。认为计划生育与出生性别比失调有关的看法由来以久,但是最初由于这个话题太敏感,公开发表的文献几乎找不到,近年来持这种认识的文献大量增加。但是,主要停留在理论推理的认识阶段,以实际数据分析结果来举证的研究很少。

  顾宝昌和罗伊(1996)曾用韩国和中国台湾地区无强制性计划生育,但也存在出生性别比偏高的现象,来说明中国的计划生育不是主要原因。这种学术观点及其论证逻辑的影响很大、广为引用。就其论证逻辑上的问题,我同意乔晓春(2004)的评论,即这种举证"只能说明对出生性别比的偏高不受计划生育的作用是可能的,但并不能证明它一定不受计划生育的作用".也就是说,作为这种观点的支持证据,上述现象可作为必要条件,但尚不充分。

  并且,我认为还有必要指出,上述推理的缺陷也同样普遍地发生于观点截然相反的研究中。问题在于,不论想支持哪种观点,举证少数例证,都不足以作为充分支持。很多社会经济影响因素并不是以确定性方式、而是以或然性方式发生作用的。因此,不服从一般规律的特例总是存在,但是并不能作为充分的反证而否定一般规律的普遍存在。所以,总是可以比较容易地找到一些特殊案例。但是,这种特例没有普遍性,所以依据它们的理论推理即使在逻辑上成立也不能代表现实中的一般规律。

  此外,在出生性别比研究中还有一种较有影响的说法也值得推敲。比如,"中国出生性别比偏高和推行计划生育政策并没直接关系,二者不是因果关系",并同时认为"计划生育政策促成了中国低生育水平的早日到来,加速人口转变的实现,间接地影响了出生性别比偏高"(原新、石海龙,2005)。应当指出:第一,没有直接影响不一定意味着没有因果关系,因为间接影响也是因果关系。这如同计划生育政策和个人社会经济变量都只能通过中间变量来影响个人生育是同一个道理。通径分析模型是一种因果分析统计模型,其主要特征就是不仅分析直接影响,而且也分析间接影响。第二,不可以简单地将直接影响等同于主要影响、而将间接影响等同于次要影响。在通径分析研究中经常可以看到,一个外生变量对结果变量的间接影响可能是大于直接影响的,并且间接影响的方向甚至可能会与直接影响的方向相反,结果是间接影响的方向决定了总影响的方向。

  下面再简评一下四个将生育政策直接与出生性别比联系起来的定量研究。

  陈友华(2006)利用广东省1997年曾大规模收紧生育政策这样一个条件,对政策调整前后的孩次递进生育结构和孩次别出生性别比进行了对比,得出了生育政策变化对出生性别比的影响。他的研究视角独特,相当于将广东省的政策调整当作一次"自然"实验(艾尔。巴比,2000:上卷315页),用"实验"前后的变化来反映不同生育政策的影响。但是,这种方法很难应用于一般的横贯数据分析。

  张二力(2005)用地区级的政策生育率(即生育政策内在要求的平均生育水平)与地区级出生性别比做了相关分析,肯定了两者之间存在正相关。这一研究从方法论上还存在一定缺陷,因为生育政策是一种大环境影响,处于宏观层次,然而夫妇的产前性别选择则是一种微观行为。严格地说,从宏观单位的变量相关推论微观单位的变量也相关,要冒生态学谬误的风险。

  笔者(2005)则是将地区级各类生育政策的人口覆盖比例信息与2000年普查的1‰样本数据联系起来,根据普查户记录中的市镇县特征按梯次地将较严政策的人口比例随机分配给各户,然后对这样划分的不同生育政策人口进行了探测性分析,也得出了不同生育政策下的出生性别比有显著差别的结论。但是,以这样的方式将两套不同来源、不同层次的数据生硬地结合起来,肯定会有分配错误,所以其分析的有效性较差,结果只能大致看看,聊补此类信息空白。

  此外,上述这三个实证研究还有一个共同的短处,就是只考虑了个别人口特征(如出生孩次、母亲的生育年龄),对其他社会经济变量的控制不够。也就是说,就算以上指出的那些方法缺陷都不存在,也不能排除其研究结果受到了育龄妇女其他人口、社会、经济特征干扰。

  杨菊华(2006a )用"中国健康与营养调查"的纵向调查数据,以社区为分析单位,应用常规回归证明了生育政策对社区男孩比例存在影响,并应用固定效应模型表明生育政策类型和推行手段的变化也导致社区男孩比例的相应变化。这一研究在方法上已经比较讲究,并且分析时对子女结构和其他社会经济变量都进行了统计控制。但是,社区虽然距离个人很近,但毕竟还不是生育行为的直接发生者,所以推理上仍然有生态学谬误的风险。另外,这种将个人数据汇总为社区层次变量再做回归有两个统计缺陷:一是个人信息被损失了,二是回归反映出来的其实是社区变量之间的关系,而这种关系与上层变量与下层变量(比如生育政策与个人生育)的实际关系可能并不一致。

  建立一个好的理论框架是做好研究分析工作的基础。乔晓春(2004)曾提出了一个出生性别比的研究框架(请参看他原文中的示意图),区分了4种不同的变量:确定性变量(如生育政策、男孩偏好),条件变量(B 超技术可得性),中间变量(如选择性人工流产),结果变量(生育数量、性别、时间)。

  根据实际研究条件,上述框架既可以扩展,也可以省略。比如,育龄妇女个人的各种社会经济特征会影响个人的男孩偏好强度,而各种社会调查都有这种信息,所以即使没有男孩偏好信息仍然可以做生育结果研究。当没有条件变量和中间变量时,那么它们也可以省略,就像乔晓春在同一篇论文中以及许多其他人所做的一样。

  此外,用什么模型来操作上述理论框架也是很重要的问题。由于生育政策数据的不可得,大家可能会忽略这个问题。比如,笔者(2005)所用生育政策信息并不是个人特征,而是以行政地区为单位口径的各类生育政策实际覆盖的人口比例。又如,中国健康与营养调查的生育政策数据(杨菊华,2006a )也是当地干部提供的社区层次数据。统计原理早就证明,无论是将地区级的生育政策变量分别赋值给个人后再进行回归分析,还是将个人信息先按各地区统计出汇总变量,然后在地区级与生育政策进行回归分析,都是不对的。在面对这种分层数据结构的情况下,1990年代以来日趋成熟的分层模型才是一种恰当的分析模型。

  本文将尝试应用分层模型来检验生育政策是否影响出生性别比。这一尝试不仅在于取得具有理论和实际意义的结果,而且也有学习和推广先进分析方法的学术意义。

  5小结

  本文对以往出生性别比研究中的某些重要观点做了一些评论,还对研究生育政策与出生性别比之间关系的几个经验统计分析中存在的方法问题进行了讨论。

  在此基础上,本文简要介绍了分层模型分析方法,并应用非线性分层模型将2000年全国人口普查1‰数据和1999年的地区级生育政策数据结合起来对出生性别比失调的影响因素做了初步的分析。

  对所有孩次出生和二孩及以上孩次出生的两个分层模型的结果表明,生育政策不同不仅对各地区的出生性别比有直接影响,而且还通过与育龄妇女个人的生育数量及子女性别结构之间的交互效应以及与个人的户口性质、教育程度之间的交互效应来影响出生性别比。此外,分析还肯定了育龄妇女以往生育结果和某些社会特征对出生性别比还存在着单独的影响。

  以上统计结果启示我们,当前出生性别比失调是多种因素作用的结果,所以需要综合对策治理。

  一方面我们应当正视现行生育政策对出生性别比失调存在影响,同时我们也不能指望调整甚至取消生育政策就能使出生性别比完全恢复平衡,因为妇女在家庭、社会、经济方面的弱势地位尚未改变,养老保障、财产继承、宗亲关系等方面也很难改变,因此既作为文化传承、又作为社会现实反映意识的男孩偏好也不是那么容易改变的。

  尽管当前政府、学界、媒体、公众都对出生性别比失调问题十分关注,但是议论很多、定量研究很少。并且,在定量研究中,描述性分析较多,解释性分析较少,并且对生育政策是否影响出生性别比的研究更少。最后一种状况显然是与得不到生育政策数据有关,导致许多不同观点只能在理论层面争论,而不能结合实际数据进行理论检验。这种状况亟待改善。

  本研究应用非线性分层模型将不同层次、不同来源的数据结合在一起分析,能够更有效地开发和利用信息。在应用分层模型研究出生性别问题时,下层当然是以育龄妇女为分析单位最好,但是上层以地区为分析单位则是无可奈何的选择,因为只有这一层的生育政策数据可得,并且能够与普查数据中的区划相对应。如果能有县、乡、村作为二层分析单位更好,因为这种脉络层次距离育龄妇女更为接近。此外,由于数据限制,本研究中没有考虑经济等其他方面的变量也是一个缺憾。所以,本研究仍然只是这方面的一个初步分析。

  分层模型是一种较新的分析手段,特别是非线性的分层分析,有关应用研究文献很少。本文一方面是为了给出生性别比研究提供一些新的定量分析结果,同时也是为了介绍一种新的研究手段。本研究是笔者首次尝试应用非线性的分层模型分析,在应用和结果解释中可能会存在一些问题和不足,就此机会求教于各位专家和同行。

  文件类型: .pdf原文下载(342.07 KB)