您的位置: 主页 > 人工智能学家 > 不再见钢琴谱:微博女性用户生育意愿影响因素分析

不再见钢琴谱:微博女性用户生育意愿影响因素分析

时间: 2019-08-13阅读:

摘要:[目的]分析在“全面二孩”政策下微博女性用户的生育意愿及影响因素,可以为政府政策提供理论依据。[方法]利用Python网络爬虫爬取微博数据,数据预处理后用KNN算法进行情感预测,最后利用TextRank算法自动抽取关键词,归纳原因。[结论]影响因素主要为经济压力、女性就业、教育压力以及生育观念。

关键词:全面二孩;微博女性;网络爬虫;KNN;情感预测;TextRank

中图分类号:TP312      文献标识码:A

文章编号:1009-3044(2019)16-0236-03

开放科学(资源服务)标识码(OSID):

Abstract: [objective] to analyze the fertility intention and influencing factors of female weibo users under the "universal two-child" policy, so as to provide theoretical basis for government policies. [methods] Python web crawler was used to crawl the microblog data. After data preprocessing, KNN algorithm was used to predict emotions. Finally, TextRank algorithm was used to automatically extract keywords and summarize the reasons. [conclusion] the main influencing factors are economic pressure, female employment, educational pressure and fertility concept.

Key words: universal two-child; weibo female; web crawler; KNN; emotion prediction;TextRank

1 引言

随着经济和社会的发展,年轻人结婚时间越来越晚,大龄生育等人群越来越多,逐渐出现了老龄化速度加快、劳动年龄人口下降、人口发展不平衡等问题。为了更好地解决这些问题,我国提出了“单独二孩”政策,随后,我国进一步调整了生育政策,实行了全面放开二孩政策。要想更好地推广二胎政策,提高人口出生率,人们对二胎政策的想法和关注是重要的,特别是正处于育龄阶段的女性和即将处于育龄阶段的女性。且当下时代随着人们思想的不断开放和女性地位的不断提高,在教育,医疗,科技,科学,军事,服务等各个领域都少不了当代中国女性的身影,而且女性作为生育的主要参与者和承担者,她们对于生育也具有一定的决定权,因此了解她们对于二胎政策是支持或不支持的看法和态度也至关重要。新浪微博作为目前最大的社交平台,越来越多的人通过它来分享和交流信息,从而产生了巨大的数据量,由此可以从中挖掘出大量的有用信息。本項目通过对微博女性用户评论的分析,探讨二胎政策下微博女性用户的生育意愿及影响因素。

2 研究理论与假设

生育意愿是人们关于生育行为的态度及看法。近几年,由于国家在生育政策上的接连调整,使得生育意愿在生育政策的实施中变得日益重要。Becke[1]认为对于女性有工作的家庭来说,生育将会占用女性大量的时间,影响她们的工作进而影响家庭收入,另一方面,他将孩子视为特别的耐用消费品。家庭的生育意愿不仅取决于对子女的需求和成本,也取决于抚养孩子的能力,家庭收入越高对孩子的需求也越大。家庭收入对生育意愿具有正向影响。潘丹[2]等人研究发现家庭收入较低的育龄妇女为了不增加家庭的负担,更偏向于少生育孩子。随着社会的发展,抚养孩子所需要考虑的因素不再是吃饱穿暖,而是教育的经济投入和人格培养的精力投入。很多符合条件的家庭因难以承受高额的抚养费用而打消生二胎的想法。张晓玲[3]的研究结果表明不想生二胎的最大原因是经济压力。

在全面实施二孩政策的背景下,女性在其中所扮演的角色较为特殊,她们既要抚育孩子,还要参加工作。在抚养孩子和家务劳动付出更多时间及精力的同时,就意味着女性将不得不减少参与市场劳动的时间和精力,这将会对女性的职业生涯发展、职位晋升、工资收入都带来不利的影响。[4]而随着生育政策的放宽,女性用于生育的时间增加,这加剧了女性就业歧视。不少企业在招人时,会将是否生育作为录用的一项指标,甚至有的企业要求女性员工轮流怀孕,有时怀孕的女员工会被单方面逼着休职、退职。在职场上,几乎所有企业,都对生育期女性充满戒心,导致女性就业更加艰难,从而导致越来越多的女性不愿生孩子。

从年龄因素来看,不同年龄段的人对二胎的态度也不同。根据王修亮[5]等人的研究发现35周岁以下的人群不想生育二胎的人居多,而36周岁以上的女性想生育二胎的意愿比较强烈 。这可能与其受教育程度、经济压力、生活环境、个人认知等有关。有些人担心年龄越大,生育的风险越高,考虑到年龄对生育的影响,因而选择在合适的年龄生育。

受中国传统生育文化影响,祈求家族人丁兴旺,子嗣绵延,是每一个家庭所共同的愿望。因此,开放“全面二孩”政策后,不少希望儿女双全的独生子女家庭积极响应国家政策,开始备孕二胎。人们希望通过生育二胎来改善独生子女教育问题和养育风险。此外,生育二胎可以在一定程度上满足老年人的情感需求、降低养老压力,并且分担养老成本。[5]除此之外,生育意愿还受伴侣、父母或朋友等身边人对全面二胎政策的态度影响。如果身边人积极响应二胎政策,就会增强她们的生育意愿,反之就会降低生育意愿。根据上述分析,做出如下假设:

假设一:经济压力越大的人不想生二胎的意愿较强烈。

假设二:受劳动市场对女性就业歧视的影响,职场中女性就业的生育意愿较低。

假设三:对于年轻女性来说,她们更倾向于不生二胎。

假设四:受生育观念以及身边人的影响,生育意愿随之变化。

3 数据和模型设计

3.1数据概括

本研究所用数据来自新浪微博。利用Python爬取与指定关键字有关的博文、评论、评论者的id以及评论者的性别,共抓取了458条博文、48991条评论,其中,女性评论数为24795条。

3.2算法模型

为了得到女性生育意愿的态度,本研究通过KNN算法构建了情感预测模型。

3.2.1 算法描述

邻近算法又称K最近邻分类算法,说的是每个样本的类别都可以用它最接近的k个邻居的类别来代表。

3.2.2 三个重要特征

(1) 距离度量公式:KNN算法中常用欧式距离和曼哈顿距离度量公式,相应公式如下所示。

欧式距离:

曼哈顿距离:

本项目选取了曼哈顿距离度量公式

(2) K值的选取:K值较小容易过拟合,K值较大虽然可以减小泛化误差,但使得预测误差会增大。为了使精确度更高,本项目选取了范围为5-20的K值,利用10倍交叉验证的方法可以发现,当K值为11时,精确度最准确。

(3) KNN的分类决策规则一般为多数表决法。

3.2.3 实现流程

4 实证结果分析

4.1 模型预测结果

本项目通过KNN算法,选取部分数据人工标注情感值作为训练集,剩余数据通过模型预测结果。预测结果显示,有85%的人不支持二胎,仅15%的人支持二胎。部分结果如下,其中0代表微博女性用户对二胎持不支持态度,1代表支持。

4.2 结果分析

(1) 经济压力(假设1)得到部分证实。不支持人群中,家庭收入较低,经济压力大,国家所给的补贴少,无力承担二胎的抚养费用。在支持人群中,生二胎的意愿与其家庭经济状况无显著相关。

(2) 职场中女性大多不愿生二胎(假设2)得到证实。生育二胎无疑会花费女性更多的时间、精力,且女性会因婚姻以及生育而长时间休婚假、产假导致用人单位不愿意招录女性员工,这也加剧了女性不愿生二胎的现象。其中,企业对孕期女性员工安排各种奇葩工作变相逼女性离职、女性员工刚过试用期就怀孕等现象更是引发了全社会的广泛讨论。二胎时代,女性就业形势更加严峻。

(3) 大多数95后表示不想生二胎(假设3)得到证实。在抓取的评论中,大多数95后及00后表示不想结婚,不想生孩子。

(4) 通过所得数据分析,家长承担了过多的家庭作业压力。在现在的教育体制下,学校倡导陪伴式教育,家长需要给孩子布置、批改、辅导作业,但由于家长白天工作以及受教育水平程度有限,导致家长在辅导孩子的过程中力不从心,进而导致家长生二胎的意愿降低。

(5) 一胎顺产的人大多支持二胎(假设4)得到部分证实。通过数据分析,大多数一胎顺产的人都支持生二胎。且很多人希望儿女双全,有生二胎的意愿。

即使在生育政策允许生育两个孩子的情况下,但由于经济压力、女性就业歧视、教育压力等因素抑制了女性生二胎的意愿。

5 结束语

通过本次研究,得到了微博女性用户对二胎生育意愿的态度及影响因素。研究分析结果可以反映当前社会中国妇女真实的生育观及影响因素,可以为研究人员和政府政策制定提供客观依据,具有较强的实用价值。此外,在项目研究实施过程中,采集整理到的大量微博用户信息及文章又是宝贵的大数据资源,可以为其他研究项目开展奠定基础。研究也存在不足之处,在原因归纳时受人工影响较大,有待进一步的改进与完善。

参考文献:

[1] Becker G.S.An Economic Analysis of Fertility.In Demographic and Economic Change in Developed Countries,a Conference of the universities-National Bureau Committee for Economic Research 209-231

[2] 潘丹,寧满秀.收入水平、收入结构与中国农村妇女生育意愿——基于CHNS数据的实例分析[J].南方人口,2010,3:45-50.

[3] 张晓玲,戈祥.“全面两孩”政策下居民生育意愿调查与分析报告[J].四川职业技术学院学报,2016,3:21-25.

[4] 张雨萌,杨翠芬.生育对职业女性就业的影响及对策[J].劳动保障世界,2019,2.62-63.

[5] 王修亮,周维,赵东霞.我国城市适龄妇女生育二胎意愿及其影响因素的实例研究[J].辽宁经济,2017,4:50-51.

[6] 梁爱玉.全面两孩政策下已育育龄妇女生育意愿的影响因素及其对策研究[J].国际生殖健康/计划生育杂志,2019,1:5-10.

[7] 张亮.城市居民的二胎生育意愿及影响因素[J].湖南师范大学社会科学学报,2011,5:92-96.

[8] 郑伟,王若怡,马林,李明,王喆.KNN算法在舆情领域中的应用研究[J].中国管理信息化,2019,6:157-158.

【通联编辑:梁书】

上一篇:藏獒发疯咬伤主人:基于高职院校图书馆的虚拟阅读社区模型构建
下一篇:没有了

相关阅读