符合学术规范的学术服务

公共决策视域下网民的情感分析与民意的引导研究———基于《学前教育法草案》微博的大数据分析

分类:管理论文 时间:2021-06-11

  内容提要:现代社会的发展推动公共决策过程中民众的参与,亦使得运用大数据方法把握网络民意成为新时代的重要课题。以《学前教育法草案》微博平台的民意分析为例,运用大数据手段以及社会网络分析方法,从决策态度、表达方式、意见领袖等维度建立分析框架,剖析负性情感偏向的网络民意聚合机制。研究发现,议题公共性强、敏感度高是民意聚合的原因,而民众负性情感偏向则是心理噪声机理、沉默的螺旋效应、极化机理综合作用的结果。基于此,决策主体可以通过培养理性意见领袖、发挥主流媒体功效、提高网络民众素质以及对话网络民众的策略,有效引导网络民意走向。

公共决策视域下网民的情感分析与民意的引导研究———基于《学前教育法草案》微博的大数据分析

  关键词:公共决策网络民意大数据民意疏导

  一、引言

  近年来,网民规模呈现指数增长,第46次《中国互联网络发展状况统计报告》显示,截至2020年6月我国网民规模达9.40亿。民众通过互联网参与政治生活的意识也日渐增强,越来越多的民众借助网络平台发表自己对政策的观点态度与利益诉求。尽管网络民意是广泛的民意集合体,对公共决策过程具有参考价值,但由于网络民意表达是网民在不自觉状态下进行的自在式评价活动,并非完全理性,有时会误导公共决策偏离科学轨道[1]。鉴于此,有必要探明公共决策视域下有关网络民意的两个重要问题:第一,如何通过大数据把握民意的情感取向与主要观点;第二,探明网络民意的聚合机制,为引导民意走向提供对策与建议。

  2020年9月7日,教育部网站发布《中华人民共和国学前教育法草案(征求意见稿)》(以下简称学前教育法草案),第39条规定幼儿园不得教授小学阶段的教育内容。我国首次以立法的形式为幼儿园超前教育划上红线,既说明国家对学前教育的重视,也充分暴露了学前教育存在的突出问题。同日,中国新闻网于新浪微博平台上创立#幼儿园不得教授小学阶段的教育内容#话题,引发了网民热议。截至目前,该话题已经拥有5.5亿的阅读数以及3.5万的讨论数。本文尝试利用网络爬虫获取学前教育法草案话题下的评论数据,借助大数据技术了解网络民众的决策态度以及表达方式,运用社会网络分析法识别民众的意见领袖以及代表观点,从情感态度、意见领袖和代表观点三方面来把握网络民意并探明民意聚合的机制,为大数据在公共决策过程中的运用提供有益探索。

  二、网络民意与公共决策研究回顾

  (一)网络民意

  国外学者韩念西认为,民意是具有相当数量的一群人针对重要议题表达其复杂偏好的综合[2]。这一界定首先指出民意的主体是一定规模的社会民众。国内学者余致力进一步辨析,认为民意之“民”未必等同于全民,民意也不必然等同于多数民众的意见[3]。其次,韩念西认为民意的实质是复杂偏好的综合,这与当前有关民意的主流观点相似,即民意是情绪、态度、意见和干涉意愿的总和[4]。再者,此界定抛出民意客体这一要素,何志武认为民意客体相较于舆论客体更具针对性,主要围绕重要的社会议题与政府公共政策[5]。本研究认为,民意是一个或一个以上社会民众针对社会公共事务和政府决策所发表的情绪、态度、意见与干涉意愿的总和。

  民意作为一种意识形态,通过特定的载体支撑外化为人们感知的表现形式。互联网,以其开放性和便利性给予民意新的物质载体与表达通道[6],网络民意成为民意的网络呈现方式。参照民意的定义,网络民意可定义为一个或一个以上社会民众,借助于互联网平台,针对社会公共事务和政府决策所发表的情绪、态度、意见与干涉意愿的总和。凭借互联网“所有人对所有人”的传播优势,社会民众突破以往精英主导的局限,对政治议题畅所欲言[7]。无须借助高成本渠道资源或是他者的力量,具有相同诉求的大众可以在网络空间迅速结盟。

  (二)公共决策

  公共决策,指国家、行政管理机构和社会团体所进行的决策,如公共福利、国家安全、国际关系等[8]。相较于一般决策,公共性是公共决策的突出特征,即公共决策总是从公共利益出发,解决公共事务中出现的问题。该特点对于公共决策长期性、多样性、权威性等特点具有本源意义[9]。

  由于公共决策的复杂特征,因此相较其他决策,公共决策需要满足更高的要求。一般而言,公共决策质量的衡量依据有二,其一,以是非标准为尺度判断决策是否合理;其二,以价值标准为尺度权衡决策优劣。成功的公共决策应当以最小化的决策投入获取最大化的公共利益,实现目标合理、方案可行[8]。为此,公共决策的民主化、科学化不可或缺。周光辉认为,当前社会结构、经济结构发生深刻变迁,要摆脱已形成的利益格局对公共决策的裹挟与影响,必须将决策民主化作为有效路径[10]。在公共决策过程中兼听各方声音,留意各方交锋博弈,有利于降低主观臆断与“拍脑袋”带来的决策失误概率,做出更客观全面的判断。同时,决策的民主化与公民的决策配合度息息相关,对于一些诸如衣食住行等对民众接受度要求高的决策问题,发动民众进行决策态度的表达尤为重要。

  (三)网络民意与决策民主化

  作为目前最为广泛的民意集合体,网络民意聚集着多样化的利益诉求,是进行公共决策过程中极具价值的“民间智库”,公共决策过程重视网络民意是提升决策民主化的内在要求。在公共决策过程中,以下三种信息是必要的:有关公众对决策偏好的信息,有关决策在其作用范围内运转态势的信息,有关决策解决方案的技术信息[11]。获取这三点信息使得听取民意成为必须。

  虽然网络民意天然地具有被决策者聆听的“必要特质”,但其中掺杂众多非理性因素。一是因为如今信息同质化严重,网络民意易受到媒体报道和用户行为策略干扰[12];二是因为民众总是带着已有观念,“先入为主”地发表对议题的看法[13];三是网络民意有被外在力量建构或者操纵的可能,存在沦为利益集团影响决策议程设置的靶子、嬗变为政治工具的风险[14]。因此,听取网络民意并不意味着决策主体要将所有权利让渡于民,而应当为民众参与决策的过程做出合理安排,使双方形成平等的互动。决策主体尤其应当注意在政策质量的规定方面、问题结构的界定方面提供权威解释。

  (四)大数据技术在决策科学化中的应用

  决策科学化是防止决策出现失误、降低决策成本与减少副作用的必然选择。一般而言,公共决策科学化要求决策过程有效利用现代科技手段,广泛收集信息[15]。信息是公共决策制定与调整的命脉,其质量是决策能否实现科学化的关键因素[16]。换句话说,没有用以决策的信息,决策便是无源之水、无本之木。在公共决策过程信息收集阶段,对民意的把握至关重要[17]。但是,传统的公共决策由于难以发现并充分利用公共服务需求方的信息而偶发决策失灵现象[18]。随着信息技术的发展,这种情况正在被改变。大数据技术的应用使得信息收集变得轻而易举,通过对信息的编码与解读,决策主体能够快速了解社会群体的偏好与认知。

  相关期刊推荐:《四川行政学院学报》创刊于1999年,是由四川行政学院主管并主办的行政学。设有公共行政、政治与法律、社会发展、经济问题研究、行政文化、调查与研究、政府工作研究、探索与市场等栏目。

  公共政策学者库克指出,数据驱动的公共决策使得决策以事实为基础,从而显著提升公共决策的有效性,塑造出开放而负责的政府形象[19]。当前,大数据提升决策透明度、提高决策效果已成为共识[20]。英国、瑞士、新加坡等国已实行在政府决策过程中使用网络进行文本挖掘、情感挖掘以及趋势研判等提高决策效率的方法[21]。我国于2015年印发《促进大数据发展行动纲要》,其中明确提出“要实现基于数据的科学决策,逐步实现政府治理能力现代化。”因此,如何在公共决策过程中利用大数据手段已成为新时代重要的实践性问题。

  三、研究方法

  (一)数据预处理

  本研究利用python对微博平台#幼儿园不得教授小学阶段的教育内容#话题下的一级评论进行抓取,共获得11565条原始数据。由于原始数据中包含大量噪声,因此在进行数据分析前先对其进行预处理,预处理包括数据清洗、分词以及关键词提取三步。

  首先,以每条评论为单位对原始数据进行清洗。数据清洗包括剔除不必要的内容以及调整数据内容的结构。清洗规则以及处理方案如表1所示,清洗完成后得到10679条文本数据。第二步,利用Python3.7.1中的第三方模块jieba实现中文分词。结合“百度停用词表”、“哈工大停用词表”以及学前教育领域的专业名词对模块自带的停用词表进行扩充,删除分词过程中的停用词以获取更精确、更有意义的文档词表。第三步,使用TextRank算法提取评论文本中的关键词。

  (二)数据分析

  1.探明决策态度

  文本情感分析(SentimentAnalysis)是指处理带有情感色彩的主观性文本的过程,常用于微博、用户论坛、微信等语境之中,其目标可以是只进行褒贬两个维度的划分,也可以是多类分类。本文选用机器学习方法中的支持向量机(SVM)对#幼儿园不得教授小学教育内容#话题下的博文评论进行情感分析,分为支持和不支持两类。其主要内容是,明确支持草案第39条内容和明确反对草案中第39条内容。利用SVM实现情感极性分类的流程如下。首先,由两名编码人员分别判断4000条评论的情感极性,正向记为1,负向记为0。使用SPSS对两名编码人员的情感标注结果做相关性分析,以验证首次情感标注的有效性。第二步,从已标注好情感的4000条评论中选取正向情感评论300条,负向情感评论300条作为样本。抽取样本中80%的数据作为模型的训练集。第三步,利用Python平台下的sklearn算法模块实现SVM模型的训练,利用F1值、准确率、召回率作为模型评估指标。第四步,运用训练好的分类器对剩下的6679条评论进行情感极性标注。

  2.分析情感表达

  表达方式是网络民众在微博平台上进行评论时使用的特定语言方法与手段,可以分为理性思考型与情绪表达型。两者的划分依据为,如果评论者以数据事实、逻辑推理、客观陈述等方式进行表达,则可以将其界定为理性思考型,如:经济基础决定上层建筑,教育作为上层建筑之一亦是如此。国家可以采用地方规定但不要用立法形式,根据各地实际情况,教学需求来制定;如果评论者注重情感表达,评论语句含有大量的形容词、副词、表达语气的标点符号,或者使用语气强烈的反问、设问等修辞手法,蕴含较强的嘲讽情绪,则将其界定为情绪表达型,如:知道了,别发通知了,不就报班吗,懂了懂了,报吧报吧!

  本文使用支持向量机(SVM)对民众的表达方式进行二分类处理。首先由两名编码人员分别对随机抽取的2000条评论进行标注,理性表达型记为1,情绪表达型记为0。利用相关性分析验证标注结果的有效性。其次,从1500条评论中选取理性表达型评论300条,情绪表达型评论300条作为样本,将其中80%的数据作为训练集。第三步利用Python平台下的sklearn算法模块实现SVM模型的训练,利用F1值、准确率、召回率作为模型评估指标。第四步,运用训练好的分类器对剩下的8679条评论进行表达方式标注。

  3.识别意见领袖

  意见领袖是网络社群中认可度高、说服力强的观点领导者。作为网络平台上的一种显性力量,意见领袖有其突出特征,比如获得较高的点赞行为或者回复。围绕意见领袖的观点,某条博文下经常会形成自发的小群体,出现局部辩论或全局辩论的场景。博登多夫和凯撒发现,意见领袖经常处于网络社区中心,与更多成员建立联系[22]。本研究拟使用社会网络分析法寻找微博平台#幼儿园不得教授小学阶段的教育内容#话题下的意见领袖并了解网络民众支持的代表观点。

  社会网络分析法是一种分析描述网络属性的结构、性质、特征的方法,强调从关系或结构的视角分析研究对象。利用社会网络分析工具Gephi,选取“学前教育法草案征意见:幼儿园不得教授小学教育内容”博文下1000条评论,将其中630名成员以001-630的数字简化标记,每一个成员为一个节点。若成员两两之间存在互动,则用直线将两点相连并且利用Gephi进行可视化操作以及节点中心度统计。节点中心度包括程度中心度、中介中心度以及接近中心度,三个指标存在信息重叠[23]。基于节点的中心度高低,可以有效识别该话题下的网络意见领袖以及代表观点。

  (三)研究框架

  本文提出如图1所示的研究框架,总结从数据预处理到数据分析的过程和步骤。——论文作者:陈林1王志丹2杨光

全学科期刊推荐 中英文发表指导

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询