摘要:网络技术和大数据的飞速发展,为重新打造统计调查发展模式创造了新的契机,也带来了新的挑战。推动大数据在统计工作中的深入融合应用,利用大数据改革创新统计手段和途径,拓展统计方法和数据来源,已成为当务之急。本文结合政府统计工作的实践和经验,分析了当前部分地区围绕大数据在政府统计工作中的融合应用现状,提出了打造与大数据要求相匹配的统计机构、公共数据平台、统计方法制度、数据发布模式等建议。
关键词:信息化;大数据;统计调查;应用研究
近年来,在移动计算、物联网和云计算等一系列新兴技术的支持下,社交媒体、虚拟服务等新型应用模式持续拓展人类创造和利用信息的范围和形式。信息技术的发展与创新使各行各业都发生了变化,在信息爆炸时代产生海量数据,开启了一个时代的转型,给人们生活、工作与思维带来一场大变革,也为统计事业发展创造了新的契机。传统的统计方式方法已无法满足新时代统计工作的新目标、新任务和新要求,因此,推动大数据在统计工作中的深入融合应用,不断改革创新统计手段和途径,不断丰富扩展统计方法和数据来源,不断提升统计工作应用现代信息技术的广度和深度,更好地服务于经济社会发展,已成为当务之急。本文结合政府统计工作的实践和经验,对大数据在统计调查中的应用进行思考和研究。
一、政府统计应用大数据的现状
大数据不是一种普通的、使用抽样调查的方法而产生的信息数据,它是运用新的处理模式,为更强大的决策力、发现力和流程优化能力服务的信息资产。大数据具有数据大量化、类型多样化、快速化和价值高等特征,它所体现出的战略意义并非是拥有海量的数据信息,而是对数据采取专业化处理。政府统计是根据国家统计方法和手段,依法对国民经济和社会发展进行统计调查和分析的活动,为各级政府提供统计数据和咨询意见,并进行统计监督。只有采用科学的统计指标体系,运用科学的统计调查方法,才能精准采集、处理、传递、存储和提供以数据描述为基本特征的社会经济信息。近年来,全国统计系统充分认识到大数据所蕴含的丰富价值和对政府统计事业发展的重要性,积极围绕大数据在政府统计工作中的融合应用进行了大量探索和尝试,并取得初步的工作成效。
如贵州省统计局围绕大数据战略行动,推进实施“数据铁笼”①建设,应用大数据技术实现对网络信息的统计应用。甘肃省统计局建立了“甘肃省社情民意互联网大数据分析平台”,对甘肃省内的社会发展、民情反馈、民意动向等相关数据进行实时动态收集,探索性地对重点事件、突发事件进行跟踪和预警。山东省统计局部署大数据平台建设,并建设完成一期工程——山东省统计数据综合管理平台。各地市级统计部门也积极开展大数据应用探索,如青岛市统计局建设完成青岛市经济社会发展动态监测分析平台,大大提高了统计工作效率和统计服务质量;济宁市统计局与华为(济宁)云计算中心合作,在全国率先完成市级“政府统计云”建设,全面覆盖市、县、乡三级统计机构。黑龙江人口普查登记“绑定”电力大数据,通过微信精准定位匹配,在不增加基层工作量的前提下,通过快捷高效的手段达到核实“空户”的最终目标。各省、市都在不同程度地开展大数据研究和应用[1]。
二、政府统计工作与大数据融合的建议
(一)打造与大数据要求相适应的统计机构
大数据的使用主要分三步,即数据搜集、数据分析加工和数据挖掘,建议统计部门建立相应的机构来满足大数据的使用要求。一是利用物联网进行前端数据抓取,或在其他网络数据库中采用提取的方法来获得数据,进行必要的数据清洗,以确保数据的真实性。二是专业的数据分析部门通过对收集的数据进行分析加工挖掘有价值的数据资源。三是数据公布部门发布数据,为社会、政府和研究机构提供参考。
(二)打造满足大数据要求的公共数据平台
借助云计算技术建立大数据平台,接收、存储过去、当前和未来所产生的数据,并对其进行整理和分类,打破数据孤岛、信息壁垒的局面。这一平台不仅可供政府使用,同时对工商业、交通和金融等行业开放,以实现资源共享。
(三)打造与大数据要求相匹配的分析系统
目前,数据处理和数据挖掘已有比较成熟的模型和算法,并应用于行政记录和商品统计,这些数据主要是结构化数据。实践中,网络和互联网信息的数据采集不仅包括结构化数据,还包括图像、视频和其他形式的半结构化和非结构化数据。处理这些数据,需要加强有关机构对数据的预处理能力,增强智能处理和实时分析、相关分析、可视化分析能力,提高统计分析的趋势性、直观性和及时性,最终提高统计分析的预警水平,从而更好地服务于政府部门,促进经济社会发展。
(四)建立与大数据相匹配的统计方法制度
深刻变革统计生产方式,以适应政府统计工作环境和调查内容、对象、方式发生的深刻变化。建议加快建设统计云,进行统计方法制度设计、数据收集、加工处理、信息传播和分析研究等统计生产流程再造,大力提升统计数据生产能力和开发应用大数据能力。
(五)打造与大数据要求相符的数据发布模式
大数据背景下,建议政府统计部门基于数据需求发布统计相关数据信息,满足多层次、多角度工作的需求,完善数据的统计范围,提升统计数据的准确度。在提升数据分析能力的前提下,政府统计部门要丰富统计数据的发布形式,增强数据发布的频率与实效,满足社会各个领域对统计数据产品的多样性需求,提升统计数据的价值。
(六)利用部门大数据开展常规性统计调查
多数政府部门都有统计调查任务,部门统计调查的指标设置与政府统计的常规性统计调查指标不同程度地有重复和交叉现象,建议对部门统计调查制度、方法等重新进行设计,以满足政府统计调查常规性数据的需要。
利用税务、银行大数据开展劳动就业统计。税务部门因收缴个人所得税的需要,对每个法人单位的人数、收入信息采集的资料比较齐全,对这些数据进行进一步的加工处理,就能满足劳动就业统计调查的需要。同时,每个法人单位的工资发放都要经过银行系统,经过进一步的加工处理,也能基本满足劳动就业统计调查的需要,且能相互评估数据的准确性。组织部门填报的“干部基本情况表”“公务员基本情况表”经重新设计,基本能满足行政机关劳动就业调查的需要。
利用公安部门大数据协助人口统计。公安部门的户籍人口数据比较准确、可靠,再加上流动人口数据,基本能满足人口统计调查的需要。
利用农业部门大数据协助农业统计。在农业部门“农村土地承包经营情况”“土地规模经营情况”“家庭农场情况”“农民合作社情况”等调查表内加入产值、产量等指标,并对其进行重新设计,基本能满足农业统计的需要。同时,也可利用遥感大数据计算农业产量、产值,相互评估数据的准确性。加强遥感和无人机视屏采集技术在畜禽统计业务上的应用研究,如利用无人机在草原牧区牛羊主产区快速清点牲畜数量、利用视频监控在生猪家禽圈舍饲养场采集识别畜禽数量,以满足畜牧业统计的需要。
利用工信部门大数据协助工业统计。工信部门为满足工业生产调度需要各种周期性的统计数据,而政府统计部门现有统计数据不足以满足工信部门工作需要。因此可以通过开展工业数据资源调查,引导企业加强数据资源管理,实现数据的可视、可管、可用、可信。整合重点领域统计数据和监测数据,在原材料、装备、消费品、电子信息等行业建设国家级数据库。重新设计工信部门的统计调查表,把工业统计指标纳入工信部门统计调查中,这样既满足工信部门生产调度的需要,也满足政府统计部门对工业统计的需要[2]。
相关知识推荐:发表学术论文交费吗
利用其他大数据提炼评估不同统计数据。如利用教育、卫生部门大数据统计,提炼所需教育、卫生统计数据;利用物联网、互联网等平台随时加工提炼所需的各种统计数据。
三、大数据在政府统计工作应用上的局限性
大数据为政府制定公共政策提供服务,通过集成各路信息、各纬度信息,带动产业互联,进而推动经济社会发展。大数据的作用和价值远远超出了人们的想象,但是就它本身而言,不能因为它有全面性而忽视它的局限性,正是由于大数据代表性和样本的偏差,使得我们不能在制定政府决策中全盘依赖大数据[3]。
(一)大数据无法保证可靠的数据来源
大数据从出现到发展,对政府统计产生了一定的影响,并带来了很多变化,但仍受到许多方面的制约,如大数据对现行的法律法规体系提出了挑战,数据的所有权、使用权、隐私权、治理权以及网络行为等如何去界定、如何去保护,已经成为世界各国政府关注的新课题。如果这些问题在立法上不予以规范解释的话,政府统计工作中的一些数据来源就得不到保障,所有权、使用权、治理权就不明确,政府统计全口径的数据支撑就得不到保证。
(二)大数据替代不了结构化数据
统计学常用的功能有两个,一是解释过去统计指标的变量分布,二是预测经济、社会和民生等领域的未来走向。解释过去统计指标变量分布这一功能是数理统计的强项,因为数理统计在人口统计、社会调查等诸多方面可以回顾历史。虽然大数据也能解释过去统计指标变量分布,但是由于大数据自身具有非结构化的特点,解释历史数据并不是其强项。在预测性上,虽然大数据对情报分析、个人情况分析、事物关联关系的分析、问题解析方面确有所长,但是由于大数据具有实时性和纪实性的特点,大数据通过已获得的数据建立起来的模型,不具备必然性和可重复性,一旦获得的数据有变化,这个模型就可能遭到否定,具有不稳定性。
(三)政府统计在大数据全方位应用上的难题
在我国电子政务建设的过程中,纵向垂直管理部门电子政务建设已经达到较高水平,但不同层级、不同部门等横向的电子政务建设水平比较滞后,政府各不同部门之间信息不畅通,还没有形成网格化,信息得不到及时共享和业务未实现协同。政府各部门之间数据共享存在壁垒。
目前,政府统计部门针对数据统计方法,已经提出了“二轨”的策略,即传统的统计是一轨,大数据的利用是二轨。通过完善基础统计数据资源,提升统计能力,提高数据质量,建立相应的标准,同时与大数据应用平台加强战略合作。现在看,只有构建适应大数据要求的统计机构体系、满足大数据要求的公共数据平台、打造与大数据要求相匹配的统计分析系统、构建符合大数据要求的数据发布模式,明确统计数据资源,明确社会性大数据的利用规则,才能促进统计工作的现代化进程。——论文作者:张宗飞
* 稍后学术顾问联系您