符合学术规范的学术服务

国际视域下数字图书馆研究的现状分析———基于 WOS 核心合集数据库的文献计量分析

分类:管理论文 时间:2021-07-17

  [摘要]自美国数字图书馆计划启动之时,国外就掀起了对该领域探索的热潮。因此,关注国外数字图书馆领域的研究现状,对研究数字图书馆领域具有重要的基础意义。研究以WOS核心合集为数据源,检索“数字图书馆”领域的文献,运用R语言、文献计量法、文献调查法和内容分析法对样本文献的发表年份,高影响作者、文献、期刊及机构进行多角度分析,以ggplot函数生成相关可视化图谱。研究发现,国外数字图书馆领域的研究文献增长已趋于稳定、研究程度已趋于成熟;在数字图书馆领域内的各学科知识交叉流动日益明显、跨学科性突出;当下国外对该领域的探索更加细微、切入点更加多元、应用方法更加科学、研究层次更加深入。

国际视域下数字图书馆研究的现状分析———基于 WOS 核心合集数据库的文献计量分析

  [关键词]数字图书馆R语言知识图谱可视化

  1引言

  “美国数字图书馆计划”于1994年启动[1],自此作为传统信息时代图书馆的延伸与扩展[2]———数字图书馆开始出现。历经数十年的快速发展,数字图书馆已成为集数据资源为一体、以用户为中心、以各种信息技术为手段的综合分布式平台[3]。随着人类进入到数据科学社会,数字图书馆的研究和建设受到了前所未有的重视,学界针对数字图书馆领域进行了多维度的深入探索。国外已有学者对该领域相关研究成果做了综述,较有代表性的是:里乌利用发表在图书情报科学期刊上的577篇文献进行计量分析,重点关注组织和人的问题,包括哪些涉及社会、文化、法律、道德和使用维度的问题[4];吉姆采用仿形分析、平行最近邻聚类和基于聚类的网络方法分析“数字图书馆”的相关研究领域[5];狄克玛在对四个不同数据库进行全面检索的基础上,分析了多语种数字图书馆的核心文献,并对这一主题的文献进行了阐述[6]。但经过十余年的发展,国外数字图书馆研究领域已出现许多新的研究分支与生长点,并产出了很多新颖的研究成果[7]。因此,重新对国外数字图书馆的研究发展情况进行系统梳理是很有必要的。本文以R语言为分析工具对相关文献进行了深入分析探讨,以期为后续相关研究作出一定的贡献。

  2数据来源及处理

  为精选研究样本,文献选取WOS核心数据库为数据源,并行设置“Subject”和“Title”均出现“digitallibrary”的检索条件,时间框选定为2006年初至2019年末,检索并导出全记录与引用的参考文献共计990篇样本文献。本文采用“R语言+文献计量分析法+文献调查法+内容分析法”对研究样本进行分析。

  首先,通过R语言自编程序分别提取出文献的发文时间、高被引作者、高被引文献、文献所属期刊以及文献产出机构这五个要素所对应的数据。其次,清理提取出的数据:在文献发文时间分析中,检索并剔除空值年份的文献,共计得到990篇有效文献;在高被引作者分析中,通过自编程序对作者进行消歧工作(包括剔除匿名作者),计算得到作者的全局被引次数(TC)与本地被引次数(LCS),选取出TC值与LCS值排名在前20位的作者(共计35位作者);在高被引文献分析中,提取出选定样本的TC值以及本地21981条参考文献所产生的LCS值,选定排名在前20位的文献(共计33篇)配以“作者+出版时间+期刊简称”的关键信息;在文献所属期刊的分析中,提取出“J”类型的期刊文献共计947篇,利用布拉德福定律进行核心区、中间区、后继区的计算;在文献产出机构分析中,通过检索出文献样本所属“Institute”数据,对产出自同一机构的文献进行累加,并将其按照降序排列;然后利用ggmap、cowplot等程辑包和ggplot函数分别生成发文时间分布图谱、高影响作者图谱、高影响文献图谱、高影响期刊图谱、以及高影响机构发文散点图,最后以控制台运行plcstop函数获取各文献DOI编号,以便检索到对应文献进行内容深度解析。

  3研究结果

  3.1发文时间分布

  文献发表时间的分布情况可以在一定程度上反映该研究领域某阶段的研究情况。在图1中,横坐标为年份,左边标尺为年均发文量,右边标尺为总计发文量,红色折线对应年均发文量,蓝色折线对应总计发文量。

  3.1.1发文时间阶段研究研究

  结果表明,国外数字图书馆领域的相关研究大致经过了三个阶段,第一阶段为快速萌芽期(2006-2008年),发文量共304篇,年均达101篇,且在2006年,发文量达到顶峰(136篇),这一阶段仅为3年,但研究内容已涉及到数字图书馆领域的多个方面,如数字图书馆的使用、发展、咨询服务方面,影响用户使用的因素方面以及用户使用的意愿等,为后续研究做了重要的铺垫。第二阶段为发展波动期(2009-2015年),发文量共487篇,年均69篇,这一阶段持续了7年,发文量上下摇摆度大。随着计算机分析与图谱绘制工具的出现,在该研究阶段计算机科学领域与图书情报科学领域具有较大的交叉强度,评价模型、知识系统与复杂算法的探索与实证成为该阶段的重要研究内容。第三阶段为稳定增长期(2016-2019年),发文量共199篇,年均49篇,此阶段处于国外数字图书馆研究领域的成熟时期,发文量没有出现很强的波峰,研究者多关注于数字图书馆的系统评价模型和未来发展趋势等方面,在该阶段各领域的交叉融合度进一步加深,数字图书馆领域的跨学科性进一步彰显。

  3.1.2发文峰值点及趋势研究

  从图1可以观察到有两处高峰值年限点(2006年,2014年)。2006年收录的文献数为136,在图中处于最高值。这是由于在2006年,以美国为首开展的数字图书馆项目在世界各地纷纷启动,各国对数字图书馆领域开始了不同程度的探索。其中,美国在2006年产出了59篇文献,占全年数量的43.38%,为该领域贡献最多的国家;而中国总计产出5篇文献,占比仅为3.68%。相较于美国的探索程度来说,我国此时仍处于萌芽阶段,研究进展相差悬殊。在2014年,美国产出26篇文献,占全部文献量的28.89%,仍居于贡献榜首,而中国共计发文12篇,占比12.22%。相较于前一峰值点,中国产出文献占比和产出文献数均有大幅增长,反映出中国对数字图书馆领域的研究进入了加速发展阶段。

  从整体趋势上看年均发文数量呈下降趋势,这并不是说明该领域不受重视,主要原因在于国外针对该领域的研究已达到稳定期,经作者计算,得到该领域的总体发文趋势线为y=65.903x+99.582,R2=0.9856,R2趋近于1,预测该领域在2020年的发文总量将保持在50篇左右,总体呈稳定增长的态势。

  3.2高影响作者分析

  为进一步分析该领域内的高影响力作者,文献通过TC与LCS指标对作者进行学术评价。TC是指被WOS核心数据库全局引用的总次数,LCS是指在特定领域内被引用的总次数,在本文中特指WOS核心数据库中的数字图书馆领域。将两图中重复出现的作者用底线标注,研究结果如图2所示。

  3.2.1作者整体分析

  由图可知,在TC图与LCS图均出现的作者共有五位,分别为埃雷拉·维德玛、弗里亚斯·马丁内斯、陈淑珍、谢鸿、加布里佐,其中作者埃雷拉·维德玛以被引558次在TC值排名中居于绝对领先的位置,其被引用次数为绝大多数作者均次的4-5倍。经R语言解析发现该作者的发文多围绕决策算法、层次模型、系统模型等主题,主要被计算机科学与技术领域、信息科学与工程领域、图书情报科学领域引用,一方面说明了该作者产出的文献质量高、影响力大,受到了相关研究领域的重视;同时表明了该作者产出文献的可交叉性、可适用性、可融合性较高,在一定程度上加速了跨学科领域的融合与发展。在TC值中位居第二位的作者波塞尔被引次数也较高(322次),经分析该作者的文献多以模糊决策、复杂算法、推荐系统为研究主题,其发文主要被计算机科学与技术领域、知识系统领域、图书情报科学领域所引用。值得注意的是,该作者就数字图书馆设计了多学科资源推荐服务系统,为后续资源推荐系统的研究做了重要支撑。同时,考察到波塞尔与埃雷拉·维德玛有多次科研协作,这也是该作者被引次数较高的原因之一。通过对TC值为100左右的作者进行考察,发现大多数作者的研究方向均不唯一,主要分布在数字图书馆领域用户行为研究方面、用户需求实证研究方面,数字图书馆系统搭建、应用与评价方面和计算机科学与技术领域复杂算法、系统模型方面,所采用的研究方法也涉及到多个学科门类,促进了不同领域之间的知识流动。

  从LCS图中可知,相邻作者被引次数相差较小,并没有出现TC图中的断崖式下降。但是,最大值与最小值的差值也达4倍之多,这与TC图基本保持一致。作者谢鸿以LCS值42居首位,说明在数字图书馆特定领域内,作者谢鸿具有重要的领头作用。分析其相关文献,发现该作者的高被引论文均为数字图书馆评估与评价研究方向。随着数字图书馆的发展,采用什么样的评估体系与如何评价数字图书馆是必不可少的方面;且该作者的发文多集中于《Evaluationofdigitallibraries》系列图书,这也是该作者在数字图书馆领域引证高的原因之一。LCS图中的其他作者,可认为是数字图书馆领域内的中坚作者。通过分析其发文分布,发现数字图书馆体系、用户与数字图书馆、数字图书馆服务是重点研究方向。因多数作者研究方向不存在绝对的专一性,所以后续研究者就自身研究点在引用文献时具有一定的主观选择性,从而使得中坚作者被引情况呈现温和下降的局面。

  3.2.2作者位次变化分析

  对比两图中同一作者的位次变化可知,有3位作者位次下降,2位作者位次上升。其中,弗里亚斯·马丁内斯下降了14位,是下降位次最多的作者;埃雷拉·维德玛下降1位;陈淑珍下降了2位;谢鸿上升了6个位次,是位次上升最多的作者;加布里佐上升了3位。分析得出,在TC图中研究者普遍涉及到两个或多个研究领域,研究范围大幅度交叉,因此施引作者也分布在计算机科学、工程科学、管理学、图书情报学等多个领域。例如作者埃雷拉·维德玛就语言评估背景下研究了群体决策一致性模型,该文献在计算机科学领域、工程科学领域、图书情报领域均有引用且频次不一,说明该文献具有较强的普适性和奠基性,也解释了该作者在TC值中位居前茅的原因,佐证了该作者的学术影响力。对于下降位次较多的作者也可做相同的解释,但这不能说明该作者的学术能力弱,只能说明该作者的论文还未被特定领域所大范围引用。另外,本文认为位次上升的作者是数字图书馆领域研究的专攻员,如作者谢鸿发文大多为数字图书馆评估体系方向,被引次数高说明该作者产出的文献质量优越,为该分支研究领域作出了重要贡献。

  在TC图与LCS图中,有30位作者只出现一次,这说明不论是在WOS全局核心数据库中,还是限于数字图书馆领域,研究者对于该领域有着较高的关注度,且因绝大多数作者的研究方向均涉及多个研究领域,研究方法也常出现交叉或借鉴,也在一定程度上印证了数字图书馆是学科背景丰富、融合度高、交叉性强的研究领域。

  3.3高被引文献分析

  高被引文献是一个领域研究发展中支柱性的存在,对领域的发展有着重要的导向作用,本研究同样以TC、LCS指标去勘探数字图书馆领域的高被引文献,TC图是选定文献在核心数据库中被引用次数的可视化展现,LCS图是在本地21981条参考文献中生成,将两图中重复出现的文献用底线标注。

  3.3.1文献整体分析

  由图可知,在TC图和LCS图中共现的文献共计7篇,主要涉及到数字图书馆推荐系统方向、数字资源整合方向、数字图书馆的评估方向和用户研究方向。作者波塞尔以文献被引154次居首位,其被引次数为最低文献被引次数的3倍左右,该文献提出了一种模糊语言推荐系统,能够更好的获取用户偏好,以此方便数字图书馆资源的充分利用。经R语言分析其引文网络发现,该文献的被引领域高达29个,其中引用次数最多的是计算机科学领域、信息系统领域以及跨学科应用领域,充分表现出该文献的跨学科性和多元融合性。TC图中其他文献从不同方法、不同维度、不同时间上进行研究,绝大多数文献均涉及到2-3个研究领域以及不同学科的研究方法,从不同的学科背景推动了该研究领域的进展。

  文本观察到在TC值图中,作者波塞尔与作者谢鸿均产出2篇文献,但作者波塞尔产出的2篇文献均没有在LCS图中出现,原因在于这2篇文献的内容均具有较强的学科交叉性,多被计算机科学人工智能领域、计算机科学信息系统领域所引用;此外,LCS图仅展示选定样本的在数字图书馆领域前20位高被引文献,经R语言查看后续排名验证,发现这2篇文献均在图书情报学领域被引用5次。

  在LCS图中,相邻文献被引次数差值随名次下降而缓慢下降,但是,首末文献的被引次数也差3倍之多,这与TC图基本保持一致。其中,作者谢鸿在2008年产出的文献以23次被引居首位,该文从用户角度出发,阐述了用户看待数字图书馆评价的标准和问题。这篇文献在数字图书馆评价、数字图书馆评估体系、数字图书馆用户研究中均有引用。LCS图中的其他文献,均可认为是数字图书馆领域的专研文献,对于数字图书馆分支领域的发展具有重要的意义。

  3.3.2文献时区分析

  在选定样本中2008年,2012年产出高被引文献最多,分别为9篇,5篇,可认定是对数字图书馆领域做出重要贡献的年份。考察2008年与2012年的高被引文献内容,发现主要的研究方向是数字图书馆的服务改进与相关建议、对图书馆质量的评估以及用户与数字图书馆系统的关联,其中最有代表性的观点有:作者诺吾奥德在2008年以个人差异和系统特征作为感知易用性的决定因素,探讨了“抗拒改变”RTC与高校数字图书馆感知易用性之间的关系,提高了数字图书馆被使用的效率与质量[8]。作者唐杰在2012年提出了一种动态估计人数进行名称消岐的两步参数估算法,并提出优于聚类算法的概率框架,为模糊消岐工作做出了巨大的贡献[9]。与此同时,作者谢鸿以用户为基点,让用户亲身体验两个数字图书馆,并写出他们的评价标准与评估结果,进一步探讨了数字图书馆评价标准的感知重要性、数字图书馆的使用与数字图书馆评价之间的关系以及用户对数字图书馆评价的偏好、经验和知识结构[10]。

  3.3.3文献位次变化分析

  在共现的7篇文献中,作者谢鸿产出了2篇文献。考察这7篇文献的位次变化发现:作者帕克在2009年发表的一文由左图第2名下降到右图第18名,下降了16位,是下降名次最多的文献,作者诺吾奥德在2008年发出的文献也由TC值第7位下降到15位,下降了11个位次,罗斯在2008年产出的文献上升了3个位次,作者查克纳斯在2008年产出的文献由位次14上升到第9位,同时作者施里法马迪在2008年产出的文献也由TC值排名中的18位上升到了LCS图中的第11位,而作者谢鸿的两篇文献均呈现不同位次的上升情况,其中一篇从位次11上升到第3位,另一篇从位次15跃居到LCS图首位,是上升位次最多的文献。

  文献位次下降并不表明该文献质量低、影响力低。相反正是该文献具有一定影响力的体现,因为文献是被多个领域所引用,只是某一文献在数字图书馆领域中被引数较低;又因文献研究的方向较为独特、切入点不同,也是导致引用数量较低的因素。如作者帕克在2009年发表的论文:以发展中国家为切入点,从宏观出发探索影响各国用户使用数字图书馆的因素,并为促进发展中国家成功采用数字图书馆系统,借用技术接受模型ATM测试数字图书馆在发展中国家的适用性[11],通过引文网络分析发现该文献被25个领域的不同作者所引用,引用领域并不集中于数字图书馆领域,但在本文限定核心数据库数字图书馆领域中的21981条参考文献中,被引用次数不是那么高。针对在TC图转向LCS图位次出现上升的文献,可判定为专研数字图书馆领域的文献。最具代表性的是作者谢鸿在图书中《DiscoverDigitalLibraries》刊登的两篇文献,分析其内容发现两篇文献均为从用户的角度探寻数字图书馆的评价标准,并基于用户主体的判断标准汇编了质量收集量表,最后借助分析结果揭示了当前数字图书馆设计与开发中存在的问题,提出改进数字图书馆设计的建议[12]。该文认为数字图书馆的评估不仅要确保其正确的演化,而且要得到用户和应用群体的接受。这个观点在现在看来仍具有至关重要的意义,因此在数字图书馆领域中存在较高的引用值。

  3.4高影响期刊分析

  因高影响文献在一定程度上对所属期刊有影响,所以本文在高影响文献的基础上,继续分析该领域的高影响期刊。本文样本数据仅来自于WOS核心数据库,并不能代表整个领域的研究状况,因此会在计算数值上产生相对偏差,但布拉德福定律仍对我们探寻该领域的高影响期刊具有一定的帮助。借助R语言得到核心区期刊散点图,如图4。其中主图是按照布拉德福定律绘制的核心期刊图(因图幅面积有限,仅展示核心区期刊名称),辅图是按照核心期刊年均载文量进行统计说明的期刊散点图。——论文作者:孙宗缘1马秀峰2

  相关期刊推荐:《河南图书馆学刊》杂志创于1981年,双月刊,是由河南省图书馆主管,河南省图书馆学会和河南省图书馆主办内外公开发行的图书类期,内容主要包括图书馆学理论研究,图书馆工作经验交流以及普及图书馆知识。主要读者对象是广大图书馆工作者和情报工作者。以贯彻党的“百花齐放,百家争鸣”的方针,促进图书馆学理论研究、交流图书馆工作经验,普及图书馆知识

获取发表周期短、审稿速度快、容易录用的期刊

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询