符合学术规范的学术服务

基于大数据共享环境下图书馆“区块链”技术应用研究

分类:科技论文 时间:2020-03-04

  〔摘 要〕 [目的] 图书馆作为公共产品其本质属性就是服务用户, 而提高服务质量是图书馆追求的第一目标。 在大数据时代, 图书馆只有掌握最先进的技术才能真正实现这一目标。 [方法] 大数据技术解决了图书馆信息服务的针对性、 有效性问题, 而 “区块链” 技术解决了图书馆信息收集多样性、 存储的安全性和传播的广泛性, 可以说它给图书馆服务带来革命性的变革。 [结果] “区块链” 技术使图书馆信息服务真正成为多中心、 安全存储和高效率的信息中心, 解决了传统图书馆技术中无法解决的一些难题。

基于大数据共享环境下图书馆“区块链”技术应用研究

  〔关键词〕 大数据; 图书馆; 用户服务; 信息; 收集; 区块链

  2016 年被称为 “区块链” 元年, 面对这一有可能带来颠覆性的新技术, 我国工信部等国家部委以及各省市给予了高度重视。 2016 年 10 月, 工信部信息化和软件服务业司指导编写了 《中国区块链技术和应用发展的白皮书》,对区块链技术的发展提供政策支持; 2016 年底, 贵州省发布了 《贵阳区块链发展和应用》 白皮书。 同时, 各地通过成立联盟 (中关村区块链产业联盟) 和研究机构 (青岛区块链研究院) 等方式大力推进其发展和应用[1]。 “区块链” 技术发展至今应用的领域越来越丰富, 从金融保险到跨境贸易, 从文娱版权到存证溯源, 而且 “区块链” 技术与大数据、 人工智能技术逐渐结合, 衍生出越来越多的应用领域。

  1 区块链技术与图书馆服务

  2017 年 9 月, 国内第一家 “区块链” 主题图书馆在深圳前海蛇口自贸片区揭牌。 虽然这是一则普通的新闻报道,但其背后的含义是一种新的图书馆业态的诞生, 同时也标志着图书馆信息服务一场革命性的变革从此拉开了序幕。据金色财经报道, 早在 20 世纪 90 年代中期, 美国图书馆服务研究所就成立了 “区块链” 技术运用于图书馆的数字管理中心。 基于区块链技术的公共图书馆系统试点, 解决图书馆和档案领域面临的挑战, 并且有可能利用新的工具、研究成果、 模型、 服务或联盟来推进图书馆和档案实践(金色财经 2017 年 9 月 5 日讯)。 基于大数据共享环境下图书馆 “区块链” 技术应用研究日益为图书馆服务的提升带来无限空间。 众所周知, 图书馆作为公共产品其本质属性就是服务用户, 而提高服务质量是图书馆追求的第一目标。在科技无限发达的今天, 大数据服务即是其服务的重要基础、 抓手和共享纽带, 也是图书馆高质量服务的必然选择和途径。 因为, 只有在大量数据分析的环境下才能研究用户区分用户, 充分满足用户的多样化需求, 细致到一个国家、 一个地区、 一个群体、 一类用户, 甚至是针对某个用户的真实需求进行超前预期判断。 只有这样工作才谈得上 “用户第一”、 “用户至上”, 才能充分实现印度图书馆学大师阮冈纳赞在其著名的 《 图书馆学五定律》 中提出的: “图书馆是一个不断生长着的有机体”。 “有机体” 代表的是图书馆本身, 是服务的基础, 而 “不断生长” 是图书馆对自身服务能力的无限追求和本领的不断增强。 现代图书馆的服务方式主要表现在如何把馆藏资源、 馆员、 服务、技术和用户这五个要素的有机体最大效率地组织在一起。图书馆界常常在思考这样一个问题: “有没有一条主线把这五个要素圆满地有机地串联在一起”, 形成一个能使服务发挥最大能量的最佳链条, 把图书馆服务能量与读者需求能量最大效率地结合与匹配。 以克服馆藏资源不足、 馆员素质不高、 服务质量不优、 技术手段落后的问题, 以及用户需求最大限度满足和积极引导的问题, “大数据” 技术的出现圆满地解决和回答了这一问题。 因为, 随着用户阅读需求日趋多元化、 个性化, 图书馆要想满足读者深度阅读、 深度研究及其多样的需求, 必须在技术服务层面上推陈出新, 在高度上深度挖掘。 可以说图书馆因科技发展而腾飞, 二者是密不可分的。 因为在大数据时代, 读者与图书馆发生的一切关系中, 哪怕是一个及其细小的动作,都会产生一系列电子地图和电子轨迹, 让图书馆研究每个用户、 每个用户群体的各种借阅习惯和学习需求成为了可能, 使图书馆在为用户的服务关系中, 始终处于一个掌握主动并且能够主动出击的地位, 可以说是 “利剑在手服务全有”, 图书馆用大数据服务用户的时代已经开启。

  既然大数据对于图书馆这么重要, 那么如何使信息收集更加准确、 存储更加安全、 传播更加有效就成为新的核心问题, 有没有哪项技术可以满足上述要求? 答案回答是肯定的, 就是 “区块链” 技术。 这一技术最大的特点就是最终解决了图书馆信息链中所有的技术难题。

  1、 1 “去中心化”技术

  “去中心化” 技术是利用分布式核算和存储, 不存在中心化的硬件或管理机构, 任意节点的权利和义务都是均等的, 系统中的数据块由整个系统中具有维护功能的节点来共同维护, 使人人都成为信息的提供者, 解决了信息收集的多样性问题。 这种技术方式大规模的使用, 使图书馆用户对图书馆的依赖程度大大减少, 客观上就迫使图书馆改变工作方式, 转变工作重心。

  1、 2 分布式账本不可更改技术

  分布式账本不可更改技术证明, 一旦信息经过验证并添加至区块链, 就会永久地存储起来, 除非能够同时控制系统中超过 51%的节点, 否则单个节点上对数据库的修改是无效的。 因此, 区块链的数据稳定性和可靠性极高。 以其 “不可篡改、 不可抵赖” 等特点带来了一种全新的信用模式, 解决了信息存储安全性问题。

  1、 3 “开放和共识”技术

  “开放和共识” 技术解决了信息传播的最大化问题,系统是开放的, 除了交易各方的私有信息被加密外, 区块链的数据对所有人公开, 任何人都可以通过公开的接口查询 “区块链” 数据和开发的相关应用, 因此整个系统信息高度透明[2]。

  可以说 “区块链” 技术与 “大数据” 技术的完美结合是图书馆起飞的无穷动力, 有了技术的飞跃发展才能有图书馆服务的巨大进步。 “区块链” 技术的工作原理非常简单, 但是理论非常深奥, 技术非常复杂, 它非常像我们平常召集人吃饭在微信上发信息接龙一样。 第一, 人人都可以组织饭局, 信息的提供者来源非常广泛; 第二, 人人都是监督者, 如果有人排序错误, 大家都会及时提醒; 第三,信息绝对安全, 因为没有中心者, 信息完整存储在每个人的手机上, 任何人都不能篡改; 第四, 传播范围广、 传播速度快, 传播影响力大, 可以说有多少人就有多少个传播者, 比传统的传播方式要提高千万倍。 深圳前海第一家 “区块链” 主题图书馆完美、 真实地把人们还处于想象中的学习关于 “区块链” 知识层面的东西赋予实践中, “区块链” 技术解决了传统图书馆技术中无法解决的一些痛点。 区块链原本是比特币等加密货币存储数据的一种独特方式, 是一种自引用的数据结构, 用来存储大量交易信息,每条记录从后向前有序链接起来, 实现了数据公开、 透明可追溯的产品的架构设计方法, 算作广义的区块链。 狭义的区块链仅仅涉及到数据存储技术, 数据库或文件操作等,这与图书馆信息服务一脉相承。

  2 “区块链”环境下图书馆重心的华丽转身

  “区块链” 技术使图书馆由信息的传播者向组织者和管理者转变。 信息的快速传播是图书馆生存的根本属性,是图书馆的压舱石, 但是在图书馆服务质量提升过程中读者诟病最多的就是信息更新慢, 数据信息慢、 图书慢、 杂志慢、 服务态度也慢, 这也是许多读者不愿意利用图书馆的一个重要原因。 而图书馆的公共属性决定了它的关注度在于大多数读者的广泛需求上, 而对个性化多样性需求很难满足。 在大数据时代, 用户的信息意识得到了极大的增强, 信息来源也越来越广泛, 需求也越来越迫切。 以往那种单一信息源的时代已经落后, 需要有一个中心对所有信息进行高效处理, 多方组织, 深入管理。 这个中心无疑就应该是图书馆, 这是基于图书馆本身的巨大实力以及用户的充分信赖这一公共属性所决定的。 这中间必要的条件就是必须要有相关的技术和平台, 以前之所以不成功的原因就是缺乏相关的技术手段。 今天 “区块链” 技术使图书馆由信息的传播者向信息的组织者和管理者的战略布局转移成为可能, 使图书馆的信息收集更加准确。

  2、1 区块链“去中心化”技术使信息收集来源多样化

  “去中心化” 就意味着 “多中心化”, 就信息而言恰好符合用户的需求, 因为用户对信息的多样性需求是与生俱来的。 传统图书馆基于公共属性几乎无法满足用户这一需求, 这几乎涉及信息体制、 成本、 人员、 流程和共享体系。 “区块链” 技术的多中心特征极大地满足了用户需求的多样性、 复杂性和个性需求, 弥补了图书馆公共属性中的缺憾。 而图书馆身份就是组织者和管理者, 要做的就是对信息进行打分和评级, 对外大力推介。 作法是可以把信息分成官方区、 自由讨论区、 核实区等等。 “区块链” 技术让大数据真正安全传递起来。

  2、 2 区块链“点对点传输”技术使信息准确率得到极大提升

  信息的准确率是其生命, 而信息的利用率是其 “活力”, 只有大力激活信息能量, 图书馆才谈得上服务效率的提升。 传统图书馆很难对馆藏信息进行适当的筛选和甄别, 然后分门别类地提供给有需求的用户。 一方面是大量信息的时滞; 另一方面是用户寻求无门, 完全由用户进行自我救赎, 信息利用效率大大降低。 图书馆只是成为了信息的搬运工, 而无附加值。 这一问题随着大数据的应用有所缓解, 但是信息激活需要的 “点” 越大越好, 力度越大越好。 而 “区块链” 技术中的点对点传输、 共识机制技术可以极大地把所有信息都公开呈现在用户的面前, 极大地增强了传播性, 进而极大地提高了利用率。 任何用户都可以对所发布的信息进行评点和提出改正意见, 尤其是相关利益人, 在彼此讨论中, 信息经过多层过滤往往最趋近真实。

  3 区块链“不可篡改、 强背书、 全历史”技术确保存储安全性

  信息存储安全是信息服务的根本保障, 也是核心的问题。 如果这一工作做不好一切都是无用功, 相反还会带来巨大的灾难, 尤其是馆藏特色资源一旦被串改, 就会给历史给社会带来一系列不可估量的损失。 数字图书馆是用数字作为技术处理和存储的方式, 对图书馆各种图文资料进行存储, 实质上就是一种多媒体制作的分布式信息存储系统。 它把各种不同载体的资料、 不同地理位置的信息资源用数字技术存储起来, 以便于所有跨越区域的用户进行信息的网络查询和传播。 数字图书馆业务涉及信息资源加工、存储、 检索、 传输和利用的全过程。 在新技术提高图书馆使用效率的同时, 也引入了大量的安全风险和隐患, 成为[WU1] 网络攻击者攻击的目标, 可以说安全风险问题从有数据概念开始就一直伴随其左右。 公共图书馆掌握着大量高密度、 高价值的数据, 尤其是用户需求数据, 是其最独特资源。 大数据开放是社会客观要求和大势所趋, 越开放其价值越大, 从而对整个经济社会的前进和发展产生一系列推动力。 然而, 在大数据开放的模式下如何保护个人隐私和馆藏资料数据成为主要难点和挑战, 其次才是开放大数据服务。 区块链技术是利用块链式数据结构来验证与存储数据、 利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的安全, 利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算方式。 “区块链” 技术中的数据脱敏技术极大地保证了数据的私密性。 其运行原理是根据密码学原理 Hash ()函数的单向性: Hash (x)= y, 通过 y很难找到 x。 哈希链: 假如现在有顺序产生的数据块 A、B、 C。 那么我们可以这样计算一个 Hash。 注意 “‖” 表示拼接 h0 =Hash (A); h1 = Hash(B | | h0); h2 = Hash(C | |h1), h2 是我们计算的 Hash 头部, 之所以称之为 Hash 链,因为 h2 的值依赖于之前一系列数据的内容和计算顺序。 假如说现在你知道了 h2, 别人拿着 A、 B、 C, 他不管是修改A、 B、 C 的任一点内容还是 A、 B、 C 的出现顺序, 你都无法再次计算出正确的 h2。 利用世界最先进的哈希处理技术等加密算法, 可以使数据进行脱敏处理, 比如基于 “区块链” 技术的英格码系统 (Enigma), 在不访问原始数据情况下进行一系列数据运算, 可以对数据的私密性进行保护,杜绝数据共享中的信息安全问题, 从而避免了来自多个方面的漏洞对图书馆的威胁。

  .3、 1 “区块链”技术使外界攻击变得几无可能

  “区块链” 技术具有不可篡改、 强背书、 全历史的数据库存储技术, 本质上就是一个去中心化的数据库, 它利用一串使用密码学方法相关联产生的数据块, 其中每一个数据块中都包含了一次信息网络交易数据, 用于验证其信息的有效性和生成下一个区块。 其中的原理是, 假如网络中大家都默认遵守协议, 只在最长的哈希链后计算新的头部, 那么一切都很好, 但是如果有人想篡改、 搞不一样技术, 那他就得拥有更为强大的计算能力, 能够计算出一个链条分叉, 或者说直接计算出一个新的链条, 让大家都承认, 而这几乎是不可能做到的事情。 至于这个难度的证明,中本聪就是建立了一个泊松分布的概率模型, 假设了诚实结点计算出新的哈希头的概率 p 和不诚实结点计算出新的Hash 头的概率 q 后, 算出了一个 N 值。 这个 N 值的含义是给出了当一个新的哈希头部 h1 计算出来后, 其后追加 N个头部(h2,h3,h4,…) 后, 网络才应该承认这个新的头部h1。 因为此时, 攻击者要想成功发动攻击, 至少需要计算出一个长度大于 N 的分支, 这个概率在攻击者没有掌握全网算力 50%的时候是很难达到的[3]。 它通过网络中所有节点共同参与共同计算, 互相彼此验证其信息的真伪以达成全网一致的共识, 可以说 “区块链” 技术是一种特定的数据库技术。 因为 “区块链” 是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构, 并以密码学方式保证的不可篡改和不可伪造的分布式账本。 保证了 “区块链” 数据难以篡改, 代表诚实节点的最长的链包含了最大的工作量, 如果想要对业已出现的区块进行修改,攻击者必须重新完成该区块的工作量外加该区块之后所有区块的工作量, 并最终赶上和超越诚实节点的工作量。 工作量最多的链, 一定是数据最完整的链, 一定是代表了全网用户利益的链[4]。 人们都说 “区块链” 其实是一种去中心化的分布式记账手法, 什么意思呢? 例如在影视剧中常常会出现这样一些桥段: 某人贪赃枉法, 事情败露后, 大家却找不着那个关键证物———账本, 因为账本记录了彼此交易的详细信息, 于是大家根据各种线索去找账本才能侦破此案。 而 “去中心化” 的意思就是根本不存在这个账本的问题, 不是某个人或者某个中心化的主体来控制, 而是所有节点共同维护、 共同记账, 任何单一节点都无法篡改它。 这条链上拥有永久和透明可查的交易记录, 全球一本账, 每个人都可以查找。 同时, 一旦记录完成, 就会永远存在并且无法更改, 这可以为图书馆信息的存储保护提供最完美解决方案。 就拿图书馆大量存储的文本资料来说,该技术有一大功能就是可以全程追溯, 从作品登上 “区块链” 的那一天开始, 每一次翻拍、 改编, 均会被盖上一个时间戳、 源头的原创作者可以追溯, 在作者去世后 “区块链” 也不会停止工作。 原则上, 只要互联网继续存在, “区块链” 技术就会永远存储相关资料。 这一技术也可以在一定程度上改善一个大 IP 授权紊乱的现象, 毕竟, 这是一种共同记账的模式, 单一节点不可随意篡改, 每次篡改必须是这一链条上所有节点均同意才行, 用户以后再也不会被无数翻拍乱花迷人眼了[5]。 第一, 它避免了安全漏洞频发。 系统漏洞的频发给业务系统的安全运行造成极大的威胁, 恶意入侵者可以利用此漏洞, 通过发起恶意扫描和远程溢出等攻击方式, 进入数字图书馆业务处理系统的后台, 以获取、 篡改甚至破坏敏感的数据手段来破坏整个网络的正常运行。 香港公共图书馆 RFID 存在漏洞致使手机 1分钟即可篡改借书 RFID (无线射频辨识) 是现在常见的一种无线通信技术, 究其原因是图书馆安全识别系统没有进行加密处理装备, 因此, 用户只要利用智能手机再配合一些应用程序, 即可轻易更改借书纪录, 并将有关书籍资料带离图书馆, 1 年的时间图书馆因遗失而注销的资料总数为 926 项。 第二, 它避免了数据库安全受到极大威胁。大数据是数字图书馆的生命, 准确而完整的数据库是图书馆自动化管理的核心和开展工作的基本保证。 但是内部人员蓄意的侵犯或其他敌意的攻击, 如一些心怀不满的授权用户可能基于某种目的蓄意破坏数据, 从而使数据库中的部分数据出现丢失或数据更新不一致的情况。 因网络安全问题导致数据丢失或信息被盗使图书馆大数据屡遭重大损失。 比如河南封丘图书馆网站未采取防范措施遭黑客篡改网页, 经查封丘县图书馆未采取防范计算机病毒和网络攻击、 网络侵入等危害网络安全行为的技术措施, 致使网站遭到攻击。 第三, 它避免 Web 应用层攻击。 攻击者通常通过 SQL 注入、 跨站脚本等攻击方式, 很容易获取图书馆网站的管理权限, 进而篡改网页代码, 加入恶意网站连接或恶意程序, 造成极其恶劣的影响。 第四, 它避免拒绝服务攻击。 拒绝服务攻击造成数字图书馆业务中断, 数字图书馆信息系统作为一个重要的业务信息平台, 很容易受到攻击者恶意的大流量拒绝服务攻击。 由于拒绝服务攻击具有发起简单、 难于追查、 危害巨大三大特点, 具有非常大的破坏性, 很容易造成系统瘫痪, 无法提供服务。 第五, 它避免人为失误及权限管理。 人为失误及业务权限管理问题也是图书馆数据面临的主要风险, 人为管理失误包括弱口令, 不正确的共享、 应用系统的错误使用等问题。 权限管理问题包括内部人员对业务应用系统的越权访问、 违规操作或者操作人员直接的错误输入导致系统宕机等。

  3、 2 区块链技术“永久存储”属性避免突发事件造成的巨大遗憾

  突发事件可以说是伴随人类而生, 有人类就有一系列突发事件。 突发事件可被理解为突然发生的事情, 具有速度很快, 出乎意料, 难以应对, 必须采取非常规方法来处理, 不管怎么说突发事件都会给图书馆带来巨大的无法弥补的损失。 图书馆作为重要的突发事件防范区域也是避免不了被毁坏的后果, 尤其是馆藏特色资料, 其具有唯一性、不可复制性, 一旦毁坏不可重生, 这对图书馆和社会都是毁灭性的打击。 1951 年 1 月 8 日, 青海省图书馆发生大火, 烧毁其全部馆藏, 甚至包括罕见的用金粉写成的 《甘珠尔大藏经》 108 部和价值连城的宋朝壁画 36 幅。 还有1991 年 2 月 13 日, 福建省建筑专科学校图书馆发生了人为纵火事件, 诸如此类的 “文明劫难” 并不罕见, 它带来不可弥补的巨大损失, 尤其是一些弥足珍贵的绝版、 孤本、善本及古玩字画, 一旦焚毁, 会造成历史性的遗憾。 同时随着这些珍贵资料母本的消失, 图书馆记录这些资料的大数据也有可能消亡, 因为资料是孤本, 大数据在不共享的情况下也是孤本。 “区块链” 技术具有分布式数据存储特点, 可以极大地避免以上问题的出现, 它可以完整保存关于孤本的所有大数据。

  相关期刊推荐:《现代情报》杂志是由中国科技情报学会主管,吉林省科技信息研究所主办,全国公开发行的大型软科学综合性期刊,是集情报科学理论与情报实践研究及图书馆学研究于一体的学术阵地。主要栏目有:理论探索、方法研究、应用研究、业务研究、技术视角、管理论坛、国外动态、综述与述评等。欢迎社会各界专家、学者及广大图书情报工作者踊跃撰文赐稿。

获取发表周期短、审稿速度快、容易录用的期刊

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询