基于知识图谱的国内机构知识库研究现状分析与展望
Analysis and Prospect of Domestic Institutional Repository Research Based on Knowledge Map
通讯作者:
Corresponding authors:
对我国机构知识库建设的相关研究进行文献检索与梳理,得出机构知识库的研究发展现状与趋势,以期给机构知识库的深入研究提供借鉴。以CSSCI期刊中821篇关于机构知识库的文献为研究对象,分析其年度分布、作者及机构发文与合作情况,并且运用DDA、UCINET、VOSviewer、Citespace等软件绘制知识图谱,总结机构知识库的研究热点。研究结果表明,我国学者对机构知识库研究的重视程度不断提升且研究不断深入。不同学者和机构就机构知识库领域的研究生产力、影响力差异较大,部分学者和机构也在机构知识库领域开展了密切的合作研究。我国机构知识库的研究热点集中在机构知识库对数据管理及知识服务的作用研究、国外机构知识库建设研究、机构知识库技术模型研究、机构知识库在各个专业领域的应用研究及机构知识库的政策研究等方面。
关键词:
This paper sorts out the related research on the construction of institutional knowledge base in China, and obtains the research status and development trend of institutional knowledge base, in order to provide reference for the further study of institutional knowledge base. This paper takes 821 articles about institutional repository in CSSCI journals as the research object,and analyses its annual distribution, authors institutions and cooperation, and summarizes the research hotspot of institutional repository by using the DDA, UCINET, VOSviewer, Citespace software knowledge mapping. The results show that Chinese scholars pay more and more attention to the research of institutional repository. Different scholars and institutions have different research productivity and influence in the field of institutional repository, and some scholars and institutions have also carried out close cooperative research in this field. The research hotspots of institutional repository in China focus on the role of institutional repository in data management and knowledge service, the construction of institutional repository abroad, the technical model of institutional repository, the application of institutional repository in various professional fields and the policy research of institutional repository.
Keywords:
本文引用格式
陈洁, 刘桂民.
Chen Jie, Liu Guimin.
1 引言
在机构发展壮大的过程中,文献资源的类型不断丰富,内容日益繁杂,如何做好科研生产过程中的资源管理尤为重要。20世纪90年代末期,开放存取运动在国外兴起,2002年11月4日,麻省理工学院图书馆与惠普实验室合作发布DSpace数字空间系统,致力于打造一个科研机构可以收集、存储并且下载使用的数据库系统,国外学者们意识到数字资源的存储和共享的重要性[1]。而我国机构知识库的研究起步较晚,21世纪初,机构知识库的研究才引起我国学者的重视,以中国科学院为代表的科研院所系统和中国高等教育文献保障系统(CALIS)牵头的高校系统,陆续开展了一系列机构知识库建设的实践,取得了一定的研究成果。近年来国外机构知识库发展迅速,根据OpenDOAR截至2021年4月的数据显示,OpenDOAR收录的美国机构知识库共905个,远超其他国家,其次是日本和英国,机构知识库数量也都在300个以上。中国注册的机构知识库数量只有120个,差距显著。
机构知识库保存、共享文献资源,不仅大大提升机构内部资源管理水平、完善绩效考核体系,还有利于成果的传播共享,提升机构影响力。同时,机构知识库成果的展示与检索一方面便于学者检索丰富的学术资源,另一方面利于管理个人的学术成果。本文希望通过回顾我国机构知识库的理论与实践,给机构知识库的研究者和工作人员提供帮助,并为今后我国机构知识库的建设提供参考。
2 数据来源与分析方法
2.1 数据来源
本文选取中国知网的中国期刊全文数据库作为数据来源进行文献分析。采用高级检索方法,以“机构知识库”为主题,期刊来源为CSSCI期刊,截至2019年共获得相关文献821篇,再次采用高级检索方法,以同样主题词和时间为检索条件,不限期刊来源,检索到相关文献1 501篇。
2.2 分析方法
使用Derwent Data Analyzer(DDA)软件清洗文献数据,对作者、机构及关键词进行合并;使用VOSviewer软件绘制作者及机构合作的知识图谱;利用CiteSpace进行主题聚类,总结机构知识库的研究热点。
3 结果分析
3.1 文献的年度分布
1996–2019 年,发文量总体呈上升趋势(图1)。基于发文量年度分布,可将机构知识库的相关研究分为三个阶段:起步发展阶段、快速增长阶段及拓展创新阶段。
图1
1996–2008年为起步发展阶段,这13年内有关机构知识库的研究文献为131篇,年均发文量约10篇,其中,2005年开始才有机构知识库的相关文献收录在CSSCI期刊中。21世纪初,开放存取的概念引入我国,学者们开始探讨开放存取的必要性和意义,并且开始研究我国图书馆面向开放存取趋势的应对策略,机构知识库的研究在我国起步。
2009–2015年为快速增长阶段,该阶段的发文量为862篇,占机构知识库研究领域总发文量的57.4%。此外,收录在CSSCI期刊的文献量达到492篇。国内学者开始关注机构知识库领域,越来越多的机构和学者了解到机构知识库的概念。2012年,国家科学图书馆举办“中国开放获取周”国际研讨会,成立中国机构知识库推进专家组,推动科学界对开放获取的关注以及机构或国家层面相关政策的实施。此后每年我国都会举行不同主题的中国机构知识库学术研讨会,在高校和科研院所展开了机构知识库的实践热潮,研究成果显著。
2016–2019年为拓展创新阶段,这四年关于机构知识库的发文量为508篇。2015年发文量达到峰值之后有所回落,这是因为机构知识库的相关发文主要集中在图书情报界,经历了快速蓬勃发展期之后,本领域的机构和学者对机构知识库的理论与实践研究热度有所下降,且未从图书情报界拓展到其他学术领域。2018年后,我国开始创新机构知识库发展的方向,不再局限于已有的功能和技术,而是将机构知识库与科研评价、科研服务等多样化模式相结合。这一阶段机构知识库的相关研究在新的领域得以拓展,发文量有所上升,相信在未来还会呈现蓬勃发展的趋势。
3.2 作者发文及合作分析
3.2.1 作者发文分析
以CSSCI期刊收录的821篇论文为研究对象进行全作者统计,共涉及1 057位作者。表1列出发文量大于等于10篇的作者。这13位高产作者分别隶属于5个机构,其中,8位来自中国科学院,2位来自北京大学,其他分别来自山东理工大学、湘潭大学和吉林大学。发文量最高的是来自中国科学院的祝忠明,共32篇,论文发表时间分布在2008–2019年,在机构知识库领域持续产出。
表1 主要作者发文量
序号 | 作者 | 发文量/篇 | 所属机构 |
---|---|---|---|
1 | 祝忠明 | 32 | 中国科学院 |
2 | 张旺强 | 16 | 中国科学院 |
3 | 刘 巍 | 15 | 中国科学院 |
4 | 顾立平 | 15 | 中国科学院 |
5 | 姚晓娜 | 13 | 中国科学院 |
6 | 张晓林 | 13 | 中国科学院 |
7 | 刘文云 | 11 | 山东理工大学 |
8 | 崔海媛 | 11 | 北京大学 |
9 | 聂 华 | 11 | 北京大学 |
10 | 马建霞 | 11 | 中国科学院 |
11 | 卢利农 | 10 | 中国科学院 |
12 | 肖可以 | 10 | 湘潭大学 |
13 | 邓 君 | 10 | 吉林大学 |
图2为论文总被引频次大于等于150的学者,张晓林排名第1,总被引频次达512次,其次是祝忠明和李麟,总被引频次也在400次以上,这些学者在机构知识库领域的研究成果具有较高的影响力。在这些高影响力学者中,曾燕的论文篇均被引频次最高(69次),刘细文(55.67次)和柯平(47.5次)紧随其后。
图2
3.2.2 作者合作分析
利用Ucinet对作者合作情况进行分析,并且使用VOSviewer绘制作者合作图谱(图3)。在机构知识库研究领域一共形成了16个作者合作团体,其中有5个团体的成员数量不少于5位。(1)以祝忠明、张旺强和刘巍等学者为核心的中国科学院研究团队,他们为了选择适合中科院需求的软件,调研了各个开源机构知识库软件[2],并且不断探索如何提高机构知识库的内容被发现和引用的机率,以及扩大机构知识库影响力的方法[3]。该团队近年来一直致力于拓展图像、音影资源的储存与检索;实现作者标识与作品认领机制;开发查收查引、可视化及知识图谱等功能。(2)以李国俊、王瑜和季淑娟等学者为核心的北京科技大学和北京邮电大学研究团队,在北京科技大学图书馆建设机构知识库的实践中建立了收录引用工作流程,并且探讨在机构知识库中嵌入Altmetrics指标和Web of Science的方式和技术,推动机构知识库的持续发展。(3)以张晓林、李麟和曾燕等学者为核心的中国科学院研究团队,着眼于开放获取的研究,提出开放获取论文推送转发服务系统iSwitch的概念、功能与基本框架[4],规范技术流程与标准[5]并且实现论文分发推送[6]。(4)以聂华、崔海媛、韦成府等学者为核心的北京大学研究团队,2011年8月,北京大学图书馆牵头开展CALIS三期机构知识库建设及推广项目[7],聂华、崔海媛等学者调研、设计建设方案,进行系统开发,采用示范馆+参建馆的形式[8],给全国高校机构知识库的发展提供思路。(5)以张冬荣、王丽、刘雅静等学者为核心的中国科学院研究团队,在机构知识库内容保存与传播权利管理、机构知识库建设推广与服务等方面研究合作密切。
图3
3.3 机构发文及合作分析
数据显示,机构知识库的研究主要分布在高校和研究所,发文量较高的机构相对集中。选取在机构知识库领域发文量大于10篇的机构(表2),排名前3位的分别为中国科学院、北京大学和武汉大学。其中中国科学院的研究成果尤为突出,其分院及院属单位都积极参与到机构知识库的研究中,共发表文献118篇,明显高于其他机构,占机构总发文量的37%。除中国科学院以外,其他高产出研究机构发文量均不足50篇,最少的只有10篇,可见高产出机构之间也存在明显差距。南开大学的篇均被引频次为27.90次,在高产出研究机构中位列第1且远超其他机构,中国科学院、北京大学和武汉大学不仅位居发文量前3位,篇均被引频次也排在前5名,说明高产出研究机构在机构知识库领域的论文产出高的同时影响力同样非常高。中国科学院早在2005年就认识到机构知识库对学术交流和知识共享的重要作用,着手调研国际上机构知识库的研究和发展情况,于2007年计划实施面向科研院所的知识仓储建设,建设首批实施单位,开始尝试机构知识库的开发,并且在各个研究所落地推广,不断完善机构知识库功能。
表2 高产出研究机构
序号 | 机构 | 发文量/篇 | 篇均被引 |
---|---|---|---|
1 | 中国科学院 | 118 | 16.11 |
2 | 北京大学 | 41 | 14.02 |
3 | 武汉大学 | 24 | 13.79 |
4 | 北京师范大学 | 23 | 11.65 |
5 | 南京大学 | 19 | 12.63 |
6 | 吉林大学 | 19 | 10.95 |
7 | 中国科学技术信息研究所 | 17 | 10.24 |
8 | 湘潭大学 | 16 | 10.00 |
9 | 华南师范大学 | 14 | 7.71 |
10 | 山东理工大学 | 11 | 8.73 |
11 | 四川大学 | 11 | 4.18 |
12 | 南开大学 | 10 | 27.90 |
13 | 东北师范大学 | 10 | 8.40 |
利用Ucinet对机构合作情况进行分析,并且使用VOSviewer绘制机构合作图谱(图4)。在机构知识库研究领域形成了一定的科研合作圈,其中机构数量在3个以上的合作圈总共有4个。(1)由南开大学、中国科学技术信息研究所、西安外国语大学等机构组成的学术圈。(2)以中国科学院为核心的学术圈,包含西北师范大学、兰州大学等机构。(3)由北京大学、西北大学、西安工程大学、陕西师范大学等机构组成的学术圈。(4)由北京师范大学、北京科技大学、中央财经大学、北京邮电大学等机构组成的学术圈。除了上述4个比较明显的科研合作圈之外,其他机构间的联系相对不密切,还有很多机构之间没有连线。
图4
3.4 机构知识库的研究热点及演变分析
关键词是作者提供的文章主题词,一般可以反映论文的核心内容,本文使用高频词及共词聚类方法来确定机构知识库的研究热点及热点的演变。
3.4.1 关键词共现网络分析
本文运用 CiteSapce 软件对机构知识库文献的关键词进行共现聚类分析,共获得 12个聚类(图5),包含知识服务、数据管理、DSpace、开放获取以及文献计量学等。
图5
在关键词共现聚类的基础上,阅读各个聚类的相关文献,梳理和总结了我国机构知识库的主要研究方向,分别为机构知识库对数据管理及知识服务的作用研究、国外机构知识库建设研究、机构知识库技术模型研究、机构知识库在各个专业领域的应用研究及机构知识库的政策研究等方面。
(1) 关于机构知识库对数据管理及知识服务的作用研究
近年来随着研究不断深入,文献计量、知识图谱等方法融合到机构知识库的建设之中,机构知识库逐渐成为信息服务的平台和科研管理的工具。机构知识库通过知识图谱等可视化手段展示机构知识资产分布状况、学术贡献状况以及知识资产关联和作者合作网络[12],以用户为需求,实现个性化推送,掌握学科趋势情报,开展学科服务,构建多层次服务体系。在科研管理方面,邱均平等[13]学者总结机构知识库现有的评价指标,并且提出利用Altmetrics可以弥补传统计量学方法评价和机构知识库质量控制方面的不足。多位学者调研新加坡高校、中国香港高校和“211工程”大学等科研数据的管理现状,了解机构的科研数据管理需求,发挥机构知识库的作用,推动科研数据管理的高效开展。
(2) 关于国外机构知识库建设研究
(3) 关于机构知识库技术模型研究
(4) 关于机构知识库在各个专业领域的应用研究
机构知识库开始渗入到各个专业学科领域中,并日益占据重要的地位。在农业领域,中国农业科学院搭建机构知识库,将DSpace本地化改造,并且扩展分面检索、关联检索、科研统计分析等功能[27]。江苏省农业科学院从标准机制层、数据管理层、系统平台层、用户体验层构建融入农业科研管理的机构知识库[28]。在医学领域,朱碧纯等学者调研32所医学高校机构库,提出提升智能化数据处理技术等手段,盘活医学高校机构知识库[29]。作为最大的军事医学科研机构,中国人民解放军军事医学科学院建立机构知识库,实现检索与浏览、科技档案管理、资源数据分析和作者数据分析等功能,促进机构知识资产的组织、揭示、存储、管理及应用[30]。
(5) 关于机构知识库的政策研究
3.4.2 研究热点演变分析
运用CiteSapce对机构知识库文献的关键词进行Timeline View视图聚类,绘制关键词时序图(图6)。
图6
去除机构知识库、知识库和IR等概念性的词汇,由图6可以看出,开放存取、开放获取的节点最大,出现频次最高且持续时间较长,2006–2018年一直为机构知识库的研究热点。国外的开放获取运动给中国文献资源建设提供了新的思路,在早期阶段,学者们着重于开放存取的价值意义研究,李枫林等[38]提出机构知识库是开放获取的有效实现形式。2016年之后学者们开始转向开放获取政策的制定[35],构建机构知识库开放获取体系等研究[36]。图书馆、高校图书馆、学术图书馆、图书馆联盟等机构知识库建设主体方面的关键词,长期以来一直是机构知识库的研究热点。一方面包括以中国科学院为代表的学术图书馆和中国高等教育文献保障系统(CALIS)牵头的北京大学、厦门大学等高校图书馆,另一方面,机构知识库联盟是机构知识库发展的趋势之一,早期中国香港的机构知识库整合系统和中国台湾地区的学术机构典藏的发展较为规模化[39],后期中国科学院机构知识库网格、各高校机构知识库联盟随之兴起。
在机构知识库的建设平台和技术方面,2007年开始,Dspace、开源软件、自存储等关键词相继出现,清华大学应用Dspace平台建设机构知识库,并对其资源提交及展示方式、用户界面定制、元数据格式等方面进行拓展[44];中国科学院机构知识库对Dspace的快速提交、数据批量导入、浏览检索、知识资产审计、用户管理、用户界面优化等模块进行扩展开发[45]。2014–2019年,研究关注点在关联数据、语义网、可视化分析、大数据等关键词,陈和[46]采用语义网的方法,基于关联数据构建机构知识库联盟,更好地实现知识服务,国内学者开始探究机构知识库建设的技术方法并且不断创新融合新兴技术。2017年关键词Cspace开始突现,吴志强等[47]扩展CSpace知识分析与可视化功能,实现可定制的图谱可视化;拓展机构知识库的影音支持服务,将影音格式转换技术应用于CSpace机构知识库系统[48]。机构知识库建设平台开始向本地化、自开发的方向转变,建设国内机构知识库建设软件平台。
4 结论和建议
通过对机构知识库研究文献的梳理,分析了近年来我国机构知识库建设研究的现状。论文数量总体呈上升趋势并且逐渐进入稳定发展阶段,说明我国学者对机构知识库研究的重视程度不断提升且研究不断深入。我国主要学者和主要研究机构在机构知识库研究领域的研究产出和研究影响力差异显著,部分学者和机构开展了密切的合作研究。通过聚类分析发现机构知识库的研究热点较为丰富,早期关注资源及知识的管理、国外文献及实践的研究、机构知识库框架模型的架构和技术拓展,近年来机构知识库在医药、农业、生物等领域内的实践成为研究热点,随着机构知识库的深入发展,随之而来的标准及政策制定也是必不可少的研究重点。
机构知识库的建设研究具有巨大的空间。随着信息的爆炸式增长,机构知识库建设的普及度和认可度会越来越高。由机构知识库研究关键词时序图可知,一方面科研管理是未来机构知识库发展的方向,在存储和展示机构信息、提高机构影响力的基础上,与机构其他系统链接,实现学科评价、职称评定、绩效考核等流程化管理,提高科研管理水平。另一方面,大数据、云计算、区块链等技术为机构知识库建设提供了支撑,因此,新兴技术如何得到更好的应用也将是机构知识库研究进程中的重要方向。
参考文献
Educational Transformation through Technology at MIT-DSPACE
[EB]. http://web.mit.edu/edtech/casestudies/dspace.html.
/
〈 | 〉 |