胡雅敏1,2, 吴晓燕1, 陈方,1,2,*

1 中国科学院成都文献情报中心 成都 610041
2 中国科学院大学经济与管理学院图书情报与档案管理系 北京 100190

Research Progress and International Cooperation of Research on COVID-19 Based on Bibliometrics

Hu Yamin1,2, Wu Xiaoyan1, Chen Fang,1,2,*

1. Chengdu Library and Information Center, Chinese Academy of Sciences, Chengdu 610041, China
2. Department of Library, Information and Archives Management, School of Economics and Management,University of Chinese Academy of Sciences, Beijing 100190, China

通讯作者: *E-mail:chenf@clas.ac.cn

Corresponding authors: *E-mail:chenf@clas.ac.cn

Online: 2021-02-15



关键词: 新冠肺炎 ; 文献计量 ; 主题聚类 ; 国际合作


Based on bibliometric methods, this paper analyzed quantitatively of current research hot topics and national cooperation situation. VOSviewer was used to draw cluster maps and cooperative network maps to show cooperative countries and research hotspots visually. We summarized the research hotspots of COVID-19 pneumonia, and analyzed the trends of international cooperation and the differences in research hotspots. The results shows that, the current research hotspots can be summarized into 7 areas: outbreak and public management of COVID-19, pathological mechanism research, diagnostic methods, symptom research, clinical treatment, epidemiological transmission models and the auxiliary application of information technology. The number of articles published of Chinese research on COVID-19 is at the forefront in the world, and it is slightly insufficient in international cooperation. China has the closest cooperation with US, mostly in the pathogenesis and management of COVID-19, suggesting that the cooperation on diagnostic methods, clinical practice, and transmission models needs to be further strengthened.

Keywords: COVID-19 ; bibliometric analysis ; theme cluster ; international cooperation

1 引言

2019年末,由一种新型冠状病毒感染的肺炎疫情(简称新冠肺炎,COVID-19)在世界多地、多点出现。2020年1月20日疫情在中国暴发之时,中共中央总书记、国家主席习近平对新冠肺炎疫情做出重要指示,强调要及时深化国际合作。抗击疫情期间,中国与美国、德国、日本、韩国、尼日利亚、俄罗斯、新加坡和世界卫生组织25名专家组成的中国-世界卫生组织联合专家考察组,与全球共享新冠病毒基因组信息,不断与各国疾控中心进行信息沟通和技术合作[1]。2020年8月24日,全球确诊病例已超过2 300万,与此同时,全球的科研机构争分夺秒开展攻关,在疫情期间独立或合作发表的关于新冠肺炎的科研成果数量快速增加。因此,有必要对相关研究进展进行总结梳理,并针对其中的国际合作情况开展分析。本研究使用文献计量法对此阶段的科研成果及国际合作进行了定量分析,利用VOSviewer工具进行了可视化展示,通过总结当前的科研成果和研究热点,了解国际合作的现状,可为该领域下一步的研究及政策制定提供建议和依据。

2 数据来源与分析方法

2.1 数据来源

选取WoS核心集数据库作为数据来源,检索策略基于新冠病毒及感染肺炎的命名过程制定。2020年1月7日,中国疾病预防控制中心从患者样本中鉴定出这种新型冠状病毒,随后世界卫生组织将其命名为“2019-nCoV”,后因其临床症状与严重急性呼吸综合征(SARS)非常相似,国际病毒分类委员会正式将其命名为“SARS-CoV-2”。2020年2月11日,世界卫生组织正式将这种病毒感染的疾病命名为“COVID-19”。因此本研究确定最终的检索式为:“TS=(2019-nCoV OR ‘2019 novel coronavirus’ OR SARS-CoV-2 OR COVID-19 OR Wuhan NEAR1 (coronavirus OR pneumonia))”,检索时间范围为2019年12月1日至2020年8月25日,检索日期为2020年8月26日,选择论文类型为Article、Early Access和Letter,检索出16 308篇,去重后共16 064篇。

2.2 数据分析方法



3 结果与分析

3.1 合作网络分析


3.1.1 机构合作分析

将新冠肺炎的相关文献数据导入到VOSviewer中,分析类型选择Co-authorship合著研究,分析单元选择Organizations,设置阈值为5,利用VOSviewer初步筛选出发文量≥5的1 682个发文机构。虽然VOSviewer的内置功能已初步对机构名称进行了统一大小写的去重工作,但对于作者著录时采用不同方式表述的同一机构名称仍需要进行清洗。首先,使用Google开发的开源数据清洗工具OpenRefine对机构名称进行自动聚类,然后,根据聚类结果人工判读是否为同一机构,最终获取规范化后的机构1 613个。最后将规范后的机构数据再次导入VOSviewer,绘制发文量≥5的1 613个研究机构的合作图谱(图1)和具体发文量排名表(表1)。


图1   新冠肺炎的发文机构图谱

表1   新冠肺炎发文机构Top30

排名 机构名 发文量/篇 排名 机构名 发文量/篇
1 华中科技大学 457 16 伦敦国王学院 132
2 武汉大学 296 17 宾夕法尼亚大学 130
3 哈佛医学院 281 18 荷兰莱顿大学 127
4 华盛顿大学 217 19 上海交通大学 126
5 米兰大学 208 20 帕多瓦大学 126
6 多伦多大学 187 21 首都医科大学 123
7 牛津大学 163 22 德黑兰大学医学院 122
8 伦敦大学学院 156 23 墨尔本大学 117
9 复旦大学 154 24 密歇根大学 117
10 罗马大学 152 25 香港中文大学 111
11 香港大学 151 26 帝国理工学院 109
12 中国科学院大学 146 27 新加坡国立大学 108
13 浙江大学 141 28 约翰斯·霍普金斯大学 107
14 哥伦比亚大学 140 29 全印度医学科学研究所 103
15 斯坦福大学 135 30 巴黎大学 101

图1可以发现,研究机构主要分为两大部分:第一部分是发文较多、合作较紧密的位于中间区域的机构,第二部分是少数分散在外部区域的机构,其相互之间关联较少,说明合作比较稀疏。总体而言,大部分机构之间合作紧密,据VOSviewer统计,1 613个发文机构中有1 603个彼此之间有连线,表明彼此间存在合作关系。


3.1.2 国家/地区合作分析

VOSviewer中分析类型选择Co-authorship合著研究,分析单元选择Countries,共有161个国家/地区参与本领域的研究,Top20发文国家/地区及其独立发文量见表2。156个国家/地区之间有连线,绘制国家/地区合作网络图谱(图2),并统计跨国合作情况(图3)。其中,英国(United Kingdom)的发文数据为英格兰(England)、苏格兰(Scotland)、威尔士(Wales)及北爱尔兰(North Ireland)的合并数据,中国的发文数据未合并台湾地区数据。

表2   新冠肺炎研究Top20发文国家/地区

序号 国家/地区 总发文量/篇 独立发文量/篇 独立发文量占比 总连接强度
1 美国 4374 2741 62.67% 3592
2 中国 3099 2212 71.38% 1776
3 意大利 2157 1462 67.78% 2344
4 英国 1861 872 46.86% 2906
5 印度 856 533 62.27% 912
6 加拿大 761 307 40.34% 1337
7 法国 747 364 48.73% 1470
8 德国 692 280 40.46% 1701
9 澳大利亚 667 252 37.78% 1268
10 西班牙 623 312 50.08% 1415
11 伊朗 406 269 66.26% 428
12 巴西 393 242 61.58% 642
13 瑞士 390 97 24.87% 1159
14 荷兰 355 104 29.30% 1176
15 土耳其 346 238 68.79% 517
16 新加坡 301 173 57.48% 486
17 日本 271 157 57.93% 446
18 比利时 264 90 34.09% 843
19 韩国 243 164 67.49% 308
20 中国台湾 186 112 60.22% 193

图2   新冠肺炎研究论文的国家/地区合作图谱


图3   新冠肺炎研究论文的国家/地区合作情况

从发文数量看(表2),美国位居首位,共发表论文4 374篇,其中独立发文量为2 741篇。其次是中国,发表论文3 099篇,其中独立发表论文2 212篇。中、美明显领先其他国家,且中国独立发文量占比更高。意大利名列第3,发文2 157篇,其他发文较多的国家分别是英国(1 861篇)、印度(856篇)、加拿大(761篇)、法国(747篇)及德国(692篇)等。发文量的多少不仅和科研水平有关,还与该国是否大面积暴发疫情有一定关联。结合世界卫生组织在2020年8月25日公布的全球海外疫情数据,截至2020年8月24日下午14时,美国累计确诊病例数最多,发文量也位居世界第1。发文量位居第2的中国则是疫情暴发较早的地区。发文量较多的印度、西班牙、英国、德国和法国均在确诊病例数排名的前20位。

在16 064篇论文中,国际合作论文占比约为四分之一。其中美国节点的连线最多,总连接强度为3 592,表示美国和其他国家共同出现次数(合作次数)为3 592次。英国的发文量排名第4,但其合作次数仅次于美国(2 906次)。意大利的发文量明显低于中国,但合作次数(2 344次)高于中国。中国的发文量位居第2,但总连接强度为1 776,排名第4,国际合作的发文量占比最低(28.62%),国际合作有待加强(图2图3)。

3.2 研究热点分析

3.2.1 主题聚类分析

高频关键词的共现可以揭示出研究领域的热点主题,有利于分析某个领域的研究热点和前沿。利用VOSviewer进行关键词共现分析并聚类,分析类型选择Co-occurrence,分析单元选择all keywords。VOSviewer提供用于数据清理的词典操作功能,具体是通过复写官方提供的thesaurus_terms.txt文件进行清洗,可过滤掉同义词、单复数词汇、缩写词汇等表达形式不同的词汇以及词频高但意义不大的停用关键词等,共筛选出21 025个关键词。最终选取词频≥10的834个关键词进行分析,筛选出9个类别,绘制出相应的关键词共现聚类网络图(图4)。


图4   新冠肺炎的主题聚类图


表3   新冠肺炎研究的9个聚类主题

聚类号 聚类主题 子主题 颜色标识 主题特征词 代表性文献
1 新冠肺炎暴发及公共管理 疫情的暴发、流行病学、心理健康、社交媒体 红色 COVID-19, pandemic, impact, management, mental health, anxiety, depression, public health, social media, policy [3](1923)、[4](7679)、[5](257)、[7](735)、[8](623)
2 临床特征与病理机制研究 临床特点、急性呼吸系统综合症、转化酶、受体、炎症、表达、细胞因子风暴 草绿 clinical characteristics, acute respiratory syndrome, ACE2, receptor, inflammation, expression, cytokine storm [9](4344)、[10](4807)、[19](1764)
3 溯源、疫苗与治疗方法 SARS病毒相关、疫苗、起源、氯喹、药物、抑制、分子对接 深蓝 SARS, virus, vaccine, origin, chloroquine, drugs, inhibition, molecular docking [20](3455)、[21](2296)、[22](1500)、[23](48)
4 预防指南 传播、个人防护设备、预防、消毒、安全 黄色 transmission, personal protective equipment, prevention, guidelines, healthcare workers [30](3)、[31](11)、[32](13)
5 流行病学的传播模型研究 模型、基本感染数R0、繁殖数 紫色 SEIR model, sir model, mathematical model, spread, basic reproduction number, reproduction number [26](2870)、[33](768)
6 诊断方法研究 诊断、CT、症状诊断 天蓝 pneumonia, diagnosis, CT, features [34](855)
7 交叉症状研究 嗅觉缺失、味觉障碍、耳鼻喉科、眼科 橙色 anosmia, smell, olfaction , taste, dysgeusia, ent, ophthalmology [37](48)、[38](102)
8 临床实践及特殊群体的免疫抑制冲突 临床研究、实践、免疫抑制、肾脏移植 棕色 clinical research, immunosuppression, kidney transplantation [39](62)
9 信息技术应用 人工智能、深度学习、机器学习 深绿 deep learning, artificial intelligence, machine learning, classification [40](17)、[41](30)、[44](120)、[45](36)

新窗口打开| 下载CSV










3.2.2 代表性文献








在治疗方面,瑞德西韦(Remdesivir)及磷酸氯喹(Chloroquine Phosphate)可在细胞水平上有效抑制COVID-19的感染[24]。恢复期血浆输注的非对照和对照试验都证明血浆治疗可以让患者病毒转阴且体内抗体明显增加,且高滴度抗体更有效[25,26]

















药物筛选:依据SARS-CoV-2与SARS-CoV高度同源特征,Zhang等[47]提出了一种基于深度学习的方法,可进行大规模的虚拟筛选和序列分析,研究结果提供了COVID-19 3C样蛋白酶的潜在药物清单。

3.2.3 中国与其他国家的合作主题分析



图5   中国与其他国家/地区合作图谱

表4   与中国的合作强度Top10国家

序号 国家 链接强度
1 美国 448
2 英国 178
3 澳大利亚 103
4 加拿大 95
5 意大利 87
6 印度 82
7 法国 51
8 泰国 49
9 德国 49
10 新加坡 44

新窗口打开| 下载CSV


对中-美合作的448篇文献进行主题聚类分析,共筛选出1 361个关键词,由于文献数量较少,选择词频≥5的49个关键词进行分析,关键词之间存在共现关联。设置resolution=0.5得到聚类结果图(图6),总结主题类别名称(表5)。


图6   中-美合作论文的主题聚类图谱

表5   中-美合作论文的3个主题聚类

聚类号 聚类主题 子主题 颜色标识 主题特征词
1 病理机制与感染研究 SARS、转化酶、急性呼吸综合征、感染、模型 红色 COVID-19、SARS、ACE2、acute respiratory syndrome、infection、protein、function recepter
2 心理健康研究 公共健康、压力 绿色 pneumonia 、public health、stress、depression
3 传播与防护管理 传播、管理医护人员、个人保护设备 蓝色 transmission、management、healthcare workers、personal protective equipment

新窗口打开| 下载CSV





图7   中-英合作论文的主题聚类图谱

表6   中-英合作论文的3个主题聚类

聚类号 聚类主题 子主题 颜色标识 主题特征词
1 病理机制研究 SARS、急性呼吸系统症状、流行病学 绿色 coronavirus、SARS、pneumonia、acute respiratory syndrome、epidemiology、ACE2、expression
2 疫情防控管理 感染、传播、管理、影响 红色 COVID-19、pandemic、infection、pneumonia、outbreak、wuhan、transmission、guidlines
3 空气污染的影响 空气污染、PM2.5 蓝色 PM2.5、air pollution

新窗口打开| 下载CSV


4 结论










