生物技术和纳米技术的统计和指标报告 ☆
Online: 2019-06-15
本报告根据专利的纵向分析,概述了生物技术和纳米技术在过去20至25年间的趋势和发展情况。此外,还介绍了一个实验性指标,旨在识别生物技术和纳米技术研究领域的趋势和发展:使用文本挖掘方法分析两个技术领域的出版物标题,并且创建了一个最常用的关键词共现叠加图,以便可视化每个研究领域随时间的发展。本报告分为两部分:第一部分给出了生物技术和纳米技术的专利统计,第二部分介绍了一个有关关键词的新的探索性指标,这些关键词在生物技术和纳米技术期刊文章中被经常使用。
本文引用格式
Steffi Friedrichs.
1 引言
“生物技术和纳米技术的统计和指标报告”汇集了有关生物技术、纳米技术以及相关新兴和融合技术的最新专利和文献计量活动数据。这些数据是由经合组织下属的生物技术、纳米技术和融合技术工作组(BNCT)秘书处收集的。
经合组织下属的生物技术工作组(OECD WPB)和纳米技术工作组(OECD WPN)与科学技术指标专家工作组(NESTI)经过多年的合作,制定、评估和公布了生物技术和纳米技术的指标和统计数据[1-4]1(经合组织生物技术和纳米技术主要指标,http://oe.cd/kbi, http://oe.cd/kni.)。随着2015年1月新的生物技术、纳米技术和融合技术工作组的创建,经合组织重新确认了这些多学科且部分重叠技术的指标和评估方法,以期建立一套独一无二的、准确的并相关联的数据集。
为了保证与传统测量统计数据(后向可比性)的可比性,以及关注特定主题的国家和多国间在当前发展背景下的可比性,这些指标必须根据其政策相关性、分析稳健性、统计质量以及可衡量性来确定。在制定新的“实验性”指标时,这些标准具有特殊的重要性,它们可以指出新的趋势和动态并激发和聚焦新的政策辩论。
本报告把生物技术、纳米技术和融合技术工作组整理和分析的生物技术和纳米技术指标和统计数据的重要部分结合在一起。大部分数据将可通过已建立的经合组织门户网站进行自我搜索和下载,这些网站包括创新政策平台(IPP)(www.innovationpolicyplatform.org/content/statisticsipp),生物技术、纳米技术和融合技术工作组网站(www.innovationpolicyplatform.org/cstp/bnct)以及经合组织的主要网站(www.oecd.org)。
本报告根据专利的纵向分析,概述了生物技术和纳米技术在过去20至25年间的趋势和发展情况。此外,还介绍了一个实验性指标,旨在识别生物技术和纳米技术研究领域的趋势和发展:使用文本挖掘方法分析两个技术领域的出版物标题,并且创建了一个最常用的关键词共现叠加图,以便可视化每个研究领域随时间的发展。
本报告分为两部分:第一部分给出了生物技术和纳米技术的专利统计,第二部分介绍了一个有关关键词的新的探索性指标,这些关键词在生物技术和纳米技术期刊文章中被经常使用。
2 执行摘要
1990至1999年期间,生物技术和纳米技术的专利申请量呈增长态势,与全球专利总量的变化趋势保持一致。这一趋势源于许多大学实现了知识产权的商业化。就生物技术而言,自2000年以来,专利申请量就已达到稳定水平;唯一的例外是美国发明人在2000年至2002年的3年间专利申请活动突然增多,这种现象是由于人们对遗传学领域技术应用的兴趣增加所致。2003年人类基因组计划完成后申请活动回归正常。然而,就纳米技术而言,2000年以后全球的专利申请数量仍在继续增加。
在生物技术领域,专利申请居前位的经济体所表现的专利行为趋势是类似的;与此相比,在纳米技术领域,两个专利申请居前位的主要经济体专利申请数量的趋势截然不同:日本在1990年提交的纳米技术专利数量超过其该领域专利的50%;自1998年以来,由于韩国、中华人民共和国(以下简称“中国”)和中国台湾的纳米技术专利申请量激增,日本的全球份额大幅下降。
基于子领域的专利申请分析表明,自1990年以来,生物技术专利在8个子领域的分布非常稳定;唯一值得注意的变化是,自1999年以来,“生物信息学”子领域的专利申请数量缓慢增长,以及自1993年以来,“环境生物技术”子领域的专利申请数量略有下降。与之相比,纳米技术的9个子领域的专利申请数量都发生了更显著的变化。过去10年,“信息处理、存储或传输”和“纳米磁力”子领域的专利申请数量有所下降,而“纳米光学”和“纳米结构的制造或处理”子领域的专利申请数量却与日俱增。
生物技术和纳米技术子领域的技术方向在一些经济体里显示出重大变化:1998–2001和2002–2005期间,“环境生物技术”领域是由韩国主导的,然而,自2006年以来,该子领域的专利申请大多来自日本和中国。除了欧盟28国在“纳米生物技术/纳米医学”领域表现出技术专长,没有任何其他经济体能够在很长一段时间内(包括几个被评估的四年期)显示出明显的技术专长。
通过对生物技术和纳米技术领域的期刊论文进行文本挖掘分析,可以深入了解过去20年两种技术在科学内容格局上的转变:纳米技术领域从最初的冶金表征转向了高科技设备和工具的应用导向研究,而生物技术领域重新聚焦于与纳米技术领域重叠的许多概念。生物技术和纳米技术的2D关键词网络地图时间序列表明,两个领域之间的重叠区域正在增加,从而确定了两种技术的融合领域。在这一领域,纳米技术越来越多地成为生物技术的支持技术,因为后者所使用的设备和工具是基于前者所提供的材料和概念。
3 概述
生物技术和纳米技术在其所属学科均存在科学领域和技术领域之分。它们还为科学和技术的其他领域包括彼此提供越来越广泛的应用工具。这种复杂的配置模式意味着传统的科学和工程学日益趋同,并对构建和衡量技术的发展和影响的可靠指标构成了巨大的挑战。
虽然从事科学和技术的人越来越多地感受到所谓“融合技术”的趋势,但很难对其进行表征或描述。如果有一组指标同时适用于多种技术,如生物技术和纳米技术(包括与其有关的生物学、化学、物理学和工程学),并在这些技术之间具有可比性,那么这组指标数据就可以描述和量化这些融合技术。
4 生物技术和纳米技术的专利统计
由于缺乏基于生物技术和纳米技术的工艺和产品在数量、性质和经济影响等方面的经济数据,专利统计数据便成为一个反映研发产出/创新的合理的替代品,使我们能够观察特定新兴领域的研发活动[5]。专利数据包含专利发明的预期工业用途信息,专利发明的分类基于非常详细的技术分类系统,最常见、使用最广泛的技术分类系统是国际专利分类(IPC)系统。使用该系统可以分析生物技术和纳米技术主要应用领域内各子领域的发展趋势。
本报告中所有专利统计数据均来源于专利申请,其中一些专利申请已经获得批准。生物技术和纳米技术领域的专利都是由IPC系统来识别的:在检索期间,一个或多个分类代码归属于一项专利。IPC会定期修订,以应对新技术的出现和现有技术的演变。重新修订的分类法可能会导致将专利重新分类为不同的类别或者导致某些类别的消失。生物技术专利的识别基于IPC代码清单,作为生物技术和纳米技术统计学定义审查的一部分,该清单于2016年进行了修订。纳米技术专利由2003年开发的专利标记系统Y01N进行识别,2011年该系统被修订为一组IPC子类[6]。
所有专利计数均基于IP5专利家族检索,根据最早的提交日期和发明人的居住地,使用分数进行计数2(所有专利数据均来源于经合组织知识产权数据库,STI微数据实验室:http://oe.cd/ipstats.)。
IP5专利家族是指拥有至少两个成员的专利家族,其中一个提交到世界五大专利局,即欧洲专利局(EPO)、日本特许厅(JPO)、韩国知识产权局(KIPO)、中华人民共和国国家知识产权局(SIPO)和美国专利与商标局(USPTO)[7]。
4.1 生物技术和纳米技术的专利数量
从1990年至2012年,生物技术专利数量的总体发展情况如图4.1所示,该图表明,生物技术专利数量在2000年至2002年间达到顶峰,然后减少约10%,稳定在每年约9 000件的水平。自2008年以来,生物技术专利申请量略呈下降趋势。
图4.1
图4.1
1990–2012年生物技术专利申请发展趋势
(根据发明人所在国家和优先权日期计数的IP5专利家族数量)
注:所有专利数量均基于IP5专利家族检索,根据最早的提交日期,使用分数进行统计。专利按其国际专利分类(IPC)代码分配到各技术领域。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
1990年至1999年期间提交的生物技术专利呈强劲增长趋势,这与全球专利总量的上升趋势是一致的。信息和通信技术(ICT)专利在此期间也出现了这种强劲趋势。2014年,Kers等人认为这种趋势源于大学大幅度加强了其知识产权的商业化[8]。
图4.2显示,2000年中国的专利申请数量也突然激增,然而,不同于美国在所有子领域都出现的双峰增长,中国的激增主要基于“医学生物技术”、“分子生物技术”和“基因工程”等应用子领域4~5倍的专利数量增长(另见下文“应用子领域专利申请”的相关讨论)。2014年,Kers等人发现这种增加只是由两家公司的专利申请引起的,并暗示政治变革和经济发展可能是中国专利申请量激增的主要原因。经合组织的分析显示,这一增长是基于一小部分中国公司,这些公司在2000年提交了大量与基因或多肽编码相关的生物技术专利。
图4.2
图4.2
1990–2012年间BRIICS六国生物技术专利申请的发展趋势
(根据发明人所在国家和优先权日期计数的IP5专利家族数量)
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.2进一步说明,所有金砖经济体的专利总数受到了中国专利申请统计数据的严重影响。
1990年以来主要经济体生物技术专利份额的发展概况如图4.3所示,美国专利份额的流失主要是由于韩国、中国、中国台湾和法国的专利活动增加,而英国和德国也正在失去其专利份额。
图4.3
图4.3
1990–2012年间主要经济体生物技术专利份额
(根据发明人所在国家和优先权日期计数的所选经济体IP5专利家族数量)
注:最上层(浅蓝色)代表世界其他地区。所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.4
图4.4
1990–2012年间纳米技术专利申请的发展趋势
(根据发明人所在国家和优先权日期计数的IP5专利家族数量)
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。2012年的数据不完整。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.5
图4.5
1990–2012年间主要经济体纳米技术专利份额
(根据发明人所在国家和优先权日期计数的所选经济体IP5专利家族数量)
注:最上层(浅蓝色)代表世界其他地区。所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。2012年的数据不完整。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
生物技术和纳米技术在专利发展趋势方面最显著的差异是,在纳米技术领域,日本的专利数量处于领先地位;在生物技术领域,日本提交的专利数量仅为美国及欧盟28国的一半(图4.1)。不过,就纳米技术而言,日本的专利申请量一直显著高于其他经济体。
然而,尽管日本在1990年至2008年间公布的纳米技术专利数增加了近5倍,但与最初50%的世界份额相比,日本的专利份额正在逐渐下降。全球专利份额自1998年以来重新洗牌的原因是韩国、中国和中国台湾的纳米技术专利申请激增。除生物技术外,德国和英国的纳米技术专利份额也相对较低,而德国的份额甚至还在减少。
4.2 生物技术和纳米技术的显性技术优势
显性技术优势(revealed technological advantage,RTA)指数通常用于比较经济体之间的获取专利权行为,而不必考虑所观察到的差异背后的原因[5]。显性技术优势被定义为一个经济体在一特定技术领域的专利份额相对于该经济体专利总量的份额。当该经济体在某一领域没有专利时,该指数等于零;当该经济体在某一领域的份额等于其在所有领域的份额时(没有专门化),该指数等于1;当该经济体在某一领域表现出专门化时,该指数大于1。
图4.6
图4.6
1990–2013年生物技术和纳米技术的显性技术优势(RTA)指数
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。2012年的纳米技术数据不完整。2010–2013年期间的数值是秘书处的估计数。只给出具有最少专利数的经济体和三年期:生物技术:每个三年期至少100,纳米技术:每个三年期至少50。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
4.3 生物技术和纳米技术子领域的专利申请
生物技术专利和纳米技术专利在其预期应用方面都具有巨大的多样性,从过程优化到全新设备样样俱全。子领域(生物技术包含9个子领域,纳米技术也包含9个子领域外加一个“未分类”)的细分为进一步分解这两个技术领域提供了一个有用的方法,可以识别具体工业应用领域的发展趋势。
图4.7
图4.7
1990–2012年生物技术各子领域专利份额(IP5专利家族)
注释:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.8
图4.8
1990–2012年间纳米技术各子领域专利份额(IP5专利家族)
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。2012年的数据不完整。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
4.4 生物技术和纳米技术特定子领域的技术专门化
一个经济体针对一种技术的一个特定应用子领域所具有的显性技术优势(RTA)可以用来描述该经济体相对于整个技术领域而言在该子领域的专门化程度。显性技术优势可以快速显示一个经济体在更大的技术领域中的重点,进而用来评估对政策和基础设施的要求。
显性技术优势被定义为:一个经济体在一个特定子领域的专利份额除以该经济体在整个技术领域的份额。当该经济体在某一子领域没有专利时,该指数等于零; 当该经济体在某一子领域的份额等于其在整个技术领域的份额时(没有专门化),该指数等于1; 当该经济体在某一子领域表现出专门化时,该指数大于1。
图4.9
图4.9
1990–1993年和2010–2012年欧盟28国、日本、美国和德国在生物技术子领域的专门化指数
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。这里只包括在本报告所述期间拥有500多项专利的经济体。“生物信息学”子领域自1998年以来被纳入。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.10
图4.10
韩国、中国、澳大利亚和荷兰在1998–2001年及2010–2012年在生物技术各子领域的专门化指数
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。这里只包括在本报告所述期间拥有500多项专利的经济体。“生物信息学”子领域自1998年以来被纳入。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
需要注意的是,美国在8个生物技术字领域中都没有表现出明显的专门化。
下面的复合图4.11给出了各经济体在纳米技术子领域的专门化程度。
图4.11
图4.11
1990–1993年和2010–2012年欧盟28国、日本、美国和韩国在纳米技术各子领域的专门化指数
注:所有专利计数均基于IP5专利家族检索,根据最早的提交日期,使用分数进行计数。专利按其国际专利分类(IPC)代码分配到各技术领域。这里只包括在本报告所述期间拥有500多项专利的经济体。“生物信息学”子领域自1998年以来被纳入。
来源:经合组织,科学技术与创新(STI)微数据实验室:知识产权数据库,http://oe.cd/ipstats,2016年10月。
图4.11(a)表明,欧盟28国集团在“纳米生物技术/纳米医学”方面表现出专门化。如图所示,这种专门化的程度在1990–2001年期间最强[1990–1993年显性技术优势指数为2.0;1994–1997年为2.2(图中未显示);1998–2001年为2.2(图中未显示)]。之后,专门化程度开始下降[2006–2009年间显性技术优势指数:1.6(图中未显示); 2010–2012年间显性技术优势指数:1.2]。
如图4.11(b)所示,日本最初没有显示出任何具体的专门化(在1990–1993年间,所有纳米技术子领域的显性技术优势指数均低于1.4),但自1998年以来,日本在“纳米磁学”和“纳米光学”两方面已经形成了一种微小但稳步的显性技术优势。
与生物技术领域类似,美国在纳米技术的任何一个子领域都没有显示出明显的专门化。尽管如此,图4.11(c)表明,美国在“交互作用、传感或驱动”子领域和“纳米生物技术/纳米医学”子领域显示出一定的专门化程度。前者的显性技术优势指数在1998–2001年间为1.6(未标出),2002–2005年间为1.7(未标出);后者的显性技术优势指数在1990–1993年间和1994–1997年间均为1.5(1994–1997未标出),1998–2001年间为1.4(未标出),2002–2005年间和2006–2009年间均为1.5(均未标出),2010–2012年间为1.6。
图4.11(d)表明,韩国在纳米技术“信息处理”子领域的专门化程度高于其他经济体。1990–1993年期间,韩国在该子领域的显性技术优势指数为1.7,但之后逐步下降,2002–2005年间为1.3(图中未标出); 2006–2009年间为1.1(图中未标出);2010–2012年间为0.6。近年,韩国在“纳米结构制造/合成”子领域形成了显性技术优势,2006–2009年间显性技术优势指数为1.6(图中未标出);2010–2012年间为2.1。
5 生物技术和纳米技术领域的内容发展
本报告的这一部分涉及对科学领域内容发展——一个潜在新指标的探索性研究:这个指标是过去20年来生物技术和纳米技术科学领域关键词纵向发展的延续,利用该指标可以深入了解两个科学领域研究内容的潜在变化,可以识别出两个科学领域之间的融合领域。
该分析基于文本挖掘方法,把生物技术文章和纳米技术文章的标题组合在一起以提供所需的样本大小(在特定时间段内),然后使用一种算法去处理这个组合来计算每个单词的出现(和共现)次数3(使用免费的VOSviewer程序(6.1.5版本)进行文本挖掘 (http://www.vosviewer.com/) 。关键词出现次数被标准化为每次文本挖掘分析所用的单个标题数量的总样本大小。针对每个纵向时间序列,人工创建和检查每个单词排除和单词变换表(即词库表)。)。出现频次最高的单词被识别为特定样本规模的最重要“关键词”。关键词之间的相对位置和距离在2D网络图上可视化,使我们能深入了解这些关键词的共现、关联和上下文关系4(VOSviewer程序(VOSviewer 6.1.5版本)设置为自动分配簇,使用“关联强度”方法来规范化共现词之间链接的强度; 其他程序设置有:(1) 布局:吸引为2,排斥为1,使用默认值; (2)簇聚:分辨率为1.00,最小簇大小为1,合并小簇。)。
根据SCImago分类法,Scopus®数据库中的期刊和论文集由ISSN号识别6(在某些情况下,一种期刊可能有两个或三个ISSN号码。),共分为27个主题领域和313个具体类别。然而,这种分类法并不相互排斥;可以将单个标题分配给多个类别。
表5.1 SCImago期刊排名和国家排名选择的主题领域和具体类别
生物化学,遗传学与分子生物学 | 材料科学 |
---|---|
老龄化 | 生物材料 |
生物化学 | 陶瓷和复合材料 |
生物化学,遗传学和分子生物学(综合) | 电子、光学和磁性材料 |
生物物理学 | 材料化学 |
生物技术 | 材料科学(综合) |
癌症研究 | 金属和合金 |
细胞生物学 | 纳米科学和纳米技术 |
临床生物化学 | 聚合物和塑料 |
发育生物学 | 表面、涂层和薄膜 |
内分泌学 | |
遗传学 | |
分子生物学 | |
分子医学 | |
生理学 | |
结构生物学 |
注:“生物技术”和“纳米科学与纳米技术”类别以绿色单元格表示。
每年对Scopus®数据库进行一次SCImago主题分类,数据库中的每种期刊都会分配给一个或多个类别。
有一个SCImago主题领域被专门指定为“多学科”,只包含一个类别,即“多学科”。这意味着发表在Science和Nature等权威期刊上的生物技术和纳米技术论文,未呈现在“生物技术”和“纳米科学和纳米技术”类别的论文统计中。
期刊名录包括大多数期刊和一些会议论文集,涉及所有类型的出版物。为了获得类别为“生物技术”和“纳米科学和纳米技术”的完整的期刊名录,我们汇总了1999年以来(1999–2015)SCImago期刊主题分类中所包括的所有期刊。
SCImago分类每年都基于Scopus®数据库进行一次调整,因此,数据库中每个期刊名都可分配给一个或多个类别7(其中一个SCImago主题领域专门分配给“多学科”,它仅包含一个主题类别,即“多学科”。这就意味着发表在著名期刊,例如“科学”和“自然”中的生物技术和纳米技术论文,并未被收集在“生物技术”和“纳米科学和纳米技术”类别中,也就没有用 于这里的出版物统计。)。
文本挖掘分析是基于爱思唯尔(Elsevier )于2016年10月出版的Scopus自定义数据(版本为12.2015)。
1996年至2014年期间,每年都根据SJR指标,把发表在以下两个主题类别的期刊论文识别出来,即分类为(a)生物技术以及(b)纳米科学和纳米技术,并从中筛选出被引频次最高的2 000篇文章(即那些在特定年份和主题类别内被引用次数最多的文章)用于分析。
使用前文阐述的方法和文本挖掘工具,基于发表在生物技术和纳米技术期刊上的文章,对其标题中最常出现的单词建立时间序列:对遴选出的被引频次最高的2 000篇论文的标题分别进行分析,以识别出最常出现的单词(以下称为“关键词”)8,9(每个技术领域每年被引用最多的2 000篇文章中,关键词出现的次数(具有100%相关性)不低于5次这个最低门槛。使用免费的VOSviewer程序(6.1.5版本)进行文本挖掘 (http://www.vosviewer.com/) 。关键词出现次数被标准化为每次文本挖掘分析所用的单个标题数量的总样本大小。针对每个纵向时间序列,人工创建和检查每个单词排除和单词变换表(即词库表)。)。
在该分析中识别出的一些关键词覆盖面广且具通用性(例如“属性”、“表征”、“工程”等),它们可以用于许多不同的技术领域。然而,随着某一技术领域的不断发展,关键词的使用和与上下文中关系的变化代表了该领域关注焦点的变化。例如,一个新兴的学科开始于对新材料的深层科学现象及其产生的“属性”进行研究和“表征”,而成熟的科学和技术领域则以先前所取得的基础知识为基础,并将其应用于新材料的靶向“合成”,例如“纳米粒子”或“石墨烯”,以及更复杂系统(例如“细胞”)的分析。
5.1 生物技术和纳米技术关键词的发展和变化
图5.1说明了过去20年中生物技术关键词的发展情况。2002年,关键词“纳米粒子”出现在最常用的10个生物技术关键词列表中,其重要性在接下来的几年中不断增加。另一方面,关键词“活性”代表对生物材料、微生物或分子的性质和行为进行分析的兴趣,自2003年以来,其使用率越来越低,甚至在2008年和2013年跌出前10关键词列表。关键词“细菌”和“基因”的出现次数在过去20年也逐步下降,与此相反,关键词“细胞”和“检测”的出现次数则增加了。
图5.1
图5.1
1996–2014年生物技术文献中最重要关键词出现次数的变化
注:1. 10个最重要生物技术关键词占比(根据它们在生物技术期刊上发表的科学论文标题中出现次数的标准化计数)。
2. 根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
图5.2说明了纳米技术领域10大关键词的发展情况:与生物技术领域相比,纳米技术在过去20年中似乎经历了一些重大变化,表现在原有关键词的消失和新关键词的引入。
图5.2
图5.2
1996年至2014年间纳米技术文献中最重要关键词出现次数的变化
注:1. 10个最重要纳米技术关键词占比(根据它们在纳米技术期刊上发表的科学论文标题中出现次数的标准化计数)。
2. 根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
5.2 生物技术和纳米技术的内容及表述的发展变化
2D网络图可以通过圆圈和标签的大小表明各个关键词的出现频次,并通过关键词的位置和彼此间的距离表明它们之间的关系。因此,2D网络图的绘制揭示了技术领域中每个关键词的(共)出现情况和上下文背景。
为了给某一相关技术领域创建一个单一样本集,首先把该技术领域(即生物技术或纳米技术)1996–2014年间每年被引频次最高的2 000个论文标题合并在一起,创建2D网络图的时间序列。然后把VOSviewer文本挖掘程序应用于该样本集10(每个技术领域在被引用最多的38 000篇文章(即每年2 000篇文章,共19年)这个累积样本集中,关键词出现的次数不低于100次这个最低门槛。),生成相关技术领域科学论文中最常用词的2D网络图。这个图上每个单词的x,y位置用于为时间序列的年度2D网络图创建锚定文件。
图5.3给出了1996年至2014年累积的生物技术论文标题中出现频次最多的单词的2D网络图。就生物技术而言,在38 000个累积论文标题中(从1996年至2014年),有72个词的出现频率大于或等于100次11( VOSviewer程序的可视化设置可能使某些关键词的标签不可见,以避免标签的重叠。)。
图5.3
图5.3
1996–2014年生物技术领域的关键词
(论文标题中最重要单词的出现频率及其间联系和簇聚2D网络图)
注:根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
2D网络图的时间序列可以有效地显示内容的发展和边界,以及每个技术领域潜在的重点转移。此外,时间序列可以给出关于两个领域相互之间现有和可能增加的重叠的结论,从而识别出趋同领域12(VOSviewer程序(VOSviewer 6.1.5版本)设置为自动分配簇,使用“关联强度”方法来规范化共现词之间链接的强度; 其他程序设置有:(1)布局:吸引为2,排斥为1,使用默认值; (2)簇聚:分辨率为1.00,最小簇大小为1,合并小簇。)。
图5.4给出了1996年[图5.4(a)]、2003年[图5.4(b)]、2010年[图5.4(c)]和2014年[图5.4(d)]生物技术领域关键词2D网络图。比较这些不同年份的网络图可以看出,生物技术领域的整体状况和内容似乎基本保持不变。然而,自2003年以来,该领域关注的重要关键词似乎比以前少得多:2003年以前,生物技术领域最重要的关键词是“基因”、“表征”、“分析”、“工程”、“蛋白质”、“细菌”和“细胞”(按出现频率降序排列),而到2014年,该列表已被简化为“检测”、“细胞”、“纳米粒子”和“分析”(按出现频率降序)。这一观察结果与前文提到的生物技术前10个关键词的发展和变化一致。
图5.4(a)
图5.4(b)
图5.4(c)
图5.4(d)
图5.4(d)
生物技术论文标题中最重要单词的出现频率及其间联系和簇聚2D网络图(2014年)
注:根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
2003年,关键词“纳米粒子”进入生物技术关键词图谱,并随即发展为三大最重要的生物技术概念之一。该关键词在位置上离“药物递送”较近,因为在生物医学和毒理学研究中前者通常用作后者的载体。
“PCR”概念(即聚合酶链反应,是1980年代分子生物学领域的一项重大突破,很快成为应用于生物研究和技术领域的常规技术)在2007年从生物技术关键词图谱中消失了,到2010年,与之密切相关的“分离”和“定量化”也从生物技术关键词图谱中消失了,同时,关于活性的关键词“表征”的重要性也逐渐降低。
图5.5
图5.5
1996–2014年纳米技术领域的关键词
(论文标题中最重要单词的出现频率及其间联系和簇聚2D网络图)
注:根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
图5.6(a)
图5.6(b)
2007年,“石墨烯”作为一个与新“材料”相关的概念出现在纳米技术关键词图谱上,这个概念与复杂应用和设备的概念非常接近,例如“锂离子电池”和“染料敏化太阳能电池”[图5.6(c)]。
图5.6(c)
到2014年,以前的冶金学概念几乎被抛弃,纳米技术领域的主要热点已经转移到“纳米粒子”、(“碳纳米管”的)“合成”和“石墨烯”、“材料”以及这些材料在特定器件中的应用,例如“电极”、“二极管”和“染料敏化太阳能电池”[图5.6(d)]。
图5.6(d)
图5.6(d)
纳米技术论文标题中最重要单词的出现频率及其间联系和簇聚2D网络图(2014年)
注:根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
2004年,关键词“金纳米粒子”与“生物传感器”检测的概念双双进入了关键词图谱,并与“纳米粒子”和“细胞”相邻。从2003/2004年左右开始,生物技术和纳米技术这两个领域日益趋同于一个新领域,即纳米技术材料和器件在生命科学中的应用。
为了深入了解生物技术和纳米技术两个领域之间现有和可能增加的重叠,我们创建了这两个领域相结合的2D网络图时间序列,用以确定趋同领域。首先把两个技术领域在给定年份的2 000个被引频次最高的文章标题结合在一起,同时从列表中删除重复的标题,以生成时间序列。把由此生成的共19年的年度论文标题数据集累积在一起,创建出一个锚定图,然后将VOSviewer文本挖掘程序应用于生成的样本集,这样就创建出一个生物技术和纳米技术论文标题中出现频率最高的单词的单一2D网络图15(在生物技术和纳米技术两个领域内被引用最多的74128篇文章这个累积样本集中,关键词出现的次数不低于150次这个最低门槛。)。这个图中每个单词的x,y位置用于为时间序列的年度2D网络图创建锚定文件。
图5.7(a)
图5.7 (b)
图5.7 (b)
生物技术和纳米技术论文标题中最重要单词的出现频率及其间联系和簇聚2D网络图(2014年)
注:根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
图5.8
图5.8
1996–2014年生物技术和纳米技术领域的融合
(生物技术和纳米技术论文标题中最重要词汇的出现频率及其间联系和簇聚注释2D网络图)
注:1. 缩放比例:大圆圈/标签=高出现频率
2. 根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
图5.9通过说明每个技术领域在1996年至2014年间所经历的方向性变化,总结了在生物技术和纳米技术结合领域中观察到的趋同现象:
图5.9
图5.9
1996–2014年生物技术和纳米技术领域的变化
(生物技术和纳米技术论文标题中最重要词汇的出现频率及其间联系和簇聚注释2D网络图)
注:1. 缩放比例:大圆圈/标签=高出现频率
2. 根据SCImago期刊排名(SJR)指标,技术领域被定义为各个主题类别;缩放比例:大圆圈/标签=高出现频率。
来源:经合组织计算是基于爱思唯尔于2016年10月出版的Scopus自定义数据(版本12.2015); 文本挖掘:VOSviewer(版本6.1.3)。
总体而言,文本挖掘分析表明纳米技术领域比生物技术领域更加多样化,有数据为证,以出现频率不少于100为标准,在2 000个纳米技术论文标题中达到这一阈值的关键词数量要少得多。在1990年代后期,与大约65个生物技术关键词相比,只有大约40个纳米技术关键词达到阈值。然而,这种差异在后来几年似乎消失了,自2012年以来,生物技术领域似乎由一组数量不足40个的关键词联合起来,这些关键词每年至少出现100次。
6 结论
对传统和新型统计指标的分析表明,这两个技术领域在发展方面存在相似之处,但在本质上仍存在显著差异。
虽然专利数据可能不被视为衡量研发产出的一个完善指标,但它们可以很好地代表各国在某一技术领域的创造性活动。在未来的工作中,除了本报告中提出的专利数据和发明人分析之外,查看专利申请人也可能会有所帮助。
新的分析工具,例如文本挖掘,提供了与传统统计数据和指标分析所得结果相称并相互支持的结果。
本报告以及为撰写本报告而进行的数据收集和分析是对这两个技术领域的纵向统计数据进行持续分析的起点。通过创建专利统计数据的时间序列而获得的结果,可以用来识别和解释在全球以及单个经济体层面上这两种技术的发展趋势,从而为其影响力和政策评估提供重要基石。
在未来的工作中,可以尝试分析各经济体的出版和专利行为,以发现它们潜在的联系或相似之处。
生物技术和纳米技术都受到日益全球化的巨大影响,这体现在中国、韩国和中国台湾等经济体的专利数量和出版物数量不断增长的事实上。
建议对本报告所创立的时间序列分析进行持续研究,以便为影响力、政策和技术的评估以及未来发展的预测提供支持。
翻译:王吉波 校译:马建华
致谢
经合组织科学、技术和创新理事会下属的生物技术、纳米技术和融合技术工作组秘书处的Steffi Friedrichs负责编写了本报告。科学技术指标专家工作组秘书处的Brigitte van Beuzekom提供了宝贵的意见,并帮助获取了文献计量数据。科学技术指标(STI)微数据实验室的Hélène Dernis提供了专利数据,并对报告提出了宝贵意见。科学技术指标专家工作组秘书处的Fernando Galindo-Rueda对本报告进行了指导,并提出了宝贵意见。
参考文献
Nanotechnology: An Overview based on Indicators and Statistics
: Statistical Analysis of Science, Technology and Industry, OECD, https://www.oecd.org/sti/inno/43179651. pdf (accessed on 12 July
World Corporate Top R&D Investors: Innovation and IP bundles
.
Trends in genetic patent applications: the commercialization of academic intellectual property
, Vol. 22/10, pp.1155-9, .Cardiometabolic traits pose a major global public health burden. Large-scale genome-wide association studies (GWAS) have identified multiple loci accounting for up to 30% of the genetic variance in complex traits such as cardiometabolic traits. However, the contribution of parent-of-origin effects (POEs) to complex traits has been largely ignored in GWAS. Family-based studies enable the assessment of POEs in genetic association analyses. We investigated POEs on a range of complex traits in 3 family-based studies. The discovery phase was carried out in large pedigrees from the Kibbutzim Family Study (n = 901 individuals) and in 872 parent-offspring trios from the Jerusalem Perinatal Study. Focusing on imprinted genomic regions, we examined parent-specific associations with 12 complex traits (i.e., body-size, blood pressure, lipids), mostly cardiometabolic risk traits. Forty five of the 11,967 SNPs initially found to have POE were evaluated for replication (p value < 1 × 10-4) in Framingham Heart Study families (max n = 8000 individuals). Three common variants yielded evidence of POE in the meta-analysis. Two variants, located on chr6 in the HLA region, showed a paternal effect on height (rs1042136: βpaternal = -0.023, p value = 1.5 × 10-8 and rs1431403: βpaternal = -0.011, p value = 5.4 × 10-6). The corresponding maternally-derived effects were statistically nonsignificant. The variant rs9332053, located on chr13 in RCBTB2 gene, demonstrated a maternal effect on hip circumference (βmaternal = -4.24, p value = 9.6 × 10-6; βpaternal = 1.29, p value = 0.23). These findings provide evidence for the utility of incorporating POEs into association studies of cardiometabolic traits, especially anthropometric traits. The study highlights the benefits of using family-based data for deciphering the genetic architecture of complex traits.
/
〈 | 〉 |