人工智能下一代数字转型的创新力与颠覆力

doi:10.15978/j.cnki.1673-5668.201705010

人工智能下一代数字转型的创新力与颠覆力

科睿唯安(原汤森路透知识产权与科技事业部)

印度工商业联合会

Online: 2017-10-20

PDF (6135KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文推荐给朋友

本文引用格式

科睿唯安(原汤森路透知识产权与科技事业部). 人工智能下一代数字转型的创新力与颠覆力[J]. 科学观察, 2017, 12(5): 45-55 doi:10.15978/j.cnki.1673-5668.201705010

人工智能成就下一代数字转型

人工智能历经数十年的发展,在从理论到实践的过程中取得了重大突破。研究表明,人工智能具有成功解决各类难题的潜力。随着高性能计算的出现,人工智能将会得到更广泛的应用。

随着人工智能逐渐演变成为信息通讯技术（ICT）创新的核心推动力,大量企业争先恐后地加入到知识产权争夺战中。他们一方面彼此间展开激烈竞争,一方面又迫于形势必须开展全球合作,因此,人工智能的战略性投资与行动对于成功实现下一代数字转型不可或缺。

何为人工智能?

人工智能是指拥有类人智慧的一类系统。英国数学家艾伦·图灵 (Alan Turing) 于 1950 年首次提出了机器智能的概念,而“人工智能”(artificial intelligence) 一词则是研究人员在 1956 年达特茅斯学院的一次会议中率先使用的。此后,数学、逻辑学、认知科学及生命科学等领域纷纷对人工智能积极开展理论研究。1990 年代后期,随着计算机技术的发展,人工智能研究取得了巨大飞跃,人工智能多样的应用前景进一步显现。

数学、认知科学、人机工程学、逻辑学、生命科学和计算机科学等各研究领域间的广泛合作,推动人工智能不断发展演进

图 1显示了人工智能的研究情况。分析数据来自于过去10年间 Web of Science 数据库收录的人工智能的前1.5 万篇高被引论文。图 1 的人工智能全景分析涵盖的研究领域有：

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 2007–2016年人工智能研究情况

来源： Web of Science 核心合集中人工智能领域前1.5 万篇高被引论文

数据分类或模式识别等识别技术

疾病或系统故障等异常诊断

自然语言处理或知识表述方法

智能机器人或自动驾驶

人工生命体

机器学习、人工神经网络和模糊逻辑等算法研究

近10年,人工智能的算法理论和实践应用均取得了实质性进展,彰显出人工智能在实际应用中作为未来数字转型核心推动力的潜力。

人工智能的研究趋势

图 2显示了过去 20 年 Web of Science 人工智能论文的发表情况。人工智能论文出版量在 2006 年之前始终呈现增长趋势,2006 年之后出现了波动。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 1997–2016年人工智能研究论文的出版趋势

来源： Web of Science 核心合集

人工智能发展的早期阶段,研究重点是将先前的研究算法和计算能力相结合来证明人工智能研究确有进展。而一旦有证据表明人工智能算法能够解决各种实际问题,研究重点便转移到了如何利用人工智能来解决实际问题。高性能计算能力的实现则加速了人工智能在解决更复杂、更具挑战性问题上的进步。

图 3显示了人工智能领域主要论文产出国的论文出版数量。其中以中国和美国的论文出版数量最多。人工智能的早期研究由美国主导,但中国自 2000 年以来所发表的论文数量惊人。此外,在亚太地区,日本、韩国和澳大利亚也都在积极开展人工智能研究。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 2007–2016人工智能研究论文出版数量较多的10个国家

来源： Web of Science 核心合集

论文出版数量可作为一个指标来衡量各国在该领域的知识积累及人才储备情况,而这最终也将有助于各国的工业发展

研究论文是研究成果的一种体现。从图 3 还可看出各国在人工智能方面积累的知识深度以及训练有素的研究人员和工程师人才库的情况。这些人工智能的专业知识和人才将成为各国推进下一代 ICT 创新的宝贵财富。

研究的影响力比论文数量更重要

表 1显示了上榜各国在人工智能方面的研究影响力,分析了各国在人工智能研究影响力方面的表现。我们分别取被引次数位于全球排名前 0.1%、1% 和 10% 的论文以及高被引论文和热点论文进行分析,结果发现美国一直主导着人工智能领域的研究。

表1 在人工智能研究领域具有高影响力的国家（2007–2016）

国家	被引频次排名前0.1%的论文数/篇	被引频次排名前1%的论文数/篇	被引频次排名前10%的论文数/篇	高被引论文数/篇	热点论文数/篇	论文总量/篇
中国	49	647	3 341	599	24	99 737
美国	270	2 365	9 559	1 055	28	97 789
德国	48	478	2 138	207	5	27 288
英国	95	654	2 655	337	7	26 687
日本	29	219	944	80	2	24 631
韩国	8	116	672	81	1	16 161

来源： Web of Science 核心合集

新窗口打开| 下载CSV

亚洲国家的人工智能研究影响力相对低于欧洲国家。例如,中国、日本和韩国都只有 0.6%~0.9% 的论文属于全球排名前 1% 的高被引论文,而美国和欧洲则占到 1.7%~2.4%。所以,亚洲国家可能需要更多地将战略重点放在研究质量上面以提升研究成果的全球影响力,或者说“以提升在人工智能领域的影响力”。

热点论文可能揭示未来研究领域的发展方向

热点论文是指近期发表并在短时间内表现出巨大学术影响力的论文,这类论文探讨的研究课题很有可能演变为未来值得关注的有潜力的课题。

中国尽管在其他高影响力论文方面相对逊色于美国,但热点论文数量与美国相近。这表明中国有可能成为人工智能研究的核心力量之一。在将人工智能应用于各种技术领域以推动工业发展方面,中国已经奠定了坚实的基础。

图4显示了全世界人工智能论文出版数量最多的10个研究机构。可以看出,中国科学院、美国加州大学和法国国家科学研究中心的论文产出量遥遥领先。

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 2007–2016年人工智能论文量最多的10个机构

来源： Web of Science 核心合集

表2列出了积极开展人工智能研究的全球前20家企业。企业是人工智能研究的积极参与者,因为他们坚信人工智能将作为核心创新引擎再次推动业务上的飞跃。为助力创新,IBM、微软和谷歌均已在人工智能方面投入了大量的人力和物力。西门子也像许多电信公司一样,将人工智能积极应用到其医疗和工业解决方案中。

表2 SCI（科学引文索引）收录人工智能论文数量最多的20家企业（2007–2016）

序号	企业名称	论文数量/篇
1	微软（Microsoft）	1 864
2	美国国际商用机器公司（IBM）	1 068
3	西门子股份公司（Siemens AG）	905
4	谷歌（Google）	459
5	诺基亚（Nokia Corporation）	322
6	三星（Samsung）	311
7	日本电话（Nippon Telephone）	278
8	本田汽车（Honda Motor）	245
9	飞利浦研究（Philips Research）	235
10	富士通公司（Fujitsu Ltd）	232
11	惠普（Hewlett-Packard）	210
12	英特尔公司（Intel Corporation）	188
13	戴姆勒股份公司（Daimler AG）	173
14	东芝株式会社（Toshiba Corporation）	171
15	施乐（Xerox）	169
16	法国Orange公司（Orange SA）	161
17	美国电话电报公司（AT&T）	158
18	日本电气株式会社（NEC Corporation）	155
19	德国电信公司（Deutsche Telekom AG）	141
20	韩国浦项钢铁公司（POSCO）	126

来源： Web of Science 核心合集

新窗口打开| 下载CSV

人工智能之所以炙手可热,是因为大家普遍认为它将成为下一代技术创新的核心引擎

按市场发展趋势来看,人工智能将成为推动下一代技术创新的关键作用力,因此许多研究机构和企业争相在这一领域建立核心竞争地位。研究机构侧重发表人工智能研究论文,而企业则更加注重专利。研究人员致力于将人工智能的作用范围扩展到金融、医药、汽车、媒体以及法律和新兴行业,而创新应用的成功也势必催生出更多的论文和专利。

机器学习的研究趋势

机器学习是人工智能的一个子领域,通过数据计算对环境进行体验和学习。

机器学习通过计算机对目标环境的输入数据进行预处理,并识别出给定数据集的关键特征。由于在做决策之前先了解环境特征是实现智能化的基础,因此,机器学习可广泛应用于各种领域。

图5显示了1997到2016年间机器学习类论文的出版情况。随着机器学习算法在人工神经网络、深度学习、决策树学习、贝叶斯网络和遗传算法等领域不断取得进展,这些算法已被广泛应用于金融、ICT、医疗和教育等行业。

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 1997–2016年机器学习的论文出版趋势

来源： Web of Science 核心合集

谷歌DEEPMIND团队开发的ALPHAGO所使用的MCTS（蒙特卡洛树搜索）算法受到了1950年代初相关研究的影响

AlphaGo从2015年开始接连击败了数位世界一流的围棋大师。该系统使用的强化机器学习算法——更确切地说是MCTS（蒙特卡洛树搜索）算法——由1949年提出的蒙特卡洛方法和1963年提出的树搜索算法结合而成。这两种算法均已得到深入研究并广泛用于解决实际问题。

1990年代初,研究人员将这两种算法结合在一起,形成了更加先进的MCTS。在高性能计算能力的帮助下,2007年以来有关MCTS的研究取得了积极进展。2010年,DeepMind在伦敦成立,开始以MCTS为基础开发AlphaGo系统。

图6作为一个示例向我们展示了如何更好地发现新兴研究。高级人工智能算法的基础原理早在五六十年前便已出现,许多热门研究领域也都基于多年前的研究课题。另有许多热门或新兴研究领域均诞生于许多年之前,但在高性能计算能力出现之前几乎毫无进展。这也反映出,有些研究课题只有在遇到强大的推动力或催化剂时,才有可能成为热门研究方向。

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 AlphaGo系统采用的MCTS算法之起源

中国是机器学习领域研究论文发表数量最多的国家

如图7所示,近年来,中国在机器学习领域发表了大量的研究论文,数量超过美国。考虑到近期的机器学习研究侧重于实际应用,我们从中可以看到机器学习对技术和产业发展的直接贡献。

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 2007–2016年机器学习领域研究论文量较多的10个国家/地区|||来源： Web of Science 核心合集

图8显示了机器学习类论文发表数量排名前10的研究机构,其中有不少亚洲大学表现不俗。

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 2007–2016年机器学习类研究论文量最多的10家研究机构|||来源： Web of Science 核心合集

虽然机器学习一直都是热门研究领域并已取得了很多令人满意的成果,但仍需应对诸多挑战。机器学习着重于通过有限的输入数据流来了解环境,而人类则能同时洞悉各种不同的环境特征。群体学习是人类与生俱来的一种交际本能,但电脑却不具有这种属性。要让一组计算机模拟自然的人类互动并通过彼此互动来“相互学习”,可谓是严峻挑战。而并行处理海量数据则是应对这一挑战的方法之一,大规模分布式计算技术可使机器学习系统通过更接近人类的方式解决问题。

机器学习领域论文学术影响力最大的国家是美国,但中国正在迅速提高其人工智能的研究质量

与其他研究领域一样,在机器学习领域同样是论文的影响力比论文的产出量更重要。美国在人工智能研究领域稳占主导地位,这一点从其论文引用次数进入全球 0.1%、1% 和 10% 排行榜中的论文数量与其论文出版总量的比例便可见一斑。然而,如表 3 所示,中国在热点论文方面表现出色。我们在上文中曾经提到,许多热点论文阐述的都是新兴研究课题。鉴于机器学习研究成果可用于各类技术创新,因此,其他亚洲国家如想在该领域开展高影响力研究,可能需要加大投入力度。

表3 在机器学习研究方面最具影响力的国家（2007–2016）

国家	被引频次排名前0.1%的论文数/篇	被引频次排名前1%的论文数/篇	被引频次排名前10%的论文数 /篇	高被引论文数/篇	热点论文数/篇	论文总量/篇
中国	19	260	2 977	315	16	47 305
美国	90	807	5 398	434	10	31 356
德国	36	252	1 664	147	4	9 072
英国	16	100	704	45	1	7 345
日本	25	183	1 408	101	2	7 693
韩国	4	41	480	39	-	4 824

来源： Web of Science 核心合集

新窗口打开| 下载CSV

机器学习的新兴研究方向

近年来的高影响力论文主要集中在人工神经网络及复杂系统应用的进化编程

图9显示了我们对1996到2015年间5 000篇机器学习领域的高被引论文的聚类分析结果。相同颜色的点表示一组研究领域相似的论文。图中某些聚类专注于复杂系统或智能控制。分析显示,人工神经网络和进化编程等计算密集型算法在机器学习研究中表现出色。

图9

新窗口打开| 下载原图ZIP| 生成PPT

图9 5000篇高被引论文的聚类分析

图10显示了机器学习领域的热点研究课题,也揭示出“集成现有算法来提高性能”这一发展趋势。例如,模糊自适应神经网络基于的便是模糊逻辑、神经网络和自适应系统的研究成果。混合算法的研究则利用了每种方法的优势从而产生了令人满意的结果。

图10

新窗口打开| 下载原图ZIP| 生成PPT

图10 机器学习的新兴研究领域|||来源：科睿唯安研究前沿方法论

机器学习的专利表现分析

自2000年以来,机器学习显示出巨大的应用潜力,专利申请数量迅速增加

图11是对机器学习类专利进行技术分类的结果。可以看到机器学习专利不仅涉及计算机算法,还包括汽车、医药和生物技术等多个领域。这表明机器学习是助力许多行业实现技术创新的推动力。

图11

新窗口打开| 下载原图ZIP| 生成PPT

图11 1996–2015年基于 CPC 分类的机器学习专利技术分类|||来源： Derwent Innovation

企业的专利申请最为活跃

图12显示了机器学习的专利全景分析。与科学研究相比,机器学习类专利更注重实际应用。许多专利的基础都是创新研究成果。

图12

新窗口打开| 下载原图ZIP| 生成PPT

图12 1996–2015年机器学习领域的专利地图|||来源： Derwent Innovation

美国是机器学习类专利的主要申请国

如图13所示,美国在机器学习类专利申请中处于主导地位,位居其后的是日本。这意味着美国是全球极具吸引力的技术创新市场,并能提供良好的商业环境。

图13

新窗口打开| 下载原图ZIP| 生成PPT

图13 1996–2015年机器学习类专利申请国/地区分布|||来源： DWPI,1996-2015

IBM、微软和谷歌通过申请或收购而拥有大量专利

图14显示了机器学习类相关专利持有数量排名前10的企业。排在最前面的是几家美国公司,紧随其后的是德国和日本公司。机器学习类专利持有量百强企业中还包括韩国的三星和 LG 以及中国的华为和腾讯。

图14

新窗口打开| 下载原图ZIP| 生成PPT

图14 1996–2015年机器学习类专利申请数量最多的10家企业|||来源： Derwent Innovation

过去10年,谷歌在机器学习类专利申请方面表现突出

图15显示了2005–2009年与2010–2014年两个不同阶段专利申请变化的对比分析结果。谷歌在2010–2014年间的机器学习类专利申请与2005–2009年相比增长率超过200%;雅虎则减少了50%多,这可能是其近几年业务下滑所致。业务模式的变化则导致亚马逊的机器学习类专利申请出现迅速增长。

图15

新窗口打开| 下载原图ZIP| 生成PPT

图15 2005–2014年机器学习类专利申请的变化率|||来源： Derwent Innovation

结语

我们可以通过使用和改进人工智能来解决许多研究领域中的复杂实际问题。美国在人工智能研究方面一直占据主导地位,但中国、日本、韩国和新加坡等亚洲国家正在迎头赶上。

虽然研究机构和大学院校在人工智能研究方面一马当先,但在专利持有量方面却是企业占优。横亘在学术界与企业界之间的这道鸿沟可能会给希望在现有想法基础上继续创新的研究人员带来阻力。面对这种情况,唯有将学术界定位为企业盟友而非竞争对手才是正解。此外,人工智能专利的积极申请也可能对开源软件社区的研究造成限制。鉴于人工智能将在技术创新中发挥关键作用,研究机构也应重视与人工智能相关的专利申请。

为了加速人工智能研究的前进步伐,为了促进企业创新,应该关注以下4个方向。

人工智能研究属于多学科前沿领域,其发展需要各领域的密切合作

人工智能的研究并不局限于计算机科学,而是需要汇集无数领域的智慧结晶。相互启发、互通有无的研究领域越多,人工智能的创新成果就越丰富,作用范围就越广泛。许多颇具影响力的研究成果都是不同领域的专业研究团体之间展开密切合作的结晶。

研究机构需要与企业密切合作

人工智能的许多研究成果均可投入商用。企业趋之若鹜的技术创新正是研究机构的专长所在,但双方必须建立紧密合作才能实现各自的战略目标,最终实现双赢。研究机构或技术转让办公室可监测行业领域对人工智能的使用趋势。企业则可监测人工智能的研究趋势,以发现可利用的创新研究成果。

人工智能的实施需依靠训练有素的软件人才

人工智能的创新成果理应得到系统化实施。但人工智能编程与企业的事务处理系统有所不同,需要操作人员具备高级分析技能。此外,协同开发人工智能应用软件的领域专家也不擅长编程工作。因此,实施人工智能绝对离不开拥有良好沟通能力、并且明确了解企业具体需求和目标的软件专家。

人工智能专利是技术创新的核心内容,专利保护至关重要

鉴于人工智能将成为技术创新的核心组成部分,因此,ICT、汽车、医疗卫生、生物技术和金融等诸多领域的企业都非常重视保护人工智能专利。但研究人员往往疏于专利申请。因此,研究机构必须制定适当策略,依据该策略来处理他们的研究成果,建立并拥有有效的专利组合,只有这样才能实现其研究成果的商业化,给未来研究筹得资金并提高机构的知名度。

The authors have declared that no competing interests exist.

作者已声明无竞争性利益关系。

观宇宙之博大 察万物之精微