欧洲科学院院士：中国领先计算机视觉和机器人领域，但AI研究还不足以支撑垂直领域解决方案

2021-08-23 07:25:49

德国人工智能研究中心（DFKI）成立于1988年，是全球最大的基于人工智能的非营利软件技术中心，是德国最大的从事软件技术和应用的研究机构，研究方向覆盖大数据分析、知识管理、画面处理与理解、自然语言处理、人机交互、机器人等各个领域。中心成功吸引了谷歌、英特尔、微软、宝马等多家全球前十的*科技企业的投资。

不仅如此，DFKI在科技成果商业转化方面也有深厚积累，已经孵化百余家创业公司。其中，50多家目前保持着较高的市场活跃度，在各自所处的细分领域也都极具竞争力。

3月29日，DFKI科学董事汉斯·乌思克尔特（Hans Uszkoreit）教授受邀出席2018新智元产业跃迁AI技术峰会，并与新智元交流了中美欧人工智能市场和技术发展差异，以及他认为有前景的研究方向。

如何构建一家伟大的人工智能研究机构？DFKI在科技成果转化方面遵循一套怎样的流程？深度学习在自然语言处理方面有怎样的发展？本文一一给出解答。

汉斯·乌思克尔特（Hans Uszkoreit）

欧洲科学院院士

深知无限人工智能研究院院长兼首席科学家

汉斯·乌思克尔特教授是德国人工智能研究中心（DFKI）科学董事，北京深知无限人工智能研究院（AITC）院长兼首席科学家，联想研究院人工智能首席顾问，柏林工业大学荣誉教授，欧洲科学院院士和国际计算语言学委员会成员。乌思克尔特教授多年来从事并引领着人工智能领域的学术及研究工作，尤其在语言和知识科技领域，拥有超过30年的经验，参与创立并指导了数十家人工智能初创公司，其研究成果刊登于200多家国际出版物。

如何构建一家伟大的AI研究院：最激烈的竞争是争取人才

DFKI是世界上最大的人工智能研究机构之一，到2018年正好有30年的历史，成果丰硕。很自然地，如何创建以及管理这样一家伟大的AI研究机构，就成了我们首先请教乌思克尔特教授的问题。

乌思克尔特教授告诉新智元，如今的情况与30年前发生了很大的变化。“30年前，就算前路坎坷，只要我们非常有远见，有一个强大的团队，得到业界和*专门支持，就可以着手成立研究院。我们有充足的时间去发展和改变研究主题，同时探索和不断适应商业化战略。”

“但在今天，虽然社会对人工智能的需求变大了，但竞争也很激烈。最激烈的竞争就是争取人才。因此，需要仔细计划，选择主题，决定次序，整理强有力的材料，才能找到需要的专业人才。

“总体来说，要完成现有前沿技术商业化，还需要踏踏实实、兢兢业业做好研究（以及金融支持），明天才可以获得新成果，毕竟今天的技术也会成为历史。”

此外，拥有一个国际化的顾问团队也很重要，“在疑惑时帮你做正确选择，在受到资助方质疑时维护你、支持你，借鉴经验，且保持科学高标准。”

吸引人才的最强磁铁是人才本身；钱不是最主要的，但没有钱不行

如今，DFKI旗下有千名研究人员，其中不乏院士、两院院士甚至三院院士，在众多领域展开交叉合作。这对管理提出了极高的要求。与此同时，近几年来，以谷歌为首的科技巨头也在AI人才方面大量挖掘。作为DFKI的管理者，乌思克尔特教授表示，招聘和留住年轻的优秀人才和经验丰富的专家，一直都是最大的挑战之一。

“吸引人才的最强磁铁是人才本身，尤其是成功人士。壮志酬酬的年轻研究人才会被值得学习的对象吸引，会被可以让人才成长和增长才智的地方吸引。一个新成立的研究中心很难迅速达到这种程度。除非成立之初就有一批能人相助，不然就要慢慢积累以达到高水平。”

“为了吸引年轻人才，钱不是最主要的。然而，想要在人才稀缺，薪酬随之飞升的时代，要留住经验丰富的领袖人才，钱就成了重要问题。”

“但还是有成熟的研究员愿意做基础研究，即使同行的工资是他们的两倍。但现在行业内工资上涨了三倍，产业界有很多机会从事振奋人心的研究，波动随之变得很大。公共研发资助必须适应这种环境，年轻的博士生也要快速成长，承担领导任务。”

孵化公司是研究成果商业化的一条重要渠道，要在市场需求产生前创立公司

DFKI成功的一大因素，在于其自筹建之初就非常注重对从研究到实际应用的转化，积累了大量产业成果。不仅如此，自成立以来，DFKI在全球范围内孵化了Chusable、B4、Ascella、Camelot、DHC、Digipen等在内的数十家分支机构，孵化了近百家AI科技公司。其中，50多家目前保持着较高的市场活跃度，在各自所处的细分领域也都极具竞争力。

乌思克尔特教授说，DFKI拥有多种渠道将研究成果商业化，孵化公司就是其中之一，也是很重要的一条渠道。“我们仅在极少数的情况下直接对接市场，换言之就是在规范的软件平台上出售产品，因为想要保持这种商业模式，必须建立和稳固销售及支持团队。”

DFKI成功实现商业化的原因之一，是他们的战略规划方案。每一个研究中心都有短期和长期发展路线图，这些路线图由研究团队制定，再经DFKI指导委员会会议讨论、修订和最终协调确定，实现研究目标和研究机遇同实际需求和未来期望相互结合。如此一来，可以在热点话题变成热点之前开展研究。

“但找出最合适的一条商业化渠道，还是需要一段时间。”乌思克尔特教授说。

中国现有AI研究尚不足以支撑垂直领域解决方案

在AI技术落地方面，欧洲、美国和中国的现实情况存在很大不同。以创业公司为例：DFKI成功孵化了很多创业公司，但在德国或者欧洲，有时候孵化公司虽然成立，但市场还未产生前沿技术需求。

在德国，前沿技术需求市场数量很少，远远不及美国或者中国。很多德国公司规模尚小，又走不出欧洲市场。症结或在于欧洲市场规模较小，市场估值较小，外资规模自然小于美国和中国。这就导致很多DFKI的孵化公司发展速度远远低于中国或美国的平均水平。

但乌思克尔特教授指出，这样做仍然比在需求产生后再成立公司要好，因为市场需求产生后，经济实力更加雄厚的竞争者会成立规模更大的公司。“即便市场还没有准备好，初创技术公司仍然可以依靠坚实的创新技术继续发展。”

另一点不同是产业结构。美国互联网产业发展速度十分可观，中国是全球唯一拥有大规模互联网产业且能与美国媲美的国家。美国电子产品产业规模也十分巨大，中国、韩国和日本也拥有优势，德国却没有。德国的制造业发展强劲，但大多服务于出口，中国也是如此。所以，“中国和德国都需要人工智能赋能制造业走向世界。”

乌思克尔特教授认为，在中国成熟人工智能技术商业化要容易得多。“如果在中国也有一家DFKI，市场需求规模大，投资规模大，商业化会比在欧洲容易得多。”

在中国，大多数人工智能研究都集中在几个领域，近期重大突破促进技术发展日臻成熟。中国在计算机视觉产品开发方面处于领先地位，在机器人研究和人工智能增强数据分析方面实力雄厚，语音技术发展日趋强劲，机器翻译逐步完善。

但是，“中国现有的研究还不能满足垂直解决方案需求，这种方案结合多种人工智能技术和可循环利用的显性知识，对制造业、医疗、交通和旅游业发展都有益处。在视觉产品开发方面，中国很有可能在国际市场上取得成功。我觉得中国在几个有关机器人研究的领域也会取得领先地位。关于基于海量知识的应用，语言障碍是很大挑战，因为就连结构化知识也极大地依赖于语言。”

最有前景领域：将深度学习和结构性知识相结合

在谈到最近自然语言处理领域令他兴奋的工作和进展时，乌思克尔特教授不出意外地提到了机器翻译。机器翻译实现跨越式发展令他非常激动，虽然现在的机器翻译还不能完全取代专业译员，但还是很受用户欢迎。

“得益于深度学习，端对端的基于神经系统的自然语言处理发展速度非常惊人，相比之下，用于深度解读，基于语言学和知识的自然语言系统发展速度就相对扎实平缓。这说明语音识别系统、语音生成系统、中等质量机器翻译、简单问答系统，甚至短篇新闻报道生成系统，都具备应用于现实的能力。”

但是，在自然语言处理领域和计算机视觉领域，要实现“理解”场景和观察行为，我们需要更多世界知识，这也包括从标记文本、标记图片中得到的常识知识。“大多数知识只有在你已经拥有很多知识的情况下才能获得，对机器来说也是如此。”乌思克尔特教授说：“因此，现在应用于自然语言处理的学习方案，还不足以让产品生成对话、文本理解或高质量翻译，必须有更多知识才行。目前的系统在现有标注语言数据中还归纳不出这么多知识。”

“我觉得最有前景的研究领域就是把深度学习和在维基数据、DBpedia和谷歌搜索的知识图谱中找到的结构性知识相结合。这并不意味着我们要将所有需要的知识机械地表达出来，大部分知识可以被自动提取。但这就意味着我们需要神经网络实现系统的获取知识，并不同阶段持续学习。”

“研究机器学习会演化更大的领域，包括研究机器教学或全面机器教育，将涵盖控制获取基础世界知识，常识知识，语言能力和专业领域知识。”

以下是汉斯·乌思克尔特教授在2018新智元产业·跃迁AI技术峰会上的演讲《基于知识和机器学习技术的人工智能强化决策支持应用》。

欧洲科学院院士：中国领先计算机视觉和机器人领域，但AI研究还不足以支撑垂直领域解决方案

汉斯·乌思克尔特：各位下午好！今天我想谈一谈AI在深度分析现有动态数据和动态资源方面的应用。

在机器学习出现之前，AI领域有两种系统：一种是基于知识的系统，比如基于规则的信用检查系统；一种是基于行为的系统，比如传统反应性的机器人控制。机器学习出现后，机器不仅可以学习行为，也可以学习知识。

有些人可能会很意外，Google的机器翻译并不是基于知识的，而是基于行为，或者说基于人类的经验，它的基础是大量已经有过翻译的文献和文本资料。无人驾驶也是基于人类行为的一种系统。同样的还有阅读理解，严格来讲并不是“理解”，而只是从人类的语言当中学习记忆。

相反的，IBM Watson是基于知识的一种系统，文本分析系统也是基于知识的系统，还有聊天机器人，和人聊天的时候，在自己的系统当中寻找答案。

我们可以在这些基于知识的系统当中看到基于行为的系统，比如在学习的时候，除了以知识为基础，还会学习行为和经验。

我们为什么会看到这样的发展？为什么以前没有这样的变革？因为五大领域的进展，包括大数据、机器学习、知识技术、互联网技术和硬件。

AI发展有4个阶段，启发式搜索和推理，基于人工设置的规则进行知识处理，从海量数据中进行机器学习，最后是结合了机器学习和知识技术的认知系统。

现在有两大令人兴奋的发展，其中一个是网络2.0、语义网（也即“网络3.0”）和数据知识社区，比如*、维基数据和DBPedia。另一个就是各种相连的系统，现在我们有非常多的数据库，我们常说的物联网信息物理系统，还有工业4.0当中的“数字双胞胎”（Digital Twin，指物理资产或流程的软件模型）、智能企业等以产品为驱动力的生产行为。总体来讲，所有智能企业都是属于这个领域。

在工业4.0概念中的智能工厂，其核心是智能制造，基础是产品、经验和记忆。拓展开去，外面的部分并不完全来自制造业，比如智能出行、智能物流和智能楼宇。

现在我们做的工作，原先并没有出现在这幅图景当中，但也十分重要，比如最重要的竞争者、消费者和供应商，有了这些，工厂才能正常运营，媒体也很重要，包括投资方和监管方，还有技术的提供方。

我们需要把这些结合到工厂的运作当中，要把圈内的内容和圈外的内容结合起来，才能做到企业的管理、工厂的管理。这些工作看起来好像和我们狭义的生产制造不是那么近，但其实这是很重要的，比如我们要知道智能客户关系管理、客户喜不喜欢我们的东西，还可以做到智能的项目管理，也要知道供应商提供的物料来源怎样、价格怎样，还需要社会*关系，所有的这些都是我们工作的一部分，这样才能带来企业的成功。

因此，我们需要得到许多外部的信息和数据，很多可能需要买，但还有很多数据是开放和开源的，比如网络上的资料、新闻媒体的报道、社交媒体的资料。我们可以分析这些外部的数据和信息，帮助圆圈内部的企业和工厂，加入到他们的决策和运作当中，比如我们可以做偏航的预警，也可以做到流程的优化和预测分析，根据过往的经验预测这个月或者下个月哪种产品会有更好的销量。

以产品的销量分析为例，我们就希望能够分析为什么有的时候销量是上升的，有的时候销量是下降的，再把销量的数据和其他数据进行比较。现在我们专门拿出来一条天气的曲线，比较天气的曲线和销量的曲线是有大致的相关性，但并不是完全相关。

我们继续分析更多的信息，可以看到一个高点，纽波特举办游艇展的时候，给我们带来了更多的销量，这是不是因为有了更多的人来到这个区域？

不光是简单分析一家企业或者工厂的数据，各个地区的许多家企业联合在一起，都可以应用这样一种分析的方法和思路。

这张图展示了铜的销量，高级铜的售价有升有降。为什么铜价会急剧上升？可以发现那段时间在智利的北部发生了地震，所有的这些红点都是铜矿，所有的蓝点都是炼铜厂。这个圆圈的波纹是地震的范围。我们需要知道地震是否真的影响了铜价，做了分析以后发现，当时的地震和铜价的上升是没有关系的。

有时候我们会听到很多的传闻，A影响了B，B影响了C，但不管是否最后真的相关，我们都需要让机器来学习，因为并非每一个人都会根据特定的规则和传统来行事，所以我们都需要让机器来做分析和学习。

还是在这个铜价表上，蓝色圆圈的位置是铜价下跌了，这个时候发生了什么事情呢？当时有新闻报道，中国的铜矿价格平稳。这条信息并没有什么负面性，只是讲到了中国的铜价是持平的，但展示了资讯的影响力。因此，紧跟资讯是一件很好的事情，能够帮助我们做出商业上的决策。

这是大英百科全书的图片，我们知道它的内容非常详尽，但*的资讯量更多，里面不仅有传统百科全书的内容，还有很多新的数据和资讯。这里有达芬奇、蒙娜丽莎和米开朗其罗这些有关联的概念，建立起了知识图谱。

知识图谱也是现在Google、百度、必应搜集和存储信息的一种方式。这是开放数据网络，有些是电影的数据库，有些是元素的数据库，可以说是无所不包，但它们都在语义上相互关联，对知识系统来说越来越重要。

我们可以把所有的知识放在一个系统当中，这些知识系统没有我们大脑的局限，在这种情况下，机器就会胜过我们，因为我们没有办法拓展我们的大脑。在智能工厂中和人互动的机器人，它们在情商和智能方面也会越来越高，这可能就是未来的发展方向。

在我们的项目当中，我们会把不同的数据结合起来，比如气象学数据、地理数据，还有一些内部企业数据。我们说服一些公司，让他们把知识放到我们的知识图谱当中，这些数据就会变成一种新的形式。我们在想怎样才能把公司内部和外部的数据鸿沟弥合起来，怎样才能让这些数据为人所用。

我们和西门子以及更小一些的市场研究公司，比如VICO、*以及其他的合作伙伴，联手建立了一个世界性的项目，总部在柏林。我们想把内部企业数据、公开数据和公开知识相连接，而为了实现这一点，我们就需要知识图谱、开源方法和工具，通过语言、技术和结构性、统计性的学习，这种工具叫做Apache Flink，对流数据的处理更好一些，我们也有很多的流数据，所以把这些都嵌入到大数据的平台当中，通过方法分析这些数据，并且和公司实现这些数据的利用。

我们有两个商业领域的应用，供应链管理和市场研究。包括一些大公司在内，对于这两个方面都有很大需求。这是Smart Data Web（SDW），就是智能数据网，可以将不同的数据结合起来。SDW的理念是把公网上的信息和企业的内部信息连接起来，这样我们就能够把公开数据和企业数据结合起来，而不是把这个企业的数据拿出来，因为企业不喜欢把他们的数据拿出来，另一方面，*也不喜欢单独的公司把他们的世界观放到*上面。

同时，我们必须找到方法来使用不断增长的数据，获取最核心、最重要的信息，比如地震在哪里，哪家公司可能会倒闭，哪家公司的高层人员要跳槽等等。现在问题的最大难点是什么呢？就是人类的语言，我们没有办法按照公式交流，同样一件事情有很多不同的表述。

但是，还是能从中找到一些规律。我举一个例子，旧金山有一家很出名的公司，叫做PowerSet，在2008年的时候以10亿美元的价格被微软收购。如何让机器学会从大量信息中学到这个事件？实际上很简单，用Google搜索可以发现很多不同的消息都是关于这起收购案，一旦提到“微软”、“PowerSet”、“2008年”这三个词，说的就是这件事，剩下的语言分析就简单了。当然，也要注意虚假数据。可能是这样的句子，PowerSet对另外一家公司感兴趣，并不是讲这个收购案的，所以我们需要剔除这样的数据。

现在我们已经在应用这样的技术了，正在为中国的一家制造企业提供相关的技术，之前这家公司从来没有用过AI方面的软件，但是在全世界范围内都有很多的客户，他们不知道客户的想法是什么，因为他们不懂法语和德语，但我们帮助他们收集客户评价，并且告诉他们产品到底是什么特点，客户喜欢或者客户不喜欢，竞争对手的产品当中，客户喜欢什么或者不喜欢什么，其他产品价格如何，这些非常精准的分析可以为企业提供自身产品和竞争对手产品的比较。

我们构建起一家叫深知无限（AITC）的公司，也是在北京开发了我们的软件，之前是在德国开发的，但现在中国发展的速度很快，我们也来到了中国。我们有一家子公司专注于金融方面的应用，比如铜价分析。我们也给西门子提供供应链方面的服务，还有很多应用都是可能的。如果大家对我们的业务有兴趣，欢迎大家和我们联系。

原文发布时间为：2018-04-14

本文作者：闻菲

本文来自云栖社区合作伙伴新智元，了解相关信息可以关注“AI_era”。

原文链接：欧洲科学院院士：中国领先计算机视觉和机器人领域，但AI研究还不足以支撑垂直领域解决方案

码农公寓

相关文章