人工智能前沿记：深度学习的应用和价值

2023-10-13 19:35:10

有一份对19个行业和9个业务职能的400多个用例进行分析的报告突出了先进人工智能技术的广泛应用和重大经济潜力。

人工智能(AI)作为数字时代的转型技术脱颖而出——人工智能在整个经济中的实际应用正在快速增长。为了撰写《人工智能前沿记：数百用例知道多》这一简报，我们将传统分析和更新的“深度学习”技术及其可以解决的问题映射到公司和组织的400多个特定用例中。借助麦肯锡全球研究院的研究以及麦肯锡分析人工智能的应用经验，我们评估了跨行业和业务职能的高级人工智能技术的实际应用和经济潜力。我们的研究结果强调了在整个经济中应用深度学习技术的巨大潜力，但随着技术的不断发展，我们也意识到一些挥之不去的局限和障碍(以及未来的机遇)。最终，人工智能的价值不在于模型本身，而在于公司是否有能力使用人工智能。

即使我们意识到使用人工智能技术的经济潜力，数据的使用也必须始终考虑到数据安全性、隐私和潜在的偏见等等的问题，这一点不得不强调。

将人工智能技术对应到问题类型

随着人工智能技术的发展，到底是哪种技术构成了人工智能的定义也在不断发展。出于本简报的目的，我们将使用人工神经网络的深度学习技术的简称为人工智能。我们还考察了其它机器学习技术和传统分析技术。

神经网络(neural network)是机器学习技术的一部分。神经网络本质上是基于通过模拟方式连接的“神经元单元(neural unit)”的人工智能系统，这些系统粗略地模拟了神经元在大脑中的相互作用方式。自20世纪40年代以来，人们已经研究了受神经连接启发的计算模型，并且随着计算机处理能力的提高和大型训练数据集成功地用于分析输入数据(如图像、视频和语音)而再次声名大噪。人工智能从业者将这些技术称为“深度学习”，因为神经网络具有很多(“深”)层的模拟互连神经元(simulated interconnected neuron)。

我们分析了三种神经网络技术的应用和价值：

• 前馈神经网络(feed forward neural network)：最简单的人工神经网络。在这种架构中，信息仅在一个方向上移动，从输入层向前移动，经过“隐藏”层移动到输出层。网络中没有环路(loop)。首个单神经元网络是由人工智能先驱Frank Rosenblatt在1958年提出的。虽然这个想法并不新鲜，但计算能力、训练算法和可用数据的发展促成了高于以往的性能水平。

• 递归神经网络(Recurrent neural network，RNN)：人工神经网络的神经元之间的连接包含环路，这些环路非常适用于处理一连串输入。2016年11月，牛津大学的研究人员报告说，基于递归神经网络(和卷积神经网络)的系统在唇读(reading lips)方面达到了95%的准确率，优于经验丰富的人类唇读者，后者的准确率为52%。

• 人工神经网络，其中神经层之间的连接受到动物视觉皮层(animal visual cortex)的启发，动物视觉皮层是大脑处理图像的部分，非常适用于感知方面的任务。

对于我们的用例，我们还考虑了另外两种技术——生成对抗网络(GAN)和强化学习——但未将它们包含在我们对人工智能的潜在价值评估中，因为生成对抗网络这一新生技术尚未得到广泛应用。

生成对抗网络(GAN)使用两个神经网络在零和游戏(zero-sum game)框架中相互竞争(因此是“对抗”)。生成对抗网络能学会模拟各种数据分布(例如文本、语音和图像)，因此，一旦没有数据分布可用的话，该网络就能生成测试数据集，这很有用。

强化学习是机器学习的子领域，在强化学习中，系统通过接收虚拟“奖励”或“惩罚”来得到训练，这实际上是通过试错法来学习。谷歌DeepMind已经使用强化学习来开发可以玩游戏的系统(包括视频游戏和围棋(Go)等棋类游戏)，其能力胜过人类冠军棋手。

在业务环境中，这些分析技术可用来解决现实问题。最普遍的问题类型是分类、连续评估(continuous estimation)和聚类(clustering)。侧栏中提供了问题类型及其定义的列表。

用例带来的洞察

我们整理并分析了19个行业和9个业务职能部门的400多个用例。这些用例为特定部门里的领域带来了这样的洞察——深度神经网络在这些领域里所能创造的最大价值，这些神经网络相较于传统分析所能产生的增量提升，以及为了实现潜力而必须得到满足的贪婪的数据需求(就数量，种类和速度而论)。我们的用例库虽然范围很广，但并不详尽，可能会夸大或低估某些部门的潜力。我们将继续对它进行改进和扩充。

人工智能可用于改善现有用例性能的例子包括：

• 预测性维护(predictive maintenance)：机器学习检测异常的能力。深度学习能分析大量高维数据(high dimensional data)，因此它可以将现有的预防性维护系统(preventive maintenance system)提升到一个新的水平。如果将额外的数据(例如来自其它传感器的音频和图像数据，来自麦克风和摄像机等相对便宜的传感器也算)加入分层中，神经网络就可以增强并取代更传统的方法。人工智能能够预测故障并使有计划的干预措施成为可能，这些能力可以减少停机时间和运营成本，同时提高生产力。例如，人工智能可以用传统的分析技术延长货机的寿命，使其寿命大大超出预期，方法就是将飞机模型数据、维护记录、物联网传感器数据(例如发动机振动数据的异常检测)和表明发动机状况的图像和视频通通结合起来。

• 人工智能驱动的物流优化可以通过实时预测和行为指导来降低成本。物流中使用人工智能技术(如连续评估)可以为各个部门带来实实在在的增值。人工智能可以优化运输路线，从而提高燃油效率并缩短交付时间。有一家欧洲货运公司将燃油成本降低了15%，其方法五花八门，比如使用能同时监控车辆性能和驾驶员行为的传感器，让司机接收实时指导(包括何时加速或减速)、优化油耗并降低维护成本。

• 人工智能可以成为解决客服管理和个性化服务方面的难题的有用工具。因为人工智能技术的应用，呼叫中心管理和呼叫路由(call routing)中的语音识别得到了改善，为客户提供了更加无缝的体验(和更高效的处理能力)。这些功能不仅仅停留在文字上。例如，对音频进行深度学习分析使系统能评估客户的情绪;如果客户对系统反应不佳，呼叫会自动再路由到接线员和管理员。人工智能技术在营销和销售的其它领域也能产生重大影响。将客户人口统计、过去的交易数据与社交媒体监控相结合有助于生成个性化的产品推荐。面向个人客户的“下一个要购买的产品(next product to buy)”推荐(亚马逊和网飞等公司已成功实施)可以使销售转化率提高两倍。

人工智能的使用场合中，有三分之二用于提高现有分析用例的性能

在我们研究的69%的用例中，深度神经网络可用于提高性能，其提升性能的能力优于其它分析技术。我们将不得不使用神经网络的情况姑且称为“绿地(greenfield)”案例，这种情况仅占总数的16%。对于剩下的15%，人工神经网络在性能上略胜于其它分析技术，原因之一是数据的局限导致这些案例不适用于深度学习。

绿地人工智能解决方案(Greenfield AI solution)在客户服务管理等业务领域以及数据丰富且数量庞大并且有时会整合人类反应的一些行业中非常普遍。在各大行业中，我们发现医疗领域里绿地用例尤其多。这其中有一些用例涉及疾病诊断和护理改善，这些用例还依赖于包含图像和视频输入的富数据集(MRI发来的图像和富数据集也算)。

平均来看，我们的用例表明，现代深度学习人工智能技术对附加值的提升可能远高于传统分析技术，高出30%到128%不等，具体要看行业。

然而，在我们掌握的大量用例中，由于人工智能在某些情况下潜力有限，所以传统分析和机器学习技术继续支撑着行业(包括保险、制药和医疗产品以及电信)中很大一部分的价值创造潜力，人工智能则局限于某些环境中。在某种程度上，这归咎于这些行业使用数据的方式，归咎于监管问题。

深度学习的数据需求远远高于其它分析

要在大多数应用中高效使用神经网络就需要大型的经过标记的训练数据集，同时充分使用计算基础设施。此外，这些深度学习技术特别强大，能从复杂的多维数据类型(如图像，视频，音频或语音)中提取模式。

深度学习方法需要成千上万的数据记录才能使模型在分类任务中表现得相对较好，在某些情况下，该方法要数百万的数据记录才可以达到人类的表现水平。根据一个估计，有监督深度学习算法(supervised deep-learning algorithm)往往能达到可接受的性能(每个类别有大约5,000个标记示例)，并且当人们用包含至少1,000万个标记示例的数据来训练有监督深度学习算法时，该算法能达到或超越人类的表现水平。在目前使用高级分析的某些情况下，可用的数据非常多(每个数据集有数百万甚至数十亿行)，以至于人工智能非用不可。但是，如果数据量阈值未达到，人工智能可能无法为传统的分析技术增值。

对于很多业务用例而言，这些海量数据集很难获取或创建，并且标记仍是一个难题。当前大多数人工智能模型都是通过“有监督学习”进行训练的，有监督学习要求人类对基础数据进行标记和分类。然而，有前景的新技术将克服这些数据瓶颈(例如强化学习，生成对抗网络，转移学习和“一次性学习”)，使训练有素的人工智能模型可以根据少量(有时只有一个)真实的演示或示例来学习主题。

组织必须采用和实施能大规模收集和整合数据的战略。即使组织有大型数据集，它们也必须防止“过拟合(overfitting)”，即模型与训练集的“嘈杂的”特征或随机特征过于匹配，过拟合会导致未来性能缺乏相对的准确性，它们还要防止“欠拟合(underfitting)”，即模型无法捕获所有相关功能。将客户群和渠道之间的数据连接起来，而不是让数据在孤岛中衰败，这对于创造价值尤为重要。

人工智能要实现全部潜力就需要各种数据类型(包括图像、视频和音频)

神经人工智能技术(Neural AI technique)擅于分析图像、视频和音频数据类型，因为它们具有从业者称为“高维度”的复杂的多维性质。神经网络擅长处理高维度，因为网络中的多个层可以学会表述数据中存在的很多不同特征。因此，对于人脸识别来说，网络中的第一层可以关注原始像素，下一层则关注边缘和线条，再下一层则关注通用面部特征，而最后一层则可以识别人脸。这些神经网络技术不同于前几代人工智能(前几代人工智能往往需要人的专业知识来做“特征工程”)，它们往往能够学会在模拟神经网络中表述这些特征，成为训练过程的一部分。

除了和数据量和数据有关的各种问题，速度也是一个需求：人工智能技术需要重新训练模型，以匹配可能的条件变化，因此训练数据必须经常刷新。在三分之一的案例中，模型至少每月更新一次，几乎四分之一的案例需要每天更新;在营销和销售以及供应链管理和制造方面尤其如此。

确定人工智能潜在价值的大小

我们估计，我们在本次简报中引用的人工智能技术有可能在19个行业的9个业务职能中每年创造3.5万亿至5.8万亿美元的价值。这构成了每年总体影响力(即9.5万亿到15.5万亿)约40%的比重，这个比重也许可以由所有的分析技术实现。

按行业来看，我们估计人工智能的潜在价值相当于2016年收入的1%至9%。按行业收入百分比衡量的价值在不同行业之间大不相同，这取决于具体的适用用例、大量的复杂的数据的可用性，以及监管和其它限制因素。

这些数字不是某个特定时期的预测，但它们表明了高级分析所代表的全球经济的巨大潜力。

从我们研究过的用例中，我们发现使用人工智能产生的最大潜在价值影响都包含在以销售收入为导向的功能中，例如营销和销售，也包含在以损益表底线为导向的运营功能，包括供应链管理和制造业。

零售和高科技等消费行业往往在营销和销售人工智能方面的应用程序中更有潜力，因为业务和客户之间的频繁数字互动会产生更大的数据集，以便用上人工智能技术。特别是电子商务平台将受益。这是因为这些平台可以轻而易举地收集客户信息(例如点击率数据或客户在网页上花费的时间)，然后能动态、实时地为每个客户定制促销、价格和产品。

以下是我们看到的受到人工智能影响的三个部门的简介:

• 在零售业，营销和销售是人工智能能发挥最大潜在价值的领域，在该职能范围内，定价和促销以及客户服务管理是主要的价值领域。我们的用例表明，使用客户数据将促销活动个性化(例如，包括每天定制个别优惠)就可以使实体零售商的增量销售额增加1%到2%。

• 在消费品中，供应链管理是可以从人工智能部署中受益的关键功能。在我们所列举的用例中，我们发现基于需求的潜在因果驱动因素(而不是先前的结果)的预测如何能够将预测准确性提高10%到20%，这意味着库存成本可能会降低5%，收入可能会增加2%到3%。

• 在银行业，尤其是零售银行业(retail banking)，人工智能在营销和销售方面具有巨大的价值潜力，丝毫不亚于它在零售业的价值潜力。然而，由于评估和管理银行业风险的重要性(例如贷款承保和欺诈检测)，人工智能在提高银行业风险绩效方面所具有的价值潜力要高于很多其它行业。

通往产生影响力和价值的道路

人工智能正在吸引越来越多的企业投资，随着技术的发展，可发掘的潜在价值很可能会增长。然而，到目前为止，只有约20%意识到人工智能重要性的公司目前在核心业务流程中使用其中一项或多项技术，或大规模使用这些技术。

尽管人工智能技术前景广阔，它仍有很多需要克服的局限。这些局限包括上面列出的苛刻的数据需求，还包括一下五个局限：

• 第一个局限是标记训练数据的挑战，这些数据往往必须手动完成，它们对于监督学习是必要的。有前景的新技术正在不断涌现，旨在应对这一挑战，例如强化学习和流内监督(in-stream supervision)，在这些技术里，数据可以在自然使用过程中进行标记。

• 第二个局限是难以获得足够大且全面的数据集用于培训;对于很多商业用例来说，创建或获取此类海量数据集可能很困难——例如，有限的临床试验数据可以更准确地预测医疗治疗结果。

• 第三个局限是难以用人类的话来解释大型复杂模型得出来的结果：为什么达成了某个决定?例如，医疗以及汽车和航空航天工业中的产品认证可能是一个障碍;除了其它限制因素外，监管机构往往希望规则和选择标准能够得到清楚的解释。

• 第四个局限是学习的普遍性：人工智能模型从一种情况转移到另一种情况时仍然存在困难。这意味着公司必须投入资源来训练新模型，即使是与之前类似的用例。迁移学习(人工智能模型在这里得到训练以完成某项任务，然后快速将学到的知识应用于类似但不同的活动)是对这一挑战的一个有前景的回应。

• 第五个局限涉及数据和算法偏差的风险。这个问题本质上涉及更具社交意义的忧虑，并且可能需要更广泛的步骤来解决，例如，要了解用来收集训练数据的流程以什么样的方式影响曾经受过它们训练的模型的行为。例如，当训练数据不代表应用人工智能模型的较大人口时，人们可能会引入非预期的偏差。因此，当人们将人脸识别应用到具有更多不同特征的群体时，在与人工智能开发者的人口统计相对应的面部群体上受到训练的人脸识别模型可能会遇到困难。最近关于恶意使用人工智能的报告突出了一系列安全威胁，如复杂的入侵自动化、超个性化的虚假政治宣传活动等等。

组织面临的与技术、流程、人员有关的难题可能会减缓或阻碍人工智能的采用

计划采用重要深度学习工作的组织要考虑一系列有关如何做到这一点的选择。选择范围包括构建完整的内部人工智能功能，将这些功能外包或利用人工智能即服务(AI-as-a-service)产品。

公司要根据计划要构建的用例来制定一个能产生结果和预测的数据计划，这些数据计划可以输入设计的界面，供人类在交易系统上进行操作。关键的数据工程难题包括数据创建或数据获取，定义数据本体(data ontology)以及构建适当的数据“管道”。鉴于深度学习的重要计算要求，因为法规或安全问题，有些组织将维护自己的数据中心，但资本支出可能相当大(特别是在使用专用硬件时)。云供应商提供另一种选择。

如果组织在数字化方面不成熟，流程也可能会成为成功采用的障碍。在技术方面，组织必须开发强大的数据维护和治理流程，并实施现代软件规程，如敏捷(Agile)和开发运维(DevOps)。在规模方面，更难的是克服“最后一英里”问题，即确保人工智能提供的卓越洞察在企业人员和流程的行为中得到实例化。

从人的阵线来说，深度神经网络的大部分建设和优化仍然是一种艺术，因此需要真正的专家才能提供逐步改进的性能。这些技能供不应求;根据一些估算，具备解决严重人工智能问题所需的技能的人不到10,000个。科技巨头们纷纷展开激烈的人才争夺战。

人工智能似乎是一个难以捉摸的业务用例

在人工智能技术和数据可用且价值得到明确验证的情况下，组织就可以抓住机遇。在某些领域，当今的技术可能已经成熟并且数据已经可用，但考虑到人工智能可能生成的价值，部署人工智能的成本和复杂性可能根本不值得。例如，航空公司可以使用人脸识别和其它生物识别扫描技术来简化登机流程，但这么做所带来的价值可能无法证明与隐私和个人身份有关的成本和问题的合理性。

同样，我们看到了很多潜在案例，在这些案例中，数据和技术日趋成熟，但价值尚不明朗。最不可预测的情况是，数据(类型和数量)或技术都太新，且未经检验，以至于无法知道数据到底能发掘多少价值。例如，在医疗方面，如果人工智能能在惊人的精细度上再接再厉(我们要做X光分析才能看得到)，将这种精度拓宽到医疗诊断乃至医疗程序上，这种经济价值是不可估量的。与此同时，抵达这一前沿的复杂性和成本也令人生畏。除其他问题外，这还需要完美的技术执行和解决医疗事故保险和其他法律问题。

社会问题和法规也可能限制人工智能的使用。监管限制在与个人身份信息相关的使用案例中尤为普遍。在一些关于某些在线平台上个人数据的使用和商业化的公众辩论日益激烈的时期，这一点尤为重要。个人信息的使用和存储在银行、医疗、医药和医疗产品以及公共和社会部门等部门尤为敏感。除了解决这些问题之外，企业和其它人工智能数据用户还要继续发展与数据使用相关的业务模式，以解决社会关注的问题。此外，监管要求和限制因国家和部门而异。

对利益相关者的影响

正如我们所看到的，真正创造价值的是公司对人工智能模型的执行能力，而不是模型本身。在最后这一节，我们概述了研究人工智能技术提供者、人工智能技术的应用者和政策制定者的案例所隐含的一些高层次的影响，这些人两种情况都占了。

• 对于提供人工智能技术的公司来说：很多为其它公司开发或提供人工智能的公司在技术本身和数据科学家所需的数据方面具有相当大的优势，但这些公司可能缺乏对终端市场的深刻理解。了解人工智能跨部门和职能的价值潜力有助于塑造这些人工智能技术公司的投资组合。也就是说，它们不一定只是优先考虑潜在价值最高的领域。相反，它们可以将所有的资源(对竞争格局的互补分析、对自身现有优势的互补分析、部门或职能领域的知识和客户关系)结合起来，以打造投资组合。在技术方面，将问题类型和技术对应到具有潜在价值的部门和职能对具有特定专业领域的公司所要关注的重点具有指导作用。

• 很多设法在运营中采用人工智能的公司已开始在业务中进行机器学习和人工智能实验。在推出更多试点项目或测试解决方案之前，走出藩篱并采取整体方法来解决问题，进而在整个企业中确立一系列重要的计划(包括人工智能和更广泛的分析和数字技术)，这是十分有用的。要让业务负责人确立适当的投资组合，重要的是要了解哪些用例和领域有望为公司带来最大价值，以及需要对哪些人工智能和其它分析技术进行部署，获取这个价值。这个投资组合必须得到两方面的启迪，即在哪里能践行理论价值以及如何在整个企业范围内大规模部署技术。分析技术如何扩展的问题不仅取决于技术本身，更取决于公司的技能、能力和数据。公司要考虑“最初一英里”(和“最后一英里”)方面的工作，即如何获取和组织数据和工作，或者如何将人工智能模型的输出整合到工作流程中(从临床试验经理和销售队伍管理者乃至采购人员)。麦肯锡全球研究院以往的研究表明，人工智能领导者在最初一英里和最后一英里的这些工作中投入了大量资金。

• 政策制定者要在支持人工智能技术的发展和管理不良行为者的风险之间取得平衡。他们有意支持广泛采用，因为人工智能可以带来更高的劳动生产率、经济增长和社会繁荣。他们的手段包括对研发的公共投资以及对各种培训计划的支持，这些手段有助于培养人才。在数据问题上，*可以通过开放的数据计划直接刺激训练数据的开发。开放公共部门数据可以刺激私营部门的创新。设立通用数据标准也大有裨益。人工智能也给政策制定者提出了新的问题，即传统的工具和框架可能不够用的问题。因此，人们可能需要一些政策创新来应对这些快速发展的技术。但鉴于商业、经济和社会受到了巨大的积极影响，其目标不应该只限制人工智能的采用和应用，而是鼓励人工智能得到有益和安全的使用。

码农公寓

相关文章