作者:沈愷
人工智能(AI)应用正在各行各业迅速普及。从全球来看,多数企业都将运用人工智能技术;根据《2021麦肯锡全球人工智能调研报告》(2021 McKinsey Global Survey on AI),56%的受访企业表示,至少在一项职能中应用了人工智能,高于2020年的50%。
麦肯锡研究显示,到2030年,人工智能有望为经济社会额外创造约13万亿美元的价值。而根据另一项近期研究,到2030年,中国的人工智能应用有望创造高达6000亿美元的经济价值。
尽管人工智能取得了不俗的进展,也带来了大量的价值创造机会,但作为享誉全球的人工智能专家,以及投资人兼作家,李开复博士依然认为,我们刚刚触及人工智能全部潜力的冰山一角。
李开复绝对有资格给出这样的洞见,他的风险投资公司创新工场资助了数百家成功企业,其中有的提供人工智能解决方案,有的则正在应用人工智能。
近期,李开复与麦肯锡人工智能业务QuantumBlack中国区合伙人沈愷进行对话,探讨了他对于人工智能发展的预期。
李开复认为,自然语言处理(NLP)应用实现了类似于计算机视觉在过去5-10年所取得的突破,而自监督学习(SSL)将推动人工智能投资进入第二个黄金时代。
李开复还就其他一些话题分享了见解,包括企业领导者怎样在运营中充分应用人工智能,如何转型成为一家真正的AI驱动型企业,以及为何我们仍处于人工智能普及的早期阶段。
李开复博士
教育经历
以优异成绩毕业于哥伦比亚大学计算机系;1988年获得卡内基梅隆大学计算机科学博士学位,并在那里担任教职至1990年。
职业亮点
2009年创办风险投资公司——创新工场,并担任董事长兼首席执行官,管理30亿美元双币投资基金,着眼于打造下一代中国高科技企业。
担任创新工场人工智能工程院院长,该院致力于孵化为医疗、教育、机器人、计算机金融等领域提供人工智能解决方案的公司。
2005-2009年担任谷歌大中华区总裁,并成功推出GoogleÆcn。
2002-2005年担任微软公司副总裁,领导用户界面、语音、自然语言和辅助技术等。
1998-2005年创办并领导全球顶尖计算机科学实验室——微软中国研究院,并担任院长。
20世纪90年代先后在SGI和苹果公司(Apple)担任高管职位,在苹果时负责为Mac电脑开发AppleBandai Pippin、PlainTalk、Casper和GalaTea语音系统。
迄今为止出版了十余本畅销书,包括登上《纽约时报》畅销书榜的《AI Superpowers∫†China¨†Silicon Valley¨and the New World Order》(2018)以及《人工智能》(Artificial Intelligence,2017)和《向死而生》(2015)。他的新书《AI未来进行式》(AI 2041∫TenVisions for Our Future,2021)成为《华尔街日报》《华盛顿邮报》和《金融时报》的年度图书。
麦肯锡:您对人工智能的定义是什么?
李开复:我的定义是,这是一项模拟人类认知和智能的研究。人工智能最重要的分支学科是机器学习,而其中的深度学习是一种具有深远全球影响的算法。这两个词经常被混用,这并不正确。
人工智能最常见的用例,是在使用海量数据的系统中利用深度学习,优化与商业意图相一致的目标函数,以做出更好的决策、预测和分类。企业可以利用深度学习来预测未来的销量和股价,或对物体及语音进行识别和分类。
麦肯锡:据您预测,人工智能未来会取得怎样的发展?
李开复:深度学习是一个承载其他技术的平台。这些技术中包括在过去五六年内出现的两个最显著的进步:一是卷积神经网络(CNN),即利用通用深度学习算法来执行计算机视觉任务:在执行具体任务时,可超越人类水平看见和识别物体,并理解场景;二是自监督学习(SSL),例如,可以训练一套基于全球自然语言数据的系统来学习英语或汉语,然后针对某个领域进行快速微调。以上两个例子表明,深度学习不光能实现匹配、制定决策和优化简单的目标函数,还可以具备视觉、听觉和理解能力。随着人工智能在执行自动驾驶、健康医疗等领域的复杂任务方面取得进步,深度学习也会进一步增强。未来5-10年,深度学习仍会是人工智能最大的支撑平台,而像卷积神经网络、自监督学习等绝妙的新主意,也会在此基础上解决过去无法克服的难题。
另一方面,有人认为,深度学习在更多数据输入、更少人工编程的情况下似乎效果更好,所以不适合模拟人类的能力,如推断、类比或获取常识。这种想法认为,利用数据和深度学习的输入输出对人类认知进行建模不是一件容易的事情,所以有必要对其进行提升,甚至用全新算法来取代它。未来有这种可能,但我们尚未挖掘出深度学习技术的所有潜能。短期内,我对上述观点持怀疑态度,其实许多聪明人都已尝试过,但却没有真正成功,大约从40年前的专家系统就开始了。此外,深度学习凭借大量的数据和计算能力持续取得突破,做成了许多之前认为不可能的事情,所以应该还有很大的发展空间。
麦肯锡:您如何看待人工智能在语言中的应用?您认为这种影响是否会比在计算机视觉领域所产生的影响更大?
李开复:确实会。尽管我们主要通过视觉,其次通过听觉来吸取现实世界的信息,但语言却会对人工智能的商业和科学发展产生更深刻的影响,因为语言是我们交流并获取知识和思想的方式。
我们正处于与2012年相似的阶段,当时Geoffrey Hinton等人展示了如何运用卷积神经网络实现计算机视觉。那时,ImageNet性能飙升,有望在三四年内与人类媲美。创新工场最大的成功之一,就是意识到计算机视觉会超越人类并改变世界,于是投资了卷积神经网络和深度学习;我们预计,当这一天真正来临时,应用程序要么与人类合作共生,要么在很多情况下彻底取代人类以节约成本。后来,我们看到了应用如雨后春笋般出现,虽然也出现了深度伪造、人脸识别等争议问题,但其他技术突破还是得到了人们的普遍认可,如自动驾驶、机器人感知、放射学和病理学识别、数字化、图像、视频、3D数据以及制造过程检测应用等,不胜枚举。
大约两年前,OpenAI的GPT-3,即第三代生成预训练转换器,推出了一种新的语言学习范式。这种范式基于这样一个事实:尽管数据越多,人工智能的效果越好,但我们不可能对万亿级数据库使用通用标签标注。如果只用名词、动词这样的标签来标记语言数据,显然是不够的。你可以标注构建航空预订系统这样的特定任务,但无法进行公认的、通用的标签标注。因此GPT-3彻底放弃了标签,转而训练新的数据大脑,并基于可以根据过去预测未来的前提假设,将世界上所有的数据都喂给它,以最高的保真度作为目标函数。这套系统自组织成一个理解并概括语言本质的网络,或许不同于人类的方式,但足以开发预订、聊天室、语音识别、机器翻译、新搜索引擎、问答、广告定位等系统。
我们的观点是,随着自然语言处理(NLP)应用像计算机视觉应用一样大量涌现,人工智能投资的第二个黄金时代将会开启。我们已投资了四家自然语言处理公司,其中一家在中文自然语言处理领域处于领先地位,还开发了一套类似于GPT-3转换器的模型,并将其压缩到原先的千分之一,使之具备实用性。他们花了大约三周时间,仅用一名工程师和两名实习生就开发了一套英语-阿拉伯语机器翻译系统。整个团队中没有一个人会阿拉伯语。这个例子充分说明,基于全球数据打造一个庞大的自监督学习训练模型,然后针对具体应用和语言进行微调的方法似乎可行。与之相似,我们展示了基于大模型的快速定制化自然语言处理应用如何在定向广告等领域发挥作用,这个技术现在非常强大,因为你可以针对不同个体推送不同广告副本。自然语言处理也被应用到语音识别领域,未来五年,我们会看到自然语言公司的覆盖面和影响力进一步提升,估值也可能会增加,超越5-8年前计算机视觉领域所取得的成就。
麦肯锡:如果以篮球比赛打比方,目前人工智能的商业应用处于赛程的哪个阶段?
李开复:显然还在第一节。比分可能是7∫8,我们用深度学习投中了一个三分球,用卷积神经网络和自监督学习投中了两个二分球。整个比赛可能刚打了两分钟。我们还有很长的路要走——正如我在《AI Superpowers》一书里提到的,我们才刚刚触及冰山一角。有多少企业在真正使用人工智能?只有不到10%,就连这些企业也未充分挖掘应用的潜能,在落地实施方面还蕴藏很多机会。比如,麦肯锡研究显示,到2030年,人工智能有望额外创造约13万亿美元的经济价值。路漫漫其修远兮,我们对未来抱有很大期待。
麦肯锡:打造AI驱动型企业意味着什么?
李开复:首先,这意味着要以数据为驱动,因为没有数据,就没有人工智能。企业需要投入资金,将能够数字化的东西全部数字化,这样才能为人工智能提供养分。不要将数据和存储作为成本中心,而将之视为最能创造价值的资产。如果你只是把数据收集和存储作为一笔预算,每年增长5%-10%,那永远都无法成功,必须彻底转变思维。然后要利用大数据体现商业智能,一旦做到这一点,越来越多的决策就会基于数据来制定,而非经验或直觉。
再后来,要寻找易于实现自动化的领域,包括制定决策这种人类处理起来比机器更费时的事情——这通常是为了节约成本。还要不遗余力地提升利润、争取客户。将一切可以量化的商业指标与人工智能关联起来,从而优化并提出人类与人工智能共生合作的解决方案。人工智能完全可以代表我们执行数据丰富、程序相对固定的单一领域任务。
麦肯锡:如果您是一家传统企业的首席执行官,想要推动AI驱动型企业转型,您首先会用人工智能解决什么商业问题?
李开复:首先考虑公司对人工智能的认知是否准确。有些高管可能会对人工智能的效果持怀疑态度,也有些可能抱有不切实际的幻想,这都很正常。我会请一些专家来提供建议,找出一项在数据方面已经准备妥当、能够与商业结果直接挂钩的任务。这样一来,当人工智能落地时,他们就会说:“哦,果然如此,确实有效。”†之后,我会考虑其他机会,前提条件是我在这方面有很多数据,以及能与目标函数相关联的商业指标,如削减成本、提高利润,或是加强客户营销的精准性。如果公司没有数据,我还要面对一个棘手问题——选出一个可以用合理成本收集数据的领域。
但我的首要目标是用生动的人工智能实例启迪我的高管和领导团队,这样做能激发大家源源不断的创造力,想出更多的应用创意。第一个落地的项目很重要,如果失败了,无论是因为无法证明其商业影响,还是因为数据太少或错误,抑或实施不当,无论出于什么原因,领导团队都会失去信心。
麦肯锡:您能举例说明一家公司怎样开始这个过程吗?
李开复:一种方式是让公司先不要考虑人工智能,而是描述其商业驱动力和挑战,然后让专家运用人工智能和其他技术来交付一套解决方案。比如,某钢铁企业最大的问题是他们的液化铁在输送过程中冷却速度过快。我们用物流管理、无人驾驶和安全传感器等方面的人工智能系统解决了这个问题。当我们赢得这家公司的信任后,他们提出了更多问题,这些都迎刃而解,因为我们已经开启数字化旅程,并且安装了传感器来收集数据。
如果你因为没有数据而难以决定从哪里入手,那就必须了解收集数据的成本。初期收集数据很容易,但清洗数据所需的资源和时间往往超出企业高管的预期。一旦清洗好数据,人工智能的时间成本和工作难度反而不像人们想象得那么大。确定问题,获取数据,并了解清洗数据的成本,之后就可以落地实施了。
麦肯锡:以这种方式切入确实很好,但最终要怎样做才能真正成为一家AI驱动型企业?
李开复:需要对商业流程进行全面数字化,只要是人工智能比人类表现更好的任务,就应该用人工智能去辅助或替代。如果有高管只顾着因循守旧、各自为政,而不愿拥抱人工智能,那就要撤换高管,或转变他们的观念。也就是说,首先要信任数据,要制定数据驱动的明智决策,并部署人工智能。如果你做得不好,别人就会抢你的饭碗;人工智能可以提高员工技能,因为它最擅长做常规、量化的事情,而员工则可以从事更高层次的创造性任务来提升竞争力。应该将人工智能用于管理的方方面面——不只是研发或技术,还可以帮助人力资源部门留住核心员工、初筛岗位简历,帮助营销部门优化和定制EDM(电子邮寄宣传),以增加客户阅读的概率。人工智能也可以运用在销售和IT运营管理中,公司的所有部门无一例外都应该利用人工智能工具来提升业绩。
麦肯锡:最后来一组快问快答:数据和算法,哪个更重要?
李开复:数据。两者都需要,但没有数据,一切都是空谈。如果已经有一套合理算法,就要努力获取更多数据,而不是调整算法。
麦肯锡:行业知识和人工智能知识,哪个更重要?
李开复:在某些行业,算法很重要,因为数据相对简单,如一家拥有用户数据的互联网公司。但在某些领域,行业知识异常复杂。不光要开发应用,还要知道如何选择正确的销售渠道。医疗就是很明显的例子。所以两者都需要。你首先要考虑进入哪个行业,以及是否真的需要行业知识。如果答案是肯定的,那就优先获取行业知识。
麦肯锡:当一家公司出售人工智能解决方案时,最重要的是规模化产品,还是更为迅速的定制?
李开复:定制更重要,因为我们还没有能够满足大量不同需求的人工智能平台。定制不可或缺,没有定制就没有业务。我希望,五年后你再问我这个问题时,我会说规模化产品更重要,因为届时人工智能研究人员已经解决了定制问题。
麦肯锡:对想要用人工智能推动业务转型的企业来说,建立MLOps平台(实现机器学习算法自动化的一种手段)和推动文化变革,哪个最重要?
李开复:推动变革更加紧迫,我们看到许多公司都在这方面遇到困难。完成文化变革之后,就可以关注MLOps了。
沈愷是麦肯锡全球董事合伙人,常驻深圳分公司。