百度CTO王海峰谈人工智能

访/邱静、吴杉杉

文/曹蕾、李琳

近年来,全球经济发展动力不足,增长持续放缓。2020年突如其来的新冠疫情无疑对全球经济更是雪上加霜。

回顾历史,科技的发展一直以来都是经济实现突破式发展的重要驱动力。作为全球最大的中文搜索引擎,百度从其诞生之日起就与人工智能(AI)技术结下了不解之缘。从20年前的搜索技术,到当前软硬一体的AI大生产平台,百度不断研究和探索,用AI打磨产品和服务,掌握世界尖端科学核心技术,让科技持续赋能业务。

在当今世界百年未有之大变局的新形势下,AI技术又将何去何从?百度将怎样进行技术布局?百度的实践经验能够为其他企业带来哪些启示和借鉴?针对这些问题,埃森哲《展望》对百度首席技术官王海峰博士进行了专访。

《展望》:人工智能是第四次工业革命的核心驱动力之一。而回顾前三次工业革命,其实每一次技术都起到了关键作用,在您看来这一次以AI为核心的技术驱动和以前的三次工业革命有什么不一样?

王海峰:不管哪次工业革命,其本质都是通过科技创新,人类延伸和增强了自身能力,从而拓展了探索和改变世界的广度和深度。第一次工业革命的纺织机、蒸汽机等发明,是人类体力的延伸和增强。后来第二次工业革命有了电气技术,再后来计算机开启了第三次工业革命——信息技术革命,已经远远超出体力的范围,但还只是人类智力活动的一个侧面。

而推动第四次工业革命的人工智能意味着什么呢?实际上是通过计算机,来全方位地延伸和增强人的智能活动。现在AI是在模拟很多场景下人类的智力活动,相对于前几次工业革命的影响要更深更广。

《展望》:AI技术发展至今,有哪些应用场景已经实现了商业化?您是如何看待AI商业化难这一观点的?您能否分享一些百度的经验和未来规划?

王海峰:我认为,AI的商业化之路并不遥远,反而很近。

百度AI最早是为搜索而发展的。AI使搜索能力增强,给用户提供了更好的服务,就直接产生了商业价值。另外,如小度音箱,它是一个由AI驱动开发的产品,已经有超过千万的销量,带来可观的收益。还有自动驾驶。尽管L4级别的自动汽车实现完全的无人驾驶广泛应用的确有些遥远,但智能交通现在已经获得了大额订单。 因此,我认为AI商业化并不遥远。

无论是百度搜索、百度翻译、小度音箱,还是自动驾驶,其本质都是AI技术的应用。但从更大层面来讲,则是产业智能化。如果说小度音箱是一个场景,自动驾驶也是一个场景,那么全场景的升级就是全方位的,在各行各业的智能化升级。这个布局离不开百度智能云。百度智能云的架构对应着AI三个最重要的要素,即算法、数据和算力,其意义在于这一整套架构将成为智能社会中产业智能升级的基础。这不仅涉及金融、医疗、教育等行业,还包括了传统的工业制造以及其他一些与国民经济息息相关的行业,如能源行业。而工业制造也是百度目前很重要的一个方向。

《展望》:2020年1月,百度上线了实时疫情地图和发热门诊地图,为大家应对新冠疫情提供了很多便利。在疫情期间,您看到AI还发挥了哪些重要作用?

王海峰:这次新冠疫情期间,我们利用AI技术做了很多事情。比如,社区人员打摸排电话是一项强度非常大的工作。但百度AI能够自动打电话,并利用自然语言理解技术,不仅理解对方讲话的内容,而且能够将关键信息提炼出来。

再比如,疫情期间很多商业服务设施难以正常运转,许多商超、店铺都闭店或限时营业。那么,如何了解某个商场、饭店、理发馆是否营业以及何时营业呢?如果我们动用人工查询,将需要拨打几百万通电话。百度通过AI给百度地图里的商家自动拨打电话,询问店铺的营业时间以及开放的业务,从而获得非常准确的信息。

此外,在疫情期间,大家每天进入公司、地铁站、火车站时都需要测量体温。而通过百度的AI多人测温系统,人们在经过检测机器时,便可以迅速测量多人的体温,既提高了测温效率,又避免工作人员近距离接触,减少了人群聚集,降低传染风险。

不仅如此,日常生产生活中,AI打破人类能力局限、改变人们生活方式、提升工作效率的例子也有很多。以企业日常运营为例,对于拥有几万人的企业而言,其庞大的信息和知识量常常给员工的工作和学习带来一些困扰。例如,由于疏于知识管理或内网维护,员工对企业大量的英文单词缩写既无法理解又难以查询,对于其他团队是否有过某类项目的相关经验也无从获知。通过AI技术对企业知识进行自动提炼和管理,可以帮助员工大大提升工作效率。

《展望》:从技术层面来讲,深度学习在语音、文本、视觉等各个领域的应用已经有了长足的发展,但智能技术也许还只是刚刚起步。未来十年,有可能会出现超越AI的技术突破。您认为下一个这样的技术风口会出现在哪里?

王海峰:我分两个层面来说。先说我们重点投入的技术,然后再说未来可能带来改变的技术。

就技术投入的方向而言,我认为算法仍然要继续突破,同时也需要在大数据和算力技术上发力。此外,由于人工智能是拓展人的智力的,所以仍然离不开感知技术和认知技术等。我们仍然会围绕这些技术进行研究和开发。

但如果说哪些技术可能会给我们带来更多改变?我的回答是认知层面的技术。为什么这么说?从人的能力发展来看,人一出生就已经具备了基本的感知能力。在正式接受教育前,听觉和视觉能力都可以帮助人类进行交流。而认知层面的语言能力更为复杂,蕴含更多的信息。

人类所有的知识最终要传承下来都得靠语言和文字。把知识讲述出来,传授给他人,或者进一步进行科学研究,沉淀为一篇篇科技论文,都是通过语言文字实现的。以汉语为例,无论是常用的几千个汉字还是全部八万多个汉字,学会语言并不是认识这些汉字就可以,而是要真正跟其背后蕴含的知识结合起来。而这些知识实际上是人类对世界的认知,最后提炼成知识。所以对语言和知识的理解,归根结底是对世界的认知和理解。

就AI技术领域而言,深度学习在视觉技术上取得成功后,在语音技术上也获得了不小的进步。目前,语音识别率在很多场景都超过了人类,但是它在语言理解方面还有很多不尽如人意的地方。这是一个很大的空间,一旦突破,意味着人类的工作、生产、生活方式都会改变。

《展望》:就整个AI产业链而言,从基础层、技术层、应用层几个方面,您认为中国AI技术的成熟度在全球处于什么样的位置?对于中国而言,AI能够带来的最大增长机遇在哪里?

王海峰:从基础层来看,首先,现在国内许多企业,包括百度都在做AI芯片,已经取得了一定进展。但如果往深层探究芯片相关的生产能力,比如流片工艺,则是我们相对欠缺的。但当前全球企业间的连接十分紧密,所以我们可以一方面补齐自身的能力,另一方面与大家相互依托,互相支持、彼此取长补短。其次,深度学习框架下接芯片,上承应用,是人工智能的核心基础。当前国内的一些科技企业和高校也陆续开源了深度学习框架,其中百度飞桨是国内首个开源、功能完备的深度学习框架。飞桨在核心技术上已经比肩国际主流框架,在社区成熟度和生态上也越来越完善和壮大。

从技术层来看,一些AI的底层算法,如强化学习、对抗学习等深度学习技术的确不是我们的强项。但我们一直在迅速追赶。语音、视觉、自然语言处理、多模态语义理解等技术的很多方面,中国已经处于国际先进水平。现在各类国际AI顶级学术会议中,中国人的成果越来越多,这是一个积累的过程。

而在应用层面,我认为中国是有很多优势的。就我的观察,在中国,大家都特别愿意接受AI。同样一个带有AI属性的产品,中国会有大量的用户迅速跟进和使用,这个过程也促使技术和产品加快进步。

在行业层面,不管是互联网行业,还是医疗、金融、教育行业,都因技术发展而发生改变,质量和效率得以提升。各个领域的共同进步,会影响整个国家的生产力,使经济发展取得进步。而纵观全局,AI技术或者说ABC(AI、Big data、Cloud)基础设施,会支撑各行各业,从而提升全社会的效能。

在前几次工业革命中,我们认识和拥抱相关技术的时间比许多国家要晚很多。而现在我们不仅站在同一起跑线上没有迟到,甚至还是起跑最快的几个经济体之一。和过去几百年相比,我们现在有了更好的历史机遇和开端,有能力和各国更好地合作,大家一起向前发展。

《展望》:我国对智能制造、工业智能化有很高的预期,对新基建的投资达几十万亿元人民币。您对此有何看法?

王海峰:新基建是我国面向经济高质量发展和社会智能化发展提出的、以技术创新为驱动、以信息网络为基础的新型基础设施建设,人工智能、5G、云计算、物联网、工业互联网等新兴技术都是其中重要的组成部分。智能制造、工业智能化则是融合新兴技术的基础上传统产业的智能化升级。在这方面,我的看法是打好坚实的基础,只有基础打牢了,才能支撑高速、长远的高质量发展。

对于AI技术而言,如果某个工厂,没有任何信息化基础,连数据都不知如何收集,那么直接应用算法显然是不现实的。从基础改造做起,先为工厂配备基础的信息采集设备,比如传感器,不管是大家通常说的传感器,还是运用语音识别、图像识别等技术的智能传感器。先利用技术去收集数据,再在此基础上训练AI,继而使用AI技术进行智能化升级。

比如说工业里的智能质检,摄像头架上以后人工智能就能看到这些零件了,还能看出零件是不是有缺陷。质检的核心是需要有一双眼睛去看,这个还相对容易。但如果要深入分析背后的生产流程,就不是简单加入摄像头可以解决的,而是要深入了解企业的各种内部信息。这些流程各个环节的数据和知识是什么?怎么样采集、留存,然后要怎样使用?答案是要在企业内部把知识组织和管理起来,这样会比单用视觉技术检测带来的收益更大。

《展望》:在您看来哪些行业的产业智能化程度最高呢?都有些什么特点?

王海峰:目前,互联网、金融、医疗等行业的产业智能化进展不错。这些行业的信息化程度已经很高,有了这个基础,再做智能化升级就更容易一些。比如在医疗行业,传统的医疗信息系统、配置系统的普及率已经很高。而有些行业相对信息化基础没那么好,但是也能做一些智能化升级,比如前面提到的智能质检。

《展望》:埃森哲在去年的《技术展望》报告里,把分布式账本技术(Distributed Ledgers)、人工智能(Artificial Intelligence)、扩展现实(Extended Reality)和量子计算(Quantum Computing)等新数字化技术统称为DARQ技术。AI作为DARQ技术之一,与量子计算、区块链等技术如何共生或相互影响,并进一步推动新数字化浪潮?

王海峰:我们一方面优化AI算法,同时也在研究AI跟量子计算等技术的结合。量子计算的发展会带来计算上的飞跃,同时一定也会影响AI算法。实现低能耗有可能是AI算法的改变,但也有可能是通过计算机制的改进来实现。假设量子计算本身可以做到低能耗,我们就能够通过量子计算和AI技术的结合,把AI算法的能耗降下来。

区块链和AI都是我们在研究和发展的技术。两者都是底层的基础设施,AI相对于区块链来说是不同的逻辑。AI本身是通过对人类智能的模拟和提升,来实现并延展人的体力和智力;而区块链则是一个分布式的共享账本和数据库,应用了分布式数据存储、点对点传输、共识机制、加密算法等技术,具有去中心化、不可篡改等特点。这两种技术可以结合发展,相互作用,共同促进社会经济智能化发展。

订阅中心
关于我们的新闻中心 关于我们的新闻中心