百度CTO王海峰:AI已经进入大生产阶段

2019年12月18日 17:54  
  12月18日下午消息,新浪“2019科技风云榜”年度盛典今日在北京香格里拉酒店开幕。本次科技风云榜以“重构新科技 赋能新生活”为主题,与众多行业领袖、业内大佬共话科技时代。百度首席技术官王海峰在盛典上发表《AI大生产平台推动产业智能化》的主题演讲。
 
  王海峰提到,相比较去年,百度AI技术整体又推进了一步,在多模态深度语义理解上,不管是语音、视觉,还是文字各个方面,都有了更深入的理解,“基于这些理解,我们可以完成各种任务”。
 
  “我们认为,AI已经进入了大生产阶段。”他表示,人类历史已经经历了三次工业革命,而这次工业革命以人工智能为核心,一个很重要的特征是进入了工业大生产时期,开始广泛影响人类社会生产生活。
 
  王海峰提到,驱动工业革命的核心技术具有很强的通用性,是从某一个行业开始发展的,但最终一定是覆盖非常广泛的行业。同时还具备几个很重要技术角度的特征:高度的标准化、自动化和模块化。
 
  人工智能作为新一轮产业变革的核心驱动力量,正在影响着我们的生活。王海峰认为,当然智能革命还处于开端,未来还有非常大的发展空间和想象空间。
 
  以下为王海峰主题演讲《AI大生产平台推动产业智能化》实录:
 
  王海峰:各位嘉宾、各位朋友,大家好,非常高兴连续两年站在这个舞台上跟大家分享。去年我讲的也是技术,百度AI技术经过十年左右的发展,已经覆盖了AI的方方面面。去年我们把这项技术整体又推进了一步,进入多模态深度语义理解阶段,语音、视觉、文字等各个方面,都有了更深入的理解,基于这些理解,我们可以进行各种应用。当下,我们认为AI已经进入了大生产阶段,所以今天我讲的题目是《AI大生产平台推动产业智能化》。
 
  回顾历史,过去每一次工业革命,给人类的生产生活、世界观都带来了很大的变化。人类历史已经经历了三次工业革命,从18世纪开始,每一次工业革命分别给人类带来了机械技术、电力技术和信息技术。新一轮的工业革命,是以人工智能为核心。
 
  每一次工业革命,真正开始广泛影响人类社会生产、生活的主要特征是进入到工业大生产阶段,进入到人们生产生活的各个环节。能带来工业革命的技术,一定是有很强的通用性,它虽然从某一个行业开始发展,但最终一定是覆盖非常广泛,同时还具备几个很重要的技术角度的特征,即具备高度的标准化、自动化和模块化的特征。
 
  人工智能作为新一轮产业变革的核心驱动力量,正在影响着我们的生活。当然智能革命还处于开端,未来还有非常大的发展空间和想象空间。
 
  百度大脑是百度人工智能技术的集大成,百度马上要20周年了,它从建立的那一天起,一开始做搜索引擎的时候,就在用各种AI技术,比如自然语言处理技术。搜索引擎要用自然语言处理技术做对用户输入的理解、对互联网上内容的理解等等。从2010年开始,百度人工智能布局初具雏形,逐渐发展至今,我们已经形成了一个全面覆盖自然语言处理、语音、视觉、以及深度学习、机器学习、大数据等等领域的、完整的AI技术布局。我们把这些集成在一起,就形成了百度大脑。百度大脑不仅应用于百度的业务,2016年开始面向开发者开放。2017年、2018年,百度大脑愈加成熟,2018年,我在百度的AI开发者大会上发布了多模态深度语义理解,同时这些AI能力也开始多维度、多层次地开放。去年我们发布100多项AI的能力开放,这个数字今年又更大了。
 
  除了技术本身,能力更多了,也更强了以外,很重要的一点是我们全面地把AI算法、AI技术变成了一个软硬一体的AI大生产平台。这样一个AI大生产平台,首先它具备能带来工业革命通用技术的基本特征,它也有高度的标准化、自动化和模块化的特征。下面就是完整的百度AI大生产平台基本的架构:人工智能首先要有算力的支撑,有数据的支撑;我们知道,现在主流的人工智能技术都是基于深度学习的,所以,百度也打造了国内唯一的能力完整的开源开放的深度学习的平台,这个平台里包括核心框架、包括工具组件、开发套件、服务平台等等,这就是百度的产业级深度学习平台;深度学习在通用的学习基础之上,是通用的各种AI能力,比如跟人的感知相关的,跟人的听觉视觉感知能力相关的语音技术、计算机视觉技术,以及跟人的认知相关的自然语言处理技术、知识图谱技术等等;再往上就是平台,定制训练的平台面向垂直场景,根据应用进行技术的定制化;训练之后当然还要通过部署让这些能力真正的去应用,这个时候我们可以在云端进行部署、在端上进行部署、也可以在边上进行部署,进而形成解决方案。
 
  今年和去年,百度大脑还有一个很重要的变化,有了一个纵贯各层的AI安全模块。前几年我们也有,但是它是隐藏在里面的,我们做每一个算法的时候都要考虑安全,因为安全这件事太重要了。今年,我们把它独立拉出来,不止针对AI安全,也解决各层,比如算力、数据等等的安全问题。我们要用AI技术不断地推动生产力进步的同时,也会更加重视安全的问题。
 
  这就是刚才提到的第二层,产业级的深度学习平台飞桨。这张图是一个完整的深度学习平台架构。
 
  基础的还是深度学习框架,很多朋友都听过一些主流的深度学习框架,百度的飞桨是中国自研的一个完整的深度学习框架,包括开发、包括训练、包括预测。熟悉深度学习的朋友可能知道,开发有些时候会用动态图,有些时候会用静态图,飞桨可以完整地支持不管是动态图开发,还是静态图开发,而且更符合程序员的逻辑编程范式。训练,很重要的一点是要支持超大规模的分布式训练,百度飞桨可以率先支持万亿级参数的训练。同时,训练之前也需要数据的处理,我们也有很多基础技术支撑工业级的数据处理,进而进行超大规模的训练、预测。此外还涉及到要部署到什么地方,可能部署到服务器上,部署到端上,同时还涉及到安全加密等等。
 
  在此基础之上就是各种通用的能力,比如自然语言处理的模型库、计算机视觉的模型库、配件的、语音的等等。
 
  再往上就是各种开发套件,比如ERNIE,我们在不断地提升人对语言语义理解的能力。还有图像分割、点击率预估等等。
 
  再往上还有各种工具组件。对深度学习这个词我们都耳熟能详了,但是深度学习还会衍生出来很多需求。我们知道深度学习是一个神经网络,神经网络是有结构的。这个结构怎么设计?通常是靠人类的深度学习专家,他会根据这个问题,对问题进行理解形成一个网络。第一,这不是每个人都能做的。第二,即使是专家,这也是一个很不容易的过程。我们开发的AutoDL可以自动化的建模,而且效果已经超过了人类专家的水平。后面还有迁移学习、强化学习、多任务学习等等,包括现在非常热的、效果也非常好的图神经网络、弹性深度学习等等。
 
  这些还是很技术的,上面一层就跟应用贴得很近了,也就是服务平台。像EasyDL定制化训练和服务平台,即使不够了解深度学习也没有关系,因为它非常简单易用,直接可以用数据进行训练,给出模型进行部署,即使不是很了解深度学习也没有关系。当然如果想了解,还有一个开发实训平台,很多开发者包括很多学校的学生都基于这个平台去学习深度学习。当然还有端计算模型的生产平台,这是一个完整的深度学习的平台。
 
  刚才讲了很多,总结一下,飞桨平台第一它很完整,第二在一些重要的方面有一些它自己领先的特色,比如在开发方面,它是一种开发便捷的深度学习平台,支持超大规模深度学习模型训练,还可以进行多端多平台的部署,以及建立产业级的模型库。说到这些模型库,第一它很丰富,这当然是很必要的。第二,所有这些模型库都是经过大规模生产环境验证过的锤炼过的产业级的、真正可以投入工业化大生产的开源模型库。
 
  前面讲到了百度大脑,讲到了深度学习平台,这些技术领先性体现在专利上,我们现在应该是中国AI专利最多的公司,已经有5712多件AI专利了。今年我们也取得了很多世界比赛的冠军。在开放层面,我们已经开放的能力有228项。接下来的数字是很庞大的数字,百度大脑开发开放的平台会支撑很多应用,量有多大?每天调用的次数已经超过1万亿次,而且已经聚集了超过150万的开发者。
 
  所有AI的应用都要依托于云的能力,百度大脑就是依托百度智能云加速赋能各行各业的。下面举几个例子。比如这是一个数字员工,我们有一个基于人工智能的虚拟员工,它可以做客服、做主播、做教师、做医生。
 
  视频中展示了在银行、运营商、能源等行业中,我们数字员工的一些应用场景。
 
  再举一个智能媒体的例子。媒体涉及到很多方面,比如大家要创作一篇稿子,可能涉及到热点的发现、写作以及校对等等。比如发布,怎么更好的传播,各个环节AI都会提供相应的服务。比如我可以帮助他自动选题,自动提供很多素材,自动帮助其写作。甚至我们已经可以做到电脑直接写作,写出来的与人工的相差无几。
 
  智能质检极大的提升了生产效率。车间里的零件,计算机视觉技术可以自动甄别哪些零件有瑕疵,自动分拣出来。效率非常高,同时也让质检工人眼睛的压力得到了极大的缓解。
 
  智能气象,我们可以基于AI大数据技术重构气象预测的过程,通过大数据、人工智能算法,可以做到效率更高,周期缩得更短。
 
  智能道路救援,通过AI技术可以让救援调度的时间大大缩短。救援的时候争分夺秒,每一秒都意味着生命和财产的挽回。当下救援调度时间已经可以从行业的平均40分钟缩短到5分钟,不仅带来了极大的经济效益,更重要的是带来了极大的社会效益。
 
  百度经过多年积累的AI技术建立的AI大生产平台,正在推动社会各行各业的智能化升级,让我们一起推动产业智能化,让我们的生活变得更加美好。谢谢大家!