提示:本文共有 3494 个字,阅读大概需要 7 分钟。
在全球人工智能(以下简称为「AI」)的竞争版图里,中国俨然成为一股不可或缺的「东方力量」,但站在全球 AI 发展历史的角度去看,中国又是一个容易被忽视的地区。由于众所周知的原因,中国并没有参与到上世纪 60、70 年代的人工智能早期研究,直到 80 年代中后期,中国 AI 领域的研究开始与世界接轨。进入本世纪,中国 AI 与中国互联网产业一起,创造了一个「中国 AI 奇迹」。
正如文艺复兴三杰之一的达·芬奇所言:所谓科学的先见之明,是基于对某一个事物变化过程的长期观察。在面向未来的机遇面前,中国 AI 产业界还需要回答一道宏大的历史命题:中国 AI 是如何从追赶到领先,并在某些领域成为全球产业发展的引领者的?
这也是最近一本新书《AI 已来,让中国 AI 走向世界的王海峰》所讨论的议题,这本书以哈工大百年校庆为背景,将焦点对准了中国著名 AI 科学家和AI产业落地领军者、百度 CTO 王海峰,通过梳理过去三十年他在学术界与工业界的成就,以点成线,以线构面,展现出一副波澜壮阔的中国 AI 激荡三十年变革图景。
本书主人公王海峰的「身份」很多,他在哈工大完成学业,一步步成为全球顶级的 NLP(自然语言处理)学者,更是ACL(国际计算语言学协会年会)五十多年历史上首位出任过主席的华人;与此同时,他还是百度 AI的重要奠基者,过去十年构建了行业领先的 AI 技术/产品/业务架构,而作为百度 CTO 的王海峰,更是肩负将 AI「输送」到千行万业并推动产业智能化转型的重任。
2020 年是王海峰母校哈尔滨工业大学的百年华诞,而早在上世纪 50年代末,这所学校就开发出了中俄语言互译的 MT 系统。近三十年里,哈工大培养的王开铸、李生、刘挺、本书的主人公王海峰等AI人才,已然成为中国 AI 产学研领域的领军人物。
从这个角度上说,这本书不仅是关于中国 AI 学术研究攻坚克难的奋斗史,也是中国 AI 技术落地并推动产业转型的产业史,而透过书中提供的三个重要节点,或许可以为破解「中国 AI 奇迹」提供一些线索。
节点一:神经网络的「中国之行」
在人工智能的历史上,上世纪 90 年代处在「AI Winter」,彼时,投资遇冷、企业转型,「人工智能」一词几乎等同于骗子。日后名声大噪的 AI 科学家们,如 Yoshua Bengio、Geoffrey Hinton、Yann LeCun 等人,在那个「AI Winter」里还在艰难地做着研究,他们要证明一件事:基于神经网络的人工智能,可以改变世界。
在中国,1996 年的王海峰,正开始在哈工大攻读博士,他一边继续钻研机器翻译,一边思考将循环神经网络引入机器翻译。
神经网络示意图
这是一次重要的尝试,在当时,机器翻译的主流模型还是 BP 网络,但这个模型对于中文翻译效果不佳,王海峰提出了在 BP 网络基础上增加一个循环层链接,形成循环神经网络,以此反映翻译过程中的上下文关系,这在当时全球范围都非常少见,更是国内首创,而随着王海峰陆续发布《基于神经网络的汉语口语言语行为分析》等多篇论文,中国机器翻译也从规则、统计方法时代的跟随,步入到神经网络时代的引领。
像极了一个轮回,当 2018 年《MIT 科技评论》称赞百度推出的即时机器翻译系统可媲美人类同声翻译的时候,操盘百度 AI 技术发展的,正是王海峰,他是中国 AI 基础研究突破的见证者与参与者,正是在他们的努力下,中国 AI 基础研究从追赶到领先,2019 年,中国已经成为 AI 学术论文发表数量最多的国家,在诸多基础研究领域保持业界领先。
节点二:「为未来买单」的 AI 投资
神经网络的再度兴起,离不开 2012 年其在 ImageNet 图像挑战赛上的惊艳表现,利用深度神经网络模型,一支名不见经传的团队取得仅 15.3% 错误率的最好成绩,震惊业界,由此也拉开了 2010 年代的人工智能热潮。
在硅谷巨头开始拥抱神经网络的同时,中国正在步入移动互联网的高速增长阶段,从 O2O 到移动应用,从社交媒体到电商,商业模式的微创新与人口红利的叠加效应,带来了一次巨大的产业发展机遇,既所谓的「风口」。
也是在这个时期,王海峰加盟百度,他做了一些当时业界看起来非常「另类」的事情,比如成立自然语言处理部,一支由几十个博士生组成的「研究团队」,致力于提升百度的搜索效率;接着,他牵头组建了「多媒体部」,其任务是围绕计算机视觉与语音技术进行基础研发。
之所以说「另类」,是因为当时包括 NLP、计算机视觉、语音等都还没有明确的应用场景,以 NLP 为例,除了对搜索引擎、翻译产品做优化,几乎没有其他可以变现的场景,而计算机视觉、语音,更多时候还是一种炫酷的演示,这也意味着,当众多企业向左,追逐产业风口的时候,百度和王海峰选择了向右,他们要构建下一个风口。
在这个过程中,招募并组建 AI 人才团队在当时更是一件很「傻」的事情,王海峰一方面利用其学术领域的影响力,招揽如吴华、贾磊这样的技术人才,构成了百度 AI 人才团队的基石;另一方面,积极推进百度内部深度学习基础研究工作,2013 年百度深度学习实验室的成立,也成为百度面向未来的又一笔重要投资。
当时间来到 2016 年,随着人工智能程序 AlphaGo 击败人类围棋世界冠军,人工智能迅速成为全球最热的技术(炒作)领域,王海峰与百度这些年的「另类」举措被证明是一种长远的技术投资,依托过去几年的打磨与积累,百度构建了一支业界领先的 AI 人才队伍,通过把 NLP、计算机视觉、语音等技术与产品创新相融合,形成了一套驱动产品创新的 AI 技术逻辑。
也是在 2016 年,中国第一个深度学习开源框架飞桨正式发布,这正是「另类」的王海峰与一群「另类」的百度工程师为中国深度学习开发者打造的底层技术架构,「为未来买单」的 AI 投资,换来的是一个属于未来的「风口」。
节点三:当 AI 走向千行万业
自 1760 年代开始,人类在过去 260 年里历经三次影响深远的产业革命。不管是由改良蒸汽机推动的第一次工业革命还是电力广泛应用所掀起的第二次革命,抑或是上世纪 50 年代之后由计算机、芯片以及互联网带来的第三次工业革命,无一例外都是新技术与产业结合后所释放的巨大经济、社会效应。
而当计算机具备了超越人类视觉的视觉能力,当机器可以理解并转化人类语言,当海量数据被收集和计算,机器具备了可媲美人类的洞察能力,如何将这些技术应用到各行各业,成为全球 AI 巨头们思考的命题。
在美国,Google 通过开源框架 Tensorflow 构建 AI 开发生态;亚马逊则在云服务 AWS 上叠加 Sagemaker AI 开发平台;在中国,BAT 三大巨头相继在 AI 与云上发力,以百度为例,随着王海峰出任百度 CTO,全面整合「云+AI」,成为百度赋能产业转型的关键一步。
比如,利用不断优化的飞桨开源平台,从技术和生态方面推动中国深度学习开发生态的发展,培养更多技术人才和产业上下游生态。截至目前,百度已经培养了超过 100 万 AI 人才,预计未来 5 年还将培养 AI 人才 500 万。同时,飞桨也已凝聚了超过 190 万开发者。
再比如,通过百度智能云,做大做宽 AI 技术的「输送管道」,真正让 AI 技术成为像水电煤一样随时可取、按需使用的新基础架构。
更重要的一点,在复杂的国际环境下,作为中国技术公司代表的 BAT 们,还需要持续坚持自主研发,从百度飞桨、昆仑芯片到各种国产 AI 产品,这些自研的底层技术架构,也将成为中国 AI 未来引领世界发展的重要支撑。
写在最后:未来已经到来
「人工智能」一词的问世,距今不过 60 多年的时间,但过去的这个甲子里,人类社会迎来翻天覆地的变化,与半导体、计算机以及互联网技术几乎平行前进的,还有一代代研究者对于制造智能机器的不屑追求。
当新老技术自 30 年前因缘际会而逐步汇成一个交点的时候,一场智能革命正在全球范围内酝酿。
从引入神经网络到机器翻译,从科学家身份加盟百度到出任百度 CTO,王海峰都是这场智能革命的重要参与者,他的故事是中国 AI 近三十年发展的缩影,提供了一个洞悉中国 AI 发展历史的观察视角,这也是这本书的最大价值。
科幻作家威廉·吉布森有句名言:「未来已经到来,只是分布不均」。过去三十年,一大批像王海峰一样的科学家前仆后继,与中国本土技术公司一起,推动中国 AI 基础研究的突破,并将 AI 技术与各个产业相融合,他们在学术与工业领域的实践,构成了中国 AI 未来发展的最好注脚。(完)
看到此处说明本文对你还是有帮助的,关于“一个人与一个时代的故事:百度CTO王海峰如何见证中国AI三十年”留言是大家的经验之谈相信也会对你有益,推荐继续阅读下面的相关内容,与本文相关度极高!