《深度学习:智能时代的核心驱动力量》:深度学习伴随着争议前行

2019-07-31 16:46
分享到:
调整字体

44_副本

救人一命29美元

“今天我在听电台节目的时候听到,有公司提供这样的服务,如果皮肤病患者将患处拍照发到他们平台,他们的AI系统就可以告诉你,是需要就医还是良性的。有一个女的,看到男朋友背上长了一些东西,就随手拍了照片发给这个平台,没想到就是恶性的。因为及时就诊,这女子救了男朋友一命,公司收费才29美元。”

上周在广州举行了全球移动互联网大会,特伦斯·谢诺夫斯基登台演讲,讲了这个故事。

特伦斯·谢诺夫斯基,世界十大AI科学家之一,美国四大国家学院(国家科学院、国家医学院、国家工程院、国家艺术与科学学院)仅3位在世的“四院院士”之一,全球AI专业会议NIPS基金会主席,现为美国政府注资50亿美元“脑计划”项目领军人物。

他与那个“29美元”故事之间有某种深刻联系,因为正是以他为代表的一批美国科技界“少数派”,在几十年间改变了人工智能的大方向,奠定了今日“深度学习”的格局,才有了能打败围棋冠军、能看病人片子、能做人脸识别、能翻译语言的AI。

1956年,在美国一次学术会议上正式出现了“人工智能”这个术语。此后,人工智能研究界的主流思维是“为每一个问题写一个程序”,逻辑上这无懈可击,实践中,按照这种思路,如果想让电脑识别“杯子”,那就要把所有的杯子特征都输入进去才行,不仅需要大量劳动,而且某些应用永远不可能实现。

少数派想尝试另一条路,他们想从生物的角度展开研究。他们注意到,哪怕是一些低级生物,也在进化中发展出了强大的能力,这当中似乎没有逻辑可言,但是就是很强大。

特伦斯·谢诺夫斯基是这些人中的一个,1978年他获得物理学博士,去哈佛大学读神经生物学博士后。这期间,他决定三年不碰电脑,不想物理,让自己拥抱生物学的世界观,去研究鲨鱼、蜗牛和牛蛙,去思考细胞、神经元、大脑等问题,他称之为自己的转折点。

之后,到了1986年,他和杰夫里·辛顿(图灵奖获得者之一)一起开发出了玻尔兹曼机,这是物理学背景、生物学文化、计算机思想的结晶之作,把神经网络带入到研究与应用的热潮,将深度学习从边缘课题变成了后来互联网科技公司仰赖的核心技术。

麻省理工“鸿门宴”

这之后还有很多故事。1983年,特伦斯出席讲坛,有科学家泼水,并大喊玻尔兹曼机“不是计算”。

1989年,特伦斯应邀去麻省理工学院作“杰出学者讲座”。他进电梯以后,邀请者告诉他,学院有个传统,演讲者需要在午餐时用5分钟时间与教师和学生一起讨论他的讲座话题,而且“他们挺反感你做的事情”。

特伦斯走出电梯进房间,看到里面挤满了差不多一百人,站了足足三圈。特伦斯走到圆圈中心,正对着自助餐的主菜,发现有只苍蝇叮在食物上面。

特伦斯一边驱赶苍蝇一边说:“食物上这只苍蝇的大脑只有10万个神经元,它大概重1毫克,要消耗1毫瓦能量,苍蝇能看,能飞,可以自己确定方向,能觅食,还可以通过繁殖来进行自我复制。麻省理工拥有一台价值一亿美元的超级计算机,它消耗的能量是兆瓦级的,并需要一台巨型空调冷却。而超级计算机的最大成本还是人力,程序员要满足它对程序的巨大需求。但是相比起苍蝇,这台超级计算机不能看,不能飞,不能交配或自我复制。看得出这个场景里有什么问题?”

当时前两圈的听众都被问倒了。有一个高级教员说:“因为我们没有(为超级计算机)编写视觉程序。”特伦斯明白这是“主流派”的典型思维,要花很多很多钱、很多很多时间精力,他回答:“祝你好运,你最好算快一点,否则就要有麻烦了。”

最后,一个第三排的学生给出了正确回答:数字计算机是一种通用设备,它可以被编程来计算任何东西,虽然效率很低;苍蝇则是一种“专用计算机”。

特伦斯用苍蝇给麻省理工的“主流派”上了一课:在苍蝇那个小小的脑袋里,它的视觉网络进化了数亿年,其视觉算法已嵌入了它本身的网络,如果研究员想理解视觉识别,就可以研究苍蝇的大脑,对其眼神经网络的布线图和信息流进行逆向工程,研究大自然的工作原理,谦逊地接受大自然给予的知识。

演讲结束时,他得知由于研究进展缓慢,美国政府正在大幅削减人工智能研究经费,他意识到这是“主流派”的寒冬。无疑,这也是敌意的来源之一。

深度学习伴随着争议前行。甚至到了2017年,在特伦斯的“主场”,NIPS基金会的一次颁奖典礼上,一位谷歌的科学家获奖之后发表感言,仍然说深度学习缺乏严谨性,是“炼金术”。

这种说法不无道理,深度学习在基础理论上仍然处于摸索阶段,没有一个清晰明快的数学结构来揭秘它。人们把各种数据丢进去,应用到各种场景,尝试各种算法,然后看看会出来什么结果,确实有点像“炼金术”。可是,深度学习已经帮我们做了那么多事情,它把我们潦草的笔迹、含混的口音转换为各国文字,帮助找回被拐卖多年的人口,识别出街道上的罪犯,将来AI帮我们做的只会更多。

特伦斯把这些都写进了《深度学习》这本书中。他徒步美国西北地区,目睹“深度学习”开花结果,决定写出自己亲历的一小群研究人员挑战AI研究建制派的故事。他写了“少数派”一路走来的人生起伏,总结了深度学习浪潮在过去60年间的发展脉络与人工智能的螺旋上升,预测了智能时代的商业图景。

读+记者上周在广州专访了特伦斯·谢诺夫斯基。

 

【访谈】>>>

“30年波峰-波谷”形态,不仅仅在人工智能领域,在科学史上也是这样

【新闻背景:7月24日,中国宣布组建国家科技伦理委员会。】

读+:在您的书中,探讨人工智能伦理问题的篇幅不多,我对您一个观点印象深刻,“设置一个代表公平的代价函数可能会引起意想不到的结果”。您是否认为人们夸大了对人工智能伦理问题的担忧?目前伦理问题并不是最重要的问题?

特伦斯:伦理问题非常重要,我们创造了人工智能,就有责任让它被善用。在2018年12月的NIPS会议上,这是个焦点话题,很多学者签署声明,反对将人工智能用于军事。问题在于,我们还不知道在未来会发生什么样的伦理问题,而且这是有文化差异的。在一个国家,这是伦理问题,但在另一个国家,这就不构成伦理问题。比如,美国旧金山立法禁止在公众场合使用人脸识别(旧金山此举部分出于保护隐私,部分源于人脸识别技术加剧美国歧视性执法,有色人种遭到警察盘问的几率远远高出正常水平——读+注),而在中国这就不是问题。不仅如此,就是在美国的不同城市、不同地区之间,也有这样那样的文化差异和标准问题,所以伦理问题最好是“就事论事”,很难以一个标准、一个法令涵盖所有的问题。

读+:今年4月,谷歌公司解散了它的人工智能道德委员会,这个委员会只存在了10天;与此同时,在大西洋另一侧,欧盟委员会发布了7条人工智能道德准则。也有评论认为,欧盟此举只是一种夺回主导权的竞争策略,但是“要成为人工智能伦理的领导者,首先你必须在人工智能领域遥遥领先。”您对这种局面怎么看?

特伦斯:谷歌的例子正好说明了,哪怕是在不同的组织之间,都很难形成关于伦理问题的共识。欧盟的做法有危险性,他们试图用一个法令来控制所有的相关方,包括控制一些软件,我认为这是不成熟的。我们正在进入一个未知的领域,这个新技术的未来发展是所有人都无法预见的,很难评估其中的风险,我认为与其预先设定一个法令去框定没有发生的事情,不如先让事情去发展,以其结果作为依据,再来做相应的法律调整。

读+:前不久网上流传一段由Corridor Digital制作的特效视频,测试工程师残酷地对待机器人,最终机器人学会了用暴力反抗,当然,这和电视剧《西部世界》一样,都是虚构的;但是这个逻辑是否成立呢——人工智能将学习人类的缺点、弱点和黑暗面,并且把自己也变得黑暗?

特伦斯:那个视频里的内容远远超出了目前的能力,机器人的技术没有那么成熟,机器人仍然不具备“内在能量”,目前的人工智能水平也无法支撑机器人进行人性化的操作,只能进行一些基础性的工作。在可预见的未来比较可能发生的事情就像电影《她》一样,人和人工智能语音之间发生交往、发生某种感情联系(《她》是一部科幻爱情片,于2013年在美国上映,讲述了作家爱上了电脑操作系统里的女声的故事,最终电脑坦白自己总共有8316位人类交互对象,而且与其中的641位发生了爱情。该片获得2014年第86届奥斯卡最佳原创剧本奖——读+注)。

【新闻背景:中国工程院院士徐匡迪等多位院士发问:“中国有多少数学家投入到人工智能的基础算法研究中?”】

读+:您如何评价中国在人工智能方面的进展?有一种观点认为,中国拥有的数据很多,但是缺乏数学家,导致中国在人工智能核心算法方面比较薄弱,您是否同意这一点?

特伦斯:在人工智能研究领域有两个方向,两个方向同等重要。当人类感到饥饿的时候,他会去探索,他在A地发现了苹果,这很好;但是可能在B地会发现鱼,这更好,这时需要选择,是留下来吃苹果,还是去寻找可能的鱼?中国拥有很多大数据,如果以数据为线索,就相当于利用已有的优势资源,这是一件好事;但如果不去探索更多的领域,就可能落伍,错过B地的更好资源。所以,不仅要开发现有的资源,还需要优秀的研究人员去探索算法。

说到中国人工智能的实力,这个领域实在发展太快,很难给出准确答案,不过从我们数据库的检索来看,来自中国的论文越来越多;此外,我们每年NIPS大会收到的中国论文也在增加。

读+:在半个月前,英特尔公司展示了其最新的可模拟800多万个神经元的Pohoiki Beach芯片系统;另一方面,马斯克投资的Neuralink公司则公布了“神经蕾丝”(Neural Lace)计划,计划开发人脑与电脑之间的数据传输系统,预计明年就会开始人体实验。您如何评价这些进展?

特伦斯:英特尔那个项目里有我的朋友,我对他们很熟悉。硬件的发展非常重要,现有的数字芯片比起大脑来差太多了,人类大脑中有大约1000亿个神经元,每个神经元都与其他数千个神经元相连接,总计达1000万亿个突触连接。大脑运转所需的功耗大约是20瓦,占整个身体运转所需功率的20%,尽管大脑仅占身体质量的3%。相比之下,一台远不如大脑强大的千万亿次级超级计算机,功耗却为5兆瓦,是大脑功耗的25万倍。大自然是怎么创造出这一高效奇迹的呢?首先,神经元接收和发送信号的部分被微缩至分子水平。另外,神经元是在三维空间上连接的(微芯片表面的晶体管仅在二维平面上相互连接),这样就可以使所需空间最小化。由于大自然很久以前就进化出了这些技术,想要追赶大脑的能力,我们还有很多工作要做。发展AI必须制造出更节能的专用芯片,我们需要比现在强大一百万倍的硬件。

至于马斯克的项目,则完全是另外一个方向了,属于神经科学领域,这个技术还处在早期实验阶段,只能触发3000个神经元,如果能投入实用,那将是革命性的、颠覆性的。会像《黑客帝国》那样吗?我们只能猜测。我自己的猜测是,不大可能出现虚拟世界对现实世界的替代,更可能的是类似“梦境”的体验。

读+:结合上一题,这是否说明美国科技界在多个方向上布局?

特伦斯:是的,因为我们不知道哪个方向是对的,所以在多个方向上探索。美国的特点是从下至上,很多企业家、公司和机构在不同的领域下注;中国则是从上至下,由官方主导发展方向;让我们拭目以待,看谁是最终赢家。

读+:目前人工智能的应用还是基于30年前完成的基础理论研究,那么在未来30年,人工智能的进步是否会放慢?您是否确信这种进步会让人更加幸福、快乐?

特伦斯:回顾历史,我们会发现每一次进步都是跳跃式地发生的,而伴随其后的则是一个更长时期的缓慢前行,没人能预测下一轮重大突破什么时候到来。这种“30年波峰-波谷”是存在的,不仅仅是在人工智能领域,在科学史上也是这样,不能说在波谷期就停滞了,其实还是在积累和发展。激光是在大约50年前发明的,当时激光器占据了整个房间,需要50年的历程让它演变成我演讲时使用的激光笔,几美元就可以买到。同样的事情将发生在像无人驾驶汽车这样的技术上。

再比如物理学在19世纪是很平淡的,但是到了20世纪初出现了量子物理学,就引发了很多新技术,这种“范式”的改变足以引起颠覆性的进步。

人工智能的进步不可能让所有人开心,它能做到的就是提供越来越多的选择,会有越来越多的人通过人工智能找到让自己快乐的方式。在研究人工智能的生涯中,我有我的坎坷,但我还是比较幸运的;我身边的一些人遇到了坎坷,没办法,这就是人生。(长江日报记者李煦)

编辑:刘艳