你需要了解的吴恩达
人工智能是现今科技界前沿的话题之一。以谷歌为代表的科技巨头均在这个方向上进行了巨大的投入,在这个全球智慧大脑的群体里,斯坦福大学人工智能实验室主任吴恩达(英文名 Andrew Ng,华裔)所领导的Google Brain项目,在人工智能技术的竞争中更加,2013年6月,Google Brain运用深度学习等研究成果,使用1000台电脑创造出多达10亿个连接的“神经网络”,让机器系统学会自动识别猫,这个在国际深度学习领域广为人知的案例惊艳全场。今年1月,李彦宏宣布,百度将建立公司历史上首个前沿科学研究机构——深度学习研究院(Institute of Deep Learning,IDL)。今年5月Google Brain之父吴恩达正式加入百度美国研究院,作为机器学习、特别是深度学习方面的资深学者之一,他将成为“百度大脑”计划以及百度全球化扩张中的核心人员。
梦想重燃:让机器拥有智慧是世界上酷的事情
有种理论认为人类的智慧来源于一个单一的算法。这个理论的实验依据是,人类大脑发育初期,每一部分的职责分工是不确定的,也就是说,人脑中负责处理声音的部分其实也可以处理视觉影像。人脑究其本质来说,是一台可以被调试以执行特定任务的通用型机器。
七年前,斯坦福大学计算机科学教授吴恩达偶然接触到了这一理论,他突觉醍醐灌顶,这个理论从此改变了他对于人工智能本质的理解,重新点燃了他对人工智能技术的热爱,从而改变了他的职业轨迹。据他回忆,“有生以来次,我感到自己有可能在人工智能的研究领域取得一点进展。”
吴恩达说,在人工智能技术研究的早期,这个领域的主流理念是,人类智慧形成于成千上万个简单代理的协同工作,也就是麻省理工大学教授马尔文·明斯基(Marvin Minsky)所说的“头脑的社会”。工程师们就以此为信条,认为要实现人工智能,就必须建立成千上万个独立的计算机模块。一个模块,或者算法,去模拟语言,第二个模块处理发声说话等等以此类推。总之,按照这个早期理念,实现人工智能所需的工作量巨大,难以实现。
吴恩达小时候的梦想就是发明能像人类一样思考的机器,当时只是很单纯地认为,让机器拥有智慧是世界上酷的事情。但当他进入大学真正开始接触人工智能时,却正逢上述理念盛行,他很泄气,因此放弃了对人工智能的研究。后来,他成为大学教授,也不忘顺便打击自己的学生,劝他们也放弃人工智能这一“不切实际的梦想”。直到有一天,他接触到了“人类的智慧来源于一个单一的算法”的理论,意识到这个领域的主流理念对于人工智能的理解可能大错特错,他看到了一个机会,于是他果断地重拾了儿时的梦想。而“单一算法”这一假说的提出者是杰夫·霍金斯(Jeff Hawkins),一名有着神经科学研究背景的人工智能领域的企业家。
现在看来,这一假说所改变的,不仅仅是吴恩达的职业生涯而已。吴恩达目前的主要研究领域是机器学习技术中的“深度学习”,在计算机科学中属于比较新的领域,深度学习研究的主要目的是打造能像人脑一样处理数据的机器。目前,深度学习的研究已经不限于学术界,谷歌和苹果这样的大公司也意识到了其中蕴藏的巨大机会。吴恩达和谷歌的其他研究人员一起成立了有史以来人工智能领域目标远大的项目——Google Brain。
究竟什么是“深度学习”?
深度学习是人工智能技术朝新的研究方向迈出的步。简单地说,深度学习包含了构建能够模仿人类大脑行为的神经网络。这些多层次的电脑网络像人类大脑一样, 可以收集信息,并基于收集到的信息产生相应的行为。这些电脑网络可以逐渐对事物的外形和声音进行感知和理解,也就是“认识”事物。
比如,为了赋予机器“视觉”,研究人员需要建立基本的一层人工神经元,用来探知如物体的边缘形状等基本信息,第二层神经元可以将层感知到了物体边缘性状拼凑起来,鉴定较大块的物体形状,然后再加一层将第二层检测到的信息再拼凑从而使机器明白物体整体的形态。这里面关键的一点是,软件可以自行做到这一切——旧的“伪人工智能”往往需要工程师人工输入物体视觉或者声音的信息,然后由机器学习算法来处理这些信息数据。
吴恩达介绍,在深度学习算法之下,可以通过给这个系统很多数据,使其“自己学会世界上的一些概念”。去年,吴恩达的一个深度学习算法机器通过扫描互联网上无数的猫的图片“认识”了猫,但是初期的机器不认识单词cat,吴恩达需要为机器输入这个单词,然后经过一段时间,机器将这种毛茸茸的小动物与单词cat联系到了一起,可以自行鉴别什么样的事物是cat。
教机器学习的方法本身就是在模仿人类的学习机制,当我们还是婴儿的时候,我们通过观察周围,开始认识我们接触到的事物,但是如果父母不告诉我们一样事物的名字是什么的话,我们在接触其他信息之前都是无法理解这个事物和名字的关系。
当然,吴恩达的深度学习算法目前还比不上人脑的精确性和灵活性,但他说,那一天会到来的。
吴恩达在他的电脑上解释何谓深度学习
加入百度的三个原因
百度拥有非常先进的深度学习技术。他的好朋友余凯(百度北京深度学习实验室的负责人)是深度学习方面的佼佼者。深度学习对于网络搜索、广告、语音识别、光学字符识别和包括百度核心产品在内的该公司一大堆产品都非常有用。百度首席执行官李彦宏本人也热衷于人工智能。我非常欣赏的一点是,李彦宏在致股东的正式年报中谈到了深度学习。这说明百度领导层认识到了人工智能的重要性
一是如今的人工智能是资本密集型产业。需要数据和计算资源才能取得进展。数据比计算资源更难获得,若要研发必须二者皆有,百度以搜索起家,发展多年来积累了大量的数据,是其他企业很难企及的。
二是灵活性。百度拥有不可思议的灵活性。例如,想建立一个图形处理器集群,马上就实现了。这与百度在互联网行业拼杀多年形成的反应机制有关。
三是人。百度的工程师极为勤奋。中国工程师努力工作的程度远远超过普通的硅谷工程师。
谈到同百度的合作,吴恩达认为还有很多工作要做,“全球共有三个百度研究院实验室,两个在北京,大部分已经建成,硅谷的正在从头建起,虽然门槛一直都很高,但是招兵买马的速度相当快,至今共招了六人全部来自硅谷,我们将在这里做些很酷的事情。”
未来:得人工智能者得天下
随着移动设备的崛起,“破解人类神经密码”的任务愈发紧迫。由于设备越来越小,我们需要它们运算更快、更准确。然而,随着电子设备的基础元件晶体管的尺寸不断缩小,将它们变得更精确更高效的难度也越来越大。比如,想要加快设备的运算速度,需要给设备提供更多电能,但更多电能会让设备的运算系统更“嘈杂”,也就是说,它得运算精确度会下降。
目前工程师们只能通过避开问题核心的方式来应对上述问题,力求在设备大小、运算速度、能耗之间取得平衡,而无恩达认为人工智能技术对此则能提供更好的解决方案,“生物科学能让我们直面问题的根本所在,生物内部的转换机制也是天生‘嘈杂’的,但其找到了一个办法来适应和忍受这些干扰噪声甚至对之加以利用。如果我们可以搞明白生物内部应对这些杂音的方法,我们就能开创一套截然不同的计算模型”。
科学家的目标并不是将计算设备变得更小,他们的目标是让计算机能够做到的事情更多。不管背后的算法多么复杂,目前的计算机无法帮助人类去杂货店购买物品,或者帮助人类挑选适合的衣服、钱包等,如果要处理这样的事情,计算机需要添加更高级的图像智能识别技术以及像人类一样的注意力和记忆力,相信,要是能够实现这一点,那么计算机能够处理的事情的想象空间将变得无穷大。
全世界都意识到,如果你可以解决这些问题,人工智能领域存在的无限商机就会被打开。
而驱使谷歌、IBM、微软、苹果、百度这些公司竞相开发高级机器学习技术的原因,正是其背后蕴藏的巨大商业潜力。纽约大学教授、深度学习领域的专家燕乐存(Yann LeCun)教授预测,两年内,将出现大量的机器学习领域的初创公司,其中很多可能会被大公司收购。
吴恩达的梦想正在照进现实。“我有了希望,不仅仅只是希望,我们可能能够实现真正的人工智能,”他说,“我们当然还没有找到正确的算法——这可能需要长达几十年的时间,要实现它很不容易,但我看到了希望。