36氪专访吴恩达:海量数据给神经网络模型带来机会

厨子与剑客 · 2015-01-21
人机交互的入口在语音,似乎这事儿没跑了

百度首席科学家吴恩达在未来论坛上发表了演讲,会后36氪对他进行了【独家采访】。

神经网络模型让数据的潜力更大

我们都知道,在海量数据时代,深度学习为人工智能带来了新的机会。这些机会集中在三个地方:文本、图片和语音识别。

吴恩达提到,人工智能有一个正循环链条。有了好的产品,可以吸引更多的用户,然后会生成海量的数据,接着数据又能带来更为优秀的产品。但是,如果采用传统的人工智能算法,数据增长到一定体量,算法效果会遇到瓶颈。但如果运用新的深度学习算法,随着数据的增长,算法的效果可以持续提升。

神经网络模型将如何优化呢?以下是他举的例子:

7年前,我让学生利用当时最好的算法完成一项简单任务——在一张放了很多餐具的图片中判断哪个是杯子,结果没有做到。基本上柱状的工具都被识别成了杯子。

虽然在人的眼里,看到的是这些物品的外形,但是在计算机的眼里,他们得到的信息只是照片上每一个像素点上代表色彩的数字,利用数字谱与其他的图像对比。再举一个语音识别的例子,过去我们将声音分解为不同的音调、音素等等,希望通过数据解码来识别一段对话,但得到的结果还是与自然语音本身不同。

人脑是怎么学习的呢?这里要声明,虽然叫做神经网络模型,但并不是真的让算法模仿人的大脑工作,因为我们并不确定大脑到底如何工作的,只是希望接近这种机制。以上面的杯子为例,我们只是提供大量的杯子图片,让计算机来发现这些样本具有怎样的特征,然后它就可以进行判断了,和我们平时学习的方式很相似。

这件事过去做不了,所以需要依赖传统的数据解码算法,但现在对数据的存储和计算都达到巨量级,能够实现海量样本对照。

语音识别将推动手机的革命

越来越多的人正在使用语音识别,深度学习语音识别系统的准确率比传统方式提升了很多。

在移动端应用场景下,语音交互与手指输入相比,是一种更自然的人机交互方式。我们可能不再需要在手机上安装那么多的Apps,你只需要跟手机进行语言交互,告诉它你需要什么,他就能为你连接服务。我相信语音将会推动手机的革命。想象一下,未来我们将围绕语音界面来重新设计移动产品,重新定义人与手机的交互界面。

在这里,吴恩达说了一句模棱两可的话:接下来,我们会为你带来更好的智能手机。不知道该理解为百度手机重出江湖,还是仅仅泛指所有的手机商呢?

不用担心机器人会占领世界

人工智能技术仍然存在挑战。比如,有的国家使用AI技术威胁到了人的权利(脑补疑犯追踪),这是很严肃的道德议题。但即使不存在AI,这样的情况也是存在的。至于说AI达到了比人更聪明的程度,甚至可能会控制我们的世界。我认为这并不是目前急需关心的问题。机器统治世界不会很快发生,或许100年后我们才需要担心这个问题。

即使我们说深度学习算法具有自我学习的能力,但也不需要为此担心。大量的神经网络算法中的模型训练,即机器学习的过程,都是有监督的训练。这种训练方式应用在语音识别、图像识别中时,效果是非常好的。但如果站在机器可能统治人的角度,这是完全不同的事情。

推荐阅读:百度最强大脑在想什么? —— 36氪硅谷专访百度首席科学家吴恩达

+1
0

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

文章提及的项目

百度

简单任务

果运

下一篇

监管细则出台之后,行业可能会加速洗牌,一些实力较弱的公司可能率先出局。

2015-01-21

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业