|
重铸天可汗你见过没有出演过影片中任何一个镜头的影后吗?宅男女神斯嘉丽·约翰逊做到了,在电影《Her》中,斯嘉丽用声音出演了一个人工智能系统,在跟情感失意的男主角交流过程中,让一个大活人成功爱上了她这个没有实体的人工智能。
她温柔体贴、幽默风趣、善解人意,双方很快从无所不谈的人机友谊变成了亲密无间的恋人关系,直到男主角发现她一共有8316位人类交互对象,并且与其中的641位发生了爱情……
影片中的故事设定发生在2025年,然而就在当下,谷歌、亚马逊、苹果、阿里巴巴、京东争相发布能听懂人类语音指令的智能音箱,打开手机,就有个虚拟人格与你“尬聊”。
8月6日,出门问问创始人兼CEO李志飞出席极客公园Rebuild 2017大会,就此给出了他的答案。
2011年,苹果发布手机助手Siri。在之前,从人工智能诞生的1956年到2011年,人们更多关注的焦点在于算法,怎样把自然语言处理、计算机视觉、图像识别,各种各样算法的框架搭起来。当时IBM、微软、谷歌等公司都在语音交互技术上做了很多尝试,包括产品方面,但从来没有像苹果一样把Siri包装成一个类似人的助理。
Siri面世后引发了大量讨论,掀起了虚拟个人助理的热潮。随后,谷歌、微软、亚马逊都发布了自己的虚拟助理或者语音助手产品。
2014年,亚马逊发布智能音箱Echo。早期虚拟个人助理都在手机上,但除了被用户“调戏”以外实用程度有限,智能音箱发布以后,成为继智能手机后唯一发售量超过一千万量的较高频人机交互产品。
出门问问也推出了智能音箱,此外还有智能车载系统、智能手表等,用智能硬件搭载的虚拟个人助理软件形成多场景联动。
李志飞表示,虚拟个人助理或者说语音交互的多场景联动是出门问问探索已久后率先打出的概念。
2012年,李志飞离开谷歌成立出门问问,因为之前的博士学习和在谷歌负责的翻译产品核心技术是自然语言理解,他和团队注意到移动互联网时代将会产生新的交互方式,不同于以往的键盘和触摸屏,未来可能会以语音交互或者全新交互为主流。
所以他们把公司愿景定位于在下一代移动计算设备普及到来时,定义下一代的人机交互。
公司刚成立的一年半主要是做算法,之后开始探索技术怎样落地,在做了很多手机应用之后,他们发现用户的主要兴趣就是“调戏”产品证明智商,真实渗透率很低。之后,团队想到未来的交互方式应该是软硬结合,于是开拓新品类,他们最先做的设备是智能手表。
在实现软硬件结合之后,出门问问提出了多场景联动概念,。拟个人助理可以被理解为一个灵魂,但必须附在载体上,真正的虚拟个人助理应该是无所不在的,现实中单一的设备很难承载所有交互,比如手表,当人躺在床上就用不着了,开车时用起来也不方便。
于是从场景出发,出门问问研发了智能车载产品、智能音箱。多场景联动以后,人们可以在家里控制车内的设备,在车里也可以打开家里的空调。
据出门问问的数据显示,用户使用语音交互的DAU在手机上小于1%,智能手表上20%,这说明设备本身在语音交互场景里是最核心方式时才会被用户频繁使用。
所以李志飞预测,智能车载是未来最先普及的语音交互产品,其次是无线耳塞或者是智能家居,最后才是手机。
未来无论是交互方式还是设备都会多元化。交互方式不仅限于语音,而会综合手势、图像、视觉、表情等。设备上,耳塞、车载设备、未来的AR、VR设备都可能会是虚拟个人助理的硬件载体。
影片中的人工智能能够跟人用非常自然的方式交流,而且无所不在,无论是早晨起床、上下班路上,还是晚上睡觉,甚至产生了自己的思想,和交互对象人类有了爱恨情仇。
李志飞指出,目前语音交互最大的瓶颈是自然语言理解,就好比很多人调戏Siri的时候把句式换一换,机器就答非所问了。
另一个关键问题是今天的计算机没有对物理世界、常识有建模和理解。一个计算机可以打败世界最一流的棋手,但是另外一方面,它甚至不能像一个5岁的小孩进行正常对话。
电影《Her》背后体现的虚拟个人助理技术非常复杂,尤其是理解和意识部分,到现在还不知道怎么建模,目前来说大家都只是从交互的层面在做。
他也表示,出门问问的虚拟个人助理不会强调人格化部分,如果企业把虚拟个人助理塑造成像人一样聪明,甚至具有人类感情,是把整个行业往一条不可能实现的路上带,这是不现实的。
而要在2025年,也就是未来七八年内实现像《Her》中的人工智能程度是非常有难度的。
|