AIR 018|搜狗CTO杨洪涛:搜索即人工智能

2016-08-13 10:30:39     作者:温晓桦      来源:雷锋网

搜索引擎=计算力+数据+应用

人工智能的研究理论讲了这么多,那么它如何才能够落地,形成能给人类带来价值的产品或服务呢?关于人工智能应用产品化,搜狗CTO杨洪涛以搜索引擎为例,介绍了如何利用AI技术做出好产品。

当下企业做AI应用化的思路或有误

我从网上找到一些数据,美国的数据说全球人工智能领域的企业和创业企业达到一千家,以及40多亿美元的投资规模。国内艾瑞1月份也有个数据,说国内有100家企业拿到了投资金额。这代表这个领域极受关注。但今天我想谈的话题是,

这些企业容易从产品角度去思考他们做的很多事情,这有可能是有问题的,这个后面去探讨。我们谈到的很多领域,比如说机器学习、机器视觉,机器人、推荐引擎、个人助手、语音相关的技术等等,我们从产品角度思考的时候,发现跟技术角度思考不一样。

此外,今年围棋大战导致一个焦虑:机器人到底会不会战胜人。我们当然希望机器在有限的时间内能战胜人,但我们希望从技术角度思考可以发现,很多问题是解决不了的——比如说我们知道深度学习现在不可解释,我们很难从数学角度去推理,它是不可解释的。也因为这些不可解释,它在一些工业应用上就会有比较大的问题,比如,如果出了车祸的时候不能解释,那百姓对它的信任程度就会下降。

另一方面,现在人工智能对语言能力的理解,现在很难做到真实地理解人的语言能力。此外,大数据的产生、训练都需要很大的成本和用户入口,才能够在训练当中去使用,现在也是一个不算有效的领域。

如果从产品角度来看这个问题,我觉得从这两个角度来看:

  • 第一个是,做谈论机器能不能战胜人的时候,我们想想:什么叫战胜?如果说机器跑得比人快,算得比人快,这样的一个回答的话,其实发现机器早已经战胜人了,今天我们说机器能不能战胜人的时候,指的是直接瞄向了人的大脑部分,能不能替代你的大脑和思考决策。

  • 第二点是,产品能不能做出一个辅助人做决策的产品形态来?很重要一点是说我们能不能生产出足够多的数据。

搜索引擎即人工智能

首先第一个是Siri,2011年的时候苹果发布了Siri,引起了关于语音识别的极大讨论和热潮;还有Echo智能家居的产品,在美国卖得非常好;还有AlphaGo,它虽然不是一个产品,但引起了普通网民的关注,对技术进步贡献非常大;然后是特斯拉的自动驾驶,包括消费者关心的一个领域,不断地出现事故,也引起了很多探讨。

但是允许我老王卖瓜一下,从搜索引擎产品的从业者来讲,我们认为搜索引擎其实是人工智能最大的一个场景。

为什么这么说呢?第一个原因从产品角度看,搜索引擎在过去这么多年当中,它起到的作用,就是人的大脑外延,它增强了你解决问题的能力,我们日常生活、工作当中很多问题其实是通过搜索引擎去实现的。

我记得谷歌的创始人之一很早的时候说过,“我们的目标就是要成为人类的第三块大脑。”这描述了搜索引擎产品的单位。但今天的搜索引擎是基于关健词和搜索结果的产品形态,用户要自己去思考,出来这十套结果是否满足自己的东西。

其实搜索引擎下一步要解决的问题,或者说人工智能技术在搜索引擎里有巨大应用的场景就是说能不能不要用这样的一个用户自己思考的方式,而是我能够直接知道你想要的东西,这是大家都想要去解决的一个工作的方向。

最后一个是,对话机器人仍不可能替代搜索引擎。聊天机器人刚上线的时候只有几十个,现在做到一千个了,它是开平带的方式,大量合作伙伴给它增强系统的功能。Siri就是个例子,2011年就上线服务,苹果公司自己研发siri的对话功能和给用户提供的服务,到今年它发现这个功能终于不行了,没办法运转下去。因为大量的用户发现它很难解决实际问题,用户实际用Siri的时候是:我要给谁打电话,我要给谁发短信这样简单的服务。今年开发者希望给它提供很多功能的研发,但实际上它都无法替代搜索引擎海量的用户带来的问题的解答。

搜索引擎=计算力+数据+应用

关于搜索引擎和AI的关系,我们知道,近十年来人工智能的发展,更明确的说是深度学习的发展取决于这三个元素。今天因为互联网的进展,或者网络的进展,足够的应用、足够的信息和足够的用户能上网,最后产生足够多的数据——这些数据使得我们能研究出更好的算法,以及让我们有了很好的计算力,有了大量低成本把计算力连接起来的方式。

这三个角度上看,谁拥有最好的三个元素?还是看搜索引擎界的老大。谷歌虽然没有公开过自己的服务器数量的数据,但根据它的能耗来估计,以及它拥有几百万台服务器的数量,可见搜索引擎公司就有这样巨大的计算力。上午张老师就提到“找猫的图象识别”,程序能够很容易的就把16000个CPU连接起来做这个训练。

再看数据,搜索引擎公司有足够大的网页,去作为数据的基础,它们还能做很多怎么去促进数据的收集工作,谷歌为什么要去发射,用来联网的切球,谷歌为什么要免费拉光纤。大家知道谷歌的母公司它里面有两个关于医疗的子公司,一个做的方式是用传感器放到眼睛里的隐形眼镜,要把一个得了病的人的数据进行搜集,然后分析,他们有这种条件去获得这样的数据的能力。

未来工作方向:自然交互和知识计算

自然交互

怎么能够让用户以很自然的方式跟产品去互动?让搜索引擎懂你想要的是什么东西,而不是一个用关健词去表达的——是一个自然语言的句子,像人与人对话一样,描述我有什么样的问题。这当中不仅仅是语言和对话,还包括视觉,能看到你的表情、样貌,读懂你的情绪。

知识计算

怎么能够对知识有足够好的获取计算或者推理的方式?在这个领域上目前我们能够获得的进展是非常有限的。

在这两个方向上,目前的搜索引擎产品也好,或者同类的对话系统、服务系统也好,还解决得不够好。那么,从产品上怎么解决这个问题?

解决不了的时候就攒数据

当一个产品体验不好的时候,我们怎么办?我们攒数据。

举一个我们自己做产品做技术时候的真实的例子:

大家知道搜狗输入法做了很长时间,我们很早也意识到用户通过语音与机器交互的方式非常重要,那时候我们还没有语音识别的技术,我们还找了一些做语音交互的公司去合作,但没有找到比较好的合作方式。于是逼得我们自己去做研发。

当时我们想了一个办法,直接调用谷歌在国外提供的语音识别接口,虽然很慢,但可以用。它的自错率43%,意思就是说如果你输入一段话100个字40个字是错的。但因为一个产品里面功能的入口,大量用户就开始用,用了之后我们开始迭代数据,积攒了足够多的用户录语音的数据。2012年11月份的时候,不到半年的时间我们把自己的数据做出来了,一上线了就获得了跟谷歌接近而且比它好的结果。随着后面用户使用越来越多,以及新技术在过程中的使用,错误率直线下降,今年4%左右的错误率,最近还在继续下降。

所以当打不过的时候,攒数据是价值提升的作用。值得一提的事,我们掌握这么多数据之后怎么办?

这需要找一些数据标注公司去标注这些数据,每一句话说的是什么,后来因为把这样一个功能用到产品里之后,用户没有选择语音识别的句子实际上是辅助标注的过程。如果用户没有选说明是错的,错的数据我们就拿给数据标注公司去标注。

面包与葡萄干:人工智能做出好产品才创造价值

使用AI技术的好产品才创造价值,这个价值有两方面:一个是给用户提供一个好的办法,第二个是真正能生产数据,从而使自己迭代。

好产品:叫好+卖座+赚钱

好的产品能得到媒体和用户的关注,能得到资源,卖座的产品能获得用户,用户能生产数据,以及能不断迭代。赚钱更不用说,一个好产品能赚钱才能使企业研发不断滚动。

不足够好的产品的例子,我们做个自我批评。搜狗前两年出了一个己的云助手产品,当时觉得这样一种对话形态可能是未来新一代的互动方式和解决问题的方式,于是我们做了跟Siri基础一样的产品架构和问答式的技术架构。但是这个产品上线之后,我们发现用户的使用率并不高,开始几天觉得好玩用了一段时间,后来就不用了,为什么?我觉得原因有很多,其中关键原因就是它没有足够好的解决用户新的需求。

讨论

郑宇:两个例子里面我觉得第二个例子可能更加有意义,因为搜索空间有限,而且字比较短,第一个发微信的例子可能不是最好的,有点鼓励大家开车发微信的意思。现在给大家提个问题:搜狗投资和布局了很多人工智能项目,目前有什么样的收获?最大的成果是什么?

杨洪涛:我的答案有点像刚刚KK(小米联合创始人黄江吉)的答案,我觉得现在还没有让我们觉得足够满意的产品,或者叫做真正让产品帮人做决策,或者帮人做出好的选择的这样一个功能上还没有完全做得到。但我们的产品确实要去解决这样的问题,然后我们还要去投入。你刚才说到投入我觉得非常好,给我一个打广告的机会,我们今年跟清华大学投入了大概1.8亿人民币建一个人工智能研究院,推动技术的进步,有了技术的进步,有了产品应用的进步,我们在这个领域的关注都是为了做一个好的产品体验出来。然后去积攒数据,现在还只能做到积攒数据的地步。下一步真的是能够去主动地给人提供辅助,我觉得还没有做到。

返回沙发首页  
沙发管家微信
扫描关注沙发管家微信 QQ群: 沙发网官方群 微博:

资讯评论

亲,你需要登录后才能进行评论喔!

还没有评论,快来抢沙发吧!

提示

热门设备安装方法 查看更多>>

最新设备

智能电视 / 盒子评测

安装指南

应用

热门专题