AIR 021丨加拿大皇家学院院士李明:深度学习在机器人问答中的应用

2016-08-14 10:37:48     作者:亚峰      来源:雷锋网

自然语言处理是人工智能中最为困难的问题之一,深度学习技术被认为是解决NLP问题的关键。

聊天机器人怎么做?常见的方式一种是通过深度学习;另外则是利用信息论,即让机器人如何去聊天、如何反馈。利用深度学习的方式现在已广泛应用,而第二种方式目前在应用较少,尚处于探索阶段。

在全球人工智能与机器人峰会上,加拿大皇家学院院士,滑铁卢大学教授,ACM、IEEE Fellow李明提到,利用深度学习的Context Model做聊天机器人,该机器人在对话中回答的问题就过于笼统,目前需要解决的产品痛点是要让机器的回答更有针对性。所以李明和他的研究团队在此基础上加了一个CNN编码器,给机器人一个有上下文的题目,然后对它进行几亿对的问答训练,最终训练出40个,让回答更具针对性,而且精度在80%以上。

它的工作方式是先接入两个Contet Model,通过不同的连接,把CNN的分类结果输入至RNN,从而更准确地理解问题,做出正确的回答。

Siri作为一个背后由自然语言处理支撑的应用,目前还存在一定的问题。当用户问Siri“鱼吃什么?”Siri内部的系统提炼出“鱼”和“吃”这两个关键词,于是理解为用户的意图是想要吃海鲜,于是回答结果罗列出很多海鲜馆。如果不用深度学习改用模板匹配也会出现问题,模板匹配灵活性较差,提问“今天天气怎么样”它可以回答,但如果换为“今天天气怎么样啊”,就会出现问题。

最近李明做了一个研究,鉴定细胞里的某项物质有多少。流程是先给到一个细胞,把细胞粉碎、分离,分离以后把黑点拿出,用质谱议摇一摇以后生成频谱,该频谱即它的质谱,按照质谱李明写了一个很简单的CNN模型,接上LSTM完成鉴定。而在这种情况下,由于噪音问题,深度学习自身不工作,此外它还需要做动态规划,通过无数个CNN,最终用动态规划把它解决。

问答机器人其中有一大技术挑战就是适度反馈系统。阿尔法狗的反馈系统,通俗讲就是下棋下输一局就减一分,反之加一分。相比于阿尔法狗简单地反馈输和赢,聊天和问答就不能用简单的对和错、输和赢来反馈,所以这里需要一个适用的度量系统。李明提出一个度量系统概念,以信息论为基础的度量系统,他们需要度量两个句子的相似性或者一个问题和一个答案的相似性,最终找到两者的语义距离。语义距离虽不可计算,但语义可以达到近似,而近似的实现方式就是压缩,通过压缩来度量语言的近似性。

李明从另外几个角度利用深度学习来解决自然语言问题,为研究者们提供新的视角。

返回沙发首页  
沙发管家微信
扫描关注沙发管家微信 QQ群: 沙发网官方群 微博:

资讯评论

亲,你需要登录后才能进行评论喔!

还没有评论,快来抢沙发吧!

提示

热门设备安装方法 查看更多>>

最新设备

智能电视 / 盒子评测

安装指南

应用

热门专题