侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

杨强:5个要素决定是否可以迈入人工智能行业

2016-07-21 09:38
FlappyBird
关注

  人工智能的发展方向

  未来的人工智能方向是怎样的?杨强表示可以从亮点去看:

  1、“强化学习”

  首先我们要知道延迟反馈这一概念,举个例子只能在一个学期到学期尾才知道我们期末模式考得好考得坏;在投资股票、在理财产品,过几天才知道这个投资是对还是错,这种现象被称为延迟反馈。

  得到延迟反馈的时候中间已经有了很多的步骤,我们不清楚哪个步骤是使得我们得到反馈的,因此我们要用到强化学习。

  杨强:“说起强化学习我不得不提到Google去年在自然杂志上发表的一篇文章,横向是得到的分数,每一个栏是个人的游戏,这个是个人学习的系统,每一次打游戏学会,再一次再打输再学会是自学习的过程,中间的这条线是humanlevel,去年5月份已经有一大半超过人类的水平,现在是所有的都超过人类的水平了,而且完全是自学习的,我们在实验室里面也实现了打乒乓的游戏,我们发现拿一个单一的GPU来算花了三天三夜的时间不断地打乒乓,最后可以达到日类的最高水平。”

  所以说强化学习是一个在状态空间的搜索,在过去人工智能的研究中,错误地认为一些状态应该是由人来定义的,因此它就一直是止步不前,甚至是有几十年的功夫都没有很大的突破,最近两年通过Google和其他的研究者的研究,发现这些状态原来可以通过深度学习来定义,那么有了深度学习以后,强化学习里面的难题也就迎刃而解了,我们现在不在乎来定义这些状态我只需要来定义输入和输出,这个有一个特别的名词叫端到端的学习,也就是说我们只关心它的输入,比如说Google打游戏的只关心一个屏幕的截图作为输入,它的输出就是赢了为赢,就这么简单叫做端到端的学习。

  2、迁移学习

  迁移学习里是分两个领域的,假设我们有一个领域已经做得很好了,比如说我们学会了法语,那么我们再学一个新的语言如果说学英语的时候,我们会或多或少地利用法语,因为它们都是拉丁系。

  假设现在我们有很多的穿戴式设备,比如说手表,我们希望通过穿戴式数据来知道这个人做什么,比如说是在开车、跑步还是在睡觉还是在听讲,但这样标注数据是非常少的,怎么办呢?我们可以到虚拟世界找更多的数据,比如说微博和微信,我们发现里面有很多大家谈论的行为的数据和地点的数据,我们把这两个数据加关联,我们有大量的虚拟世界的模型迁移到现实世界,我们就可以有更好的模型来告诉我们这个人到底在做什么,可以帮助穿戴式的硬件公司做一个行为模型。

  强化学习加上迁移学习,实际上还可以做另外一件事,除了能够把小数据也用起来,还可以实现个性化。

  总结一下,我们按照现在的方式走下去只是AIFORSOMEONE,我们希望能够达到AIFOREVERYONE,因此我们能够个性化的情况下,让中小公司和非人工智能的公司用起来的话,一定要在技术上努力,包括我们现在推的“先知”平台,包括我们用的迁移学习。 

<上一页  1  2  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号