侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

【聚焦】最强大脑人机大战:黑幕疑云密布的人工智能秀

2017-01-24 09:14
潇纵
关注

在这场比赛中,百度大脑和“水哥”王昱珩比拼的仍然是图像识别。通过三段在夜幕下分别从行车记录仪、高位摄像头、和手机中拍到的模糊动态影像,双方需要记住三名不同识别对象的面部特征,然后从节目现场的30人中将他们辨认出来。

相对于第一场目标清晰的情况,这次识别对象戴了口罩、帽子,并且是在光线阴暗的条件下一闪而过,使得可观察的特征和细节大大减少,让识别难度陡然提高。

王昱珩肩负着捍卫人类尊严的使命,更是在比赛中放出豪言将成为百度大脑的“滑铁卢”,并私下同节目组沟通要求把识别环境的光线再调暗20%,进一步加大了识别难度。

然而随着比赛结果揭晓,挑战要求识别的三名识别对象,百度大脑找出了两名,王昱珩却一名都未找对。。在《最强大脑》舞台上与人类的三场对战中,百度大脑两胜一平,保持不败。

而在第一场人机大战人脸识别的比拼中,双方进行了两轮较量,需要根据年龄跨度近二十年的照片中找出真人。百度大脑最后以3比2战胜人类记忆大师王峰,尤其是根据一张模糊的童年照片,从一对高度相似的双胞胎中准确地认出了识别对象,完成了常人无法完成的任务。

在第二场的听音辨人中,比赛项目则是从21位性别相同、年龄相仿、声线极为相似的专业合唱团中,选出三位每个人读一句话,加密后成为断断续续的声音样本再交给百度大脑和人类选手,要求他们从合唱声音中识别出三名线人的声音。百度大脑与被誉为拥有“绝对听力”的孙亦廷1比1战平。在备选的3人中,双方都只选对了1名。有趣的是,赛后百度语音识别团队的成员称,百度大脑内置的两道算法分别认出了两名备选人,然而在进行算法融合时,“出现了小概率事件”,只筛选出了一人。这似乎是想说明百度在语音识别方面的能力也是强于人类的。

人机大战背后 百度做了哪些事

对于百度的人工智能技术,需要补充一点背景。

科大讯飞研究院院长胡郁认为人工智能主要分为三个维度,同时它们也代表了人工智能发展的三个阶段:运算智能、感知智能、认知智能。

在之前数十年,人工智能呈现的主要是最底层的运算智能,表现形式即各类的计算平台。

而在上世界80年代,人工智能领域从人脑的神经系统模式中吸取灵感,构造出了人工神经网络,使人工智能开始步入感知智能阶段。

这种新的运算模型用自身结构的复杂性简化了运算的难度,通过把占据不同权重的神经元连接起来并行分布式运算,一定程度上克服了传统运算程序难以处理非结构化信息的短板。由此,它使得人工智能获得了深度学习的能力:无需人工对数据做复杂的预前处理,就可以从大量的数据中抽取出它们更深层的共同特征。

用人话说,这种方式绕开了把复杂问题表述为计算机语言的过程,通过简单粗暴的大数据训练来解决问题,它并不回答“熊长什么样”,只是看足够多的熊,来获得认出熊的能力。

这两年,人工神经网络的成果极大地促进了人工智能领域在计算机视觉与自然语言处理方面的进步,让计算机获得了“看”与“听”的能力。

百度的面部识别和语音识别,对应的就分别是感知智能中的“看”与“听”。

面对人类顶尖高手的车轮挑战,百度大脑为何能保持不败?主要在于以下三个方面。

1、海量数据与训练

在百度方面的说法中,其人脸识别准确率达到了97.7%。在人脸识别技术两个最为权威的国际评测FDDB与LFW中,百度都获得了第一名。而这个成绩背后,是巨大的数据与海量的训练。百度大脑团队称其通过超过2亿的面部图像数据来进行深度学习,用大规模的训练,让百度大脑自身建立了一整套人脸特征提取与比对模式,成为了人脸识别方面的专家。

而在声音方面,百度同样拥有庞大的数据库。并且在上节目前两个月,百度大脑团队就开始特别面向声纹识别对算法进行了优化以及训练。

2、过目不忘的记忆

同时百度大脑在记忆力上占据绝对的优势,信息一旦进入其存储单元就可以被原封不动地保存与提取。而人类选手却不得不担心遗忘以及后摄信息对之前记忆的干扰。在节目的赛程设计中,主要信息都是需要记忆的,这使得机器的胜算大大增加。

3、没有情绪问题

尽管百度方面特意拿出了“小度”这样一个萌萌的机器人来与现场进行互动,营造亲和感。然而它其实是由人工控制的,其互动语音都是工作人员打的字。百度大脑没有感情,没有压力,不会犹豫。它既不会感受到百度工程师团队对它倾注的殷切期望,也听不到现场观众的喝彩或者嘘声。它只是一个冷冰冰的任务执行者,不会有任何人类选手所谓的临场感、情绪波动,只会根据任务进行对比,给出匹配概率。

尽管人类在百万年的进化中,发展出来了对人脸与人声直觉性的感知,然而却不曾拥有百度大脑在数据训练、记忆能力以及情绪稳定性方面的优势。并且,选手往往是独自应战,百度大脑身后站着的,却是一整个工程师团队。

另外,王昱珩主动要求调低影像的做法,除了给自己添堵,并没有给百度大脑增加难度——机器人对人脸面部特征的提取主要依靠的是对比度,整体亮度变化影响不大。

因此,在机器一方占据多种优势的情况下,选手战平或输给百度大脑,在现今的技术或者情面上也是理所应当。

百度没赢的,不仅仅是口碑,还有技术

在第三场比赛中,还有一个容易被忽略但值得关注的细节:第二名需要识别的对象是一个身形明显较胖的人(8号),百度大脑却选了一个体型差异巨大的瘦子(29号)。这般反应,让人难以相信这是国内领先的人脸识别技术。

这不禁让人感慨,百度人脸识别果然是只认脸,连胖瘦都不管了。百度大脑的这个明显失误其实反映了人工智能目前存在的问题:强于感知,弱于认知,甚至在感知上,都是割裂的。

尽管人工智能已经取得了长足发展,但它仍然处在初级阶段,未能达到认知智能。现今的人工智能仍然是由人类圈定一个既定的领域,提出一个有封闭边界的问题,让机器人通过大量数据进行反复训练来获得解。它并不会像人类一样,从小量样本中就能提取关键点,并用语言将其描述出来。

换句话说,人工智能目前只知道怎么做,而不知道为什么,只能用笨办法去针对特定领域“苦练”,而不能在高层次上综合地去“理解”,这极大地限制了人工智能的学习效率与能力。

百度大脑识别第二名对象时所出的bug,正是其初级阶段的表现——它应对的问题完全被圈定,对于人脸之外的特征,即便十分重要,也根本不关心。虽然百度方面称其人脸识别在国际比赛中名列第一,但其识别情景都是相对标准化的。而在实际应用中,情况千变万化,并没有太多标准化的可能,第三场比赛的项目便是绝好的例子。

按照百度官方的说法,其识别错误率仅为2%左右。然而在30选3的识别中就出现了如此离谱的错误,也让人为其在实际应用中的可靠性打了个问号。

如果必须依赖标准化图像才能达到超高的识别率,那么百度的成果只能停留在实验室中。

<上一页  1  2  3  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号