机器阅读理解首次超越人类!云从科技创自然语言处理新纪录
继国际象棋、围棋、游戏等领域之后,人工智能首次在深度阅读理解超越人类。
2019年3月8日,中国人工智能“国家队”云从科技和上海交通大学联合宣布,在自然语言处理(NLP Neuro-Linguistic Programming)上取得重大突破,在大型深层阅读理解任务数据集RACE数据集(ReAding Comprehension dataset collected from English Examinations)登顶第一,并成为世界首个超过人类排名的模型。
有评论认为,这会是机器深层理解人类语言的开端。
论文中,云从科技与上海交通大学基于原创DCMN算法,提出了一种全新的模型,使机器阅读理解正确率提高了4.2个百分点,并在高中测试题部分首次超越人类(机器正确率69.8%、普通人类69.4%)。
这一研究成果,在应用领域搭配文字识别OCR/语音识别技术后,NLP将会帮助机器更好地理解人类文字/语言,并广泛应用于服务领域:帮助企业判断客户风险、审计内部文档合规、从语义层面查找相关信息;在社交软件、推荐引擎软件内辅助文字审阅工作,从枯燥的人工文字工作中解放人类。
突破语义理解瓶颈
此次云从科技和上海交通大学在自然语言处理(NLP)领域的深度阅读理解上登顶RACE排行榜第一名。RACE是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约28000个文章以及近100000个问题。它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(Passage),针对提出的问题(Question)从四个选项中选择正确的答案(Answers)。该题型的正确答案并不一定直接体现在文章中,只能从语义层面深入理解文章,通过分析文章中线索并基于上下文推理,选出正确答案。相对以往的抽取类阅读理解,算法要求更高,被认为是“深度阅读理解”。
RACE数据集的难点在于:由于正确答案并没有直接使用文章中的话术来回答,不能直接从文中检索得到答案。必须从语义层面深入理解文章,才能准确回答问题。
解决方案
怎么让机器在庞大的题库文章中(28000个)找到正确的答案?
云从科技与上海交通大学首创了一种P、Q、与A之间的匹配机制,称为Dual Co-Matching Network(简称DCMN),并基于这种机制探索性的研究了P、Q、与A的各种组合下的匹配策略。
结果显示,采用PQ_A的匹配策略,即先将P与Q连接,然后与A匹配,策略都得到了更优的结果。
再将模型(基于PQ_A策略)与其他已知的模型、以及纯粹基于BERT自身的模型进行了比较,得到如下的结果:
从RACE leaderboard上结果比较可以得到以下结论:
·云从科技与上海交大的单体模型就已经超越榜单上所有的单体或Ensemble模型;
·云从科技与上海交大的Ensemble模型在高中题目(RACE-H)部分优于人类结果(Turkers)。
论文缘起
这篇论文的作者,来自中国人工智能“国家队”云从科技与上海交通大学。
云从科技孵化于中国科学院,2017年3月,承担国家“人工智能”基础项目——“人工智能基础资源公共服务平台”建设任务。
2018年10月的国家“人工智能基础资源与公共服务平台”发布会上,云从科技创始人周曦提出了人工智能发展五个阶段,核心技术闭环是五个阶段的重要基础。
从感知到认知决策的一系列技术组成了核心技术闭环:
1-感知技术:人脸识别、语音识别、文字识别OCR、体态识别、跨镜追踪(ReID)、车辆识别等
2-认知决策:自然语言处理(NLP)、脑科学、大数据分析(风控、精准营销)等

图片新闻
最新活动更多
-
泰科电子立即查看>> 创新的工业机器人解决方案
-
4月23日立即报名>> 【在线会议】研华嵌入式核心优势,以Edge AI驱动机器视觉升级
-
4月25日立即报名>> 【线下论坛】新唐科技2025新品发布会
-
4月30日立即参与 >> 【白皮书】研华机器视觉项目召集令
-
限时免费下载立即下载 >>> 2024“机器人+”行业应用创新发展蓝皮书
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
推荐专题
- 1 非夕科技亮相ITES:表面处理、装配测试、视觉伺服......自适应机器人带来智造新范式
- 2 大会嘉宾|哈尔滨工业大学(深圳)智能学部主任楼云江出席“OFweek 2025(第十四届)中国机器人产业大会”并发表演讲
- 3 重磅 | “维科杯·OFweek 2024中国机器人行业年度评选”入围名单揭晓!
- 4 齐聚鹏城,OFweek 2025(第十四届)中国机器人产业大会与您相约四月!
- 5 开年王炸!6亿订单砸向杭州具身智能大脑企业
- 6 精业锐志,极致创新!ITES深圳工业展助力制造业开年起步即冲刺!
- 7 蓝点触控闪耀2025深圳工业展力控技术赋能智能未来
- 8 iEi威强电IMBA-AM5荣获控制产品“新质奖”,精彩亮相中国自动化+数字化产业年会!
- 9 大咖齐聚,智启新篇 | OFweek 2025(第十四届)中国机器人产业大会圆满收官!
- 10 高光时刻!“维科杯?OFweek 2024 中国机器人行业年度评选” 获奖榜单发布
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论