当AI出现问题时,我们竟无能无力?
“对我们来说,每颗芯片都是如此独特,我们只处理几百个系统,所以输入数据量很小,”ArterisIP首席技术官说。“这个东西是一个黑盒子。如何处理以前从未处理过的事情,特别是涉及偏见和道德的问题。需要更多的训练数据。”
对于AI/DL/ML,即使是对bug的定义,也是不同的。
因为算法性能在一个领域中得到了发展,而它又不是确定性的,所以bug的定义也会改变。有时候,可能无法从这类算法中分离出一个作为bug的特定输出,因为它是基于算法中捕获的进化概率分布。
但我们可以通过预先设定算法可接受行为的明确边界条件,来避免这种情况。然而,理解这些边界条件并不简单,一则算法本身处于不断优化的状态,再则是这些算法被广泛用于各种应用中。
了解未知的
调试AI/ML/DL的一个起点是描述你所做的和不理解的。
这在机器学习中比在深度学习中简单,这两者都适合在AI的保护伞下,因为算法本身更简单。深度学习是一种基于多层矩阵的数据表示,其中每一层使用上一层的输出作为输入。机器学习则使用为特定任务开发的算法。
在一个生产环境中,我们要知道哪里出了问题。可以了解机器学习算法来自于哪个模型,并对不同的算法进行大量比较,但不同产品之间可能会有所不同。可能在产品A上,随机森林效果不错;而在产品B上,另一个算法或某种组合效果更好。但是,如果没有大量的数据,或者有很多独立变量在改变的时候,机器学习可能就没什么作用了。
而这正是当下研究的重点。
人工智能系统观察一只狗,将它识别为小狗或某种类型的狗。机器能识别五到六个特征,但这些特征是否正确?是否存在过分强调一个特征?这一切都将回归到人们对机器的擅长程度上。
人们很容易理解导致这一决定的一系列事件,但决策过程并非如此。
一位Arm研究员说:“这或许是人工智能,就是把一些数据输入到系统中,然后弹出一个答案。它不一定解释得出这个答案的精确推理,输入数据的属性,强烈地影响了这个答案是这样出来的。如果我们给AI程序或机器学习算法提供了更多的决策控制,对于各种各样的环境也是有帮助的。”
训练数据偏差在这方面也起着关键作用。
这对医疗数据来说是一巨大挑战,因为在某些领域,专家们在如何给某些东西贴上标签的问题上存在分歧,因此不得不开发在标签中容忍噪音的算法。我们从算法的角度知道它在做什么,我们发现它告诉我们看起来有用的东西。但与此同时,我们也向自己证明,不管输入设置中出现任何偏差,都会影响输出结果。这是一个关于智力的例子,或只是一个推理滥用的例子,亦或是我们还不知道的事情?
什么可行,什么不可行?
一旦错误被识别出来,处理它们的实际过程也不清楚。
解决这个问题的方法之一,是从传统方面着手,比如支持系统和优化内存带宽。但没人知道这些系统实际上是如何运作的。如何配置黑盒?这可能是需要机器学习来调试机器学习的情况,需要一名主管来训练这些系统,并确定什么是好的,什么是坏的。
训练数据的微小变化也会蔓延开来。用于培训一台机器的数据可以由另一台机器生成,后者可能实现不同的算法,或者它可能是实现相同算法的不同实例。例如,两台机器(两台机器都实现一种玩围棋的算法)可能会互相玩,这样每台机器就会产生数据供给另一台机器用来训练。调试原理与上述相同,因为每个机器的行为分别根据可接受行为的边界条件进行验证。
另一种方法是使AI/DL/ML的应用范围足够小,这样就可以在内部不断优化。从TensorFlow算法开始,很快会发现它们是不够的,所以要转用随机森林。今天我们做分析,还能够改变方法灵活适应。但是如何才能在一个已经是虚构的深度学习中做到这一点呢?
迄今为止取得的进展
更令人困惑的是,所有这些系统都是基于训练算法,几乎处于不断变化的状态。当它们用于现实世界的应用程序时,问题就会显现出来。在此基础上对训练数据进行修正,并对推理系统进行分析和测试,以了解这些变化是如何影响行为的。
西门子商业公司Mentor产品营销经理表示:为了生成一组好的测试数据,我想做很多不同的事情。我提出一套特定的刺激装置,并且在我的模拟农场里一天内做了1000次测试,却总得到同样的结果。因为我将得到同样的结果,所以它必须做一些不同的事情。这实际上是一些方法的应用,这些方法与我们所说的形式化技术非常相似,但这并不是纯粹意义上的形式化验证,就像我们考虑属性检查和基于断言的验证一样。就形式数学而言,它是正式的。
领先的公司已经为此努力了一段时间。我们还没有看到任何商业上的东西,但你可以想象贝尔实验室的客户类型。有一些客户早就站在了这项技术的前沿——为自己开发,不一定是用于商业目的。
未来之路
多年来,人工编写算法由大学和研究机构开发和测试,调试人工智能一直被搁置一旁。在过去一年里,一切都变了。机器学习、深度学习和人工智能无处不在,这项技术甚至在去年还在测试的系统中得到了更广泛的应用。
这种情况必须迅速改变。其中一些应用背后的想法是,人工智能可以用于培训其他系统,并提高制造业的质量和可靠性,但只有在培训数据本身没有缺陷的情况下,这种方法才有效。但也是在这一点上,没有人可以很确定。

图片新闻
最新活动更多
-
泰科电子立即查看>> 创新的工业机器人解决方案
-
4月23日立即报名>> 【在线会议】研华嵌入式核心优势,以Edge AI驱动机器视觉升级
-
4月25日立即报名>> 【线下论坛】新唐科技2025新品发布会
-
4月30日立即参与 >> 【白皮书】研华机器视觉项目召集令
-
限时免费下载立即下载 >>> 2024“机器人+”行业应用创新发展蓝皮书
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
推荐专题
- 1 非夕科技亮相ITES:表面处理、装配测试、视觉伺服......自适应机器人带来智造新范式
- 2 大会嘉宾|哈尔滨工业大学(深圳)智能学部主任楼云江出席“OFweek 2025(第十四届)中国机器人产业大会”并发表演讲
- 3 重磅 | “维科杯·OFweek 2024中国机器人行业年度评选”入围名单揭晓!
- 4 齐聚鹏城,OFweek 2025(第十四届)中国机器人产业大会与您相约四月!
- 5 开年王炸!6亿订单砸向杭州具身智能大脑企业
- 6 精业锐志,极致创新!ITES深圳工业展助力制造业开年起步即冲刺!
- 7 蓝点触控闪耀2025深圳工业展力控技术赋能智能未来
- 8 iEi威强电IMBA-AM5荣获控制产品“新质奖”,精彩亮相中国自动化+数字化产业年会!
- 9 高光时刻!“维科杯?OFweek 2024 中国机器人行业年度评选” 获奖榜单发布
- 10 大咖齐聚,智启新篇 | OFweek 2025(第十四届)中国机器人产业大会圆满收官!
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论