侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

【聚焦】同样是做AI芯片 巨头走的路又有什么不同?

2017-02-15 10:33
安娜PARKER
关注

一、芯片行业的演进路线

芯片行业的整体发展始自上世纪60年代,一开始是指数型发展,所以有了每18个月集成度翻一番的摩尔定律,可以说当时的发展是非常快的。摩尔定律背后的逻辑是说,随着工艺制程的进化,同一款芯片的制造成本会更低,单位面积晶体管数量提升导致相同的芯片所需要的面积缩小;而如果工艺制程发展速度过慢,则意味着芯片制作成本居高不下,导致利润无法扩大。但是,如果孤注一掷把所有的资本都用来发展新制程,则风险太大,一旦研发失败公司就完蛋了。

摩尔发现当时市场上成功的半导体厂商的制程进化速度大约是每年半导体芯片上集成的晶体管数量翻倍,于是写了著名的论文告诉大家这个发展速度是成本与风险之间一个良好的折中,半导体业以后发展可以按照这个速度来。

可以说,摩尔定律背后的终极推动力其实是经济因素,它给市场带来的积极影响是,随着半导体工艺制程的进化,芯片的性能以指数级增长,从而带动了电子产品性能大跃进式发展,电子市场一片生机勃勃。在摩尔定律提出的前三十年,新工艺制程的研发并不困难,但随着晶体管越来越小,越来越接近宏观物理和量子物理的边界,高级工艺制程的研发越来越困难,研发成本也越来越高。如果工艺制程继续按照摩尔定律所说的以指数级的速度缩小特征尺寸,会遇到两个阻碍,一个是经济学阻碍,另一个是物理学阻碍。

经济学阻碍是,随着特征尺寸的缩小,芯片的成本上升很快。这个成本包括NRE成本(Non-Recurring Engineering,指芯片设计和掩膜制作成本,对于一块芯片而言这些成本是一次性的)和制造成本(即每块芯片制造的成本)。有人计算过,以现在的最新工艺,一块芯片的NRE要到1000万美元以上。如此高昂的NRE意味着需要非常非常高的芯片生产量才能去摊薄这个成本。换句话说,如果芯片的产量不到,那么你就没有能力去使用最新的工艺,只能沿用较旧的工艺。这就部分打破了摩尔定律 “投资发展制程-芯片生产成本降低-用部分利润继续投资发展制程”的逻辑。

而物理学的障碍主要来源于量子效应和光刻精度。晶体管太小就会碰到各种各样的问题,比如当特征尺寸缩小到10nm的时候,栅氧化层的厚度仅仅只有十个原子那么厚,这时便会产生诸多量子效应,导致晶体管的特性难以控制。

我认为,现在芯片行业的发展已经到了瓶颈期,接下来的发展策略有三种,分别是More Moore, More than Moore和Beyond Moore。第一种More Moore,意思是继续按照摩尔定律的老路走下去,继续缩小晶体管尺寸;第二种More than Moore,意思是首先芯片系统性能的提升不再单纯地靠晶体管的缩小,而是更多地靠电路设计以及系统算法优化。其次集成度的提高不一定要靠把更多模块放到同一块芯片上,而是可以靠封装技术来实现,例如Intel的EMIB,TSMC的InFO等等(苹果的处理器就用了InFO技术);第三种Beyond Moore,意思是干脆不用CMOS器件而是去研发一些新的器件,不过这个目前看起来还比较遥远。未来估计是会More Moore结合More than Moore,随着时间推移More than Moore比重越来越大。

其实我对未来还是蛮悲观的,这个瓶颈期如果没有新器件诞生的话,应该会持续5年10年甚至更长一段时间。就像钢铁行业,它早已进入平缓期,也没什么特别新的技术,如果这个行业想要有比较大的发展,那除非是发现新的材料可以替代钢。半导体行业也一样,什么时候出来新器件结束这个瓶颈期我也不知道,有的时候科学上的事情就是很偶然,可能突然就发现某种材料可以用了,但如果你找不到新材料,就是没办法有很大突破。

二、NV/Google/Intel/AMD在AI芯片的不同战略

其实人工智能计算还是分很多领域,芯片应用大概有两个极端:一个是用于云端服务器的高功耗高计算能力的芯片,走的是高性能超级计算机(HPC)的路子;另一个是用于终端(比如手机)的人工智能芯片,这个就特别注重低功耗,对计算能力的要求不是特别高。

在云端服务器这个领域,因为要处理海量的数据,Nvidia的GPU已经成为服务器不可或缺的一部分,但Nvidia自己目前还没有打算大规模自己做服务器,因此在人工智能的云端市场,Nvidia提供的是硬件而非平台。而在终端这个领域,Nvidia基于GPU的人工智能平台一方面功耗太大,另一方面过高的计算能力反而导致成本过高,因此无法与定制芯片抗衡。其实,Nvidia的人工智能平台最具优势的应用场景是上面两种情况的中间,即数据量中等、对计算能力要求还比较高、对功耗有一定要求但是并不苛刻的地方,比如ADAS市场。Nvidia人工智能平台无论计算能力(10-100TOPS)还是功耗(10-100W)都能完美地符合要求,因此它主打自动驾驶市场并不奇怪,它在2017年1月份举办的CES上也主要发布了自动驾驶相关的产品。

Intel的话,从三个方面来说吧。第一,在云端市场,它是最大的玩家,并且正在积极准备与Nvidia抗衡,因为Intel在HPC方面的业务本来就是驾轻就熟,而Nvidia进入HPC还没有几年,只能算这个市场的new player。大概是在2013年的时候,人们才发现原来GPU可以用于深度学习,之前根本不知道这个事情。说回Intel,它在收购Altera之后推出了基于FPGA的专用深度学习加速卡,可以在云端使用。另外Intel收购Nervana后正在积极推广结合其技术为AI优化的Knight Mill至强处理器,目标也是在云端。第二,在车载端,Intel与Mobileye和BMW结成了自动驾驶联盟,Mobileye提供传感器芯片和算法,Intel提供云端计算平台,BMW提供汽车。第三,在移动端,Intel收购了Movidius,但是尚未看到大的动作。所以我预期,移动端的人工智能芯片,如果有的话还是高通之类的厂商会比较有优势。

再说Google,它推出来的芯片TPU主要是自用的。这个有点像IBM,IBM最早出的Power PC系列芯片也是为了给自己的server用。所以Google也是类似的思路,它的芯片就没有打算给别人用,换句话说它没有真的打算进入芯片这个市场,和别人竞争。

最后说AMD,它在GPU和CPU的技术都处于追赶者的位置,在AI方面比较低调,在CES上公布新产品的时候也都没有主动去提人工智能的事情。最近的新闻大概是和阿里巴巴合作云端服务作为试水。AMD的总体思路还是求稳,不刻意去跟Nvidia争谁先谁后,它就等你们把这些东西先做出来再说,自己就很踏实地把显卡技术做好。其实GPU天生就符合深度学习的要求,只要AMD把自己芯片的运算能力做上去,它很快就可以杀入人工智能这个领域中来。

1  2  3  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号