中国AI创业想打败NVIDIA,有机会吗?

2021-04-21 23:54:26 来源:互联网

我觉得2018年会是各种芯片产品& lsquo百家争鸣。一年。计算机体系结构领域的著名教授大卫·帕特森说。

果然,新年伊始,芯片领域就出现了重磅消息。约翰·汉尼斯成为Alphabet董事长后,谷歌宣布全面开放TPU云。然后ARM发布延龄草项目,亚马逊被曝正在开发Echo专用AI芯片。

算法成熟后自然会寻求转化计算能力。就在两三年前,芯片领域的风险融资& lsquo仍然像一场噩梦。:一家初创公司为什么要与英特尔竞争?随着深度神经网络的普及,风险投资(VC)基金已经回归半导体领域。

腾讯发布的中美人工智能行业发展综合解读显示,美国有33家公司,中国有14家左右(实际数字可能更多)。虽然比不上世界上3000多家AI公司的数量(国内1000多家),但对于半导体领域来说还是很神奇的。

在过去的10到15年间,任何细分领域都从未出现过这样的情况:15家以上的半导体公司同时出现。一位连续创业者感叹道。

2017年,投资于芯片初创公司的风险资本超过15亿美元,几乎是两年前投资额的两倍。其中,沈剑科技获得数千万美元(A轮),4000万美元(A轮+,能人获得1000多万美元(A轮),ThinkForce宣布完成融资4.5亿元(A轮)。寒武纪和Horizon的融资规模都达到了1亿多美元,但是2017年只有三家AI芯片初创公司达到了这个融资规模:脑波(2018年初)、Graphcore和Wave Computing。

中国人工智能创业者与资本融合良好,资本愿意投资有潜力的公司。李开复说。

一些活跃的芯片公司投资者通常活跃在AI领域(比如红杉资本),甚至是以AI为未来战略重点的大公司。投资了顶级算法公司商汤和鄙视阿里巴巴,2017年投资了寒武纪、沈剑科技、能三家AI芯片公司。在此之前(2016年),公司还投资了杭州中天威和赤脚网络。

资本的热情背后,离不开国家资金对芯片行业的大力支持。对于中国企业来说,这是一个难得的赶超机会。长尾和AI、物联网等分散的新兴市场,为中国芯片创业公司带来重要的进入机会。近十年来,中国芯片行业环境的巨大变化也降低了初创企业制造芯片的门槛。

其中,沈剑科技是最早进入这一领域的创业公司之一。以下是魏尧(沈剑科技CEO)的采访记录(机器可以编辑,不改变内容):

要优化整体内部结构,可以做到这个业务成本最低,效果最好,最后可能还得自己做芯片。

大卫·帕特森和约翰·汉尼斯是《计算机体系结构:定量研究方法》的作者,也是计算机体系结构领域的著名教授。最近,约翰·汉尼斯接替施米特成为Alphabet的董事长。在你看来,这给芯片行业发出了怎样的信号?

我认为这是一个相当大的优势。

符合整体发展逻辑。谷歌这么大的公司,只能靠搜索来拓展业务。我觉得很难。因此,我们必须优化内部结构,开拓一些新市场。在人工智能领域,有很多合作,所以谷歌必须做TPU才能做好它的人工智能服务。否则因为大家都用GPU,成本高,性能功耗都有瓶颈,差异化无法避免。所以公司才请了超级大牛。

这和AI的整体逻辑是一样的。只有优化整体内部结构,这项业务才能达到最低的成本和最好的效果。最后,你可能要自己做芯片了。

对创业公司会有什么影响?

对创业公司的影响分为两个层面。

在业务层面,我觉得影响不大。不同的创业公司做的东西差别很大,业务方向也没有太大的冲突。甚至还有一些优点。许多公司可能没有这么长的时间来等待他们内部的TPU出来与谷歌TPU竞争。你在云上做的第一件事可能就是FPGA。其实谷歌是从上千个FPGA开始的,经过大量的FPGA变成了芯片。

另一方面,如果我们真的越来越重视硬件层面,那么在投资环境方面,我们会越来越重视这个领域,这肯定是一些间接的好处。

如何评价欣顿最近提出的扶贫网框架?这会是一个变革性的成就吗?

从学术角度来说,是有可能的。但是从工业的角度来说,我觉得还是挺难的。

自从爆发以来,深度学习用了很多年才让大家适应。即使顶点网超越深度学习,也需要几年时间才能完全普及到行业。另外,我觉得深度学习之所以传播的这么快,是因为在很多实际场景中,它完全超越了过去所有传统的机器学习,在很多问题上0和1是有区别的。但是如果一个问题,比如人脸识别,现在能做到八个九,再有一个算法能做到九个九,大家都会觉得意义不大。

所以从产业的角度来说,如果这个时候再有变化,推广速度可能会比原来稍微慢一点。如果是颠覆性技术的话,需要好几年才能在整个行业盛行。

如何看待目前这个领域的泡沫现象?

整体有很多气泡。但是,只要是创业板块,无论哪个行业都会有类似的情况。

比如自行车共享出来,全国会有几十家公司做自行车共享;还有千团。创业圈,不管哪个细分,总会这样:只要一件事有前景,就会有很多人陆续进来。只是到了现在,转到科技创业后,我们发现对这件事的理解并不像当初对团购、自行车共享、出租车商业模式的理解那么简单,需要一种新的方式去理解,但本质上并没有什么不同,我们都希望从中分一杯羹。

当大家说个不停的时候,还是需要分析这个行业最关键的竞争因素是什么。

在芯片领域,设计门槛确实越来越低,深度学习处理器芯片的设计复杂度可能只有CPU芯片的1/10。但芯片本身可能不是核心竞争因素,竞争必须是系统级的事情。

2018年对AI芯片行业意味着什么?

我认为这是关键的一年,有必要核实一下你是否有真实的材料。这是整个人工智能行业特别关键的一年。

2018年之前,人们仍然可以凭借团队背景、学术能力等一些薄弱的东西获得资本,吸引人才加入,进一步前进。从2018年开始,每个人都必须有实际的产品和订单,以及实际的销售额。

所以这个行业的马太效应会越来越明显。如果技术没那么强,那就没办法更进一步了。在商业竞争中,产品卖不出去,甚至因为公司能力不够,产品做不出来,所以一批公司获得融资的难度会越来越大。

如果今年有新的创业公司想进入市场做芯片,还有机会吗?

我觉得快没了。

从2015年到2016年,这个时间窗口已经过去了。2017年后成立的公司几乎没有机会。

谷歌从2014年甚至更早开始做TPU。2012年我们开始做TPU,2015年做寒武纪和地平线。没有人能逃脱芯片硬件几年的开发周期。如果我们试图变得勇敢并急于大规模生产芯片,那么短暂的R&D周期将使我们很难设计出具有良好性能或多功能性的架构。这样一来,芯片的能效比可能比我们的FPGA差十倍。

未来十年,芯片行业所有环节都将聚焦计算能力匹配算法,软件算法定义硬件?

一定是这样。

原来通用芯片因为摩尔定律可以一直扩展,所以每个人都要不断地写原程序。反正性能两年翻一倍,成本就下来了。

现在摩尔定律已经不可持续了,为了获得更高的性能和更低的功耗,只能做得越来越特别。随着越来越专业化,涉及算法和应用场景,需要了解应用和场景。这个时候很多东西都是算法软件给的。

所以我觉得这绝对是一个很大的趋势。其实从2014年开始,就有人一直在提这个趋势。比如百度在2014年开始提出一个概念叫软件定义加速器,Xilinx也有类似的口号。未来系统必须决定芯片,所以像CPU这样的架构很难什么都做。

说到AI芯片解决方案,一般提到FPGA和ASIC,大厂商走的是不同的路线。科技选择芯片解决方案的逻辑是什么?

我们也在做自己的处理器芯片,也是即将推出的专用芯片。其实我们做的是一套东西。我一直强调,我们一直在做的是深度学习处理器,有指令集,而不是在一个芯片或者FPGA上写一些算法。我们从2012年就开始这样做,一直走在这条路上。

当然,我们的普遍性仅限于深度学习的推论。这是我们的核心东西之一,不管是ASIC还是FPGA,核心架构都是深度学习处理器。

这是首先需要澄清的。

为什么要用FPGA?因为对于创业公司来说,有几个特殊的困难。

第一,要做处理器级芯片,无论量产周期如何,核心架构至少需要3到4年。但是只有芯片制造过程,量产,要走一年半到两年,创业公司耽误不起这个时间。

第二,芯片研发一次性投入很高。例如,如果我们制造一个28纳米的芯片,R&D的一次性投资可能超过400万美元,不包括人力成本和后续的大规模生产成本。如果算个人的话,钱至少要翻倍。然而,一个公司不能只保留工资和做这件事的钱。这笔钱肯定只是公司总预算的一小部分,还有很多其他地方可以花钱。

第三,整个行业面临着一个特别大的挑战:如何定义芯片?

芯片的原始定义,比如X86 CPU,告诉你是X86指令集,任何算法都可以运行。这个定义比较明确。蓝牙芯片和wifi芯片类似。芯片的功能和协议是固定的,所以我们可以优化芯片。

但是对于AI芯片,如何定义AI呢?大AI一部分是机器学习,一部分是深度学习,深度学习有各种网,卷积,大小。深度学习分为训练和推理,在不同的场景下,人们不仅仅是在运行神经网络,因为深度学习比神经网络的概念更大。所以很难明确定义芯片应该做什么功能,能支持哪个Net,通用性有多大。

FPGA可以解决这些问题。

一方面FPGA芯片已经在这里(Xilinx已经做了),芯片的研发已经结束,不需要经过一年半到两年的量产周期。把开发出来的新产品结构烧成FPGA后,产品就可以直接上市了,上市时间极快,可能只需要三个月。

另一方面,如果你买Xilinx或者Altera的FPGAs,你可以买多少就买多少。不需要一开始就投入400万以上,所以不存在一次性投入过高的问题。

第三,芯片无法定义这个问题,不如解决。FPGA是可重构的。重新烧结每一代的处理器架构,只要向上兼容。上一代架构写的程序也可以在新一代架构上运行,向上兼容。

但是FPGA确实有两个痛点,这也是我们自己做芯片的原因。

有一个问题,一直存在:在量大的情况下,成本高。如果有几十万芯片的订单,芯片成本会比FPGA低。虽然一次性R&D投资成本极高,但后续成本很低:只要需要几十万的平板,成本可能分摊到10块钱以内,然后卖了就能赚钱。

另外,处理器芯片在FPGA上实现时,其性能和功耗通常比直接制作芯片差十倍左右。因为FPGA必须考虑到可以擦除和烧录各种芯片,所以在很多地方不是最优的。

比如一个芯片可以运行在1GHz,1.2GHz甚至1.5GHz,在FPGA上可能只能运行在200MHz或者300MHz。FPGA不能把功耗优化的特别低,因为有很多一般的事情要考虑。

对于AI来说,核心竞争力不是芯片真正的性价比,核心要素是软件环境。.....用芯片和完整的支持软件做一个真正有竞争力的产品真的很难。

沈剑科技非常重视安全领域,在中国安装了大量的摄像头,大约十亿台。用AI的市场有多大?好像只有1%,不到2%?

现在AI普及率低,硬件是主要原因。

大家都在用GPU,但是会有几个问题。一个问题是GPU只能用在服务器上。

比如我们公司也有几百个GPU,用来训练算法,做压缩。当我们自己管理服务器的时候,北京很多IDC机房又尝试了一次。他们都说我的电源可以很稳定,空可以很好的冷调制。后来发现或多或少都有问题,因为GPU不稳定,经常需要重启服务器。

所以你现在要用GPU,一定要建一个条件特别好的机房。但是,一个小派出所,或者一个超市,或者小区都没有这个条件。另外,警察不能接受一个经常丢视频的产品。

所以目前的智能安防还是局限于一些大规模的智慧城市项目,只有这样的项目才有预算去建一个机房,购买服务器。

第二,GPU很贵。如果所有AI都去云,带宽成本和存储成本都很贵,成本太高,视频的每一个通道可能都在几千到几万的数量级。

中国每年大约有2亿个安全监控芯片出货。只有少数预算最高的智慧城市项目才能承受这么高的成本,这也是AI普及率很低的原因。所有新技术的应用都必须从能够承受高成本的地方开始。

沈剑科技正在做的实际上是将每条路线的成本降低到几百元和一百美元的水平。我们产品的稳定性比GPU好很多,GPU是低功耗解决方案,发热少,整体稳定性好。以前因为硬件而无法覆盖的市场,现在可以覆盖了。该公司这一块的订单量增长很快。

我们正在做这样一件事:在新的市场中,让它的渗透率变得更高。

想做安全领域的芯片有不同类型的竞争对手,比如深入行业多年的大公司,创业公司(比如算法公司、硬件芯片公司),传统芯片公司。你更喜欢什么样的竞争对手?

我只喜欢Hikvision。其他公司在某种程度上有一些缺陷。

首先,算法公司会遇到的问题是,芯片的难度和周期可能超出大家的想象。R&D周期加上大规模生产周期至少是两到三年。先把算法做好,然后直接把算法写在一个芯片上。即使是这种最简单的方法,也需要两年多的时间。我想,这可能是一件意想不到的事情。

这两年左右,一定要不断的砸钱,看不到什么水花。这是一个大考验。虽然肯定可以做到,但是芯片出来之后,上面的算法可能是一两年前的,算法的优势就消失了。片上算法落后于目前研究领域最好的新算法,准确率肯定会略低,所以算法公司会面临这样的竞争。

第二个问题是没有办法更新算法。如果算法需要更换,需要制作新的芯片。其实这也是一场赌博:算法在很长一段时间内不会被替代,然后就可以产生大量的芯片。另外,用户也觉得低成本更重要。

其实FPGA的价格不一定很贵,要看场景和公司的设计能力。如果公司把FPGA开发好,成本可能只有其他公司的三分之一,但能达到的性能是一样的。Xilinx之所以深究,是因为同样的芯片,我们至少可以发挥出比别人强三倍的纯硬件能力。FPGA最本质的芯片架构设计是核心。它是一个载体和一个乐高积木,用来拼那个DPU芯片。归根结底还是看芯片设计能力。

至于传统的芯片制造商,他们可能会觉得很难理解这件事。比如一个很重要的问题,如何定义一个芯片,如何让你的芯片具有竞争力。

AI芯片的玩法和传统半导体行业有很大不同。有一种可能的玩法,就是别人有芯片,我就做一个类似的,然后用性价比高的方式占领这个市场。所有人都认为芯片可以在两年内重新制造出来。如果这个芯片不成功,再推一个,只要能成功打开市场。

但对于AI来说,核心竞争力不是芯片真正的性价比,核心要素是软件环境。

单从芯片性价比来看,GPU未必有优势,但以上软件生态环境特别不同。小白可以非常简单地使用各种图书馆和工具。你可以在网上找到很多支持来开发一个新的研究项目。在行业的竞争壁垒导致大家都习惯了这个软件之后,如果别人的芯片不是完全颠覆性的东西,就很难取代你。

这是传统半导体公司需要意识到的事情,包括我每次和Movidius CEO Remi聊天,总会谈到软件。这个行业的游戏性可能会颠覆他们曾经的游戏性。

另一个朋友纳文可能也遇到过类似的问题。英特尔在2016年收购了Nervana。据说2016年底会生产出一款AI芯片,17年年初说会推出一款芯片,结果却推迟到17年年底。有了这个芯片和完整的配套软件,真的很难做出一个真正有竞争力的产品。

至于Hikvision,它最大的优点是场景要求明确,知道自己想要什么芯片。

经过多年的行业深度培养,海康知道算法可以达到什么程度,用户可以接受。未来几年,这些用户将能够接受向他们添加什么功能。他能明确定义芯片想要什么,不想要什么。这是算法公司和其他想切入这个行业的公司无法掌握的。

此外,他们还有强大的渠道,可以保证大量芯片售出,稀释成本,赚大钱。这是我比较喜欢的,也是传统的做ASIC的方式。

现在看马斯克打开芯片,我觉得符合正常逻辑。他打算做自动驾驶。现在用GPU,但是GPU很贵;一年能卖出几十万辆车,做芯片能稀释成本;他也知道这些自动驾驶功能,知道自己想要什么,不想要什么。

总之,必须满足两个条件,一是需求明确,二是真的有非常大的量。这两点都满足了,开芯片就没有逻辑问题了。

对于算法公司来说,要想在这样的场景中生存下来,或者说最终取得胜利,我认为只有一条路可走:成为一家行业公司。这就是我看到这些公司现在在做的事情。每个行业公司都知道这个系统是什么样子的。它不仅仅是一个芯片,而是一个非常复杂的系统。

比如考虑芯片,整个软件环境,网络录像机,服务器,视频管理软件等。,这是一个非常复杂的整体系统。在这个系统中,AI是核心竞争要素,但除此之外,99%的工作量是传统的。如果你真的想赚钱,想好好生活,那就一定要成为一个行业公司。

谁能打败NVIDIA?可能是十几家像沈剑科技这样的公司在不同的垂直领域打败了英伟达。

有人认为对于AI芯片创业公司来说,卖ip是一个很好的模式。如果你制造芯片,你就是在爬山。你怎么想呢?

我觉得这个模式很难。IP很难赚大钱。在所有的IP公司中,第一名是ARM,世界第二?不知道有没有单纯依靠IP业务,十几亿美元的公司。像Cadence这样的EDA巨头,单看IP的话,可能就是上亿美元的公司。

知识产权是一个竞争门槛和壁垒相对单一的行业。为了做IP,必须把接口定义清楚。一旦明确定义了接口,人们就可以根据这个接口来替换你,除非别人没有而你有。现在虽然你的深度学习IP可以很强,但是DSP也可以,卖的很便宜。很大程度上是纯业务,纯销售。

所以IP一直是一个很难做的生意,属于行业上游最多,肉最少的地方。只有ARM能得到肉,因为它有全球生态。现在,这些AI公司没有时间布局全球生态。ARM可能需要几十年才能达到目前的规模,因为这是一个更好的时机,竞争对手也更少。当然,他们的技术能力真的很强,可以一扫包括Atom在内的竞争对手。

所以,走IP模式的创业公司应该问自己两个问题。第一,横扫全球所有竞争对手的能力,是直接的面对面的竞争。二是时机合适吗?我觉得有一点点机会的时间是2014年,未来的可能性很低。在这样一个被狼包围的环境下,一个创业公司很难最终成长为ARM。

我觉得用IP核统一江湖很难,在AI芯片领域几乎不可能。

其实我还是回到一个问题:谁能打败ARM?

我曾经和很多人讨论过一个问题,包括大卫·帕特森和其他人。他们觉得没人能打败ARM,也没人能和英伟达直接竞争。

能打败ARM是什么概念?使用RISC-V的公司可能有100家(RISC-V是近几年推出的开源处理器架构,都是开源的,很多人都在用它开发CPU,能效比真的不错)。当时大家都在讨论,是100家使用RISC-V的公司才能在每一个垂直领域打败ARM,然后他们才能最终打败ARM。

现在英业达也是这样。其软件环境优秀,技术积累深厚。正面击败英伟达?我觉得几乎不可能。谁能打败NVIDIA?可能是十几家像沈剑科技这样的公司在不同的垂直领域打败了英伟达。

比如摄像头芯片的功耗不能超过3瓦,因为NVIDIA的最低功耗是10瓦,所以把NVIDIA扫地出门。作为服务器端的一个推论,一个很重要的指标就是延迟,英伟达会因此被打垮。在自主驾驶领域,如果英伟达不能克服功耗和成本的问题,可能会因此再次被撞出局。但是,它肯定会有一部分市场,不能因为它的软件生态在那里就完全被扫地出门。

所以,没有哪家公司可以用一个框架直接推翻英伟达。

ARM这个时候会怎么玩?

ARM有可能主导IP。如果ARM做一个好的深度学习IP,免费和它的CPU一起卖,那这方面做IP业务的公司可能都死了。

在考虑行业的时候,重要的是考虑短期内是否可以削减。除了短期收益,还要看这个市场长期的规模。

最近去世的定位大师杰克& middot鳟鱼说,要么定位,要么死。你能分享一下沈剑科技在寻找自己的利基市场方面的经验或教训吗?

比如刚开始的时候(2016年),我们做了一些机器人和无人机的生意。当时我分析这个行业,发现了一些好的地方。

稳定产品特别困难,降低成本也非常困难。但是我们发现,机器人和无人机行业对成本并没有那么敏感,因为产品的单价至少在几千元到几万元之间。至于稳定性,跑几十分钟就要换电池了,不需要特别稳定。这些对新技术的实践相当友好。

但是做了之后,我们发现这个市场很难做。例如,有100万架无人驾驶飞行器,因此,其中70多万架来自DJI,其他公司很少。如果你和每个人合作,你就不能把他们做大。

所以在考虑行业的时候,我觉得考虑短期内能不能切入是很重要的。除了短期收益,还要看这个市场长期的规模。

不同的行业和公司对采用创业产品可能会有不同的看法。大公司特别注重供应的稳定性。一旦供货,大公司通常会要求对方保证供货至少连续五年。比如Xilinx推出某个FPGA芯片,就承诺芯片到2025年量产。他一定要说同样的话,让大家继续用他的产品。

最重要的是汽车行业。车厂特别注意:对方必须稳定供应车厂几年,车厂与一级和汽车电子供应商有几十年的合作,这是信任的问题。

但是对于创业公司来说,(行业和公司的态度)真的是一件很大的事情。选择安全领域也是考虑到这是一个特别长尾的市场,市场上的中小公司不会那么在意采用创业公司的产品。

对于中国来说,AI芯片真的是弯道超车的机会吗?

我觉得这是一个变道超车的机会。

对每个人来说,这将是一个非常大的新挑战,一个战略和结构上的挑战。

以前我们都是互相追逐的。不管是CPU、GPU还是FPGA,都是中国走的老路,追上去很费劲。硬件不会开源,也看不懂开源代码,只能自己踩坑,很难赶上。

然而,有一个成功的传统例子,BOE。大家突然发现,他在领导世界。为什么?因为他直接投钱布局了几年后就要量产的下一代技术,比如柔性显示器。在世界上做柔性显示器的时候,他已经在下一代技术上领先了。

有点像AI。虽然我们整个人才积累和产业基础还是比国外薄,但是从视野来看,这件事确实领先于国外。比如2012年我们做研究的时候,全世界很少有人重视这件事。即使到了2016年,世界上也没有人会看重它。2015年底和2016年底,没有人真正开始创业。

我们做的比别人早,一直在投资,所以我觉得有可能超越。我觉得弯道超车和变道是完全不同的思路,但我觉得芯片行业在AI上可能确实会超过国外。

有投资者曾经说过,在中国创业投资,一定要做长尾市场。你怎么想呢?

在我看来,创业公司的进入一定是基于长尾市场。

这其实是品牌对抗。淘宝刚成立的时候,吸引了那些晚上有空余时间想开店赚点外快的人。大品牌不会在淘宝开店。人够了,一些小品牌开始在上面开店,淘宝变成天猫,越来越多的大品牌开始出现在淘宝平台上。

所以创业公司早期是没有品牌的,顶多靠一些投资人的消息和一些代言来形成一个好的品牌,但是这个品牌和海康这样的品牌完全不一样。所以一开始直接服务最大的公司是很难的,即使宣传上说有一些服务,其实直接从他们那里拿钱是很难的。

所以一定要从小的开始,然后逐渐打大的。然而,我们必须有一颗尽力而为的心。

延伸 · 阅读