探境推全球首款通用型语音AI芯片,2美元已量产,图像芯片年底见

原标题:探境推全球首款通用型语音AI芯片,2美元已量产,图像芯片年底见

芯潮(ID:aichip001)文 | 心缘

9月19日消息,今天,国内AI芯片创企探境科技推出语音主打产品——高能效低功耗语音AI芯片音旋风611,是全球首款通用型语音AI芯片。该芯片已量产、可供货,2019年底,大家将在卖场看到搭载探境芯片的智能家电。

音旋风611基于探境独创的存储优先架构,采用创新音频阵列算法,支持200条唤醒词,命令词识别率高达97%,可远场识别10米识别范围,具有毫安级待机功耗,常用接口齐全且外部电路简单,而售价不到2美金。

此外,探境科技还透露了支持本地自然语言处理的高端芯片音旋风621和图像芯片性能,图像芯片PPA为全球最高,已经流片,今年年底发布。

据介绍,探境科技仅用2年实现芯片量产出货,是最快量产、最快实现商业化落地的AI芯片公司。探境科技创始人兼CEO鲁勇表示,未来探境期望与合作伙伴携手,成为物联网界Wintel,比肩世界巨头。

▲探境科技创始人兼CEO鲁勇

作为有着20年芯片打造经验的行业老兵,鲁勇也在现场分享了自己对芯片产业的一些观察。

鲁勇说,其他人造AI芯片如造车,算法像在田间泥泞小路,不管车多好,还是会受坑坑洼洼的路的限制,探境的技术差异点在于,不仅造车,还修高速公路,这样无论什么车都能跑很快。

期间,鲁勇还同中芯聚源研究总监樊锋、一流科技创始人兼CEO袁进辉,就AI芯片核心竞争力、AI芯片商业化落地的关键要素、应用公司下沉做芯片等问题进行深入探讨。

一、高识别低功耗语音芯片,已量产、可供货

成立于2017年的探境科技,是国内AI芯片新生力量之一,聚焦在语音芯片、安防芯片和边缘计算。去年,探境科技完成上亿元A轮融资。

据鲁勇介绍,探境拥有世界级研发团队,具备全链条研发能力,从前端、后端、Foundry到运营均由自己完成,在语音和视觉领域提供全栈式解决方案。

探境科技仅用2年实现芯片量产出货,是最快量产、最快实现大规模商业化落地的AI芯片公司。

其核心技术为存储优先架构(Storage First Architecture,SFA),也是全球首款通用型计算架构。该架构以存储驱动计算,数据在存储间搬移过程之中即完成计算,通过Scheduler控制层完成整个数据算子的调动。

其Scheduler为自主研发的一款RISC-V微处理器,可完成数据调度管理过程,从而高效执行复杂算法,控制运行期的动态数据流,并且配合专有硬件电路,解决data shuffle等难题。

探境创始人兼CEO鲁勇曾在GTIC 2019 AI芯片创新峰会上系统探讨这一创新架构的技术原理及优势。

简而言之,其SFA架构对语音、机器视觉、自动驾驶等各种终端应用场景都很适用,能将数据访问量降低10-100倍,进而将存储子系统功耗降低10倍以上;在28nm条件下,系统能效比超过4 TOPS/W,计算资源利用率超过80%,DDR带宽占有率降低5倍,并在当前主流集成电路工艺下可商用。

同时,SFA可做到通用型AI芯片,支持所有已知神经网络,等同于GPU,对数据类型也没有任何限制,还能自适应支持稀疏数据处理,并配以易上手的工具链。

探境将首款旗舰产品定位于端侧语音芯片。依托SFA架构,探境的端侧语音芯片有三大特点:识别高、功耗低、性价比超高。

其语音主打产品音旋风611,据探境科技研发副总裁李同治介绍,这是综合性能最好的离线语音识别方案,已量产、可供货,在市场上非常受欢迎,已经应用于空气净化器、垃圾桶、咖啡机、抽油烟机、智能空调、窗帘、晾衣架、血压计、蓝牙灯等很多智能家居产品。2019年底,大家将在卖场看到搭载探境芯片的智能家电。

李同治表示,90%的所谓AI语音芯片都是DSP/MCU芯片,不是真正的AI芯片。

传统DSP芯片存在先天算力不足,只能采用相对简单的算法,语音识别效果差,成本高;而基于SFA架构的AI芯片提高了芯片内部性能,支持更先进算法,识别效果更好,成本也更低。

从架构上看,DSP是为传统信号处理算法设计的通用型处理器,不是为神经网络相关的运算而设计,与专门的AI芯片相比,DSP芯片算力上有数量级上的差异。另外,DSP多是采取哈佛结构存算分离,受数据带宽的限制其算力有效利用率较低,支持的词条数目及最终的准确率方面都会受到限制。

音旋风611支持高达200条命令词,唤醒率超过99%,识别率不低于97%,响应时间小于0.2秒。而一般语音AI芯片在离线状态一般支持20条左右的命令词。

探境的架构团队和算法团队紧密耦合,打造自主专利技术NPU,基于自研SFA架构带来超高能效比,具备高效的本地推理能力,支持DNN/TDNN、CNN、LSTM等各种网络,内置高速存储,无需外挂,可节省空间和成本。

同时,探境还研发了在独特音频前端的创新AI麦克风阵列处理算法。该算法完全数据驱动,场景限制少,还能自适应麦克风特性,最终探境的算法使用2麦的效果可以超过传统麦克风阵列算法4麦的效果,在0-10米远场识别范围没有明显差异。

还有一个自研算法是AI降噪算法,结合传统降噪的性能,适应性能更好,而传统降噪只能适应稳态的噪声。

基于百度云测试,其信噪比低于0dB时,降噪后单次识别正确率提升20%以上。

上图是探境音旋风611已出货的完整产品,外围电路简单,BOM成本极低。

音旋风611供货方式有芯片和模块两种,芯片产品最大程度满足对体积要求严格的应用,模块产品则可帮助客户缩短产品上市时间。

另外其内部集成ADC/DAC,单芯片实现完整的语音识别功能,外围电路简单。

探境的高端芯片音旋风621将比音旋风611更加智能,支持8麦麦克风阵列和远场识别,并支持本地自然语言理解(NLP)和局域范围内各智能家居间内联网,避免隐私信息泄露。

探境的音旋风621主要面向高端应用,其低端产品311系列应用则主要针对蓝牙耳机等对功耗要求极苛刻的场景。

二、图像芯片剧透,PPA全球最高

随后,探境对其基于SFA架构的图像芯片功能也做了剧透。

其图像芯片已流片成功,具有超高能效比,PPA为全球最高;模型低比特量化无重巡,支持接近无损的量化技术;支持任意神经网络参数,对TensorFlow、Caffe等神经网络框架支持一键导入,无隔阂感。

另外,其芯片采用28nm工艺,能效比超越一些友商在12nm工艺的性能,由于12nm流片成本至少是28nm一倍以上,探境的图像芯片能带来超高性价比。据悉,其核心能效比在全球范围内也是顶尖的。

三、20年行业老兵的芯片产业观察

探境科技创始人兼CEO鲁勇是在半导体行业摸爬滚打20年的行业老兵,曾在通信和存储解决方案Marvell同时管理中美两地的研发团队。Marvell一度是全球排名前五的半导体公司,和高通、AMD等巨头实力旗鼓相当。

回顾过往20年,有两个产品最令鲁勇骄傲。

一是HDMI芯片,每台电视机、机顶盒都在用这一芯片;二是硬盘控制芯片,这个芯片控制整个芯片数据传输。两款芯片给鲁勇带来了巨大的成就感,影响他对芯片产品的理念,希望AI终端芯片能发挥实际作用、给人们带来真实价值。

中兴事件后,更多人意识到中国芯片正被“卡脖子”。去年,芯片进口额超3000亿美元,超过石油进口。近两年,国家出台更多相关政策,资本涌入,芯片热度变高,大大小小的AI芯片企业超过100家。

那么,现在是否已经到了造芯的黄金年代?全民造芯是否是真的好的方式?

鲁勇表示,芯片是一个高投入、大周期、人才密集型的行业,对人素质要求高。有点类似于老中医,越老越值钱,同时技术不断迭代,需要“活到老,学到老”。

芯片设计笼统来说包括从架构设计、代码实现到芯片封装、测试有十余个环节,越靠前的环节越要靠脑袋来解决问题。

芯片研发生产周期长,不能像做软件,打补丁就能修复。如果研发的思路一开始就有问题,那无形中浪费了很多时间。

鲁勇幽默地说,做芯片的工程师都有一个习惯,流片后去求神拜佛烧烧香,如果芯片回来后一次就能点亮,就像中六合彩一样兴奋。

为了保证优异设计,设计方法学非常重要, 可以有效降低错误机制。同时,芯片架构决定芯片的本质,架构设计是一门艺术,好的架构依赖优秀芯片人才。

鲁勇认为,市场上之所以涌现大量DSP芯片,是由于AI芯片行业市场浮躁及人才匮乏所致。“芯片行业的准入门槛非常高,硕士毕业是芯片行业培养初级人才基本要求,多年来的低薪环境又造成了芯片从业人员人才流失,许多人转行去了互联网、房地产等行业。”

从图中可见,芯片设计的人才结构比例呈金字塔结构,依赖经验的后端设计人才比例较大,而前中端人才比例偏小。

鲁勇说,即便是在大公司,掌握核心架构设计的人才仍然很少。当年Marvell在通信传输接口方面非常领先,但一个核心架构师离职后,必须在外采购IP,他在Marvell任职的8年期间,也没能看到Marvell重回巅峰。

没有人才造不出好芯片。很多公司做国际芯片进口替代,生存环境非常艰难,就是因为没法造出好芯片。

芯片行业马太效应明显,做不到行业前几名,基本没有生存空间。资金是必要条件,但砸不出成功,全民造芯并不可取,低端制造进口替代前途黯淡,会加剧缺人才窘境。

AI芯片泡沫很大,鲁勇认为,许多AI芯片企业缺少核心技术,做的是低端AI芯片,商业化落地差。未来大部分AI芯片公司将倒下。

AI芯片落地难,价格高、不同神经网络性能差异大、部署需重新训练、实际运行效率低、工具链复杂、用电续航时间短等因素亟待解决。

一个成功的芯片公司,产品和销售比例为7:3,产品为王,要满足客户需求并有独特竞争力,背后就是核心技术。

鲁勇表示,探境科技希望依托国际化研发班底,做有国际竞争力的芯片公司,同时培养国内芯片人才,为带动中国芯片水平的提高贡献绵薄之力。

AI芯片面临的核心难点存储墙难题,数据无法高效传输给计算单元。

对于AI芯片设计来说,计算并不重要,本质上AI计算的核心问题是如何打破数据供给瓶颈,更高效地将数据输送给计算单位。

鲁勇介绍说,市场上现有方案,DSP/GPU+软件方案比CPU运行速度快,但离最优化的效果差很远;卷集或矩阵计算的类CPU架构在做计算单元优化,没对存储墙做改善;存算一体结构主要在改造存储器本身,是非常底层的技术,商业化路径长,其问题是打破了芯片成本结构,成本阻碍会很高。

探境打造的存储优先架构和世界上任何一种芯片架构不同,以存储驱动计算。鲁勇打了个比方,其他人造AI芯片如造车,造的好就如保时捷法拉利,算法像在田间泥泞小路,不管车多好,还是会受坑坑洼洼的路的限制,而探境不仅造车,还修高速公路,这样无论什么车都能跑很快,这是真正的技术差异所在。

四、AI芯片商业化成功的关键要素

随后,鲁勇同中芯聚源研究总监樊锋、一流科技创始人兼CEO袁进辉,就AI芯片落地等问题进行深入探讨。

▲从左到右依次为一流科技创始人兼CEO袁进辉、中芯聚源技术分析师樊锋、探境科技创始人兼CEO鲁勇

1、AI芯片公司的核心竞争力

谈及AI芯片公司的核心竞争力,中芯聚源研究总监樊锋认为,最核心竞争力在于AI的能力和芯片的能力,包括AI算法、芯片系统架构设计、半导体设计能力、质量控制能力等,而商业化能力则是检验这些能力是否强的最后一道关口。

鲁勇非常认同这一观点,芯片公司要成功,其产品就要大卖、走量,关键是要找到场景。这意味着要做到两点:第一,有市场洞察力,快速切入场景;第二,建立护城河,带来更高性能、更低成本的独特价值。

鲁勇说,芯片从生产到商业化的几个关键节点,分别是能否流片、芯片回来、是否量产、什么时候供货。

2、提ASIC路线是掉入名词的陷阱

AI芯片的不同路线一直是热议话题,大家常言性能最高的一定是ASIC路线,当时的想法是这个芯片没有办法做到那么通用,而是专门支持AI算法的,所以用了ASIC这个名词。

鲁勇认为,现在还是这么提,其实是掉入了一个名词的陷阱里。实际上,现在99%的AI芯片都是按照CPU或者GPU的操作思路,希望通过软件载入的方式来运行不同的神经网络,而不是类似其他通信类ASIC那样只能完成单一功能。

例如,只完成以太网或者WiFi这样一个功能,而是基于一个基础计算架构,能够通过软件的载入来完成不同算法的计算功能。与GPU相比,只是更侧重于AI算法的优化。

3、AI芯片商业化成功的要素

那么,如何才能实现AI芯片商业化成功呢?

鲁勇表示,要考虑AI芯片的功能是否符合市场需要。很多芯片没能大规模使用,是卡在性能、价格等产品本身的问题上。与传统芯片相比,AI芯片公司若想成功,还要考虑软硬件一体化的协调配合,考虑算法和芯片融合成功。

樊锋补充说,一是定义要很准确,二是产品做好,三是注意推广方法。

4、如何看待芯片、应用公司相互渗透

近些年,很多芯片公司开始往上走做应用,也有越来越多的应用公司往下走做芯片。

对于这一现象,樊锋认为,做应用的巨头公司做芯片是一种商业行为,他个人对这一模式的有效性存疑。

因为造芯需要专业团队,建立团队本身存在困难,做出芯片的量是否足以与公司本身需求的量匹配也很难。另一种情况则可以理解,那就是这家公司商业应用已经非常成功,找不到合适的芯片,需要去探索,但这类公司非常少见。

而芯片企业往上走,更好的方向是把芯片做好,初期阶段所做的应用是方便客户推广,而非与客户竞争,这种方式更为稳妥。

鲁勇补充说,任何事情事在人为,路径不同,取决于执行层面、外界环境,取决于当想去达到目标时是否能达到,没有固定的成功模式。现在国内环境下,资金政策都不缺,缺人,高端人才不够很难成功。这件事情没有定论,关键看如何执行。

结语:AI芯片进入拼落地阶段

存储墙难题已成为当今AI芯片产学界热议的话题,国内外半导体巨头和芯片创企都在尝试通过压缩神经网络大小、增加计算资源、近存内计算、存算一体等不同方式来突破这一瓶颈。

尤其在AIoT芯片领域,出于成本、算法变化快等因素考量,很多创企选择围绕具体需求打造专用AI芯片,像探境这样用创新架构打造通用型AI芯片的企业并不在多数。

自2018年起,AI芯片行业整体投融资金额骤减。中芯聚源研究总监樊锋表示,这一方面是受宏观经济及整体行业运行周期影响,另一方面,AI芯片行业自身也已到了行业洗牌期。

对资本而言,AI芯片已经到了看产品核心技术及商业化落地能力的时期了。最终,市场将会大浪淘沙,去粗取精。返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免费获取
今日搜狐热点
今日推荐