国科微杨应麟:论应用于AI上的低延迟NVMe系统

原标题:国科微杨应麟:论应用于AI上的低延迟NVMe系统

7月20-21日,2018全球存储半导体大会暨全球闪存技术峰会(简称“GSS大会”)在武汉光谷拉开帷幕,大会以“构建闪存新生态”为主题,针对全球闪存和存储半导体的产业新生态、行业新热点、企业新发展,进行全面分析与解读。国科微美国研究所总经理杨应麟发表了题为《应用于AI上的低延迟NVMe系统》的主题演讲。

以下为演讲实录:

杨应麟:各位嘉宾,我是杨应麟,美国国科微美国研究所的总经理。

今天我给大家演讲的内容与AI有关,在我之前的演讲嘉宾谈到了不同的应用场景以及分类,我们也发现了它还有一些不同寻常的应用场景,包括股市或者癌症治疗的一些非常态情况的捕捉,除此之外,还有现在可以和人类下棋的阿尔法狗机器人等等。基于以上不同的分类,我们可以识别出迎面而来的公交车或其他车辆,以及看到人行道是否处于可通行状况,绿灯是否亮了,以上这些都是人工智能的具体应用

比如,在这里我们看到一名行人正准备过马路,但是我们又可以看到方向不同,那么我们到底是转向左边还是右边呢?这个是瞬间做出的决定,它停下然后马上又跑起来,这就是AI避免公交事故的一个办法

所以我们必须有这样一个系统,将不同的数据进行积累,包括来自传感器和摄象头的数据,这些数据来了之后,我们必须进行一些处理,如噪声的过滤,或者是数据格式的处理,数据的安全性压缩,另外还有机器学习等等。

我们还会有不同的候选模型进行选择,然后才知道哪个是最好的学习模型范本,看左边也就是数据处理的部分,在网上或者是一些商场会储存这些数据,借助模型版本进行机器学习,然后把他们归纳起来应用,所以这里有很多的数据。另外还有波音公司的无人驾驶,每小时会有80TB的数据产生,所以我觉得这一切归根结底都涉及到机器学习,所以我会把这个部分移除。

从数据中心的需求来看,需要很大的功能。我们所做的是虚拟学习,如何使这两个部分能够联系起来呢?数据和学习,所以我们在中间填补了一些虚拟化。我们有一个这样的虚拟化储存器,把它们连接起来,会有很多数据在中间来来回回转移,在这个部分让数据在储存器中转移,包括前面我们提到的一个图片,数据会在这里被放大或缩小,这就是我们的人工智能学习的一个算法。

那么,我们现在谈到这些技术有哪些优势呢?在这张片子里,我们看到固态硬盘的一个学习部分。正如之前我们提到的无人驾驶的汽车一样,我们可以去管理和处理这些数据,而且这样的一个机器学习的过程应该是有一个层级的,最重要的是找到合适的算法,使我们能够通过这个算法建立起这样的一个级别。另外还有深度学习的一些算法,大概可能会有50个层级用到这里面,我们必须要找到一个最好的算法去使用。因此,这部分是一个有序的模型,有级别的、层级的模型,这些不同的节点都是非常重要的。

还有一个虚拟化机器的数据中心,通过它来处理有什么好处?基本上会减少处理量,这是一个关键点。每年我们会发现和诊断400万例这样的例子,所以如果通过这样的方法帮助我们去了解这些全球被诊断的新增癌症病例,包括去进行数据的分析,还考虑到这些病患是否有足够的经济来源,去服药,去确保在它最终死亡之前能够找到解决办法。

下面我想谈一下我们的企业,今天早上我也听到有些学生会受到邀请来到这里参加大会,这是一个很好的学习机会。我们的公司在台北和硅谷设有研发中心,在成都、北京、上海、深圳等地也有我们的分子公司等。去年国科微在深交所上市,我们的员工有近600人,绝大多数在美国从事研发的工作人员都有博士学位。我们的业务范围包括四个方面,监控、广播电视、存储,还有物联网。可以说我们的工作涉及到整个市场的不同细分部分,包括企业和专业SSD的市场和消费者市场。在控制器方面,我们获得了中国信息安全测评中心、国家密码管理局等多项认证。

下面回到技术方面的介绍,刚才谈到了存储,下面我们看一看数据是如何处理的。在这里我们可以看到一些数字,假设这些人都在使用智能电话,这意味着每一个人都会产生大量数据。基本上未来的数据收集会来自于很多的方面,包括前面提到的自动驾驶数据等等,我们生活的方方面面都会产生大量的数据。

在这种情况下,我感兴趣的是,当我们在街上行走的时候,有人喜欢自拍,而自拍也会产生大量的数据,而且大部分人会用到美颜功能,这些应用都会产生大量的数据。

另外,我想介绍的是我们的低延时存储的系统。早上听到了很多这样的技术,如何使用?我们先来看看关于存储方面的要求,包括深度学习的算法,我们有2600万个这样的参数,放在网络中进行深入学习,如果把这些汇总起来,可以得到这样一个图片。

如果使用一个这样的监控摄像机,进行一些检测,例如我们在天安门地区范围内,放置十个典型的集线器摄象头,它的性能大家非常清楚,存储的数据量级是海量的,所以在这个方面我们要去补充一些对储存的需求。如果我们想知道一张被拍摄的图片中发生了什么,需要把这个复杂问题简化,希望从这里获得一些数据,包括前面嘉宾谈到控制器,一些制造商已经可以提供这种低延时的产品,所以在技术方面都有很多优势。

一个非常有意思的图片,AI训练了机器狗喝水,但机器狗却喝了马桶里面的水,我觉得十分有趣,这是AI待完善的点。最后,我总结一下,第一点,神经网络使用了大量的数据和内存。第二点,大量数据移动代价很高,我们可以让处理更接近存储;第三点,DRAM很昂贵,减少缓存延迟变得越来越关键。

(注:文字已通过演讲人确认)返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
免费获取
今日搜狐热点
今日推荐