中科院金融科技中心首席科学家刘世平博士飓风生态发布会演讲实录

原标题:中科院金融科技中心首席科学家刘世平博士飓风生态发布会演讲实录

当下风头正劲的三种企业技术,无疑是人工智能,区块链和物联网,它们背后的驱动因素都是数据,有人甚至宣称数据就是新的石油。新数据能够使数据的收集共享分析以及基于这些数据的决策自动化并成为可能。与此同时,在大数据时代下,其数据的存储低效及数据安全性差似乎成为另一个新的问题。

为此,借助2019全球分布式存储创新发展高峰论坛暨飓风生态发布会,飓风生态特别邀请了中科院金融科技中心首席科学家刘世平博士来到现场,就“大数据时代数据的存储与安全”主题发表了自己的看法。

以下是刘世平博士演讲实录:

首先,感谢飓风生态的热情邀请,这是一个生机勃勃的峰会啊!我开一句玩笑:如果说北京是个政治中心,上海是对法律法规遵循的比较好的地方,但是真正的创新的高地应该是在深圳。所以,我本人非常高兴来到深圳跟大家一起交流一下大数据和数据存储的问题。

众所周知,我们已经完全进入了一个新的信息化落地的时代,那它的代表的技术都有哪些,其实我们大家都很清楚,就是大家嘴边常说的大数据、云计算,区块链,人工智能等等。大家想一下这个技术的发展的过程中相对来讲,人工智能现在是应该是最火的。

那么,人工智能距今有多少年的历史了?到现在已经快七十年,也就是一九五六年开始到今天的二零一九年,从一九五六年那么反过来看。再看一下这两年很火的大数据,大数据真正的元年应该一九八七年,距今已经有三十二年的历史。那么物联网有几十年的历史,而我们的互联网已经有大概半个多世纪的都超过半个世纪了。那么区块链呢,我们需要什么东西?我们需要它的保密,需要它的完整性。那么我们知道我们在这个银心也好,在飓风生态也罢,我们都有这个上市的计划。而我一直是在上海证券交易所帮它们在处理很多事情。

那么上海证券交易所对于上市公司的数据的要求是什么?上海证券交易所对于上市公司的数据要求是什么?是三个要求。我们叫做数据资产里面有三个很重要的,一个是及时性,另外是准确性完整性。

一个企业监管机构要监管一个东西,它一定要数据,要及时准确和完整,它才能做分析,才能做研究,才能做决策。那么在过程中对于数据的安全使用者对数据的收集者,对数据的管理者都非常的重要。所以数据的安全,所以数据的保密性,数据的完整性和可用性也是从另外一个不同的角度来谈数据本身的重要性。

那么数据呢怎么去保护它?怎么去让它比较达到安全技术呢?首先从一个国家来讲,首先要制定的战略。全世界各个国家都要制定一个战略。另外一个很重要的问题在战略的基础上把数据资源要能够狠抓数据的标准。标准非常重要,那么这个数据战略的基础上直接的数据的标准之后。第三点就是立法,目前我们国家还是刚刚启动,立法最早的目前是上海。上海市在三年前启动了数据的使用安全制定,其中有六个专家,我是其中一个,那么其他五个专家都是这个学法律的,唯一我是搞IT的。现在全世界比较有名的就是欧盟的。那么私密安全数据,如何有效的收集存储传输,如何使用?这消费者问题这很重要但很多时候我们会被忽略的。你如果在美国呆久的话,美国人的征信管理系统里面,比方说有不良的记录过了十年它就销毁它。那么区块有哪些方面的一些优势。

今天是我们飓风生态的主场,它这里面一个分布式存储,而且是透明的分布式的这样一个组合。在这个国际气氛下讲的整个区块链诞生,它的本身的源泉也就是它的透明性,不可篡改性和时间戳。除了这些,还有在某种意义上都对数据的安全起了一个很大保障责任。那么在在我国和目前各种角度来讲,它是任何一个国家不论是从数字资产也好,区块链也好,都是一个经济数据未来的数据存储战略,西方国家的这个推动的速度很快。

下面区块链这个基本的概念我就不详细地说,因为在今天这个峰会上,我们所有人准备从不同角度和从完整的系统性的简单的讲一下分布式记账和数据。

什么叫做数据?其实这个东西是争议很大,我们早年所谓的数据就是阿拉伯数字到现在企业的财务的账务人员的统一的数据结构,我们衍生到了什么叫做文本,因为这个Text。我们一起发个邮件,或者它是已经标准的统计数据。

那么,在未来将在我们飓风做的图像与图形的处理,这些东西都是数据。数据的关键问题,那么刚才黎江教授和吴主席也介绍过数据的真正的价值是数据的本身。它真正的价值体现在应用,你怎么样的能把数据里潜在的价值能够发挥和发掘出来?

所以我对大数据的以前的总结,就是有四步,第一步,是把分散在各个不同地方的数据进行有效的整合。第二步,把数据里边的信息提炼出来,依托于各种不同的方法或不同的算法。比方说,我们平常用的,我们用的多维分析,我们用的数据挖掘,我们的查询和调阅,这是四种。我把它回答的方法把信息提炼出来,第三个很重要的问题在任何一个地方,也就是后面讲我们飓风生态未来的发展,或者很重要的一点是一定得有行业知识和行业的应用场景,这个一点非常重要。即便你有了数据和信息,但是不了解这个行业,你同样无法用。

我经常和别人举一个很简单例子,我会问他如果这个企业今年的毛利率是百分之二十,你说这个企业是好的还是坏的?因为你不知道它处在哪一个行业,不知道它处在哪一个时间段,所以你无法给出正确的判断。

这个是很重要,所以这就是第四点,即行业知识,把所有的数据挖掘来的信息运用到你的决策过程中。所以对于数据资产、数据支持来讲的话,这四个不同的方面数据信息行业的知识用到你的决策的过程中,这样才可以发挥巨大的价值。那么这里面就包括了存储收集整理就是我们第一个环节,像我们现在要做的这个分布式存储就是其中很关键一个环节,我认为讲区块链的时候,这四个特点是我认为最明显的。

第一个是它的透明性,因为它是通过互联网,通过区块链数据存储的透明性、不可篡改的开放性和去中心化。那么这个去中心化和开放性,就让区块链让产生了巨大的价值,这个价值就是竞争的。

那有人会问,这个价值在哪里来产生呢?其实,它是一种共识机制,而这个区块链价值来说,它不是事物的本身的价值,它是一种共识机制所带来的价值,而这个价值的往往就是我们大家看一下区块链的价值大概是一万多美金(这里是以比特币为衡量)。是不是因为只是区块链这个价值这么多钱呢?不是。它更多的价值是取决于人民对它的共识的一个认证。

我们知道,人民币真正的价值也是共识,因为我们都认可这个国家资源的后面的一个背书。比如,我拿了一张百元大钞,我能够出去买东西。这也是一种共识经济或者共识机制的问题,这是未来非常重要的一个环境。所以,这个安全方面取决于你数据本身的不同的层次。

那么数据其中的一块是什么?它是一个可开发的数据。我们有很多的数据可开发,半公开的,还有保密的数据,以及最后一块社区验证可互动的数据,这个就是我们区块链可验证的完全的层面。那这个里面数据,其实什么叫大数据,什么叫小数据,这个跟数据的量没关系。

我给它的定义是,当你的数据能回答你的问题,我对你关心的问题,数据能够进行一个准确明确的描述,能对你的角色起到了帮助和作用,它就是大数据的概念,这是一个很重要的东西。

所以,今天所讲这个数据,我们一定要注意在数据的存储,除了互联网的数据在我们国家比较有用,有价值的数据大部分在政府手上,这是我们国家的特色。我们国家大概有80%的数据还都在政府的手上,数据的共享是最困难的一件事情。我目前在全国做了很多的数据共享的事情。

目前为止,我这两年到处去讲的一个案例就是浙江省的余姚市,我们把46个局的数据,它只有46个局的数据全部收集整理完整,数据共享,这个是目前全中国唯一的一个案例。它不是技术的问题,因为共识共享不是技术的问题,主要是共识共享主要理念和愿不愿意跟共享的问题。但是,只有把数据进行了共享,才是解决问题的方法。

我们老百姓经常讲盲人摸象的一个问题,这是什么概念,因为你只是看到一部分。我们国家的数据是什么,目前就是叫做蜂窝煤的现象,为什么?因为公安部的数据一插到底,交通部的数据一插到底,银行的数据一插到底,但是它们之间并不共享,所以我把它比喻成蜂窝煤,这是目前大的情况。因为各个城市也都在推动这样的一个过程,

尤其是广东省,网络、数据,现在推动叫数字广东的计划,也在做一个比较大的数据。那从这个过程来讲的话,安全的涵盖是数据的收集、数据的存储。

我们现在的飓风生态就是做一个分布式存储,就是说存了以后怎么样的去共享。一个是怎么把数据存进去?怎么快速的有效把它提炼出来?这个事情是非常重要的,这里面的数据仓库,里面有各种各样的模型,数据共享,还有一个就是数据销毁的问题,综上所述就是比较关键的问题。

同时,数字签名是未来在中国一个很重要的市场,现在来说这是最显著的一个应用。为什么呢?因为我们的这个认证和签名的过程中,是一个很大的过程。另外我在说一下加密,以及各种各样的算法。算法是很重要的一个,怎么样的及提升和改进算法,我倒是很希望如果我们飓风生态在这方面能够有所突破,我觉得在未来会有很大的市场。我们中国目前在这个加密领域里面,我认为比较落后。我们在应用方面我们一直非常好的,但是我们在技术研究方面我们有一定的距离。那么飓风生态干了这件事儿,我觉得非常的棒,就是从存储的角度,从根本上去解决这样一个问题。我觉得这是这是非常值得去投入,值得一起去推动的一件事。

安全和密钥各方面的东西,我就不花太多的时间去讲了。所以关键的问题是在什么地方,就是我刚才讲的所有的东西都在一个应用,如果没有应用所有的东西,你就很难带来社会的价值。如果你没有基础的研究,你就不会走得太远。

最后,我再讲解一些东西。一个是数据带我们的机遇,越来越集中,它面临的风险越大。大家都知道去年的时候,Facebook出现了很多的5000万人的这个信息披露,那么这样的话,以前分散的时候,这些东西要怎么样处理,这是我们一定要去考虑。

这些大量的数据就是给我们提供这样的机遇。我的意思就是说,你要跟人工智能的数据挖掘的算法进行一个有效的结合,我们提前的预估和预判未来我们的风险点在什么地方。那么这样进行一个精准的防范和精准数据的保护,这样就让我们的数据会更安全,让我们存储更加的有效,我们提取更加的精确。我们使用有效的数据也会更加安全。今天我就讲到这里,谢谢大家。返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免费获取
今日搜狐热点
今日推荐