大咖分享|牛东晓:基于数据空间的分布式边云协同关键技术研究

数栖大会①号机    发布于:2021-08-26 浏览 210

在数据空间内,通过数据挖掘的方法,以深度智能学习为核心,解决多源异构庞大复杂的影响,以此来提高电力预测精度。

牛东晓 国际欧亚科学院院士,华北电力大学经济与管理学院院长,博士生导师,教育部长江学者特聘教授

国家正朝着数字经济逐步转型,所有人都期待着数字经济能够创造产生更多增量价值。在这样的背景下,我们设计并提出了企业数据空间的理论体系,从定义到内容、操作,再到流程实现,将来用于支撑我们企业的数字化的腾飞。

以电力预测为例,在电力工业里面,电力预测是一件大事情。以往数据缺失、精度不够的情况下,很难做到精准预测。但随着多源数据的引入,电力预测正在变得可控。

关于电力预测,数据的来源是多样性的,有气象的、有政策的,有经济的,有系统的,同时,数据的结构又是各不相同的,从过去的纯数字型的,到现在数字+文字+图像+视频、音频这些数据,如何将这些多源异构数据处理、建模,就需要我们仔细考虑了。

早在上世纪90年代初我就开始编程做这种数据,那时候我们用的数据库,但是数据库的问题在于过于死板,在非结构化数据的处理上效率极低,并且,数据管理能力也比较低端,尤其是不能处理一些全过程使用的数据。在这样的情况下,我们一步步转型,逐渐从数据库过渡到了数据仓库,发展到大数据,发展到我们现在的数据空间。

在数据空间内,通过数据挖掘的方法,以深度智能学习为核心,解决多源异构庞大复杂的影响,以此提高电力预测精度。 

同时这套方法也会可以延伸用到企业、政府中去的。我们发现每一个企业数字化转型的时候,都需要建立自己的企业数据空间,它比大数据、比数据湖更加科学、精确。

相比大数据,数据空间有完全不同的特征。首先,它是有边界的,是企业关心的数据,它不像大数据那么宽泛;其次,这个数据空间非常安全的,可以设立各类安全管理机制;最后,企业数据空间是面向对象的,在统一整理下,数据都是带有标签的,它提供了一种数据的规范,这种数据都是我企业所关心和需要的,是全生命周期的、安全的、可以管理的数据。当我把企业的数据空间建立起来后,就可以用这些数据支撑企业的经营,挖掘数据的价值,把它转化为真正的财富。

基于在电力预测领域的经验,我们构建了企业数据空间的架构,也叫九层架构。架构的底层就是数据来源层,包括企业的数据和你协作企业的数据。数据价值层就是制造服务商,然后数据输入层、数据集成层,通过数据介入,采集,文件采集,数据清洗和数据汇集,然后把它存储起来形成存储层。在储存层上,面对数据进行基础的处理。在我们数据空间里可以加一个数据管理层,包括这种搜索引擎和支持引擎等等,使得我调阅查询我企业相关的数据的时候变的更加的灵活方便、高效可以使用。

在此之上,是知识服务层,在知识服务层里,我们可以强调对数据进行一个判断,比如说我们营销人员面对客户的诉求,客户诉求里包括什么信息。再之后,就是数据分析层,包括分析各种要素模型、数据预警模型,还有它的物流的模型,库存的模型,质量的检测的模型等等,服务的模型都在这个层里面。在应用输出层,可以进行它的排序优化、利益分享、智能决策、情景判断,可以提升我们企业的价值。

基于数据空间,我们将分布式边云协同也可以应用进去。目前,在电力预测领域,我们已经开始做了,过去变电站是没有监控中心的,没有分析中心的,现在开始每个变电站要建设了,这样使得我们的网格化的这样一种精细化的数据管理,使得我们的各项工作的水平更高的提高了,更加精准。

*本文摘录自2021第三届数栖大会演讲内容

收藏此文章 点赞此文章

评论 (1)

  • 数栖大会①号机

    1楼

评论此篇文章

登录后可回复
/1000