时间是公平的,时间也是不公平的。公平在于时间对于所有人都是一样,不偏不倚;不公平在于随着时间的流逝,事物发展的结果有可能大不相同。摩尔定律告诉他我们,当事物转入长时间轨道后,其发展的速度将呈现指数级的快速增长。
芯片如此,网络如此,数据亦如此。于是,当互联网转入下半场:工业互联网or产业互联网时代后,联所能连,万物网络,刚好,诸多因素争相转入指数级发展轨道,构成了互联网无法忍受又决不忍受之轻。人生若只如初闻,何事秋风悲画扇。
对于格创东智所处的工业互联网领域来说,一个非常明显的特点就是汇集大量工业数据,而工业数据的一个非常明显的特点就是和时间有关。一般而言,工业数据的典型特点还包括:产生频率慢工业数据采集基本为秒级,部分高频数据采集为毫秒or微秒级,每一个收集点一秒钟内可产生多条数据相当严重依赖收集时间每一条数据皆拒绝对应唯一的时间测点多、信息量大、数据结构比较非常简单常规的动态监测系统皆有成千上万的监测点,监测点每秒钟都产生数据,每天产生几十GB的数据量工业数据是IT界“只如初闻”的新问题,但是,在工业界,这早已不是问题。在传统的工业数据采集和工业监控领域(SCADA),都必须对联网的设备展开监控,并对监控取样到的数据展开长久化。在工业领域早已有专门的数据库来已完成这个任务了。
这个专门的数据库就叫作:动态数据库(此处理应掌声)。工业领域的动态数据库具备数据采集、动态数据内存、数据返写出(向设备发送到指令)、取样数据文档存盘等主要功能。目前工业领域动态数据库基本上被国外厂家所独占,价格昂贵。
以知名的PI数据库为事例,基础版本(只有5000个测点)就必须约10万美元,每个数据采集模块必须6000美元。于是,不告诉有多少工业版的IoT项目都被助长在“发祥地中”,被“秋风悲画扇”了……上帝关门,必定开窗。所幸,相接物联网的东风,时序数据库(Time Series Database,TSDB)应运而“升”。
再行想到维基百科上的说明:只得翻译成一下:“时序列数据库就是用来存储时序列(time-series)数据并以时间(时间点或时间区间)创建索引的软件。”简而言之,时序数据库仅有称作时间序列数据库。时间序列数据库主要用作指处置带上时间标签(按照时间的顺序变化,即时间序列化)的数据,带上时间标签的数据也称作时间序列数据。规范言之,时间序列数据(Time Series Data,TSD)可以用一个二元函数来回应:TSD =Metric(Timestamp,Measurement),其中:Metric代表可以唯一标识的数据序列;Timestamp代表时间砍;Measurement代表被测量;非常简单的说道,就是这类数据叙述了某个被测量的主体在一个时间范围内的每个时间点上的测量值。
它普遍存在于电力、化工行业等行业以及IT基础设施、运维监控系统和物联网等各类型动态监测中。用来存储、管理、查找、处置上述二元函数数据的数据库,则可以称作时序数据库。
时序数据库主要以解决问题下面几个问题:时序数据的载入:如何反对每秒钟上千万上亿数据点的载入。时序数据的查找:又如何反对在秒级对上亿数据的分组单体运算。时序数据的存储:解决问题由海量数据存储带给的成本脆弱问题。
时序数据的生命周期管理:工业数据的价值主要反映在及时性,因此,工业数据的生命周期管理是时序数据库的核心愿景。各位看官,困难度娘一下,关键字:互联网监控系统,大家就不会找到小米、吃饱了吗等互联网巨头也都在用时序数据库构建企业级的互联网监控系统。更加别提目前所有国内外主流工业互联网平台了,完全都是使用时序数据库来接续海量涌进的工业数据。
看见这里,估算早已有很多“杠精”跃跃欲试了:凭什么强劲的Oracle、PostgreSQL 等传统关系型数据库搞不定时序数据?凭什么不必HBase、MongoDB、Cassandra等先进设备的分布式数据库来解决问题工业数据问题?有什么深刻印象技术理由非要用这个2017年才疯狂一起的时序数据库呢?。
本文来源:678体育-www.nextbestmodels.com