使用HDFS冷热数据

以下的视频是易鲸捷专家关于HDFS冷热数据的介绍。

热数据是指,您希望快速访问的数据(主要用于报告)。冷数据是指,不常访问的数据(主要用于BI或分析)。可以设置一定的数据量(例如,最新的100GB数据)、特定的时间段(1天或1周)、特定的数据集,识别相应的热数据。

企业使用不同的平台,分别存储和管理热数据、冷数据。因此,数据需要从一个数据库迁移或复制到另一个数据库。不同用途的数据迁移(例如,报告和BI/分析)由于改变了schema,会造成报告延迟并需要进行维护。

而通过基础架构完善的HDFS,您可以将热数据和冷数据存储于同一个平台,避免了数据的复制和迁移。

EsgynDB构建于Hadoop之上,帮助您在最大程度上减少数据的迁移,同时存储热数据和冷数据。从而减少了服务器占用的空间、降低了许可和支持的成本,最主要的是您可以获得冷热数据结合的实时数据分析

近期,来自Esgyn的Rao Kakarlamudi和Hans Zeller就以上主题,在Milpitas Big Data会议上进行了分享。视频如下


[qwardo-cta][/qwardo-cta]