分类大数据下的文章

列式存储简介

2019年06月24日 admin 875

业务背景关系表结构是被人们普遍接受的数据模型，通常一行数据由多个属性组成，每个属性是一列。但是磁盘是一维的，文件只能顺序写，那么先写谁后写谁呢？不同的写文件顺序就对应了不同的存储模型。传统数据库通常采用行式存储，即先存一行数据，再存下一行数据。在大数据时...

阅读全文 0 评论

Flume 是什么？

2019年06月24日 admin 1059

　Flume是一个分布式、可靠、和高可用的海量日志聚合的系统，支持在系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。收集、聚合事件流数据的分布式框架通常用于lo...

阅读全文 0 评论