9.3.3 列存储

2025-06-16 12:42:57 更新


数据库

类型

数据存储方式

特点


传统关系型数据库

面向行

以行为单位

对少量行进行数据读取和更新


列存储数据库

面向列

以列为单位

对大量行少数列进行读取,

对所有行的指定列进行同时更新

1、具有高扩展性,即使数据增加也不会降低处理速度

2、作为批处理程序对大量数据进行更新


列存储数据库主要产品有Google的Bigtable、由Bigtable衍生的Hypertable和HBase、Cassandra。


数据库

说明

1

Bigtable

由Google建立,通过一些主键来组织海量数据,并实现高效的查询。利用 GFS作为其文件存储系统

2

Hypertable

基于Bigtable的开源实现,高性能、可伸缩,采用Bigtable相似模型

3

HBase

(Hadoop Database)

基于Bigtable的开源实现,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,支持在廉价PC Server上搭建起大规模结构化存储集群。

4

Cassandra

由Facebook开发,用于存储特别大的数据,是一套开源分布式数据库。结合了Dynamo键值与Bigtable面向列的特点,属于混合型数据库。主要特性是分布式、基于column的结构化、高扩展性。

主要特点:不是数据库,而是由一堆数据库节点共同构成的分布式网络服务。写操作被复制到其他节点;读操作被路由到某个节点。

扩展性能方便,只需在集群中添加节点。

特点:模式灵活、真正的扩展性、多数据中心识别、范围查询、列表数据结构、分布式写操作。

目的是满足大数据量、大量随机的读写操作应用场景下的数据存储需求,更是用于实时事务处理和提供交互型数据的应用。