数据库 | 类型 | 数据存储方式 | 特点 | |
传统关系型数据库 | 面向行 | 以行为单位 | 对少量行进行数据读取和更新 | |
列存储数据库 | 面向列 | 以列为单位 | 对大量行少数列进行读取, 对所有行的指定列进行同时更新 | 1、具有高扩展性,即使数据增加也不会降低处理速度 2、作为批处理程序对大量数据进行更新 |
列存储数据库主要产品有Google的Bigtable、由Bigtable衍生的Hypertable和HBase、Cassandra。
数据库 | 说明 | |
1 | Bigtable | 由Google建立,通过一些主键来组织海量数据,并实现高效的查询。利用 GFS作为其文件存储系统 |
2 | Hypertable | 基于Bigtable的开源实现,高性能、可伸缩,采用Bigtable相似模型 |
3 | HBase (Hadoop Database) | 基于Bigtable的开源实现,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,支持在廉价PC Server上搭建起大规模结构化存储集群。 |
4 | Cassandra | 由Facebook开发,用于存储特别大的数据,是一套开源分布式数据库。结合了Dynamo键值与Bigtable面向列的特点,属于混合型数据库。主要特性是分布式、基于column的结构化、高扩展性。 主要特点:不是数据库,而是由一堆数据库节点共同构成的分布式网络服务。写操作被复制到其他节点;读操作被路由到某个节点。 扩展性能方便,只需在集群中添加节点。 特点:模式灵活、真正的扩展性、多数据中心识别、范围查询、列表数据结构、分布式写操作。 目的是满足大数据量、大量随机的读写操作应用场景下的数据存储需求,更是用于实时事务处理和提供交互型数据的应用。 |