一、HBase简介

1、HBase定义

    Apache HBase™是以hdfs为数据存储的,一种分布式、可扩展的NoSQL数据库。

HBase官网

Welcome to Apache HBase™
Apache HBase™ is the Hadoop database, a distributed, scalable, big data store.

Use Apache HBase™ when you need random, realtime read/write access to your Big Data. 
This project's goal is the hosting of very large tables -- billions of rows X millions 
of columns -- atop clusters of commodity hardware. Apache HBase is an open-source,
 distributed, versioned, non-relational database modeled after Google's Bigtable: 
A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable 
leverages the distributed data storage provided by the Google File System, Apache 
HBase provides Bigtable-like capabilities on top of Hadoop and HDFS.

    billions of rows X millions of columns:数十亿行X数百万列

2、HBase数据模型

    HBase 的设计理念依据Google的BigTable论文,论文中对于数据模型的首句介绍。 Bigtable 是一个稀疏的、分布式的、持久的多维排序map。

    之后对于映射的解释如下:
该映射由行键、列键和时间戳索引;映射中的每个值都是一个未解释的字节数组。
    最终HBase关于数据模型和BigTable的对应关系如下:
HBase使用与Bigtable非常相似的数据模型。用户将数据行存储在带标签的表中。数据行具有可排序的键和任意数量的列。该表存储稀疏,因此如果用户喜欢,同一表中的行可以具有疯狂变化的列。
    最终理解HBase数据模型的关键在于稀疏、分布式、多维、排序的映射。其中映射map
指代非关系型数据库的key-Value结构。

Hadoop分布式文件系统(一)

请记住,你当下的结果,由过去决定;你现在的努力,在未来见效;
不断学习才能不断提高!磨炼,不断磨炼自己的技能!学习伴随我们终生!
生如蝼蚁,当立鸿鹄之志,命比纸薄,应有不屈之心。
乾坤未定,你我皆是黑马,若乾坤已定,谁敢说我不能逆转乾坤?
努力吧,机会永远是留给那些有准备的人,否则,机会来了,没有实力,只能眼睁睁地看着机会溜走。

03-10 07:31