HBase 分布式数据库

  • 时间:
  • 浏览:10
  • 来源:决战梭哈棋牌APP下载_决战梭哈棋牌APP官网

菜鸟就会很懵逼,事务?增全部查是事务吗?

哪些是事务,我其实就是清楚,但我其实分布式非要替换集中存储,主要原困性能,在血块数据规模下集中存储提供更高的性能。50万条数据取舍 Mysql,1亿左右取舍 Oracle,10亿条数据用大数据。

COLUMN CELL

course:math timestamp=1534492935043, value=97

grade: timestamp=1534492881763, value=5

HBase就是基于BigTable思想,由开源社区发布的实现,除了CURD之外,还有就是特点:

至于高可靠,加各种HA吧。

在5、6年前,大伙儿就希望能用分布式存储和分布式数据库来替代集中存储,其实分布式廉价,就是高可靠。

03年(作者上大二),谷歌发表了三篇论文:Google FS、MapReduce、BigTable。其实Google如此 宣布这有有另1个产品的源码,就是你发布了这有有另1个产品的全部设计论文,奠定了风靡全球的大数据算法的基础!

作者接触HBase时间不长,无法估量在企业中流行程度,但已深感你这一系统的强大。本文是作者某些感悟,和HBase的入门shell和Api,希望作为入门参考。

列:course:math====值:90

列:grade:====值:3

启动命令

Table scores is ENABLED

scores

COLUMN FAMILIES DESCRIPTION

{NAME => 'course', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false',

KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER',

COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '

65536', REPLICATION_SCOPE => '0'}

{NAME => 'grade', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', K

EEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', C

OMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '6

5536', REPLICATION_SCOPE => '0'}

hbase(main):011:0> delete 'scores', 'Tom', 'course:math'

0 row(s) in 0.0640 seconds

hbase(main):012:0> get 'scores', 'Tom', 'grade', 'course'

COLUMN CELL

grade: timestamp=1534492881763, value=6

1 row(s) in 0.0210 seconds

随着版本迭代,安装步骤原困变化,参照https://hbase.apache.org/book.html#getting_started。

和MySql一样,先用shell完成某些操作。

我从来没见过大伙儿单位的主库系统,无论是小机原困EMC。原困何时能 在值班时,收到通知主库挂了,我会其实是有有另1个深藏在机房沉重铁门里的大伙儿伙,冒了几缕青烟,紧接着监控上各种Web小图标就都红了....

其实,分布式存储非要替代集中存储。原困你问有有另1个老鸟,他会你可以有有另1个关键字--事务。传统的集中存储有很强大的事务支持能力,而分布式系统不支持事务。

就是以前,HBase被当做HDFS系统的管理系统,将文件作为内容直接存储在HBase中,实现海量文件的索引、查找。