小小千想和您聊一聊

当前位置: 首页> 视频教程> 2019最新快速玩转Hbase

2019最新快速玩转Hbase高级

   评分9.4

50节课

17528人已学

下载本章视频你能学到什么?

熟悉HBase详细的架构原理及特点、HBase内部各个角色的详细介绍、安装配置、HBase的Shell操作、新旧版本的读写数据详细流程、HBase的API操作等等。

千锋大数据官方①群(857910996)——猛戳进入


课程介绍

HBase是一个基于HDFS的分布式、面向列的开源数据库,是一个结构化数据的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。是每一个大数据都应该掌握的基本框架。

章节目录

第1章 day1 25 封装模板类
01 HBase是什么 26 Namespace的CRUD
02 HBase的作用 27 Table的创建
03 HBase的表结构 28 查询表中所有列簇
04 HBase的内部结构原理 29 修改表
05 HBase各个节点之间的关联 30 删除表中的列簇
06 HBase各个节点之间的映射关系 31 删除表
第2章 day2 32 进一步重构工具类
07 HBase的单机节点安装前准备 33 添加记录
08 HBase的单机节点安装 34 获取行键指定的列簇信息
09 HBase的单机测试与启动 35 批量查询Get
10 HBase的伪分布式安装介绍 36 scan查询
11 HBase的伪分布式安装以及配置说明 37 再次重构工具类
12 HBase的全分布式安装说明 38 删除表数据
13 HBase的全分布式安装以及配置说明 第5章 day5
14 HBase全分布式启动与测试 39 单列过滤器
第3章 day3 40 过滤器链进行列值查询
15 ddl:namespace 41 重构工具类
16 ddl建表 42 RegexStringComparator
17 ddl表的其他操作 43 SubstringComparator
18 dml:put 44 BinaryPrefixComparator
19 dml:scan 45 BinaryComparator
20 dml:get 46 FamilyFilter
21 dml修改数据和删除 47 QualifierFilter
22 dml:count 48 ColumnPrefixFilter
23 JAVA API 连接HBase服务 49 MultipleColumnPrefixFilter
第4章 day4 50 RowFilter
24 封装连接工具类

  • 第1章 - day1

    • 第1节 - 好程序员_快速玩转HBase之HBase是什么

      点击播放
    • 第2节 - 好程序员_快速玩转HBase之HBase的作用

      点击播放
    • 第3节 - 好程序员_快速玩转HBase之HBase的表结构

      点击播放
    • 第4节 - 好程序员_快速玩转HBase之HBase的内部结构原理

      点击播放
    • 第5节 - 好程序员_快速玩转HBase之HBase各个节点之间的关联

      点击播放
    • 第6节 - 好程序员_快速玩转HBase之HBase各个节点之间的映射关系

      点击播放
  • 第2章 - day2

    • 第7节 - 好程序员_快速玩转HBase之HBase的单机节点安装前准备

      点击播放
    • 第8节 - 好程序员_快速玩转HBase之ddl建表

      点击播放
    • 第9节 - 好程序员_快速玩转HBase之HBase的单机测试与启动

      点击播放
    • 第10节 - 好程序员_快速玩转HBase之HBase的伪分布式安装介绍

      点击播放
    • 第11节 - 好程序员_快速玩转HBase之HBase的伪分布式安装以及配置说明

      点击播放
    • 第12节 - 好程序员_快速玩转HBase之HBase的全分布式安装说明

      点击播放
    • 第13节 - 好程序员_快速玩转HBase之HBase的全分布式安装以及配置说明

      点击播放
    • 第14节 - 好程序员_快速玩转HBase之HBase全分布式启动与测试

      点击播放
  • 第3章 - day3

    • 第15节 - 好程序员_快速玩转HBase之ddl:namespace

      点击播放
    • 第16节 - 好程序员_快速玩转HBase之ddl建表

      点击播放
    • 第17节 - 好程序员_快速玩转HBase之ddl表的其他操作

      点击播放
    • 第18节 - 好程序员_快速玩转HBase之dml:put

      点击播放
    • 第19节 - 好程序员_快速玩转HBase之dml:scan

      点击播放
    • 第20节 - 好程序员_快速玩转HBase之dml:get

      点击播放
    • 第21节 - 好程序员_快速玩转HBase之dml修改数据和删除

      点击播放
    • 第22节 - 好程序员_快速玩转HBase之dml:count

      点击播放
    • 第23节 - 好程序员_快速玩转HBase之JAVA API 连接HBase服务

      点击播放
  • 第4章 - day4

    • 第24节 - 好程序员_快速玩转HBase之封装连接工具类

      点击播放
    • 第25节 - 好程序员_快速玩转HBase之封装模板类

      点击播放
    • 第26节 - 好程序员_快速玩转HBase之Namespace的CRUD

      点击播放
    • 第27节 - 好程序员_快速玩转HBase之Table的创建

      点击播放
    • 第28节 - 好程序员_快速玩转HBase之查询表中所有列簇

      点击播放
    • 第29节 - 好程序员_快速玩转HBase之修改表

      点击播放
    • 第30节 - 好程序员_快速玩转HBase之删除表中的列簇

      点击播放
    • 第31节 - 好程序员_快速玩转HBase之删除表

      点击播放
    • 第32节 - 好程序员_快速玩转HBase之进一步重构工具类

      点击播放
    • 第33节 - 好程序员_快速玩转HBase之添加记录

      点击播放
    • 第34节 - 获取行键指定的列簇信息

      点击播放
    • 第35节 - 批量查询Get

      点击播放
    • 第36节 - scan查询

      点击播放
    • 第37节 - 再次重构工具类

      点击播放
    • 第38节 - 删除表数据

      点击播放
  • 第5章 - day5

  • Hive分区和分桶

    当单个表数据量越来越大的时候,hive查询通常会全表扫描,这将会浪费我们不关心数据的扫描,浪费大量时间。从而hive引出分区概念partition

    231
  • 大数据编程之UDF函数

     UDF:user difine function,用户自定义函数,一对一。常用 udaf:user define aggregate function,用户自定义聚合函数,多对一。 udtf:user define table_generate function,用户自定义表生成函数,一对多。

    500
  • marpreduce快速入门

    mapreduce:分布式并行离线计算框架,是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架;Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上;

    237
  • 大数据之hive入门操作

     Apache Hive数据仓库软件可以使用SQL方便地阅读、编写和管理分布在分布式存储中的大型数据集。结构可以投射到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。

    502
  • 大数据编程hive内部函数

    大数据编程hive内部函数

    549
  • hive表的查询

    子查询是内嵌在另一个SQL 语句中的SELECT 语句。Hive 对子查询的支持很有限。它只允许子查询出现在SELECT 语句的FROM 子句中。Hive支持非相关子查询,这个子查询通过IN或EXISTS语法在WHERE子句中进行查询。Hive目前暂不支持相关子查询,相关子查询的执行依赖于外部查询的数据。

    527
  • hive的数据类型

    本质上是在hdfs上创建一个目录,使用comment加入数据库的描述信息,描述信息放在引号里。数据库的属性信息放在描述信息之后用with dbproperties 加入,属性信息放在括号内,属性名和属性值放在引号里,用等号连接有多条属性用逗号分隔。

    538
  • 大数据概念

    大数据:指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新模式才能具有更强大的决策力,洞察发现力和流程优化能力的海量,高增长率和多样化的信息资产

    865
  • HDFS基本概念

    源自于Google的GFS论文发表于2003年10月 HDFS是GFS克隆版 ,HDFS的全称是Hadoop Distributed File System易于扩展的分布式文件系统,运行在大量普通廉价机器上,提供容错机制,为大量用户提供性能不错的文件存取服务

    759
  • 大数据基础教程:TextFile分区问题

    获取分区的个数:rdd1.partitions.length,在spark-shell中没有指定分区的个数获取的是默认分区数,除了这个外parallelize方法可以使用,指定几个分区就会有几个分区出现

    1367

他们都在看