凡间的精灵

凡尘落素一精灵


  • 首页

  • 归档

  • 分类

  • 标签

  • 站点地图

  • 搜索

Hive QL常用操作

发表于 2021-10-28 | 分类于 Hadoop
字数统计: 3.1k | 阅读时长 ≈ 15
一、数据定义(DDL)创建修改和删除数据库、表、视图、函数和索引1.1 创建、修改和删除数据库12345678910create database if not exists hive; #创建数据库show databases; #查 ...
阅读全文 »

Hive 权限管理

发表于 2021-10-27 | 分类于 Hadoop
字数统计: 2.2k | 阅读时长 ≈ 9
目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员, 也就对hive中的所有表都有查看和改动的权限,这样是不符合一般数据仓库的安全原则的。下面一起来看看Hive的权限管理。一、Hive 三种授权模型1.1 基于存储的授权Storage Based ...
阅读全文 »

Hive MetaStore和HiveServer2的高可用配置

发表于 2021-10-26 | 分类于 Hadoop
字数统计: 1.9k | 阅读时长 ≈ 9
一、Metastore和Hiveserver2服务的区别1.1 Metastore 服务Metastore 服务访问元数据的方式bin/hive(cli命令行的方式访问元数据) –访问–> metaStore server –访问–>MySQLMetastore 服务启动方式服务端启动M ...
阅读全文 »

Hive 的三种连接方式

发表于 2021-10-26 | 分类于 Hadoop
字数统计: 718 | 阅读时长 ≈ 3
一、CLI连接123456[hadoop@hadoop2 sbin]$ hivehive> show databases;OKdefaultTime taken: 0.788 seconds, Fetched: 1 row(s)hive>启动成功的话如上所示,接下来便可以做 hive 相 ...
阅读全文 »

Hadoop 分布式数据仓库Hive

发表于 2021-10-21 | 分类于 Hadoop
字数统计: 3.5k | 阅读时长 ≈ 15
一、Hive 原理Hive 是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce ...
阅读全文 »

Hadoop NoSQL数据库HBase

发表于 2021-10-18 | 分类于 Hadoop
字数统计: 5.8k | 阅读时长 ≈ 23
一、简介NoSQL是Not Only SQL的缩写,泛指用来解决大数据相关问题而创建的数据库技术,NoSQL技术不会完全替代关系型数据库,而是关系型数据的一种补充。HBase是建立在Hadoop文件系统之上的分布式面向列的NoSQL数据库。它是一个开源项目,可横向扩展。HBase的数据模型,类似于谷 ...
阅读全文 »

Hadoop Shell常用命令

发表于 2021-10-15 | 分类于 Hadoop
字数统计: 2.3k | 阅读时长 ≈ 10
一、HDFS Shell大多数HDFS Shell命令的行为和对应的Unix Shell命令类似,主要不同之处是HDFS Shell命令操作的是远程Hadoop服务器的文件,而Unix Shell命令操作的是本地文件,其他不同之处将在介绍各命令使用详情时指出。常用的HDFS Shell命令如下表所示 ...
阅读全文 »

Ambari 部署Hadoop 大数据集群

发表于 2021-10-13 | 分类于 Hadoop
字数统计: 3.1k | 阅读时长 ≈ 14
一、Ambari 介绍Apache Ambari 项目旨在通过开发用于配置、管理和监控 Apache Hadoop 集群的软件来简化 Hadoop 管理。Ambari 提供了一个直观、易于使用的 Hadoop 管理 Web UI,由其 RESTful API 支持。Ambari 使系统管理员能够:配 ...
阅读全文 »

Hadoop HDFS基于ZK的高可用配置

发表于 2021-10-12 | 分类于 Hadoop
字数统计: 4.1k | 阅读时长 ≈ 19
一、前言在 Hadoop 1.X版本中,NameNode会是整个HDFS集群的单点故障(single point of failure,SPOF):每一个HDFS集群只能有一个NameNode节点,一旦NameNode所在服务器宕机或者出现故障将导致整个集群都不可用,除非重启或者开启一个新的Name ...
阅读全文 »

Hadoop 2.7.2 手动部署

发表于 2021-10-07 | 分类于 Hadoop
字数统计: 2k | 阅读时长 ≈ 9
一、集群简介Hadoop 集群具体来说包含两个集群:HDFS集群和YARN集群,两个逻辑上分离,但物理上常在一起。HDFS集群负责海量数据的存储,集群中的角色主要有:NameNode、DataNode、SecondaryNameNodeYARN集群负责海量数据运算时的资源调度,集群中的角色主要有:R ...
阅读全文 »
Prev1…678…38Next
Zhongzhou Chen

Zhongzhou Chen

371 日志
89 分类
188 标签
RSS
0%
© 2023 Zhongzhou Chen | Site words total count: 863.9k