概述
Cloudera企业级数据中心的安装主要分为4个步骤:
- 集群服务器配置,包括安装操作系统、关闭防火墙、同步服务器时钟等;
- 安装Cloudera管理器;
- 安装CDH集群;
- 集群完整性检查,包括HDFS文件系统、MapReduce、Hive等是否可以正常运行。
准备工作
集群规模5个节点
1234567Cloudera管理器节点:172.31.46.113CDH节点:172.31.34.88172.31.34.89172.31.34.90172.31.34.91操作系统版本:CentOS 6
- CDH版本:CDH 5.x
- 采用root对集群进行部署
服务器配置
- 安装操作系统CentOS 6
- 如果不能连接互联网,先创建CentOS的repository,以便yum可以访问OS镜像
- 网络配置:为了令集群中各个节点之间互相通信,需要对以下文件进行修改:
(以cm节点为例)
/etc/sysconfig/network-scripts/ifcfg-eth012345DEVICE=eth0ONBOOT=yesBOOTPROTO=staticIPADDR=172.31.46.113NETMASK=255.255.240.0
/etc/selinux/config
重新启动网络服务,初始化网络
安装需要的软件与服务
4.禁止交换(可选)
内存页面交换在某些情况下会导致CDH性能下降,建议关闭
修改transparent_hugepage参数,这一参数默认值可能会导致CDH性能下降(可选)
CDH软件下载与配置(Cloudera管理器节点)
下载Cloudera管理器需要的rpm包
12wget -c -r -nd -np -k -L -A rpmhttp://archive-primary.cloudera.com/cm5/redhat/6/x86_64/cm/5/RPMS/x86_64/下载Parcel包(包含了CDH中的Hadoop组件)
从以下地址选择合适版本的parcel包:
http://archive-primary.cloudera.com/cdh5/parcels/latest
下载manifest.json文件:
http://archive-primary.cloudera.com/cdh5/parcels/latest/manifest.json下载后将下载的软件放置为如下结构(该步骤不是必须的,只是为了后续说明的方便)
12345678910[root@ip-172-31-46-113]# lsCDH-5.2.0-1.cdh5.2.0.p0.36-el6.parcel cm manifest.json[root@ip-172-31-46-113]# ls cmcloudera-manager-agent-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-daemons-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-server-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-server-db-2-5.2.0-1.cm520.p0.60.el6.x86_64.rpmenterprise-debuginfo-5.2.0-1.cm520.p0.60.el6.x86_64.rpmjdk-6u31-linux-amd64.rpmoracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm创建repo文件以支持本地yum的操作
123456789101112131415161718192021$> cd cm$> createrepo .Spawning worker 0 with 7 pkgsWorkers FinishedGathering worker resultsSaving Primary metadataSaving file lists metadataSaving other metadataGenerating sqlite DBsSqlite DBs complete$> lscloudera-manager-agent-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-daemons-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-server-5.2.0-1.cm520.p0.60.el6.x86_64.rpmcloudera-manager-server-db-2-5.2.0-1.cm520.p0.60.el6.x86_64.rpmenterprise-debuginfo-5.2.0-1.cm520.p0.60.el6.x86_64.rpmjdk-6u31-linux-amd64.rpmoracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpmrepodata
执行完后,在cm目录下生成目录repodata
5.将文件移动到特定的目录,确保可以通过HTTP协议进行访问
现在,我们可以使用浏览器对相关目录进行访问:
http://172.31.46.113/cdh5/parcels/5.2.0/
http://172.31.46.113/cm/
6.新建文件/etc/yum.repos.d/myrepo.repo
安装Cloudera管理器
1.安装JDK
2.安装Cloudera管理器服务器
3.安装内置数据库
4.启动内置数据库
5.启动Cloudera管理器服务器
启动后就可以访问Cloudera管理器页面了, Cloudera管理器的监听端口为7180
http://172.31.46.113:7180/smf/login