小白入门必知必会-Hadoop集群安装

一 Hadoop基础

1.1 介绍

Hadoop是一个由Apache基金会开发的分布式系统基础架构，主要解决海量数据存储和海量数据的计算问题。

1.2 集群概述

Hadoop集群包括两个集群：

HDFS集群

YARN集群。

两个集群逻辑上分离、通常物理上在一起，两个集群都是标准的主从架构集群，两个集群互相之间没有依赖、互不影响。

HDFS集群：

主角色NameNode

从角色DataNode

主角色辅助角色SecondaryNameNode。

YARN集群：

主角色ResourceManager

从角色NodeManager

MapReduce是计算框架、代码层面的组件，没有集群之说。

1.3 下载地址

https://archive.apache.org/dist/hadoop/common/

1.4 服务器规划

三台服务器

192.168.0.54

192.168.0.58

192.168.0.59

操作系统：CentOS7.2

配置：4核CPU、8G内存、100G磁盘空间

二 Hadoop集群安装

2.1 主机名修改

3台机器分别执行

hostnamectl set-hostname hadoop01

hostnamectl set-hostname hadoop02

hostnamectl set-hostname hadoop03

2.2 hosts映射

3台机器分别执行

cat >>/etc/hosts << EOF

192.168.0.63 node1 hadoop01

192.168.0.64 node2 hadoop02

192.168.0.65 node3 hadoop03

EOF

2.3 关闭防火墙

3台机器分别执行

systemctl stop firewalld

systemctl disable firewalld

2.4 配置ssh免密登录

node1->node1/node2/node3

ssh-keygen

ssh-copy-id node1

ssh-copy-id node2

ssh-copy-id node3

2.5 集群时间同步

3台机器分别执行

yum install ntpdate -y

ntpdate ntp4.aliyun.com

定时同步

10 00 * * * ntpdate ntp4.aliyun.com >/dev/null 2>&1

2.6 创建统一工作目录

3台机器分别执行

mkdir -p /web/{server,data,software}

2.7 安装JDK1.8

jdk下载地址：

https://www.oracle.com/cn/index.html

将安装包上传到/web/software目录下

解压缩包

cd /web/software

tar xf jdk-8u333-linux-x64.tar.gz -C /web/server/

设置环境变量

vim /etc/profile

export JAVA_HOME=/web/server/jdk1.8.0_333

export PATH=${JAVA_HOME}/bin:${JAVA_HOME}/jre/bin:${PATH}

export CLASSPATH=${CLASSPATH}:${JAVA_HOME}/lib:${JAVA_HOME}/jre/lib

export JRE_HOME=${JAVA_HOME}/jre

使环境变量生效

source /etc/profile

查看是否安装成功

java -version

2.8 上传解压hadoop安装包

3台机器分别执行

cd /web/software

tar xf hadoop-3.3.0-Centos7-64-with-snappy.tar.gz -C /web/server/

2.9 修改配置文件

hadoop01执行

cd /web/server/hadoop-3.3.0/etc/hadoop

vim hadoop-env.sh

export JAVA_HOME=/web/server/jdk1.8.0_333

export HDFS_NAMENODE_USER=root

export HDFS_DATANODE_USER=root

export HDFS_SECONDARYNAMENODE_USER=root

export YARN_RESOURCEMANAGER_USER=root

export YARN_NODEMANAGER_USER=root

vim core-site.xml

fs.defaultFS

hdfs://node1:8020

hadoop.tmp.dir

/web/data/hadoop-3.3.0

hadoop.http.staticuser.user

root

hadoop.proxyuser.root.hosts

hadoop.proxyuser.root.groups

fs.trash.interval

1440

vim hdfs-site.xml

dfs.namenode.secondary.http-address

node2:9868

vim mapred-site.xml

mapreduce.framework.name

yarn

mapreduce.jobhistory.address

node1:10020

mapreduce.jobhistory.webapp.address

node1:19888

yarn.app.mapreduce.am.env

HADOOP_MAPRED_HOME=${HADOOP_HOME}

mapreduce.map.env

HADOOP_MAPRED_HOME=${HADOOP_HOME}

mapreduce.reduce.env

HADOOP_MAPRED_HOME=${HADOOP_HOME}

vim yarn-site.xml

yarn.resourcemanager.hostname

node1

yarn.nodemanager.aux-services

mapreduce_shuffle

yarn.nodemanager.pmem-check-enabled

false

yarn.nodemanager.vmem-check-enabled

false

yarn.log-aggregation-enable

true

yarn.log.server.url

http://node1:19888/jobhistory/logs

yarn.log-aggregation.retain-seconds

604800

vim workers

192.168.0.63 hadoop01

192.168.0.64 hadoop02

192.168.0.65 hadoop03

另外两台服务器同样的配置

scp -r hadoop-3.3.0/ node2:/web/server/

scp -r hadoop-3.3.0/ node3:/web/server/

2.10 配置Hadoop环境变量

3台机器分别执行

vim /etc/profile

export HADOOP_HOME=/web/server/hadoop-3.3.0

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

2.11 Hadoop初始化操作

hadoop01服务器执行

首次启动之前需要format操作；

format只能进行一次，后续不再需要；

如果多次format除了造成数据丢失外，还会导致hdfs集群主从角色之间互不识别，通过删除所有机器hadoop.tmp.dir目录重新format解决。

hdfs namenode -format

2.12 Hadoop集群启动

HDFS集群

start-dfs.sh
stop-dfs.sh

YARN集群

start-yarn.sh
stop-yarn.sh

Hadoop集群

start-all.sh
stop-all.sh

2.13 进程状态、日志查看

jps

日志路径

/web/server/hadoop-3.3.0/logs

2.14 页面查看

HDFS集群

NameNode所在机器

http://192.168.0.63:9870/

YARN集群

ResourceManager所在机器

http://192.168.0.63:8088/

至此，Hadoop集群安装完成，感谢观看。

展开阅读全文

页面更新：2024-03-06

标签：集群主从海量架构环境变量入门主角角色机器两个服务器

1 2 3 4 5

申报新政出炉，公募REITs再迎利好本周三2只新能源REITs将上市

每经记者：李沛沛每经编辑：叶峰就在刚刚过去的这个周末，REITs申报新政的出炉引发了全市场的热议。3月24日，证监会和发改委发布了《关于进一步推进基础设施领域不动产投资信托基金（REITs）常态化发行相关工作的通知》（以下简称

前巨人CEO创业项目曝光，《球球大作战》核心成员追随

前段时间，前巨人CEO吴萌的创业项目曝光，其于2022年7月成立了元宇宙游戏开发商MiAO（上海妙世界科技有限公司，以下简称妙世界）。妙世界已在去年完成1亿元的天使轮融资，办公点分别设立于新加坡翡翠山路（总部）和上海徐汇区。综合

速递丨物流企业大宗商品仓储设施用地税收优惠政策继续实施

头条两部门继续实施物流企业大宗商品仓储设施用地税收优惠政策3月27日，财政部、税务总局发布公告称，自2023年1月1日起至2027年12月31日止，对物流企业自有（包括自用和出租）或承租的大宗商品仓储设施用地，减按所属土地等级适

英国最新月度报告：生活必需品支出较去年同期增加12%

近日，英国全国建房互助会发布的月度分析报告显示，在过去六个月里，由于通货膨胀导致的物价上涨，38%的英国人不得不使用信用卡贷款购买生活必需品，其中包括食品、饮料、公共交通和儿童保育等基本需求，英国家庭在生活必需品上

中国国际管道大会，打造行业发展风向标！

这是为您推送的第3738篇文章中国国际管道大会20年发展成果丰硕踏着时代节拍，中国国际管道大会成功举办了11届，走过了20年时光。管道局作为主办方，一直坚持大会的专业性、权威性、国际化特色，逐步将其打造成为了综合型的

2023年重庆楼市第十二周市场

2023年已经开始了，3月份已经开始了，3月也开始进入尾声了，同时在上周，重庆房交会（春交会）开始，那么重庆楼市在上周成交如何呢？在2023年第十二周，重庆楼市一共有23盘入市，一共带来了1564套房源，供应有所的增加，连续2周，供应相对都不

“超级牛散”赵建平关联人最新买进这只股！此前布局这家同类公司股价刚刚创新高，或爆赚2300万……

本刊编辑部 | 齐永超作为一个神秘的投资群体，牛散们手握重金，风格各有不同。本期的“主角”赵吉就是一位“标签”极其鲜明的投资人，其尤其偏爱刚刚上市不久的次新股，从赵吉此前布局的次新标的来看，有不少在其入驻之后都迎

招行朱江涛：预计今年房地产不良率还会上升，但风险大概率基本出清

“房地产贷款的表内业务风险，2022年已经得到了充分释放。”3月27日，在2022年业绩说明会上，招商银行副行长兼首席风险官朱江涛称，该行的房地产行业风险，大概率将在2023年基本出清。朱江涛说，2022年，招商银行表内对公房地产贷

国家为支持芜湖发展，批复芜湖建设自贸区，为何会选中芜湖呢

中国经济不断发展，各地也在积极探索经济发展的新路径。近日，国家批复了芜湖建设自由贸易试验区的申请，这一消息引起了人们的广泛关注。为什么国家选择在芜湖建设自贸区？一、地理位置优势芜湖位于中国安徽省东部，毗邻上海、

中国经济回暖背后，隐藏着老百姓的习惯性焦虑

中国经济一直保持着平稳增长的势头，尤其在疫情冲击下，中国经济更是实现了逆势增长。然而，中国经济回暖背后，却隐藏着老百姓的习惯性焦虑。这种焦虑并不是短暂的、局部的，而是深深地植根于人们的内心深处，影响着他们的生活和

东莞各镇街GDP塘厦镇突破600亿，沙田镇领先石碣镇，谢岗镇在第31

东莞市统计局发布了2022年各镇街GDP排名数据。根据数据显示，东莞塘厦镇的GDP突破了600亿，位列东莞市GDP排名第一；沙田镇位列第二，领先石碣镇；而谢岗镇排名第31。一、塘厦镇GDP突破600亿塘厦镇是东莞市的一个经济发展较快的

养老金上涨方案有三大争议，企退职工有三大愿望，有关部门应重视

2023年即将迎来养老金的第19涨，这已经在今年两会上2023年中央和地方预算草案报告中明确提出来了，接下来人社部将发布调整通知，确定养老金上涨方式。养老金上涨固然是好事，退休老人拍手称快，也是退休老人在2023年中的一件大

警报拉响、危机将至，怎么办?

原创韬略哥01“烽火”连三月这个三月可谓惊心动魄，全球经济“烽火”不断，频陷危机。先是美国硅谷银行破产，随后签名银行、第一共和银行、瑞士信贷陆续出现危机。上周五，德意志银行股又出现大跌，欧美银行业、金融业受到

市政府工作组督查马岭镇重大项目建设

3月23日，庆阳市政府办公室督查专员温军平一行，督查庆城县马岭镇重大项目建设工作，县委常委、组织部长王小军，县发改部门负责人一同督查。工作组先后深入庆阳威克瑞计量检测有限公司的机械设备研发制造及计量检测项目、庆

华为“盘古”AI大模型来了，常山北明一字涨停，哪些上市公司在布局？

记者｜赵阳戈华为盘古大模型曝光，引爆了概念股。据悉，在沉寂两年后，华为云官网展示了盘古系列AI大模型，分别为NLP大模型、CV大模型以及科学计算大模型（气象大模型）。其中，盘古NLP大模型是被认为最接近人类中文理解能力的AI大

上滑加载更多 ↓

小白入门必知必会-Hadoop集群安装

申报新政出炉，公募REITs再迎利好本周三2只新能源REITs将上市

前巨人CEO创业项目曝光，《球球大作战》核心成员追随

速递丨物流企业大宗商品仓储设施用地税收优惠政策继续实施

英国最新月度报告：生活必需品支出较去年同期增加12%

中国国际管道大会，打造行业发展风向标！

2023年重庆楼市第十二周市场

“超级牛散”赵建平关联人最新买进这只股！此前布局这家同类公司股价刚刚创新高，或爆赚2300万……

招行朱江涛：预计今年房地产不良率还会上升，但风险大概率基本出清

国家为支持芜湖发展，批复芜湖建设自贸区，为何会选中芜湖呢

中国经济回暖背后，隐藏着老百姓的习惯性焦虑

东莞各镇街GDP塘厦镇突破600亿，沙田镇领先石碣镇，谢岗镇在第31

养老金上涨方案有三大争议，企退职工有三大愿望，有关部门应重视

警报拉响、危机将至，怎么办?

市政府工作组督查马岭镇重大项目建设

华为“盘古”AI大模型来了，常山北明一字涨停，哪些上市公司在布局？

江小忠督导食品安全“两个责任”工作

全城沸腾！2023重庆合川钓鱼城半程马拉松海量高清大图来

人形机器人进驻中科馆打造全国科技馆创新应用新模式

马云回国第二天，阿里开启24年来最重要一次架构重组，事情

AMD新一代移动端混合架构APU，值得期待

秦皇岛这两个县或将合并，如果成功实现，未来经济发展有望

新品发布丨广电五舟鲲鹏服务器S627K2(Pro)筑牢数字金

不可思议，小小的沙县，竟然出了两个空军司令

7.37亿！七都建发集团又开工两个项目！

王慧文与AI架构公司一流科技达成并购意向，搜狗输入法之