10
Hadoop 껐다가 키기
NameNode에서 끄기
cd ~/hadoop/hadoop-3.2.2
sbin/stop-all.sh
컴퓨터 전부 찌꺼기폴더 삭제
rm -rf ~/hadoopTmpData
NameNode에서 하둡 시스템 포맷
bin/hadoop namenode -format
bin/hadoop datanode -format
NameNode에서 켜기
sbin/start-all.sh
Hadoop
HDFS(Hadoop Distributed File System)
실제로는 20GB짜리 HDD 2개
Hadoop은 2개를 묶어서 40GB 하나의 공간으로 사용
빅데이터 분석은 실시간으로 할 수 없음
Hadoop은 HDFS에 있는 파일을 분석
내가 HDFS에 파일을 올려줘야함
NameNode의 HDD - 분석용파일, 프로그램
DataNode의 HDD - x
HDFS - 분석용 파일
알드라이브로 파일 업로드
.jar파일과 분석용.txt 파일 두개
위치 hadoop/hadoop-3.2.2
HDFS 확인
현재 위치
cd ~/hadoop/hadoop-3.2.2
bin/hadoop fs -ls HDFS경로
bin/hadoop fs -ls / (최상위 경로 확인)
HDFS로 분석용 파일 업로드
현재 위치
cd ~/hadoop/hadoop-3.2.2
bin/hadoop fs -put 뭐를 HDFS경로
sherlock.txt를 HDFS 최상위에 업로드
bin/hadoop fs -put shelock.txt /
실행
현재 위치
cd ~/hadoop/hadoop-3.2.2
bin/hadoop jar 뭐를
bin/hadoop jar wc2.jar
실행하면 결과폴더/part-r-00000로 결과파일을 만들어줌
결과파일 가져오기
bin/hadoop fs -get HDFS에있는뭐를 NN의어디로
bin/hadoop fs -get /sherlockResult/part-r-00000 sResult.txt
NN에 있는 결과파일을 알드라이브로 Window로 가져오기
Exception의 경우
만약에 exception 메세지가 나온다면
java 파일 수정하고
다시 jar 파일 만들어서 보낸뒤
실행할때 결과폴더가 없어야함
다시 돌리고 싶다면
bin/hadoop fs -rm -r HDFS경로
bin/hadoop fs -rm -r /sherlockResult
경로에 있는 result 파일 지우고 나서 다시 실행
실행
bin/hadoop jar wc3.jar /sherlock.txt /shResult
결과파일 가져오기
bin.hadoop fs -get /shResult/part-r-00000 shResult.txt
내일할꺼
'Hadoop' 카테고리의 다른 글
MongoDB설치 (0) | 2021.03.11 |
---|---|
h (0) | 2021.03.05 |
9. Hadoop - 맛보기 (0) | 2021.03.04 |
8. Hadoop - Hadoop 설치 하기 (0) | 2021.03.03 |
7. Hadoop - 종료관련 (0) | 2021.03.02 |