10 :: 원태기네

10

2021. 3. 4. 14:55

Hadoop 껐다가 키기

NameNode에서 끄기

cd ~/hadoop/hadoop-3.2.2

sbin/stop-all.sh

컴퓨터 전부 찌꺼기폴더 삭제

rm -rf ~/hadoopTmpData

NameNode에서 하둡 시스템 포맷

bin/hadoop namenode -format

bin/hadoop datanode -format

NameNode에서 켜기

sbin/start-all.sh

Hadoop

HDFS(Hadoop Distributed File System)

실제로는 20GB짜리 HDD 2개

Hadoop은 2개를 묶어서 40GB 하나의 공간으로 사용

빅데이터 분석은 실시간으로 할 수 없음

Hadoop은 HDFS에 있는 파일을 분석

내가 HDFS에 파일을 올려줘야함

NameNode의 HDD - 분석용파일, 프로그램

DataNode의 HDD - x

HDFS - 분석용 파일

알드라이브로 파일 업로드

.jar파일과 분석용.txt 파일 두개

위치 hadoop/hadoop-3.2.2

HDFS 확인

현재 위치

cd ~/hadoop/hadoop-3.2.2

bin/hadoop fs -ls HDFS경로

bin/hadoop fs -ls / (최상위 경로 확인)

HDFS로 분석용 파일 업로드

현재 위치

cd ~/hadoop/hadoop-3.2.2

bin/hadoop fs -put 뭐를 HDFS경로

sherlock.txt를 HDFS 최상위에 업로드

bin/hadoop fs -put shelock.txt /

실행

현재 위치

cd ~/hadoop/hadoop-3.2.2

bin/hadoop jar 뭐를

bin/hadoop jar wc2.jar

실행하면 결과폴더/part-r-00000로 결과파일을 만들어줌

결과파일 가져오기

bin/hadoop fs -get HDFS에있는뭐를 NN의어디로

bin/hadoop fs -get /sherlockResult/part-r-00000 sResult.txt

NN에 있는 결과파일을 알드라이브로 Window로 가져오기

Exception의 경우

만약에 exception 메세지가 나온다면

java 파일 수정하고

다시 jar 파일 만들어서 보낸뒤

실행할때 결과폴더가 없어야함

다시 돌리고 싶다면

bin/hadoop fs -rm -r HDFS경로

bin/hadoop fs -rm -r /sherlockResult

경로에 있는 result 파일 지우고 나서 다시 실행

실행

bin/hadoop jar wc3.jar /sherlock.txt /shResult

결과파일 가져오기

bin.hadoop fs -get /shResult/part-r-00000 shResult.txt

내일할꺼

'Hadoop' 카테고리의 다른 글

MongoDB설치 (0)	2021.03.11
h (0)	2021.03.05
9. Hadoop - 맛보기 (0)	2021.03.04
8. Hadoop - Hadoop 설치 하기 (0)	2021.03.03
7. Hadoop - 종료관련 (0)	2021.03.02

원태기네

CATEGORIES

10

Hadoop 껐다가 키기

'Hadoop' 카테고리의 다른 글

BELATED ARTICLES

NOTICE

ARCHIVE

RECENTPOST

RECENTCOMMENT

티스토리툴바