11

2021. 3. 5. 16:04

분석할 파일, 프로그램은 알드라이브로 hadoop/hadoop-3.2.2로 넣어주기

 

cd hadoop/hadoop-3.2.2로 들어가서

ls로 확인

 

분석용 파일 업로드

bin/hadoop fs -put sam* /

sam으로 시작하는 파일은 전부 다 올리기

 

잘 올라갔는지 확인하기

bin/hadoop fs -ls /

 

실행

bin/hadoop jar sc.jar /scResult

 

결과파일을 L로

bin/hadoop fs -get /scResult/part-r-00000 scResult.txt

 

결과파일 윈도우로 가져오기

 

Hadoop은 합계 쪽

window로 가져와서 통계내고, 의미부여, 시각화 

 

R

텍스트 파일에서 전체선택 -> 엑셀로 옮기기

최종 프로젝트에서 굳이 R로 할 필요는 없다.

 

설치하기

cran.r-project.org/

istall R for the first time

 

Java , Python과 같은 언어

R - Python과 비슷

 

rstudio.com/products/rstudio/

rstudio.com/products/rstudio/download/