11
2021. 3. 5. 16:04
분석할 파일, 프로그램은 알드라이브로 hadoop/hadoop-3.2.2로 넣어주기
cd hadoop/hadoop-3.2.2로 들어가서
ls로 확인
분석용 파일 업로드
bin/hadoop fs -put sam* /
sam으로 시작하는 파일은 전부 다 올리기
잘 올라갔는지 확인하기
bin/hadoop fs -ls /
실행
bin/hadoop jar sc.jar /scResult
결과파일을 L로
bin/hadoop fs -get /scResult/part-r-00000 scResult.txt
결과파일 윈도우로 가져오기
Hadoop은 합계 쪽
window로 가져와서 통계내고, 의미부여, 시각화
R
텍스트 파일에서 전체선택 -> 엑셀로 옮기기
최종 프로젝트에서 굳이 R로 할 필요는 없다.
설치하기
istall R for the first time
Java , Python과 같은 언어
R - Python과 비슷
rstudio.com/products/rstudio/download/