Intro 개인적으로 데이터 분석 관련 내용을 정리하자는 차원에서 현재 ADP자격증 공부를 하고 있다. 그런데 보면 알겠지만 분산 처리 시스템 관련 내용이 자주 등장한다. 그 중 하둡이라는 기술은 실무에서 잘 쓰인다고 알려져 있어서 올해 안으로 이에 관해 알아보려 계획했다. 물론 당장은 다른 일정 때문에 실제 환경을 구축하고 사용해보기는 힘들다고 생각한다. 아마 본격적으로 사용하게 된다면 올해 중반쯤에나 조금 다뤄볼 생각이긴 하다. 아무튼 하둡을 다루는 강의를 들어보며 개괄적인 내용과 명령어를 복습 노트를 남긴다는 차원에서 정리해보려 한다. 적어도 이론적인 측면은 알아두면 나중에 편하지 않을까 생각한다. 하둡 시스템이란? 아파치 하둡(Apache Hadoop)이라 불리우는 친구는 HDFS와 맵리듀스를 구..