반응형 분산1 Hadoop 이란? Hadoop은 Apache의 오픈 소스 프레임워크로 대용량의 데이터를 처리하고 분석하는 데 사용됩니다. Hadoop은 Java로 작성되었으며 OLAP(온라인 분석 처리)가 아닙니다. 일괄/오프라인 처리에 사용됩니다. Facebook, Yahoo, Google, Twitter, LinkedIn 등에서 사용되고 있습니다. 또한 클러스터에 노드를 추가하는 것만으로 확장할 수 있습니다. 하둡의 모듈 HDFS: 하둡 분산 파일 시스템. Google은 GFS라는 논문을 발표했으며 이를 기반으로 HDFS가 개발되었습니다. 파일이 블록으로 분할되어 분산 아키텍처를 통해 노드에 저장될 것이라고 명시되어 있습니다. Yarn: 또 다른 Resource Negotiator가 작업 스케줄링 및 클러스터 관리에 사용됩니다. Ma.. 2022. 5. 31. 이전 1 다음 반응형