Notice
Recent Posts
Recent Comments
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 빅데이터
- RDD
- SQL
- r
- graph database
- Graph Tech
- Graph Ecosystem
- 그래프 질의언어
- 인공지능
- 분산 병렬 처리
- 그래프 데이터베이스
- GraphX
- GSQL
- Python
- TensorFlow
- RStudio
- Neo4j
- Cypher
- Federated Learning
- graph
- 그래프 에코시스템
- BigData
- TigerGraph
- 딥러닝
- 연합학습
- GDB
- DeepLearning
- SparkML
- spark
- 그래프
Archives
- Today
- Total
Hee'World
[1004jonghee]하둡이란? 본문
하둡이란?
• It is designed to scale up from single servers to thousands of machines, each offering library is a framework that allows for the distributed processing of local computation and storage
- hadoop.aphache.org –
- 하둡은 클러스터 환경에서 대량의 데이터를 분산처리,저장,관리를 지원하는 오픈소스 프레임워크.
- 구글 파일 시스템을 대체할 수 있는 HDFS(Hadoop Distributed File System )와 MapReduce를 구현한 것이다.
하둡의 장단점
Strengths
- 오픈소스로 라이선스에 대한 비용 부담 적음
- 시스템을 중단하지 않더라도 장비의 추가 및 삭제가 용이
- 일부 장비에 장애가 발생하더라도 전체 시스템 사용성에 영향이 적음
- 저렴한 구축 비용과 비용 대비 빠른 데이터 처리
- 데이터의 복제 본을 저장하기 때문에 서버의 장애가 발생했을 때도 데이터의 복구 가능.
Weaknesse
- HDFS에 저장된 데이터는 변경 불가
- 대용량 데이터의 배치 처리에는 적합하나, 스트리밍과 같은 실시간성 데이터 분석이나, 신속성이 보장되어야 하는 작업에는 부적합.
- Hadoop 엔지니어의 부족.
Hadoop core project
•Hadoop MapReduce: A YARN-based system for parallel processing of large data sets.
•Hadoop Distributed File System (HDFS™): A distributed file system that provides high-throughput access to application data.
•Hadoop YARN: A framework for job scheduling and cluster resource management.
- hadoop.apache.org -
'BigData > Hadoop' 카테고리의 다른 글
BIG DATA 관련 사이트 모음_하둡/연동 Project/Nosql (0) | 2013.08.19 |
---|---|
[1004jonghee]Hadoop release version (0) | 2013.08.12 |
1004jonghee, 하둡에코시스템(Hadoop Eco System) Ver 1.0 (2) | 2013.08.04 |
[1004jonghee]하둡 에코 시스템(Hadoop ECO System) (1) | 2013.07.09 |
[1004jonghee]CentOS 6.4에 Hadoop 설치하기(네임노드,세컨더리노드,데이타노드1,2) (6) | 2013.07.08 |
Comments