컴공생의 개인공부일지

  • 홈
  • 태그
  • 방명록

Hadoop #하둡 1

하둡(Hadoop) 개요

하둡(Hadoop)은 안정적이고 확장성이 높은 저장 및 분석 플랫폼을 제공한다. 범용 하드웨어에서 실행되고 오픈소스이다. SQL이나 RDBMS와는 다르고 코드는 대부분 JAVA로 작성된다는 것이 특징이다. 크기가 큰 데이터 셋을 디스크에 나눠서 저장하고 공유하게 되면 빠른 분석이 가능하고 분석 작업에도 탁월한 효과를 지니게 된다. 하지만 여러 개의 디스크를 병렬로 쓰거나 읽기 위해선 몇몇 문제를 고려해야 한다. 하드웨어 장애 데이터 손실을 막기 위한 방법은 데이터를 여러 곳에 복제하는 방법 - RAID 방식 HDFS와는 조금 다른 방법을 사용한다. 분할된 데이터를 분석 과정에서 다시 결합 많은 분산 시스템이 다중 출처의 데이터를 병합하는 기능을 제공하지만, 정합성이 안 지켜지는 경우가 많다. 맵리듀스의 ..

4학년 공부 과정/분산 데이터베이스 2023.03.11
이전
1
다음
더보기
프로필사진

컴공생의 개인공부일지

데이터 분석가가 되기위해

  • 분류 전체보기 (242)
    • 4학년 공부 과정 (11)
      • 분산 데이터베이스 (9)
      • 빅데이터 (2)
    • 영어 숙어 모음 (17)
    • 알고리즘 공부 (24)
      • 파이썬 알고리즘 인터뷰 (15)
      • Binary Tree (5)
      • Greedy Algorithm (4)
    • 데이터분석 (33)
      • R (7)
      • ML 이론 (2)
      • Tableau (7)
      • Power BI (1)
      • PostgreSQL (13)
    • 프로젝트 (4)
    • 자격증 (97)
      • SQLD (4)
      • ADSP (8)
      • 정보처리기사 (84)
      • 정보처리기사 요약 (1)
    • 코딩테스트(프로그래머스) (6)
      • SQL (6)
    • 3학년 2학기 공부 과정 (16)
      • 정보보안 (11)
      • 정보보안 연습문제 (5)
    • CS(Computer Science) (24)
      • Algorithm (9)
      • Computer Science (5)
      • Software Engineering (5)
      • Design Pattern (5)
    • 2024 동계 UST 인턴 (6)
    • Paper review (1)

Tag

UST, R #통계학 #ML, 알고리즘, UST #인턴, 머신러닝 #크롤링, ADSP #DB, tableau, 토픽모델링 #gpt #llm #topic modeling, 파이썬, SQLD #DB, sql #postgresql, 데이터 #postgresql #sql, postgresql #sql, SQL #데이터리안 #데이터 분석 캠프, R #통계학 #컴퓨터공학 #ML, wsl2 #docker, 영어 #숙어 #idiom, 소프트웨어공학, pyspark #Jupyter Lab #Docker, postgresql #sql #데이터분석,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • 깃허브주소

티스토리툴바