sql #postgresql 2

테이블에 대한 조작하기

목차 1. 그룹핑한 데이터 특징량 계산하기 2. ORDER BY 구문을 통해 테이블 내부의 순서를 다루는 쿼리 3. 각 카테고리의 상위 n개 추출하기 4. 가로 기반 데이터를 세로로 변환하기 실습에 필요한 테이블 그룹핑한 데이터 특징량 계산하기 GROUP BY 뒤에 집약 함수는 SELECT 구문 컬럼만 지정 가능 SELECT 구문 내부에서 product_id, score 동시 지정은 불가능 SUM, AVG 등 집계 함수를 이용해서 결과값 도출 SELECT user_id , COUNT(*) AS total_count , COUNT(DISTINCT user_id) AS user_count , COUNT(DISTINCT product_id) AS product_count , SUM(score) AS sum ,..

SQL 도구 들의 관계 및 차이

PostgreSQL 오픈소스 RBD(Relational Database) 다양한 플랫폼 지원, GUI 인스톨러가 제공 특유의 확장 기능으로 편리하게 사용할 수 있음 Apache Hive HDFS라 불리는 분산 파일 시스템 위의 데이터를 SQL스러운 인터페이스로 간단하게 처리해주는 시스템 Hive는 Hadoop 생태계의 일부분으로 SQL스러운 쿼리 언어로 작성한 쿼리를 MapReduce 잡으로 변환해서 간단하게 병렬 분산 처리 파일 기반의 시스템(특정 레코드 하나 변경하거나 제거 X, 쿼리 실행 시 파일 전체를 조작) 동적으로 데이터를 정의 풍부한 UDF(User-Defined Function)을 활용해서 어려운 문자열 처리가 가능 Amazon Redshift AWS에서 제공하는 분산 병렬 RDB Hive..