데이터분석/PostgreSQL 13

SQL 도구 들의 관계 및 차이

PostgreSQL 오픈소스 RBD(Relational Database) 다양한 플랫폼 지원, GUI 인스톨러가 제공 특유의 확장 기능으로 편리하게 사용할 수 있음 Apache Hive HDFS라 불리는 분산 파일 시스템 위의 데이터를 SQL스러운 인터페이스로 간단하게 처리해주는 시스템 Hive는 Hadoop 생태계의 일부분으로 SQL스러운 쿼리 언어로 작성한 쿼리를 MapReduce 잡으로 변환해서 간단하게 병렬 분산 처리 파일 기반의 시스템(특정 레코드 하나 변경하거나 제거 X, 쿼리 실행 시 파일 전체를 조작) 동적으로 데이터를 정의 풍부한 UDF(User-Defined Function)을 활용해서 어려운 문자열 처리가 가능 Amazon Redshift AWS에서 제공하는 분산 병렬 RDB Hive..

빅데이터 시대에 요구되는 분석력?

언어 소개 분산 처리 담당 미들웨어 : Apache Hadoop 클라우드 서비스 : Amazon Redshift, Google Bigquery 미들웨어 부속 도구 : Hadoop - Hue, Amazon Redshift - Aginity 분석 담당자의 과제 스스로 지표 결정해야 함 SQL을 배우지 않은 상태에서는 무엇을 집계하는 지 자체를 생각할 수 없음 데이터 추출 시 SQL 사용해야 함 SQL 사용시 겪는 시행착오에 시간이 더 오래 걸려서 리포트 품질을 담보할 수 없게 됨 => Tableau, Kibana, Power BI 등 시각화 도구가 잘 되어있어서, SQL을 잘 못 써도되더라도 시각화하는데 문제는 없다. 하지만? SQL에 서툰 마케팅 담당자를 고려해서 BI 도구를 도입하더라도 문제 발생 복잡한..

(데이터분석을 위한 SQL 레시피) 실무 위주의 PostgreSQL 공부

이번방학 때에는 sql지식을 oracle, mysql 뿐만 아니라 다른 sql언어도 배우고싶다는 생각이 들어 어떤 언어를 할까 찾던 와중 PostgreSQL이 현업에서도 많이 쓰이고 확장성이 높아서 해당 언어를 공부하게되었다. 해당 책은 현업에서 쓰이는 실무 위주의 내용이 담겨져 있고 책을 통해 배운 쿼리나 예제문들을 통해 도메인에 대한 지식 및 sql 실력을 한층 더 성장할 수 있는 발판이 되었으면 한다.