데이터분석 33

R언어 공부 - 1

R은 동적 타입 언어(Dynamically typed language)이기 때문에 변수의 자료형을 마음대로 바꿀 수 있다는 장점이 있다. 또한 다양한 통계, 시각화 패키지들이 존재하여 손쉽게 꺼내쓸 수 있다는 점이다. 또한 오픈소스이고 직관적이고 쉽게 데이터 전처리가 가능하다는 점이다. 하지만 단점으로는 모든 데이터를 메모리에 로딩한 후 처리하기에 속도 측면에서 불리하다. 불필요한 데이터 저장으로 메모리 부족 현상이 일어난다. 1) Cat cat 함수는 print의 대안으로, 여러 개의 항목을 묶어서 출력할 때 쓰임 추가로 한 줄을 끝내고 싶을 때에는 \n 개행 문자 삽입 하지만 행렬이나 리스트 같은 데이터 구조는 출력할 수 없다는 점 > cat(pi, 2*pi, sqrt(3)) 3.141593 6.28..

데이터분석/R 2022.12.26

빅데이터 분석기사 작업 유형 2 - 데이터 전처리

다음은 펭귄 데이터를 이용하여 빅데이터 분석기사에서 활용할 수 있는 전처리에 대해 설명하고자 합니다. # 작업 유형2 - 데이터 전처리 # 펭귄 데이터를 이용해서 전처리 import seaborn as sns df = sns.load_dataset('penguins') print(df.head()) # 결과 species island bill_length_mm bill_depth_mm flipper_length_mm \ 0 Adelie Torgersen 39.1 18.7 181.0 1 Adelie Torgersen 39.5 17.4 186.0 2 Adelie Torgersen 40.3 18.0 195.0 3 Adelie Torgersen NaN NaN NaN 4 Adelie Torgersen 36.7 1..

데이터분석 2022.08.09

빅데이터분석기사 작업형 유형 1 문제 모음

# 작업형 유형 1 문제(1) # alcohol이 상위 10번째 값으로 1~10위의 범위 값으로 변경 후 # speeding가 7이상의 alcohol 데이터들의 평균 산출 # print만 출력 import numpy as np import pandas as pd import seaborn as sns sns.get_dataset_names() df = sns.load_dataset('car_crashes') print(df.head()) # 결과 total speeding alcohol not_distracted no_previous ins_premium \ 0 18.8 7.332 5.640 18.048 15.040 784.55 1 18.1 7.421 4.525 16.290 17.014 1053.48 2..

데이터분석 2022.08.09