프로젝트 4

벅스 차트 크롤링 및 워드클라우드, 감성 분류, 장르 분류

프로젝트를 수행하게 된 계기 : 2023년 6월 22일 제가 좋아하는 이세계아이돌의 새로운 노래 Lockdown이 나왔다 해서 스트리밍을 돌리던 와중 멜론 차트와 벅스 차트를 보던 도중 순위가 점점 올라가는 것을 보았습니다. 그걸 보면서 마침 방학인데 시간도 어느정도 있어서 프로젝트를 하나를 진행하면 좋다고 생각했습니다. 제가 자신있는 분야와 학교에서도 여러번 실행해보았던 워드클라우드, 감성, 장르 분류를 진행하게 되었습니다. 진행상황: colab 환경에서 진행하였습니다. 우선 워드클라우드를 만들기 위한 패키지들을 모두 설치 해줍니다. !pip install requests !pip install BeautifulSoup4 우선 벅스 Top 100차트의 가사 기준으로 워드 클라우드를 만들었습니다. 차트의..

프로젝트 2023.06.26

Move(만보기앱)에 대한 데이터 셋 만들기 및 가공

캡스톤 디자인으로 진행한 Move(만보기앱) 프로젝트를 진행하는 중이다(현재도 진행중) 팀원은 총 3명 나(팀장), 팀원 2명이고 프론트엔드 담당 2명(나, 팀원 1), 백엔드 담당 1명(팀원 2)으로 구성되어 있다. 프로젝트 배경 개인의 건강을 증진시키기 위한 걷기운동의 필요성 랭킹 시스템을 통한 경쟁을 유도해 걷기운동에 대한 동기부여 프로젝트 개발 내용 GPS 연동으로 개인의 속도, 심박수 측정 랭킹 시스템 및 게임의 레벨제도 도입(경험치를 쌓아 레벨업) 지역별, 팀별 대회를 개최해 대결 개인의 평균속도 및 총 걸음걸이를 통해 기록 메뉴에서 확인 활용방안 및 기대효과 현대인의 건강부족 문제에 도움을 줄 수 있다. 기록되는 데이터를 공공데이터로 활용할 수 있다. 자기계발을 통해 성취감을 얻을 수 있다...

프로젝트 2023.06.07

카카오톡 대화 내용 워드클라우드

사이드 프로젝트로 간단하게 카카오톡 대화 내용을 불러와 워드클라우드를 만들어 보았다. 카카오톡 대화내용 가져오기 대화방에서 메뉴 -> 대화내용 -> 대화 내보내기 대화내용을 가져올 시 [이름][시간][대화내용]의 형태로 저장이 되는데 내가 필요한 것은 [대화내용]만 필요하므로 전처리 과정이 필요하다. replace 함수를 사용해 필요없는 내용들 및 불용어들을 처리해준다. 물론 replace를 쓰지 않고도 불용어 담겨져있는 text파일을 따로 열어서 진행하는 방법도 있다. 진행하던 도중 C:\Windows\Fonts에 있는 나눔 폰트 경로 문제인지 자꾸 에러가 뜨는 문제가 생겼었다. OSError: cannot open resource 문제인데 stackoverflow 및 다른 웹사이트쪽에서 검색을 해보니..

프로젝트 2023.01.13

성심당 리뷰를 이용한 긍정, 부정 워드클라우드 프로젝트

프로젝트의 일환으로 성심당(대전의 유명한 빵집)의 리뷰들을 모아 워드클라우드를 만드는 작업을 했다. 코드 작성은 python으로 프로그램은 colab으로 구동했다 리뷰 데이터는 2022년 11월~ 2022년 3월의 리뷰를 인스타, 네이버로부터 추출하였고 인스타의 경우 2022년 3월까지 가지고 오는게 불가능하여 2022년 10월까지만 가지고 오게 되었다(크롤링 도중 봇으로 인식하여 자동으로 종료됨) train set과 test set을 나눈뒤 test set은 NaverInstagram.csv, train set은 ratings_test.txt를 사용했다 총 데이터의 갯수는 6046개 그중 인스타그램은 1076개 네이버는 4970개이다. 우선 작업 도중 경고 메시지가 뜨지 않게 하기 위해서 다음과 같은 ..

프로젝트 2022.12.24