2022년 10월 16일 AI스쿨에 지원할 때부터 가장 기대했던 팀 프로젝트! 두 번째 미니 프로젝트를 기록해보려 한다.비대면으로 진행하는 수업인 데다 전공과 다른 분야라서 학교에서 경험했던 팀 프로젝트와 많이 달라서 새로웠다. 경영학과의 프로젝트란 자고로 PPT와... 밤새서 기업분석 보고서 쓰기...확실히 팀으로 진행하니까 진행이 잘 된다.기한 안에 못 끝내면 미팅 때 아무런 결과물도 보여줄 수 없다는 불안감! 효과가 굉장하다.이번 미니 프로젝트는 kosis의 이혼 데이터를 활용했다. 팀 회의 중에 나가야 했어서 어떤 경로로 이혼이 선정된 건지는 모르지만, 재밌는 주제였다.어차피 도메인 지식도 없으니 재밌으면 그만이다.1 연도별이혼 + 이혼사유2 연도별이혼 + 동거기간3 연도별이혼 + 평균이혼연령총 ..
멋사 ai스쿨 두 번째 자기주도 학습 시간 뭘 하면 좋을지 고민하다가 캐글 데이터로 시각화를 해보기로 결정했다. plot 수업 시간에 코드 받아쓰기만 했던 슬픈 기억 덕분이다. 시각화에 사용할 데이터(Bike Sharing Demand)를 다운받고 업로드한 다음 (colab을 이용했기 때문에 파일로 업로드 했다) https://www.kaggle.com/competitions/bike-sharing-demand/overview 1. 파이썬 환경 설정 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt 데이터를 불러와서 확인하기 데이터 이름이 train이어서 train data => td로 설..
판다스의 대표적인 데이터 타입인 시리즈와 데이터프레임은 비슷하면서도 다르다. 두 타입의 차이점은 표와 같다. 이전의 사진에서 확인했듯 시리즈는 1차원 벡터구조인 반면 데이터프레임은 2차원 행렬구조를 가지고 있다. 시리즈가 여러 개 모인 것을 데이터프레임으로, 데이터프레임을 하나로 쪼갠 것을 시리즈로 볼 수도 있다.
2022.09.22 데이터프레임에서 자주 등장하는 loc와 iloc의 개념, 차이점을 정리해보았다. loc = location 데이터프레임의 행이나 열에 label, boolean array(True, False)로 데이터에 접근 사람이 읽기 편한 라벨로 특정 값을 추출 loc 사용법 df.loc[행 인덱싱 값, 열 인덱싱 값] iloc = inter location 데이터프레임의 행이나 열의 순서를 나타내는 정수(int), 인덱스 값으로 특정값을 추출 정수(숫자)로 접근하기 때문에 컴퓨터가 읽기 좋은 방법 iloc 사용법 df.iloc[행 인덱스, 열 인덱스] loc와 iloc의 실행 방법 df.loc[0] -> 전체 데이터프레임에서 인덱스 이름이 0인 행만 추출 df.iloc[0] -> 전체 데이터프..