어떻게 마무리했는지 모르게 중간 프로젝트가 끝나고 바로 파이널 프로젝트가 시작되었다. 이번엔 AI 허브 데이터를 사용하는데 데이터 형식이 정말... 모든 정보가 때려넣어진 json 파일과 씨름하고 있다. 용량은 또 얼마나 큰지 json 파일로 12GB나 된다. 로컬에 다운로드 하느라 시간 쓰고 구글 드라이브 올리느라 시간 쓰고 이게 맞는지 모르겠다.
전처리를 한 번에 하려고 코드를 짰는데 용량이 너무 커서 한 시간 넘게 돌려보다가 포기했다. 욕심 부리지 말고 나눠서 하자. 샘플 데이터로 코드를 돌리는 중인데 데이터가 240개인데 고유값은 222개가 나와서 약간 막막해졌다. 데이터 설명서에도 고유값이라고 했는데. 혹시 내가 모르는 사이에 고유값의 뜻이 바뀌었나.
'프로젝트' 카테고리의 다른 글
로컬 프로젝트 폴더 GitHub 업로드 / There isn’t anything to compare / everything up-to-date 에러 해결 (0) | 2024.07.01 |
---|---|
최종 프로젝트 2주차 TIL : 한글 데이터 너무 무섭다... (1) | 2024.06.12 |
티스토리 hELLO 스킨 본문 글자색, 코드블럭 테마 커스텀 (0) | 2024.04.03 |
Colab에서 Kaggle api로 데이터 다운 받아서 사용하기 (0) | 2024.03.27 |
이혼 사유 별 발생 건수는 어떻게 변화했을까? : 파이썬 데이터분석 프로젝트 (0) | 2024.03.05 |