행 인덱스 재배열 - reindex( ) 메소드를 사용해 데이터프레임의 행 인덱스를 새로운 배열로 재지정할 수 있음 DataFrame 객체.reindex( ) 행 인덱스 초기화 - reset_index( ) 메소드를 활용해 행 인덱스를 정수형 인덱스로 초기화 - 이 때 기존 인덱스는 컬럼으로 이동한다 행 인덱스 정렬 - ascending을 활용해 인덱스를 오름차순, 내림차순 정렬 가능 - 기본값 True(오름차순) - Fasle로 정해서 내림차순 가능 특정 열의 데이터값을 기준으로 데이터프레임 정렬 - sort_values( ) 메소드 사용 DataFrame 객체.sort_values(by='기준 컬럼 명', ascending) 산술 연산 - 판다스 객체의 산술연산은 내부적으로 3단계 프로세스를 거친다 ..
데이터분석 공부
이전에 loc와 iloc를 정리한 글이 있지만 다시 읽어보니 헷갈리는 부분이 많아서 새롭게 다시 정리했다. 1. loc - 인덱스 이름(index label) 탐색 - 인덱스 이름이 숫자일 경우 loc[0] -> 이 경우 iloc와 유사한 형태이지만 위치 인덱스를 나타내는 건 아니다. - 사용법 - df.loc[행 인덱스 이름] - df.loc[행 인덱스 이름, 열 인덱스 이름] - 범위 지정 가능(범위의 끝 포함) - loc[3 : 7] -> 3, 4, 5, 6, 7 (7 포함) - loc['a' : 'c'] -> 'a', 'b', 'c' 2. iloc - 정수형 위치 인덱스(interger location) 탐색 => 우리 눈에는 보이지 않지만 인덱스에는 순서대로 위치가 존재한다. - 사용법 - df..
지금까지 for문을 천 번은 썼을 텐데 아직도 너무 헷갈린다. 그때그때 제대로 이해하고 넘어가지 않아서 그렇다. 치다보면 이해될 줄 알았지. 여전히 감으로 for문을 쓰고 있었는데 오늘 수업을 들으면서 좀 정리했다. 내일은 for문과 while문의 차이를 정리해야겠다. for문의 기본 구조는 다음과 같다. ``` for 변수 in 리스트(또는 튜플, 문자열): 수행할_문장1 수행할_문장2 ... ``` 리스트나 튜플, 문자열의 첫 번째 요소부터 마지막 요소까지 차례로 변수에 대입되어 ‘수행할_문장1’, ‘수행할_문장2’ 등이 수행된다. for 문 안의 문장을 수행하는 도중 continue 문을 만나면 for 문의 처음으로 돌아간다. range 함수 숫자 리스트를 자동으로 만들어준다. 사용 시 주의점 ra..
= 와 == 의 차이 =은 할당연산자로, 우항의 피연산자(operand)를 좌항의 피연산자에 할당한다. ex) a = [1, 2, 3] ==은 비교연산자로, 두 객체(숫자, 문자열, 리스트, 튜플 등)의 값을 비교하여 같으면 True, 다르면 False를 반환한다. ex) a = [1, 2, 3] a == [1, 2, 3] >>> True a == [1, 2, 4] >>> False == 와 is ==은 비교연산자로, 두 객체의 값(내용)을 비교하여 객체의 내용이 같으면 True, 다르면 False를 반환한다. ex) 5 == 5.0 >>> True is는 식별연산자로, 두 객체의 메모리 주소를 비교하여 같으면 True, 다르면 False를 반환한다. 객체의 내용이 같아도 메모리 주소가 다르다면 Fals..