아래의 pop_seoul 데이터프레임을 활용해서 column 이름을 바꿔보려고 한다.
합계를 인구수로, 한국인을 내국인으로, 등록외국인을 외국인으로, 65세이상고령자를 고령자로 바꾸려 한다.
1. 데이터프레임.rename( )
pop_seoul.rename(columns={pop_seoul.columns[1] : '인구수',
pop_seoul.columns[2] : '내국인',
pop_seoul.columns[3] : '외국인',
pop_seoul.columns[4] : '고령자'},
inplace=True)
pop_seoul.head()
대상 컬럼을 정수형 인덱스 위치(키)로 불러와 바꿀 이름(밸류)과 대치시킨 딕셔너리를 만들어 columns에 저장,
rename을 사용해 컬럼 명을 바꿨다.
pop_seoul.rename(columns={'구별' : '인구수',
'한국인' : '내국인',
'등록외국인' : '외국인',
'65세이상고령자' : '고령자'},
inplace=True)
pop_seoul.head()
컬럼을 인덱스 위치로 불러오지 않고 이름으로 직접 불러오는 것이 더 편리해 보인다.
컬럼 중 일부만 지정해서 변경하려고 할 때 사용하면 좋다.
2. 데이터프레임.columns( )
pop_seoul.columns = ['구별', '인구수', '내국인', '외국인', '고령자']
pop_seoul.head()
전체 컬럼의 이름을 리스트 형태로 입력해서 변경하는 방법이다.
기존 컬럼과 바꿀 컬럼 리스트가 동일한 길이를 가져야 하고, 그렇지 않으면 오류가 발생한다.
컬럼의 수가 적을 때, 바꿔야 할 컬럼이 많을 때 사용하기 편하다.
이렇듯 다양한 메소드에서 딕셔너리와 리스트 개념이 자주 등장하니 정리해두면 코드를 짤 때 용이하다.
'데이터분석 공부 > DSBA 4기' 카테고리의 다른 글
파이썬 데이터프레임 astype( ) 으로 데이터 자료형 변경하기 (0) | 2024.03.08 |
---|---|
파이썬 str.replace( ) 메소드로 데이터프레임 속 문자 변경하기 (1) | 2024.03.07 |
07/03/2024 TIL (0) | 2024.03.07 |
pandas 데이터프레임 loc와 iloc 비교 정리 (0) | 2024.03.06 |
05/03/2024 헷갈리는 for문 (0) | 2024.03.05 |