데이터분석 공부/DSBA 4기

파이썬 column 명 바꾸기

이삼오 2024. 3. 7. 22:27

아래의 pop_seoul 데이터프레임을 활용해서 column 이름을 바꿔보려고 한다. 

합계를 인구수로, 한국인을 내국인으로, 등록외국인을 외국인으로, 65세이상고령자를 고령자로 바꾸려 한다. 

 

1. 데이터프레임.rename( )

pop_seoul.rename(columns={pop_seoul.columns[1] : '인구수',
                          pop_seoul.columns[2] : '내국인',
                          pop_seoul.columns[3] : '외국인',
                          pop_seoul.columns[4] : '고령자'},
                 inplace=True)
pop_seoul.head()

 

대상 컬럼을 정수형 인덱스 위치(키)로 불러와 바꿀 이름(밸류)과 대치시킨 딕셔너리를 만들어 columns에 저장,

rename을 사용해 컬럼 명을 바꿨다. 

pop_seoul.rename(columns={'구별' : '인구수',
                          '한국인' : '내국인',
                          '등록외국인' : '외국인',
                          '65세이상고령자' : '고령자'},
                 inplace=True)
pop_seoul.head()

 

컬럼을 인덱스 위치로 불러오지 않고 이름으로 직접 불러오는 것이 더 편리해 보인다.

컬럼 중 일부만 지정해서 변경하려고 할 때 사용하면 좋다. 

 

2. 데이터프레임.columns( )

pop_seoul.columns = ['구별', '인구수', '내국인', '외국인', '고령자']
pop_seoul.head()

 

전체 컬럼의 이름을 리스트 형태로 입력해서 변경하는 방법이다.

기존 컬럼과 바꿀 컬럼 리스트가 동일한 길이를 가져야 하고, 그렇지 않으면 오류가 발생한다.

컬럼의 수가 적을 때, 바꿔야 할 컬럼이 많을 때 사용하기 편하다. 

 

 

이렇듯 다양한 메소드에서 딕셔너리와 리스트 개념이 자주 등장하니 정리해두면 코드를 짤 때 용이하다.