1. str.replace( ) 추천하지 않는 경우 파이썬에서 데이터프레임 속 문자열 데이터를 변경(대체)할 때 주로 str.replace 메서드를 사용한다. 오늘은 이 메서드를 사용하면 안 되는 경우에 대해 알아보겠다. 아래는 UCI 머신러닝 저장소에서 제공하는 자동차 연비 데이터(auto mpg data)로 연비, 실린더 수, 배기량, 출력, 차종, 가속능력, 출시년도, 제조국, 모델명 정보를 담고 있다. car_name을 제외한 컬럼들은 숫자형 데이터로 보이지만 df.info( )로 데이터 타입을 확인해보면 horse_power 컬럼이 object 타입임을 알 수 있다. car_names를 제외한 컬럼들을 계산이 가능한 데이터 타입으로 변경하려 한다. horsepower 컬럼에는 소수점이 있는 숫자..
1. astype( ) 메서드 사용법 데이터프레임 속의 데이터 타입을 바꿔주는 astype( ) 메서드 사용법은 다음과 같다. df.astype(dtype, copy=True, errors='raies') - dtype : 변경할 데이터 타입을 입력한다. - copy : 사본 생성 여부로 bool 타입으로 입력한다. 입력하지 않을 때 기본값은 True로 copy=False는 원본 데이터를 변경시키므로 주의가 필요하다. - errors : 데이터 타입을 오류를 발생시킬지 여부로 'raies', 'ignore' 로 입력한다. 'raies' : 오류 발생 O => 오류 문구가 반환된다. 'ignore' : 오류 발생 X => 변경 불가능한 요소는 기존 dtype 그대로 보존된다. 2. astype( ) 메서드..
1. str.replace( ) 메소드 사용법 파이썬에서 str.replace() 메소드를 사용하는 방법은 다음과 같다. str.replace('변경할 문자', '변경 후 문자') str.replace('변경할 문자', '변경 후 문자', 횟수) 2. str.replace( ) 메소드 사용 예시 아래의 pop_seoul 데이터프레임에서 인구수, 내국인, 외국인, 고령자 컬럼의 데이터들을 int 타입으로 바꾸려 한다. 이를 위해 우선 데이터에 있는 콤마 , 를 없애보자. 2-1. srt.replace( ) pop_seoul['인구수'] = pop_seoul['인구수'].str.replace(',', '') pop_seoul['내국인'] = pop_seoul['내국인'].str.replace(',', '')..
아래의 pop_seoul 데이터프레임을 활용해서 column 이름을 바꿔보려고 한다. 합계를 인구수로, 한국인을 내국인으로, 등록외국인을 외국인으로, 65세이상고령자를 고령자로 바꾸려 한다. 1. 데이터프레임.rename( ) pop_seoul.rename(columns={pop_seoul.columns[1] : '인구수', pop_seoul.columns[2] : '내국인', pop_seoul.columns[3] : '외국인', pop_seoul.columns[4] : '고령자'}, inplace=True) pop_seoul.head() 대상 컬럼을 정수형 인덱스 위치(키)로 불러와 바꿀 이름(밸류)과 대치시킨 딕셔너리를 만들어 columns에 저장, rename을 사용해 컬럼 명을 바꿨다. pop_s..