Pandas에서 Column 추가 및 삭제하는 방법
Pandas에서 Column 추가 및 삭제하는 방법
Pandas에서 DataFrame의 Column 추가 및 삭제하는 방법
Pandas는 데이터 분석과 조작을 위한 강력한 Python 라이브러리로, 데이터프레임(DataFrame)이라는 데이터 구조를 사용하여 다양한 작업을 수행할 수 있습니다. 이 글에서는 Pandas에서 데이터프레임의 열(column)을 삭제하고 추가하는 방법을 설명하겠습니다.
1. Pandas 라이브러리 소개
Pandas는 데이터 조작 및 분석을 위한 도구로, 주로 표 형식의 데이터를 처리합니다. 데이터프레임은 2차원 데이터를 담고 있는 구조로, 행과 열로 구성되어 있습니다. Pandas를 사용하면 데이터를 쉽게 추가하고 삭제할 수 있습니다.
Pandas를 사용하기 위해서는 먼저 라이브러리를 설치하고 임포트해야 합니다. 아래의 명령어로 Pandas를 설치할 수 있습니다:
pip install pandas
Pandas를 임포트해보겠습니다.
import pandas as pd
2. DataFrame 생성하기
열을 추가하고 삭제하기 전에, 먼저 데이터프레임을 생성해보겠습니다.
# 예시 데이터 생성
= {
data 'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
= pd.DataFrame(data)
df
print("Original DataFrame:")
print(df)
출력 결과:
Original DataFrame:
Name Age City
0 Alice 25 New York
1 Bob 30 Los Angeles
2 Charlie 35 Chicago
3. 열(column) 삭제하기
3.1. drop()
메서드 사용하기
가장 일반적인 방법은 drop()
메서드를 사용하는 것입니다. 이 메서드는 특정 열을 삭제하고 새로운 데이터프레임을 반환합니다.
예제: drop()
메서드로 열 삭제하기
# 'Age' 열 삭제
= df.drop('Age', axis=1)
df_dropped
print("\nDataFrame after dropping 'Age' column:")
print(df_dropped)
출력 결과:
DataFrame after dropping 'Age' column:
Name City
0 Alice New York
1 Bob Los Angeles
2 Charlie Chicago
코드 설명:
drop('Age', axis=1)
: ‘Age’ 열을 삭제합니다.axis=1
은 열을 의미합니다.df_dropped
: 삭제된 열을 포함하지 않는 새로운 데이터프레임입니다. 원본 데이터프레임은 변경되지 않습니다.
3.2. 원본 데이터프레임에서 직접 삭제하기
drop()
메서드의 inplace
매개변수를 True
로 설정하면 원본 데이터프레임을 직접 수정할 수 있습니다.
# 원본 DataFrame에서 'City' 열 삭제
'City', axis=1, inplace=True)
df.drop(
print("\nDataFrame after dropping 'City' column (inplace):")
print(df)
출력 결과:
DataFrame after dropping 'City' column (inplace):
Name
0 Alice
1 Bob
2 Charlie
코드 설명:
inplace=True
: 원본 데이터프레임을 직접 수정하여 ‘City’ 열을 삭제합니다.
4. 열(column) 추가하기
4.1. 새로운 열 추가하기
Pandas에서 새로운 열을 추가하는 방법은 매우 간단합니다. 데이터프레임에 열 이름을 키로 사용하고, 추가할 값을 할당하면 됩니다.
예제: 새로운 열 추가하기
# 'Country' 열 추가
'Country'] = ['USA', 'USA', 'USA']
df[
print("\nDataFrame after adding 'Country' column:")
print(df)
출력 결과:
DataFrame after adding 'Country' column:
Name Country
0 Alice USA
1 Bob USA
2 Charlie USA
코드 설명:
df['Country'] = ['USA', 'USA', 'USA']
: ’Country’라는 이름의 새로운 열을 추가하고, 각 행에 대해 값을 지정합니다.
4.2. 조건에 따라 새로운 열 추가하기
조건에 따라 새로운 열을 추가할 수도 있습니다. 예를 들어, 나이에 따라 성인 여부를 표시하는 열을 추가할 수 있습니다.
예제: 조건에 따른 열 추가하기
# 'Is_Adult' 열 추가 (나이가 18세 이상인 경우 True)
'Is_Adult'] = df['Age'] >= 18
df[
print("\nDataFrame after adding 'Is_Adult' column:")
print(df)
출력 결과:
DataFrame after adding 'Is_Adult' column:
Name Country Age Is_Adult
0 Alice USA 25 True
1 Bob USA 30 True
2 Charlie USA 35 True
코드 설명:
df['Is_Adult'] = df['Age'] >= 18
: ‘Age’ 열의 값이 18 이상인 경우 True, 그렇지 않은 경우 False로 설정하여 ’Is_Adult’라는 새로운 열을 추가합니다.
5. 결론
Pandas에서는 데이터프레임의 열을 쉽게 추가하고 삭제할 수 있습니다. drop()
메서드를 사용하여 열을 삭제하고, 데이터프레임에 열 이름을 키로 사용하여 새로운 열을 추가할 수 있습니다. 이러한 작업은 데이터 전처리 과정에서 매우 유용하며, 데이터 분석의 효율성을 높일 수 있습니다.