Pandas에서 Column 추가 및 삭제하는 방법

Pandas에서 Column 추가 및 삭제하는 방법

Pandas
Pandas에서 Column 추가 및 삭제하는 방법
Author

gabriel yang

Published

October 3, 2024


Pandas에서 DataFrame의 Column 추가 및 삭제하는 방법

Pandas는 데이터 분석과 조작을 위한 강력한 Python 라이브러리로, 데이터프레임(DataFrame)이라는 데이터 구조를 사용하여 다양한 작업을 수행할 수 있습니다. 이 글에서는 Pandas에서 데이터프레임의 열(column)을 삭제하고 추가하는 방법을 설명하겠습니다.

1. Pandas 라이브러리 소개

Pandas는 데이터 조작 및 분석을 위한 도구로, 주로 표 형식의 데이터를 처리합니다. 데이터프레임은 2차원 데이터를 담고 있는 구조로, 행과 열로 구성되어 있습니다. Pandas를 사용하면 데이터를 쉽게 추가하고 삭제할 수 있습니다.

Pandas를 사용하기 위해서는 먼저 라이브러리를 설치하고 임포트해야 합니다. 아래의 명령어로 Pandas를 설치할 수 있습니다:

pip install pandas

Pandas를 임포트해보겠습니다.

import pandas as pd

2. DataFrame 생성하기

열을 추가하고 삭제하기 전에, 먼저 데이터프레임을 생성해보겠습니다.

# 예시 데이터 생성
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

print("Original DataFrame:")
print(df)

출력 결과:

Original DataFrame:
      Name  Age         City
0    Alice   25     New York
1      Bob   30  Los Angeles
2  Charlie   35      Chicago

3. 열(column) 삭제하기

3.1. drop() 메서드 사용하기

가장 일반적인 방법은 drop() 메서드를 사용하는 것입니다. 이 메서드는 특정 열을 삭제하고 새로운 데이터프레임을 반환합니다.

예제: drop() 메서드로 열 삭제하기

# 'Age' 열 삭제
df_dropped = df.drop('Age', axis=1)

print("\nDataFrame after dropping 'Age' column:")
print(df_dropped)

출력 결과:

DataFrame after dropping 'Age' column:
      Name         City
0    Alice     New York
1      Bob  Los Angeles
2  Charlie      Chicago

코드 설명:

  • drop('Age', axis=1): ‘Age’ 열을 삭제합니다. axis=1은 열을 의미합니다.

  • df_dropped: 삭제된 열을 포함하지 않는 새로운 데이터프레임입니다. 원본 데이터프레임은 변경되지 않습니다.

3.2. 원본 데이터프레임에서 직접 삭제하기

drop() 메서드의 inplace 매개변수를 True로 설정하면 원본 데이터프레임을 직접 수정할 수 있습니다.

# 원본 DataFrame에서 'City' 열 삭제
df.drop('City', axis=1, inplace=True)

print("\nDataFrame after dropping 'City' column (inplace):")
print(df)

출력 결과:

DataFrame after dropping 'City' column (inplace):
      Name
0    Alice
1      Bob
2  Charlie

코드 설명:

  • inplace=True: 원본 데이터프레임을 직접 수정하여 ‘City’ 열을 삭제합니다.

4. 열(column) 추가하기

4.1. 새로운 열 추가하기

Pandas에서 새로운 열을 추가하는 방법은 매우 간단합니다. 데이터프레임에 열 이름을 키로 사용하고, 추가할 값을 할당하면 됩니다.

예제: 새로운 열 추가하기

# 'Country' 열 추가
df['Country'] = ['USA', 'USA', 'USA']

print("\nDataFrame after adding 'Country' column:")
print(df)

출력 결과:

DataFrame after adding 'Country' column:
      Name  Country
0    Alice      USA
1      Bob      USA
2  Charlie      USA

코드 설명:

  • df['Country'] = ['USA', 'USA', 'USA']: ’Country’라는 이름의 새로운 열을 추가하고, 각 행에 대해 값을 지정합니다.

4.2. 조건에 따라 새로운 열 추가하기

조건에 따라 새로운 열을 추가할 수도 있습니다. 예를 들어, 나이에 따라 성인 여부를 표시하는 열을 추가할 수 있습니다.

예제: 조건에 따른 열 추가하기

# 'Is_Adult' 열 추가 (나이가 18세 이상인 경우 True)
df['Is_Adult'] = df['Age'] >= 18

print("\nDataFrame after adding 'Is_Adult' column:")
print(df)

출력 결과:

DataFrame after adding 'Is_Adult' column:
      Name  Country  Age  Is_Adult
0    Alice      USA   25      True
1      Bob      USA   30      True
2  Charlie      USA   35      True

코드 설명:

  • df['Is_Adult'] = df['Age'] >= 18: ‘Age’ 열의 값이 18 이상인 경우 True, 그렇지 않은 경우 False로 설정하여 ’Is_Adult’라는 새로운 열을 추가합니다.

5. 결론

Pandas에서는 데이터프레임의 열을 쉽게 추가하고 삭제할 수 있습니다. drop() 메서드를 사용하여 열을 삭제하고, 데이터프레임에 열 이름을 키로 사용하여 새로운 열을 추가할 수 있습니다. 이러한 작업은 데이터 전처리 과정에서 매우 유용하며, 데이터 분석의 효율성을 높일 수 있습니다.