Pandas에서 Column 추가 및 삭제하는 방법

Pandas에서 Column 추가 및 삭제하는 방법

Pandas
Pandas에서 Column 추가 및 삭제하는 방법
Author

gabriel yang

Published

October 3, 2024

Pandas에서 DataFrame의 Column 추가 및 삭제하는 방법

Pandas는 데이터 분석과 조작을 위한 강력한 Python 라이브러리로, 데이터프레임(DataFrame)이라는 데이터 구조를 사용하여 다양한 작업을 수행할 수 있습니다. 이 글에서는 Pandas에서 데이터프레임의 열(column)을 삭제하고 추가하는 방법을 설명하겠습니다.

1. Pandas 라이브러리 소개

Pandas는 데이터 조작 및 분석을 위한 도구로, 주로 표 형식의 데이터를 처리합니다. 데이터프레임은 2차원 데이터를 담고 있는 구조로, 행과 열로 구성되어 있습니다. Pandas를 사용하면 데이터를 쉽게 추가하고 삭제할 수 있습니다.

Pandas를 사용하기 위해서는 먼저 라이브러리를 설치하고 임포트해야 합니다. 아래의 명령어로 Pandas를 설치할 수 있습니다:

pip install pandas

Pandas를 임포트해보겠습니다.

import pandas as pd

2. DataFrame 생성하기

열을 추가하고 삭제하기 전에, 먼저 데이터프레임을 생성해보겠습니다.

# 예시 데이터 생성
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

print("Original DataFrame:")
print(df)

출력 결과:

Original DataFrame:
      Name  Age         City
0    Alice   25     New York
1      Bob   30  Los Angeles
2  Charlie   35      Chicago

3. 열(column) 삭제하기

3.1. drop() 메서드 사용하기

가장 일반적인 방법은 drop() 메서드를 사용하는 것입니다. 이 메서드는 특정 열을 삭제하고 새로운 데이터프레임을 반환합니다.

예제: drop() 메서드로 열 삭제하기

# 'Age' 열 삭제
df_dropped = df.drop('Age', axis=1)

print("\nDataFrame after dropping 'Age' column:")
print(df_dropped)

출력 결과:

DataFrame after dropping 'Age' column:
      Name         City
0    Alice     New York
1      Bob  Los Angeles
2  Charlie      Chicago

코드 설명:

  • drop('Age', axis=1): ‘Age’ 열을 삭제합니다. axis=1은 열을 의미합니다.

  • df_dropped: 삭제된 열을 포함하지 않는 새로운 데이터프레임입니다. 원본 데이터프레임은 변경되지 않습니다.

3.2. 원본 데이터프레임에서 직접 삭제하기

drop() 메서드의 inplace 매개변수를 True로 설정하면 원본 데이터프레임을 직접 수정할 수 있습니다.

# 원본 DataFrame에서 'City' 열 삭제
df.drop('City', axis=1, inplace=True)

print("\nDataFrame after dropping 'City' column (inplace):")
print(df)

출력 결과:

DataFrame after dropping 'City' column (inplace):
      Name
0    Alice
1      Bob
2  Charlie

코드 설명:

  • inplace=True: 원본 데이터프레임을 직접 수정하여 ‘City’ 열을 삭제합니다.

4. 열(column) 추가하기

4.1. 새로운 열 추가하기

Pandas에서 새로운 열을 추가하는 방법은 매우 간단합니다. 데이터프레임에 열 이름을 키로 사용하고, 추가할 값을 할당하면 됩니다.

예제: 새로운 열 추가하기

# 'Country' 열 추가
df['Country'] = ['USA', 'USA', 'USA']

print("\nDataFrame after adding 'Country' column:")
print(df)

출력 결과:

DataFrame after adding 'Country' column:
      Name  Country
0    Alice      USA
1      Bob      USA
2  Charlie      USA

코드 설명:

  • df['Country'] = ['USA', 'USA', 'USA']: ’Country’라는 이름의 새로운 열을 추가하고, 각 행에 대해 값을 지정합니다.

4.2. 조건에 따라 새로운 열 추가하기

조건에 따라 새로운 열을 추가할 수도 있습니다. 예를 들어, 나이에 따라 성인 여부를 표시하는 열을 추가할 수 있습니다.

예제: 조건에 따른 열 추가하기

# 'Is_Adult' 열 추가 (나이가 18세 이상인 경우 True)
df['Is_Adult'] = df['Age'] >= 18

print("\nDataFrame after adding 'Is_Adult' column:")
print(df)

출력 결과:

DataFrame after adding 'Is_Adult' column:
      Name  Country  Age  Is_Adult
0    Alice      USA   25      True
1      Bob      USA   30      True
2  Charlie      USA   35      True

코드 설명:

  • df['Is_Adult'] = df['Age'] >= 18: ‘Age’ 열의 값이 18 이상인 경우 True, 그렇지 않은 경우 False로 설정하여 ’Is_Adult’라는 새로운 열을 추가합니다.

5. 결론

Pandas에서는 데이터프레임의 열을 쉽게 추가하고 삭제할 수 있습니다. drop() 메서드를 사용하여 열을 삭제하고, 데이터프레임에 열 이름을 키로 사용하여 새로운 열을 추가할 수 있습니다. 이러한 작업은 데이터 전처리 과정에서 매우 유용하며, 데이터 분석의 효율성을 높일 수 있습니다.

Date Title Author
Jan 1, 3000 전체 카테고리 gabriel yang
Oct 3, 2024 Pandas 데이터프레임 mongodb에 저장하기 gabriel yang
Sep 21, 2024 Pandas에서 결측치(NaN) 처리하기 gabriel yang
Sep 11, 2024 Pandas SQL 쿼리 이용하기 gabriel yang
Aug 29, 2024 Pandas에서 데이터 형식 변경하기 gabriel yang
Aug 29, 2024 Pandas에서 데이터를 정렬하는 방법 gabriel yang
Aug 29, 2024 Pandas에서 인덱싱 및 슬라이싱하는 방법 gabriel yang
Aug 27, 2024 Pandas SQL 데이터베이스 읽어오기 gabriel yang
Aug 26, 2024 Pandas groupby 사용방법 gabriel yang
Aug 26, 2024 Pandas에서 두 개의 데이터프레임을 연결하기 gabriel yang
Aug 24, 2024 Pandas에서 melt를 사용해야 하는 데이터 유형과 사용 방법 gabriel yang
Aug 24, 2024 Pandas에서 pivot_table 사용하기 gabriel yang
Aug 24, 2024 Pandas에서 reset_index를 사용해야 하는 이유 gabriel yang
Aug 22, 2024 Pandas Excel과 CSV 파일을 읽어오는 방법 gabriel yang
Aug 19, 2024 Pandas DataFrame의 컬럼 이름 변경하기 gabriel yang
Aug 17, 2024 Pandas SettingWithCopyWarning 문제 해결 gabriel yang
Nov 30, 2023 Dataframe을 Dict로 생성 및 변환 gabriel yang
Nov 29, 2023 python datetime 사용법 정리 gabriel yang
Sep 14, 2023 Pandas 중복 데이터 제거하기 gabriel yang
No matching items
Back to BLOG LIST