Jak działa pandas rename w języku Python? Przykład zastosowania

Jak działa pandas rename w języku Python? Przykład zastosowania
„`html

Jak działa pandas rename w języku Python? Przykład zastosowania

W pracy z biblioteką pandas w języku Python bardzo często pojawia się potrzeba zmiany nazw kolumn lub indeksów w ramach naszego DataFrame’a. Na szczęście mamy do tego dedykowaną metodę rename(), która pozwala na szybkie i wygodne dostosowanie naszego zestawu danych. Dzisiaj pokażę Ci, jak działa pandas.rename() i przedstawię praktyczne przykłady jego zastosowania.

Podstawowa składnia pandas.rename()

Metoda rename() umożliwia zmianę nazw kolumn lub indeksów w DataFrame. Oto jej podstawowa składnia:


DataFrame.rename(
    mapper=None, 
    index=None, 
    columns=None, 
    axis=None, 
    inplace=False
)

Kluczowe parametry, które możemy wykorzystać:

  • index – słownik mapujący stare indeksy na nowe, dzięki któremu możemy zmieniać nazwy wierszy.
  • columns – słownik mapujący nazwy kolumn na nowe, co jest najczęściej używaną opcją.
  • axis – można ustawić na 0 (indeksy) lub 1 (kolumny), ale zazwyczaj korzystamy bezpośrednio z index i columns.
  • inplace – jeżeli ustawimy True, zmiany zostaną zapisane bez konieczności przypisywania nowego DataFrame’a.

Zmiana nazw kolumn w DataFrame

Najczęstszym zastosowaniem rename() jest zmiana nazw kolumn w DataFrame. Spójrzmy na przykład:


import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({
    'stary_kolumna1': [1, 2, 3],
    'stary_kolumna2': [4, 5, 6]
})

# Zmieniamy nazwy kolumn za pomocą rename
df = df.rename(columns={'stary_kolumna1': 'nowa_kolumna1', 'stary_kolumna2': 'nowa_kolumna2'})

print(df)

Efektem działania kodu będzie DataFrame z nowymi nazwami kolumn:

nowa_kolumna1 nowa_kolumna2
1 4
2 5
3 6

Zmiana indeksów w DataFrame

Oprócz kolumn możemy również zmienić nazwy indeksów:


df.index = ['A', 'B', 'C']

# Zmiana indeksów za pomocą rename
df = df.rename(index={'A': 'X', 'B': 'Y'})

print(df)

Teraz pierwszy indeks zmieniony został z ‘A’ na ‘X’, a drugi z ‘B’ na ‘Y’.

Użycie parametru inplace

Jeśli nie chcemy przypisywać ponownie DataFrame’a, możemy użyć parametru inplace=True:


df.rename(columns={'nowa_kolumna1': 'kolumna_A'}, inplace=True)

Teraz zmiana zostanie zapisana od razu, bez konieczności przypisywania zmiennej.

Zastosowanie funkcji w rename()

Metoda rename() pozwala także używać funkcji do zmiany nazw kolumn lub indeksów. Możemy np. zmienić wszystkie nazwy kolumn na wielkie litery:


df = df.rename(columns=str.upper)

Teraz wszystkie nazwy kolumn zostaną przekonwertowane do wielkich liter.

Podsumowanie

Metoda pandas.rename() jest niezwykle użytecznym narzędziem w pracy z danymi. Dzięki niej możemy w prosty sposób:

  • Zmieniać nazwy kolumn za pomocą słownika.
  • Modyfikować indeksy wierszy.
  • Stosować funkcje do masowej zmiany nazw.
  • Korzystać z parametru inplace, aby dokonać zmian bez przypisywania nowego DataFrame’a.

To stosunkowo niewielka, ale bardzo przydatna funkcjonalność biblioteki pandas, którą warto mieć w swoim arsenale, pracując z danymi w języku Python.

„` Inny ciekawy artykuł: Jak działa pandas assign w języku Python? Przykład zastosowania
KajoDataSpace