
Jak działa pandas rename w języku Python? Przykład zastosowania
W pracy z biblioteką pandas
w języku Python bardzo często pojawia się potrzeba zmiany nazw kolumn lub indeksów w ramach naszego DataFrame’a. Na szczęście mamy do tego dedykowaną metodę rename()
, która pozwala na szybkie i wygodne dostosowanie naszego zestawu danych. Dzisiaj pokażę Ci, jak działa pandas.rename()
i przedstawię praktyczne przykłady jego zastosowania.
Podstawowa składnia pandas.rename()
Metoda rename()
umożliwia zmianę nazw kolumn lub indeksów w DataFrame. Oto jej podstawowa składnia:
DataFrame.rename(
mapper=None,
index=None,
columns=None,
axis=None,
inplace=False
)
Kluczowe parametry, które możemy wykorzystać:
index
– słownik mapujący stare indeksy na nowe, dzięki któremu możemy zmieniać nazwy wierszy.columns
– słownik mapujący nazwy kolumn na nowe, co jest najczęściej używaną opcją.axis
– można ustawić na0
(indeksy) lub1
(kolumny), ale zazwyczaj korzystamy bezpośrednio zindex
icolumns
.inplace
– jeżeli ustawimyTrue
, zmiany zostaną zapisane bez konieczności przypisywania nowego DataFrame’a.
Zmiana nazw kolumn w DataFrame
Najczęstszym zastosowaniem rename()
jest zmiana nazw kolumn w DataFrame. Spójrzmy na przykład:
import pandas as pd
# Tworzymy przykładowy DataFrame
df = pd.DataFrame({
'stary_kolumna1': [1, 2, 3],
'stary_kolumna2': [4, 5, 6]
})
# Zmieniamy nazwy kolumn za pomocą rename
df = df.rename(columns={'stary_kolumna1': 'nowa_kolumna1', 'stary_kolumna2': 'nowa_kolumna2'})
print(df)
Efektem działania kodu będzie DataFrame z nowymi nazwami kolumn:
nowa_kolumna1 | nowa_kolumna2 |
---|---|
1 | 4 |
2 | 5 |
3 | 6 |
Zmiana indeksów w DataFrame
Oprócz kolumn możemy również zmienić nazwy indeksów:
df.index = ['A', 'B', 'C']
# Zmiana indeksów za pomocą rename
df = df.rename(index={'A': 'X', 'B': 'Y'})
print(df)
Teraz pierwszy indeks zmieniony został z ‘A’ na ‘X’, a drugi z ‘B’ na ‘Y’.
Użycie parametru inplace
Jeśli nie chcemy przypisywać ponownie DataFrame’a, możemy użyć parametru inplace=True
:
df.rename(columns={'nowa_kolumna1': 'kolumna_A'}, inplace=True)
Teraz zmiana zostanie zapisana od razu, bez konieczności przypisywania zmiennej.
Zastosowanie funkcji w rename()
Metoda rename()
pozwala także używać funkcji do zmiany nazw kolumn lub indeksów. Możemy np. zmienić wszystkie nazwy kolumn na wielkie litery:
df = df.rename(columns=str.upper)
Teraz wszystkie nazwy kolumn zostaną przekonwertowane do wielkich liter.
Podsumowanie
Metoda pandas.rename()
jest niezwykle użytecznym narzędziem w pracy z danymi. Dzięki niej możemy w prosty sposób:
- Zmieniać nazwy kolumn za pomocą słownika.
- Modyfikować indeksy wierszy.
- Stosować funkcje do masowej zmiany nazw.
- Korzystać z parametru
inplace
, aby dokonać zmian bez przypisywania nowego DataFrame’a.
To stosunkowo niewielka, ale bardzo przydatna funkcjonalność biblioteki pandas
, którą warto mieć w swoim arsenale, pracując z danymi w języku Python.
Opanuj analizę danych w Pythonie z moim kursem!
Opanujesz podstawy programowania w Pythonie, w tym typy danych, zmienne, listy, słowniki, funkcje oraz obsługę błędów. Nauczysz się korzystać z biblioteki pandas do zaawansowanej analizy danych i pracy z różnymi rodzajami danych. Zrozumiesz proces analizy, eksploracji (EDA) i wizualizacji. Tworzenie własnych funkcji przygotuje Cię do rozmów kwalifikacyjnych i rozwiązywania rzeczywistych problemów biznesowych.
Zostań analitykiem danych – dołącz do KajoDataSpace!
Najlepsza ścieżka do zawodu analityka danych. Dostęp do pełnych wersji kursów online z Excela, SQLa, Tableau i Pythona z certyfikatami + specjalistycznych webinarów z PowerBI.
Ekskluzywana ale pomagająca sobie społeczność.
Ponad 61 godzin materiałów video.
Spotkania LIVE co miesiąc.
Mój osobisty mentoring.