Jak działa pandas pivot w języku Python? Przykład zastosowania

Pracując z biblioteką Pandas w Pythonie, często musimy przekształcać dane w różne formaty, aby lepiej je analizować. Jednym z kluczowych narzędzi dostępnych w Pandas jest funkcja pivot(), która pozwala na reorganizację tabeli w bardziej czytelny sposób. Jeśli kiedykolwiek zastanawiałeś się, jak działa pandas pivot w języku Python, to ten artykuł szczegółowo to wyjaśni.

Czym jest `pandas.pivot()`?

Funkcja pivot() w Pandas służy do zmiany struktury danych. Pozwala ona na konwersję danych z formatu „długiego” (gdzie każdy wiersz zawiera pojedynczą wartość) do „szerokiego”, gdzie wartości są rozłożone na różne kolumny.

Składnia i parametry `pivot()`

Funkcja pivot() ma następującą składnię:

DataFrame.pivot(index, columns, values)

index – kolumna, która stanie się indeksami w nowej tabeli.
columns – kolumna, której unikalne wartości staną się nagłówkami kolumn.
values – kolumna, której wartości zostaną rozmieszczone w nowej tabeli.

Przykład zastosowania `pandas.pivot()`

Załóżmy, że mamy następujący zbiór danych w formacie długim:

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({
    'Data': ['2024-06-01', '2024-06-01', '2024-06-02', '2024-06-02'],
    'Produkt': ['A', 'B', 'A', 'B'],
    'Sprzedaż': [100, 200, 150, 250]
})

print(df)

Wynikowa tabela wygląda tak:

Data	Produkt	Sprzedaż
2024-06-01	A	100
2024-06-01	B	200
2024-06-02	A	150
2024-06-02	B	250

Teraz użyjmy funkcji pivot(), aby przekształcić te dane:

df_pivot = df.pivot(index='Data', columns='Produkt', values='Sprzedaż')
print(df_pivot)

Wynik będzie wyglądał następująco:

Produkt       A    B
Data                
2024-06-01  100  200
2024-06-02  150  250

Teraz mamy przejrzystą tabelę, gdzie wartości kolumny Produkt stały się nagłówkami kolumn.

Potencjalne błędy i sposoby ich rozwiązania

Kiedy używamy pivot(), możemy napotkać następujące błędy:

ValueError: Index contains duplicate entries – występuje, gdy w danych są duplikaty dla tej samej kombinacji indeksów i kolumn. Można rozważyć użycie pivot_table(), która obsłuży agregację.
KeyError: – błąd ten pojawia się, gdy podana kolumna nie istnieje w DataFrame.
NaN w wynikach: – jeśli niektóre kombinacje indeksów i kolumn nie mają wartości, Pandas wypełni te miejsca NaN.

Kiedy warto używać `pivot()`?

Funkcji pivot() warto używać, gdy:

Chcesz przekonwertować dane z formatu długiego na szeroki.
Masz pewność, że nie ma duplikatów dla unikalnych wartości.
Chcesz lepiej zorganizować dane do analizy wizualnej.

Podsumowanie

Teraz już wiesz, jak działa pandas pivot w języku Python i w jaki sposób można go użyć w praktyce. Jest to narzędzie niezwykle przydatne, gdy chcemy uporządkować dane w czytelny sposób. Pamiętaj jednak, że jeśli napotykasz na błędy związane z duplikatami, warto rozważyć użycie pivot_table(), które oferuje dodatkowe możliwości agregacji danych.

Inny ciekawy artykuł:

Jak działa pandas crosstab w języku Python? Przykład zastosowania

Opanuj analizę danych w Pythonie z moim kursem!

Opanujesz podstawy programowania w Pythonie, w tym typy danych, zmienne, listy, słowniki, funkcje oraz obsługę błędów. Nauczysz się korzystać z biblioteki pandas do zaawansowanej analizy danych i pracy z różnymi rodzajami danych. Zrozumiesz proces analizy, eksploracji (EDA) i wizualizacji. Tworzenie własnych funkcji przygotuje Cię do rozmów kwalifikacyjnych i rozwiązywania rzeczywistych problemów biznesowych.

Zostań analitykiem danych – dołącz do KajoDataSpace!

Najlepsza ścieżka do zawodu analityka danych. Dostęp do pełnych wersji kursów online z Excela, SQLa, PowerBI, Tableau i Pythona z certyfikatami!

🟨 Ekskluzywana ale pomagająca sobie społeczność.
🟩 Ponad 75 godzin materiałów video.
🟨 Spotkania LIVE co miesiąc.
🟩 Mój osobisty mentoring.

Jak działa pandas pivot w języku Python? Przykład zastosowania

Czym jest pandas.pivot()?

Składnia i parametry pivot()

Przykład zastosowania pandas.pivot()