
W pracy z danymi w Pythonie biblioteka pandas
to jedno z najpotężniejszych narzędzi. Jedną z jej kluczowych funkcji jest cumsum()
, pozwalająca na obliczanie skumulowanej sumy wartości w kolumnach lub wierszach. Jeśli zastanawiasz się, jak działa pandas.cumsum()
w języku Python, to jesteś we właściwym miejscu. Dzisiaj pokażę Ci wszystko, co powinieneś wiedzieć o tej metodzie, wraz z praktycznymi przykładami zastosowania.
Co robi pandas.cumsum()?
Funkcja pandas.cumsum()
oblicza skumulowaną sumę wartości w danym zbiorze danych, zwracając nową kolumnę lub serię. Mówiąc prościej, dla każdego elementu w kolumnie (lub wierszu) funkcja sumuje wszystkie poprzednie wartości, dodając je do obecnej. Dzięki temu uzyskujemy rosnący zbiór danych.
Podstawowa składnia pandas.cumsum()
Składnia funkcji jest bardzo prosta:
DataFrame.cumsum(axis=None, skipna=True)
Gdzie:
axis
– określa, czy operacja dotyczy wierszy (1) czy kolumn (0). Domyślnie 0 (czyli po kolumnach).skipna
– decyduje, czy pomijać wartościNaN
(domyślnieTrue
).
Przykład zastosowania pandas.cumsum()
Spójrzmy na podstawowy przykład, w którym zastosujemy cumsum()
do danych w Pandas:
import pandas as pd
# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1]})
# Obliczamy skumulowaną sumę dla każdej kolumny
df_cumsum = df.cumsum()
print(df_cumsum)
Wynik będzie wyglądał następująco:
A | B |
---|---|
1 | 5 |
3 | 9 |
6 | 12 |
10 | 14 |
15 | 15 |
Skumulowana suma w wierszach
Jeśli zamiast sumowania po kolumnach chcemy obliczyć skumulowaną sumę w wierszu, wystarczy ustawić axis=1
:
df_cumsum_rows = df.cumsum(axis=1)
print(df_cumsum_rows)
To sprawi, że wartości w pierwszym wierszu będą sumować się w poziomie.
Obsługa wartości NaN w pandas.cumsum()
Biblioteka Pandas automatycznie pomija wartości NaN
, chyba że ustawimy skipna=False
. Spójrzmy na poniższy przykład:
df = pd.DataFrame({'A': [1, 2, None, 4, 5], 'B': [5, None, 3, 2, 1]})
df_cumsum_na = df.cumsum()
print(df_cumsum_na)
Domyślnie wartości NaN
są pomijane podczas sumowania, ale jeśli zmienimy parametr skipna
, NaN
pozostaną w obliczeniach.
Praktyczne zastosowania pandas.cumsum()
Skumulowana suma to funkcja niezwykle przydatna w analizie danych, m.in. w:
- Analizie trendów – np. wykresach skumulowanych przychodów.
- Obliczeniach dotyczących szeregów czasowych.
- Śledzeniu postępu w metrykach.
Podsumowanie
Funkcja pandas.cumsum()
to doskonałe narzędzie w analizie danych, pomagające w uzyskiwaniu skumulowanych wartości kolumn lub wierszy. Dzięki elastycznym opcjom, takim jak obsługa wartości brakujących czy wybór kierunku sumowania, pozwala ona na szeroką gamę zastosowań w praktyce. Mam nadzieję, że ten przewodnik dobrze wyjaśnił, jak działa pandas cumsum
w języku Python oraz jak można ją stosować w codziennej pracy z danymi.
Opanuj analizę danych w Pythonie z moim kursem!
Opanujesz podstawy programowania w Pythonie, w tym typy danych, zmienne, listy, słowniki, funkcje oraz obsługę błędów. Nauczysz się korzystać z biblioteki pandas do zaawansowanej analizy danych i pracy z różnymi rodzajami danych. Zrozumiesz proces analizy, eksploracji (EDA) i wizualizacji. Tworzenie własnych funkcji przygotuje Cię do rozmów kwalifikacyjnych i rozwiązywania rzeczywistych problemów biznesowych.
Zostań analitykiem danych – dołącz do KajoDataSpace!
Najlepsza ścieżka do zawodu analityka danych. Dostęp do pełnych wersji kursów online z Excela, SQLa, Tableau i Pythona z certyfikatami + specjalistycznych webinarów z PowerBI.
Ekskluzywana ale pomagająca sobie społeczność.
Ponad 61 godzin materiałów video.
Spotkania LIVE co miesiąc.
Mój osobisty mentoring.