Jak działa pandas cumsum w języku Python? Przykład zastosowania

Jak działa pandas cumsum w języku Python? Przykład zastosowania
„`html

W pracy z danymi w Pythonie biblioteka pandas to jedno z najpotężniejszych narzędzi. Jedną z jej kluczowych funkcji jest cumsum(), pozwalająca na obliczanie skumulowanej sumy wartości w kolumnach lub wierszach. Jeśli zastanawiasz się, jak działa pandas.cumsum() w języku Python, to jesteś we właściwym miejscu. Dzisiaj pokażę Ci wszystko, co powinieneś wiedzieć o tej metodzie, wraz z praktycznymi przykładami zastosowania.

Co robi pandas.cumsum()?

Funkcja pandas.cumsum() oblicza skumulowaną sumę wartości w danym zbiorze danych, zwracając nową kolumnę lub serię. Mówiąc prościej, dla każdego elementu w kolumnie (lub wierszu) funkcja sumuje wszystkie poprzednie wartości, dodając je do obecnej. Dzięki temu uzyskujemy rosnący zbiór danych.

Podstawowa składnia pandas.cumsum()

Składnia funkcji jest bardzo prosta:

DataFrame.cumsum(axis=None, skipna=True)

Gdzie:

  • axis – określa, czy operacja dotyczy wierszy (1) czy kolumn (0). Domyślnie 0 (czyli po kolumnach).
  • skipna – decyduje, czy pomijać wartości NaN (domyślnie True).

Przykład zastosowania pandas.cumsum()

Spójrzmy na podstawowy przykład, w którym zastosujemy cumsum() do danych w Pandas:

import pandas as pd

# Tworzymy przykładowy DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1]})

# Obliczamy skumulowaną sumę dla każdej kolumny
df_cumsum = df.cumsum()

print(df_cumsum)

Wynik będzie wyglądał następująco:

A B
1 5
3 9
6 12
10 14
15 15

Skumulowana suma w wierszach

Jeśli zamiast sumowania po kolumnach chcemy obliczyć skumulowaną sumę w wierszu, wystarczy ustawić axis=1:

df_cumsum_rows = df.cumsum(axis=1)
print(df_cumsum_rows)

To sprawi, że wartości w pierwszym wierszu będą sumować się w poziomie.

Obsługa wartości NaN w pandas.cumsum()

Biblioteka Pandas automatycznie pomija wartości NaN, chyba że ustawimy skipna=False. Spójrzmy na poniższy przykład:

df = pd.DataFrame({'A': [1, 2, None, 4, 5], 'B': [5, None, 3, 2, 1]})
df_cumsum_na = df.cumsum()
print(df_cumsum_na)

Domyślnie wartości NaN są pomijane podczas sumowania, ale jeśli zmienimy parametr skipna, NaN pozostaną w obliczeniach.

Praktyczne zastosowania pandas.cumsum()

Skumulowana suma to funkcja niezwykle przydatna w analizie danych, m.in. w:

  • Analizie trendów – np. wykresach skumulowanych przychodów.
  • Obliczeniach dotyczących szeregów czasowych.
  • Śledzeniu postępu w metrykach.

Podsumowanie

Funkcja pandas.cumsum() to doskonałe narzędzie w analizie danych, pomagające w uzyskiwaniu skumulowanych wartości kolumn lub wierszy. Dzięki elastycznym opcjom, takim jak obsługa wartości brakujących czy wybór kierunku sumowania, pozwala ona na szeroką gamę zastosowań w praktyce. Mam nadzieję, że ten przewodnik dobrze wyjaśnił, jak działa pandas cumsum w języku Python oraz jak można ją stosować w codziennej pracy z danymi.

„` Inny ciekawy artykuł: Jak działa pandas cov w języku Python? Przykład zastosowania
KajoDataSpace