Für die Analysen brauchen wir das Pandas package
wir brauchen Pandas und Numpy bibliotheken installieren wir sie zuerst mit pip:
pip install pandas
jetzt importieren wir die bibliotheken in unser Python skript:
import pandasas pd
wir laden die csv datei in ein pandas DataFrame:
df= pd.read_csv(
"transporte.csv",
parse_dates=["Date"],
dayfirst=True
)
Erster Blick auf die Daten
df.head()
Allgemeine Informationen
df.info()
Statistische Zusammenfassung
df.describe()
Daten bereinigen
df.dropna(inplace=True)# Entfernt fehlende Werte
df['Number of items']= df['Number of items'].astype(int)# Konvertiert zu Integer
Statistische Übersicht (für Zahlen)
df.describe()# Statistische Zusammenfassung für numerische Spalten