Vorlesung Business Intelligence 2

Videolektionen

Data-Mining-Dienste aus der Cloud bzw. Machine Learning Cloud Service Provider:

Amazon Web Services (AWS)
Microsoft Azure (Azure AI / Azure ML)
Google Cloud Platform (GCP) mit Vertex AI, AutoML, BigQuery ML
…

Typische Trainingspipeline:

Kategorie des Verfahrens bzw. Art des Modells auswählen z.B. Regression oder Klassifikation
Datensammlung hochladen, z.B. als CSV-Datei
Aufteilung in Trainings- und Testdaten festlegen
Zielmerkmal festlegen
ggf. weitere Parameter festlegen
Training starten (Dauer je nach Daten und Modell: Minuten bis Stunden)
Qualität des Modells anhand der bereitgestellten Kennzahlen auswerten (z.B. R2)
Modell auf neue Datensätze anwenden, um Prognosen zu erstellen

https://medium.com/@surajagrahari330/machine-learning-pipeline-from-raw-data-to-insightful-models-80c54914b7a9

Die Cloud-Services funktionieren in der Regel als Black-Box-Systeme, d.h. die Auswahl eines konkreten Verfahrens für die Regression oder Klassifikation wird automatisiert vorgenommen, sodass das Verfahren zum Einsatz kommt, welches für den vorliegenden Datensatz am besten geeignet ist.

Beispiel für Regressionsverfahren in der Google Cloud: lineare Regression, multiple lineare Regression, Gradient Boosted Decision Trees (GBDT), …

In diesem Artikel erfahren Sie mehr über die Trainingspipeline für Maschinelles Lernen in der Google Cloud.

Hinweis: Schalten Sie im Artikel in den einzelnen Abschnitten immer auf den Tab “Tabellarisch” um!