Data-Mining-Dienste aus der Cloud bzw. Machine Learning Cloud Service Provider:

Typische Trainingspipeline:

  1. Kategorie des Verfahrens bzw. Art des Modells auswählen z.B. Regression oder Klassifikation
  2. Datensammlung hochladen, z.B. als CSV-Datei
  3. Aufteilung in Trainings- und Testdaten festlegen
  4. Zielmerkmal festlegen
  5. ggf. weitere Parameter festlegen
  6. Training starten (Dauer je nach Daten und Modell: Minuten bis Stunden)
  7. Qualität des Modells anhand der bereitgestellten Kennzahlen auswerten (z.B. R2)
  8. Modell auf neue Datensätze anwenden, um Prognosen zu erstellen

https://medium.com/@surajagrahari330/machine-learning-pipeline-from-raw-data-to-insightful-models-80c54914b7a9

https://medium.com/@surajagrahari330/machine-learning-pipeline-from-raw-data-to-insightful-models-80c54914b7a9

Die Cloud-Services funktionieren in der Regel als Black-Box-Systeme, d.h. die Auswahl eines konkreten Verfahrens für die Regression oder Klassifikation wird automatisiert vorgenommen, sodass das Verfahren zum Einsatz kommt, welches für den vorliegenden Datensatz am besten geeignet ist.

Beispiel für Regressionsverfahren in der Google Cloud: lineare Regression, multiple lineare Regression, Gradient Boosted Decision Trees (GBDT), …

In diesem Artikel erfahren Sie mehr über die Trainingspipeline für Maschinelles Lernen in der Google Cloud.

Hinweis: Schalten Sie im Artikel in den einzelnen Abschnitten immer auf den Tab “Tabellarisch” um!