Die Zukunft vorhersagen: Klingt wie aus einem Film und in der Realität unmöglich. Dabei ist es unter anderem das, was Machine Learning macht - doch es gibt noch viel mehr Möglichkeiten.
Machine Learning ist, wie der Name schon sagt, auf eines angewiesen: das Lernen. Das kann auf zwei Wegen geschehen: überwacht und unüberwacht. Viele Machine Learning Systeme lernen mit Supervised Learning und sind so in der Lage, die Zukunft vorauszusagen. Denn die Maschine findet Regelmäßigkeiten und entwickelt Vorhersagemodelle.
Was Filme mit Machine Learning zu tun haben
Um supervised und unsupervised Learning ganz alltagstauglich zu erklären, eignet sich das Beispiel Filme. Beim supervised Learning werden Filme in verschiedene Genres kategorisiert. Beim unsupervised Learning beobachtet die Maschine jedoch, dass Teens gerne Filme mit Ryan Gosling sehen. Deshalb schlägt das Modell jungen Nutzern Filme mit diesem Schauspieler vor. Das bedeutet, beim supervised Learning gibt es schon vorher Kategorien, beim unsupervised Learning bildet die Maschine selbst Kategorien.
Was das supervised Learning grundlegend vom unsupervised Learning unterscheidet ist die Art, wie von der Maschine mit den Daten umgegangen wird. Beim überwachten Lernen sind die möglichen Antworten schon im Vorhinein bekannt, da alle Informationen vom Menschen in das Modell eingegeben wurden. Beim unüberwachten Lernen versteht die Maschine die vorliegenden Daten.
ML für einen optimalen Kundenservice
Um den Prozess des supervised Learning zu verdeutlichen, verwenden wir das Beispiel eines Call Centers von einem Telekommunikationsanbieter. Dort kommen häufig Anfragen, weil das WLAN nicht funktioniert. Die Künstliche Intelligenz kann dem Agenten dann vorschlagen, einen Router Reboot durchzuführen. Das schlägt die Maschine vor, weil sie gelernt hat, dass dies in der Vergangenheit häufig zu Erfolg geführt hat. Damit sie das aber überhaupt weiß, müssen die Datensätze der Vergangenheit mit den jeweils erfolgreichen Lösungen markiert, also gelabelt werden. Deshalb ist es wichtig, dass Call Agenten Feedback über den Erfolg der Vorschläge einholen.
Das Modell wird mit solchen gelabelten Datensätzen trainiert und kann am Ende für neue Datensätze einen passsenden Vorschlag geben. Am Ende des Trainings können die Daten dann eben beispielweise bei der Lösungsfindung von Internetproblemen helfen.
Beim unsupervised Learning werden hingegen Daten verwendet, die nicht markiert oder gelabelt sind und das System kategorisiert sie. Dies geschieht in der Regel durch Segmentierung, bei der Daten nach Gemeinsamkeiten gruppiert werden, auch Clustering genannt.
Viele der erfolgreichsten und bekanntesten ML Anwendungen, wie die Spracherkennung, Spamerkennung oder Schadenshöhebewertung klassifizieren einfach Datensätze, die ihnen vorgelegt werden. Andere ML Anwendungen wagen sogar den "Blick in die Glaskugel", indem sie Vorhersagen über zukünftige Ereignisse treffen. Dazu gehören Wettervorhersagen, Aktienkursprognosen oder auch Modelle für die vorausschauende Maschinenwartung, die sogenannte 'Predictive Maintenance'.