Was ist maschinelles Lernen und weshalb ist es essentiell für unsere Zukunft?

Neben Begriffen wie „künstliche Intelligenz“ und „virtuelle Realität“ ist „maschinelles Lernen“ (kurz: ML) wohl einer der bedeutendsten Technologien in den letzten Jahren. Dabei gibt es ML eigentlich schon lange: 1959 hat Arthur Samuel, ein Pioneer im maschinellen Lernen, den Begriff zum ersten Mal verwendet:

Maschinelles Lernen ist ein Studiengebiet, das dem Computer die Möglichkeit gibt zu Lernen, ohne dass er explizit dazu programmiert wird.

(Original: Machine learning is a field of study that gives computers the ability to learn without being explicitly programmed.)

Was ist Maschinelles Lernen?

ML ist eine rechenintensive, statistische Methode die basierend auf Erfahrung die Leistung eines Aspektes verbessert oder Vorhersagen macht. Die ‚Erfahrung‘ ist in diesem Falle basierend auf einem Daten-Set dessen Daten meist (von Menschen) kategorisiert worden sind. Die Qualität der Vorhersagen hängt demnach von der Genauigkeit und der Menge der Daten ab, die in den Algorithmus gespiesen werden.

In statistischen Modellen sammeln wir Daten, reinigen diese, und verwenden dann den gereinigten Datensatz um eine Hypothese zu testen. Statistische Modelle basieren auf statischen Algorithmen, die vom Programmierer implementiert werden. Auf der anderen Seite, beim maschinellen Lernen, wird vorgängig kein Modell ausgewählt. Die (Art der) Daten bestimmen welches analytische Verfahren (bzw. welcher Algorithmus) am besten geeignet ist für den Task. Er ‚lernt‘ dann von den markierten/kategorisierten Daten und extrahiert daraus Wissen, das die Grundlage für Vorhersagen ist.

Wie funktioniert die Daten-Markierung/Kategorisierung?

Es gibt drei Typen von ML, die sich unterscheiden wie die Daten markiert und vorbereitet sind, und dadurch die Art und Weise wie der Algorithmus sie versteht beeinflussen:

  • Supervised ML: In diesem Verfahren ist der Algorithmus auf Daten trainiert, die von Hand markiert/kategorisiert worden sind – also meist exzellente Qualität haben. Möchten wir zum Beispiel einen ML-Algorithmus nutzen, der auf Fotos entscheiden kann, ob darauf ein Auto oder ein Raumschiff zu sehen ist, müssen wir jedes Foto das wir einspeisen vorher mit ‚Raumschiff‘ oder ‚Auto‘ markieren. Der Algorithmus lernt dann den Unterschied auf den Fotos und kann daraus ein neues Foto (ohne Markierung) mit einer gewissen Genauigkeit selbst Kategorisieren.
  • Unsupervised ML: Hat ein Datenset keine Markierung/Kategorisierung und wird so eingespeist, kann der Algorithmus auf keiner ‚Erfahrung’/’Wissen‘ basieren und muss alles selbst ‚lernen‘. Der Algorithmus nimmt also die rohe, un-kategorisierte Datenmenge und versucht selbstständig Gemeinsamkeiten/Gruppierungen, usw zu finden. Wie sich sicher vorstellen können, ist dies sehr aufwändig und es ist anspruchsvoller, die Ergebnisse zu interpretieren und zu nutzen.
  • Reinforcement ML: Der Basis-Lernalgorithmus ist wie beim unsupervised ML, weil die Training-Daten auch unmarkiert sind. Dafür wird aber der Output (also die Vorhersage des Algorithmus) von einem User bewertet. Wenn also in unserem Beispiel der Algorithmus bei einem Foto eines Teslas sagt dass es ein Raumschiff ist, so gibt der User als Feedback ‚falsch‘. Durch das Feedback (also korrekt/inkorrekt) lernt der Algorithmus dazu und verbessert sich.

Von selbstfahrenden Autos zu schönerem Zeichnen

Ein paar Beispiele wie ML heute genutzt wird:

AutoDraw Demo:

Was bedeutet Maschinelles Lernen für mein Unternehmen?

Heute hat maschinelles Lernen fast alle Bereiche unseres Lebens in verschiedenster Form abgedeckt: Algorithmen, die Aktien handeln, Bots, die den Kundendienst (teilweise) übernehmen, Gesundheits-Algorithmen die uns helfen, besser zu verstehen wie wir unser Wohlbefinden verbessern können, oder sie entdecken Betrugsversuche bei Kreditkarten-Abbuchungen.

Für alle diese Lösungen braucht es Daten und gute Algorithmen. Haben Sie (markierte oder unmarkierte) Daten und möchten sie besser verstehen oder ein Model trainieren, dass Sie dann als Web-Service nutzen können, um neue Daten zu analysieren? Kontaktieren Sie uns und wir diskutieren gerne die Möglichkeiten.