Einführung in maschinelles Sehen

Das computergestützte Sehen (Computer Vision) schreitet seit einigen Jahren rasant voran. Neuronale Netze und Deep Learning eröffnen zahlreiche Anwendungsmöglichkeiten, die unseren Alltag erleichtern und bereichern.

In diesem Artikel vermitteln wir Ihnen einen Überblick über den Begriff und die Anwendung des maschinellen Sehens.

Lassen Sie uns direkt einsteigen!

Der Begriff des maschinellen Sehens

Maschinelles Sehen bezeichnet die Fähigkeit von Computern zu visuellem Erkennen. Beim maschinengestützten Sehen werden analoge Bildinformationen erfasst und in digitale Signale umgewandelt. Zu diesem Zweck kommen Videokameras sowie Technologien der Signalverarbeitung zum Einsatz.

Maschinelles sehen ist ein Teil von Deep Learning
Welches Objekt befindet sich auf dem Bild?

Der über das bloße computergestützte Sehen hinausgehende, aber teilweise synonym verwendete Begriff „Computer Vision“ umschreibt sämtliche Technologie-Formen, mit denen Bilder computergestützt digitalisiert und darin enthaltene Informationen zwecks Auslösung bestimmter Aktionen verarbeitet werden.

Wie funktioniert das maschinelle Sehen?

Grundlage der maschinellen Bilderkennung sind zum einen umfangreiche Bilddatenbanken, die der Maschine einen Abgleich mit in der Außenwelt befindlichen Objekten ermöglichen (Trainingsdaten) und die notwendigen künstlichen neuronalen Netzwerke liefern. Die daraus resultierenden Bildmodelle lernen grundsätzliche Strukturen (z.B. Rundungen, Kanten), Muster, Farben und Objekte.

Bildmodelle (mxnet, resnet50 etc.) enthalten also das notwendige Vorwissen, das vom Computer zur Identifizierung von Gegenständen genutzt wird. Dieses Vorwissen wird in einem komplexen Trainingsprozess genutzt, um bestehende Modelle für neue Problemstellungen zu nutzen. Dies nennt man auch Transfer Learning.

Die zur Klassifikation von Objekten, verwendeten Deep Learning Algorithmen vergleichen und klassifizieren die einzelnen zu untersuchenden Bilder. Der Deep Learning Algorithmus zerlegt das Bild in ein Raster (zahlreiche kleinste Quadrate) und extrahiert die Bildinformationen, die jeweils auf eine bestimmte Bildeigenschaft untersucht werden.

Objekterkennung durch maschinelles Sehen
Die Algorithmen beim maschinellen Sehen zerteilen das Bild in Raster.

Durch automatische Vergleiche mehrerer Bilder erkennt das System Muster und berechnet daraufhin die Wahrscheinlichkeit, ob es sich bei dem jeweiligen Bild um einen bestimmten Gegenstand handelt. Die visuellen Inhalte werden beim Computer-gestützten Sehen also unter Nutzung von Deep Learning und Neuronalen Netzen erkannt.

Welche sind die typischen Aufgaben von Computer Vision?

Die Möglichkeiten des digitalen Sehens werden beispielsweise eingesetzt für die Erkennung und Zuordnung von:

  • optischen Zeichen,
  • Mustern und
  • Objekten.
Machinelles Sehen
Objekterkennung durch Computer Vision

Zu den typischen Aufgabengebieten von Computer Vision gehören insbesondere

  • Klassifizierung von Objekten,
  • Lokalisierung von Objekten,
  • Durchsuchen großer Datenmengen,
  • Bewegungsanalyse,
  • Beschreibung von Bildern,
  • Aufbau von 3D-Bildern aus einzelnen 2D-Darstellungen und
  • Rekonstruktion von Bildinhalten.

Künstliche Intelligenz optimiert Marketing und Vertrieb

In 6 Fallstudien erfahren Sie:

  • Wie Sie 29% mehr Umsatz pro Kampagne machen.
  • Wie Sie durch KI und Automatisierung mehr Zeit gewinnen.
  • Wie Sie 300% mehr Conversions zur richtigen Zeit machen.
Jetzt herunterladen

Anwendungsbeispiele für maschinengestütztes Sehen

Maschinelles Sehen wird beispielsweise genutzt für:

  • Identifizierung von Unterschriften oder Handschriften,
  • Überprüfung von Banknoten,
  • Materialprüfung,
  • Erkennung und Zuordnung von Pflanzen oder Pflanzenkeimlingen oder
  • Analyse medizinischer Abbildungen (Beispiel: Identifizierung einzelner Zellkerne, Erkennung von Hautkrebs).
Bilderkennung mit TensorFlow anhand von dem MNIST Datenset
Erkennung von Handschrift anhand von dem bekannten MNIST Datenset.

In natürlichen Umgebungen wird maschinelles Sehen beispielsweise in folgenden Fällen genutzt:

  • Identifizierung von Personen aufgrund biometrischer Daten,
  • Erkennung der Mimik oder Gestik von Personen oder
  • Erkennung von Fahrbahnen und von Fußgängern außerhalb einer Fahrbahn.

Industrielle Anwendungsbereiche sind unter anderem

  • Automatisierungstechnik (Beispiel: Steuerung von Schweißrobotern in eine gewünschte Arbeitsposition),
  • Qualitätssicherung (zum Beispiel die Überprüfung der Produktqualität zum Abschluss eines Herstellungsprozesses oder während der Nutzungsdauer eines Werkstücks oder einer Maschine)
    • Oberflächenkontrolle,
    • Messung von Schichtdicken,
    • Erkennung von Defekten auch unter der Oberfläche,
    • Prüfung von Lage, Maßen und Formen,
    • Überprüfung auf Vollständigkeit,

Sicherheitstechnik (Zutrittskontrollen und Erkennen von Gefahrensituationen) sowie

Verkehrstechnik (Qualitätssicherung und autonomes Fahren von „sehenden“ Fahrzeugen).

Computer Vision für Ihr Unternehmen

Schauen Sie sich an, wie Sie KI gestütztes Computer Vision für Ihr Unternehmen verwenden können. 

Computer Vision

Maschinelles Sehen im Beispielsfall Gesichtserkennung

Aufgrund eines vorgegebenen Gesichtsmodells weiß die Maschine mithilfe eines Suchalgorithmus,

  • dass sich Nasen stets zwischen Mund und Augen befinden und
  • wo sich ausgehend von bereits identifizierten Augen und Nase in etwa der Mund befinden muss.

Die Gesichtserkennung kann nach dem Hochladen von Bildern auch in sozialen Netzwerken erfolgen. Bildklassifizierungen lassen sich (so beispielsweise bei Facebook praktiziert) zusätzlich mit Sprachfunktionen kombinieren.

  • Wird ein erkanntes Bild von einem Ausgabegerät der Maschine ausgesprochen, so ist es für Sehbehinderte möglich, die visuellen Inhalte zu verstehen.
  • Das Verfahren der Bilderkennung ermöglicht ebenfalls das Ablesen von Lippen und die anschließende Umwandlung in Sprachsignale.

Die Technologien des Computer-gestützten Sehens liegen auch der Google Fotos App und der Google Fotosuche zugrunde.

Profilbild von Vinzent Wuttke Geschäftsführer Datasolut GmbH
Vinzent Wuttke
Geschäftsführer

Ihr Ansprechpartner

Ob und wie künstliche Intelligenz Ihnen weiterhelfen kann, können Sie in einem ersten, unverbindlichen Gespräch mit uns herausfinden.

In diesem Gespräch erfahren Sie:

  • Wie Ihr Use-Case technisch am besten umgesetzt werden kann
  • Wie wir maximal sicher mit Ihren Kundendaten umgehen
  • Wie lange wir für die Umsetzung benötigen und wie ein konkreter Projektplan aussehen könnte
Jetzt Erstgespräch vereinbaren

Weiterlesen

künstliche neuronale Netze sind das zentrale Element im Deep Learning
Deep Learning Grundlagen Vor 9 Monaten

Künstliche Neuronale Netzwerke: Definition, Einführung, Arten und Funktion

Künstliche Neuronale Netze (KNN) sind dem menschlichen Gehirn nachempfunden und werden für maschinelles Lernen und Künstliche Intelligenz eingesetzt. Computerbasiert lassen sich damit diverse Problemstellungen lösen, die für uns Menschen fast […]
Deep Learning GrundlagenKünstliche Intelligenz (KI) Vor 1 Jahr

Bilderkennung: Definition, Funktionsweise und Anwendungsbereiche

Schadensfälle bewerten, Menschen erkennen oder die Produktsuche. Schon heutzutage stellt die Bilderkennung einen Bereich dar, mithilfe dessen die Identifikation verschiedener Gegenstände oder Muster eines Bildes geschieht. Dabei kommt die Bildererkennung in vielen Anwendungen zum Einsatz und hat […]
Deep Learning GrundlagenSprachmodelle Vor 1 Jahr

Was ist ein Large Language Model?

Large Language Models (zu dt. Große Sprachmodelle) arbeiten auf Basis von Deep Learning Modellen mit menschlicher Sprache. Das Ziel des Large Language Models (LLM) ist es, einen Text auf menschenähnliche […]
Was ist Reinforcement Learning?
Deep Learning Grundlagen Vor 1 Jahr

Reinforcement Learning: Wenn KI auf Belohnungen reagiert

Dass dem maschinellen Lernen die Zukunft gehört, dürfte mittlerweile unbestritten sein. Mit der wachsenden Komplexität der anfallenden Aufgaben und den sich ständig weiterentwickelnden Lösungsansätzen sind im Laufe der Zeit eine […]
Zusammenhang von Natural Language Processing, Natural Language Understanding und Natural Language Generation
Deep Learning Grundlagen Vor 1 Jahr

NLP vs. NLU vs. NLG: Unterschiede, Funktionen und Beispiele

Obwohl die Themengebiete Natural Language Processing (NLP), Natural Language Understanding (NLU) und Natural Language Generation (NLG) miteinander verwandt sind, haben sie jedoch unterschiedliche Funktionen. Im folgenden Beitrag werden Ihnen die Bedeutung, […]
Deep Learning Grundlagen Vor 1 Jahr

Einführung in Keras

Keras ist eine Open-Source-Bibliothek, die in der Sprache Python geschrieben ist und eine rasche Implementierung neuronaler Netzwerke für das Deep Learning ermöglicht. Es kann gemeinsam mit TensorFlow, Theano oder anderen […]
Deep Learning Grundlagen Vor 1 Jahr

Deep Learning: Definition, Beispiele & Frameworks

Deep Learning (tiefes Lernen) ist ein Teilgebiet von maschinellem Lernen, welches sich auf künstliche neuronale Netze und große Datenmengen fokussiert. Deep Learning wird dazu genutzt Durch große Datenmengen (Big Data) […]
Newsletter und Updates

Sie sehen gerade einen Platzhalterinhalt von HubSpot. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen
Erstgespräch vereinbaren