Text Mining: Definition, Methoden und Anwendung

Eine der herausfordernden Aufgaben in der Informatik besteht heute im Umgang mit großen Textmengen und der Extraktion von relevanten Daten aus Dokumenten mit unterschiedlicher und uneinheitlicher Formatierung. Das Text Mining macht sich moderne Ansätze im Maschine Learning und der künstlichen Intelligenz zunutze, um an die gewünschten Daten im Rahmen eines automatisierten Prozesses zu gelangen. Definition: […]

Training-, Validierung- und Testdatensatz

Um ein Machine Learning Modell korrekt zu trainieren, wird ein Datensatz (Trainingsdaten) benötigt. Unüberwachtes Lernen braucht keine Beispiele und kann direkt mit den Eingabedaten trainiert werden. Überwachtes Lernen hingegen braucht Beispieldaten, also Daten wo die Zielvariable vorgegeben ist (bspw. Kauf Ja/Nein). Diesen Datensatz nennt man auch Beispieldatensatz. Bei überwachten Lernverfahren wird dieser Datensatz in der […]