Künstliche Intelligenz definiert das Auswerten und Verfassen von technischen Kurztexten in der Automobilentwicklung neu
Die EDAG Group hat nach zwei Jahren Forschung das Projekt „Künstliche Intelligenz zur semantischen Analyse technischer Kurztexte“, kurz „AIdentify“, abgeschlossen. Dabei geht es um die automatisierte Textanalyse und –redaktion mithilfe von Künstlicher Intelligenz. Denn gerade komplexe, technische Texte stellen die Grundlage der Automobilentwicklung dar. Im Mittelpunkt solcher Analysen steht Natural Language Processing, kurz NLP, als technische Verarbeitung natürlicher Sprache. Das Projekt hat der größte unabhängige Mobilitätstechnologie-Entwickler gemeinsam mit der denkbares GmbH, einem Think Tank der digitalen Transformation, durchgeführt. Gefördert mit Mitteln des Bayerischen Staatsministerium für Wirtschaft, Landesentwicklung und Energie im Rahmen des Bayerischen Verbundforschungsprogramms (BayVFP) hat das interdisziplinäre Team die Auswertung und Verwendung technischer Kurztexte mit KI erforscht. Ziel ist es, mithilfe von NLP-Textanalysen Inkonsistenzen in der Fahrzeugentwicklung, Trends in der Automobilindustrie und ländertypische Fehler an Fahrzeugen leichter und schneller zu erkennen.
„Die maschinelle Textanalyse und -erstellung ist für die EDAG Group ein weiterer Meilenstein für den Auf- und Ausbau eines zukunftsweisenden Ökosystems der Mobilität von morgen“, sagt Cosimo De Carlo, Geschäftsführer und CEO der EDAG Group. „Mit der EDAG Pipeline AIdentify liegt nun ein vielversprechender Prototyp einer strukturierten und weitestgehend automatisierten Wissens- und Informationsvermittlung vor, der die Technologieentwicklung in der Automobilindustrie maßgeblich voranbringen wird.“
In dem Forschungsprojekt hat das EDAG-Softwareentwicklungsteam von Jacek Burger, Head of Embedded Systems & Computer Vision/AI, untersucht, ob und wie insbesondere NLP dazu beitragen kann, die rasant wachsende Zahl von Kurztexten zu bewältigen. Denn gerade in der Automobilindustrie fällt eine Vielzahl solcher Kurztexte beispielsweise bei Prüfstands- oder Einsatzberichten von Servicetechnikern oder Reklamationen von Kundinnen und Kunden an. Diese gilt es mithilfe von KI in einem Datenbank-basierten Ticketsystem automatisiert auszuwerten und zu verarbeiten.
„Der Unterschied von technischen Kurztexten zu Prosa ist, dass diese von etlichen Autoren mit unterschiedlichem Hintergrundwissen erstellt wurden. Sie weisen oft Rechtschreibfehler, Codes, Abkürzungen, Mehrsprachigkeit und Umgangssprache auf. Damit stoßen die gängigen NLP-Ansätze an ihre Grenzen“, sagt Nathalie Klingler. Die Softwareentwicklerin der EDAG Group und Spezialistin auf dem Gebiet „Explainable Artificial Intelligence“ hatte das AIdentify-Projekt gemeinsam mit Jochen Nüßle, Softwareentwickler bei der EDAG Group in Lindau federführend betreut.
Bislang sind solche Datenbanken nach jetzigem Kenntnisstand des EDAG KI-Team lediglich für die Ablage und nicht als Wissensquelle verwendet worden. Das soll sich nun ändern. „AIdentify ermöglicht die Ausgabe semantisch ähnlicher Texte auf Basis eines Eingangstextes. Die KI evaluiert die Ansätze und leitet daraus Empfehlungen für den Umgang mit technischen Kurztexten ab. Dadurch erhalten die Mitarbeiterinnen und Mitarbeiter Zugriff auf Lösungen von ähnlichen Problemen und werden so in ihrer Arbeit mit technischen Kurztexten sinnvoll unterstützt“, sagt Jochen Nüßle.
Die von der EDAG Group entwickelte Pipeline AIdentify ist nach Abschluss des zweijährigen Forschungsprojekts auf einem guten und funktionsfähigen Stand. Sie ermöglicht bereits die Extraktion ähnlicher Texte und deren semantische Aufbereitung aus einer Datenbank.
„Die Pipeline bearbeitet schon heute etliche Anwendungsfälle sinnvoll und zuverlässig“, erklärt Jacek Burger. „Sie verbessert bereits die Textqualität, die Konsistenzprüfung in Tickets, die Wissensextraktion und auch das Clustering.“ Ziel ist es nun, zusätzliche Evaluationen und weiterer Praxistests der Software durchzuführen, um eine robuste und modulare Toolbox marktreif weiterzuentwickeln. Diese soll ohne viele Anpassungen auch auf weitere Anwendungsfälle und Datenbasen anwendbar sein.