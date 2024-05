Was hat Datenqualität mit grüner KI zu tun?

„Daten sind die Grundlage der KI. Die Leistungsfähigkeit der KI ist eng mit der Datenqualität, dem Datenkontext und der Datenrelevanz verbunden“, sagt Munz. „So führt eine schlechte Datenqualität zu einem schlechten KI-Modell.“ Wesentlich ist also, die Qualität zu verbessern, um so Genauigkeit und (Energie-)Effizienz der Modelle in Balance zu bringen.

„Ein Weg, um sicherzustellen, dass KI-Modelle nur mit relevanten Daten gefüttert werden, ist ein klarer KI-Leitfaden im Unternehmen“, erklärt Munz, „Dadurch wird sichergestellt, dass es einen transparenten Entscheidungsfindungsprozess gibt, der dabei hilft, zu bestimmen, welche Daten verwendet werden sollen und welche nicht.“

Doch was genau zeichnet hochwertige Trainingsdaten aus? Datenqualität wird von zahlreichen Faktoren beeinflusst, hängt aber entscheidend von der Erfassungsmethode ab: Für die Gewinnung hochwertiger Daten ist ein akkurater Aufnahmeprozess unerlässlich. Im nächsten Schritt muss dann in den so gewonnenen, noch unsortierten Daten die Teilmenge gefunden werden, die das Zeug zu erstklassigen Trainingsdaten hat, sprich, exakt die Informationen enthält, die die KI zum Lernen braucht. Die große Kunst besteht darin, aus einer Datenmenge genau diese Informationsmerkmale und -muster im genau richtigen Mengenverhältnis herauszufiltern.

Datensparsame Altteil-Identifizierung per KI

Wie so etwas in der Praxis gelingen kann, zeigen Forschende des Fraunhofer IPK im Projekt EIBA, bei dem KI-basiert Auto-Altteile identifiziert und analysiert werden, um sie wiederaufzubereiten. Die Herausforderung: Auch bei verschmutzten, verschlissenen und überlackierten Teilen müssen Teilenummern eindeutig erkannt werden. Entsprechend ausgefeilt sollten neuronale Netze und Algorithmen für das maschinelle Sehen arbeiten. Klingt nach horrendem Trainingsaufwand. Nicht unbedingt, wie das Fraunhofer IPK zeigt.