Was ist eigentlich … KI-Bias?

Mit KI-Bias sind Verzerrungen einer künstlichen Intelligenz gemeint, die sich auf die verwendeten Daten oder KI-Systeme zurückführen lassen. Sie sind nicht zu verwechseln mit dem Halluzinieren, bei dem eine KI Sachverhalte erfindet.

Das BSI (Bundesamt für Sicherheit in der Informationstechnik) beschreibt KI-Bias als eine Verzerrungen in den Daten, die von KI-Systemen durch Ungleichbehandlung ausgelöst wird. Im Unterschied dazu ist KI-Halluzination ein überzeugend formuliertes Ergebnis, das nicht auf Trainingsdaten basiert. Verzerrungen können bereits durch die Datenerhebung entstehen. In der Medizin wurden früher viele Studien an weißen, älteren Männern durchgeführt. Viele Gruppen wie Frauen, Kinder oder Menschen anderer Ethnien sind in diesen Datensätzen unterrepräsentiert. 

Durch diese einseitig erhobenen Trainingsdaten lernt die KI Muster, die nicht neutral sind. Dadurch können zum Beispiel Frauen bei KI-Systemen für Herz-Kreislauf-Erkrankungen benachteiligt werden. Der KI-Bias kann aber auch andere Ursachen haben. Datensammlungen sind nicht nur durch soziale, sondern auch durch technische, wirtschaftliche oder rechtliche Entscheidungen gefärbt. Auch Messungen, beispielsweise in Studien, haben einen Einfluss auf die Datenlage. 

Die Auswahl des Messverfahrens, die Messungen selbst sowie die Berechnungen, aber auch Messfehler können zu einem Bias führen. Erhebliche Konsequenzen kann auch das Weglassen von wichtigen Variablen haben. Dies wäre zum Beispiel der Fall, wenn ein KI-System die Wahrscheinlichkeit berechnet, mit der eine Patientin bei einer Grippeerkrankung einen schweren Verlauf bekommt, und das Alter – ein wichtiger Faktor – nicht in die Entwicklung der KI einbezogen wurde. 
 

Verzerrungen können viele ursachen haben.

Die Konzeption des KI-Systems, die Auswahl der Daten und des Trainingsprozesses haben ebenfalls einen Einfluss auf die Ergebnisse, die eine KI liefert. Das BSI warnt in diesem Zusammenhang, dass sich ein KI-Bias auch auf die Datensicherheit auswirken könnte. Der Bias könnte zu einer unerwarteten Verhaltensweise von KI-Systemen führen, die ein Angreifer ausnutzen kann. Ferner kann ein Bias auch durch die Nutzung des KI-Systems entstehen. Große Sprachmodelle zum Beispiel verwenden die Interaktionen der Nutzer als Trainingsdaten für die Weiterentwicklung. 

Wenn die Nutzer falsche Informationen oder Vorurteile in die KI einbringen, kann dies zu einem Bias bei der nächsten KI-Version führen. Ein KI-Bias ist vermeidbar. Hersteller können bereits bei der Entwicklung die Trainingsdaten auf den Prüfstand stellen: „Wie repräsentativ sind die Daten, wann und von wem wurden sie erhoben? Wurden alle relevanten Daten erhoben?“ Für große Sprachmodelle gibt es eigene Verfahren, um einen KI-Bias zu identifizieren. Bei allgemeinen Sprachmodellen kann der Bias aber nur für einen bestimmten Anwendungsfall definiert werden. So lassen sich zum Beispiel Verhaltensauffälligkeiten gegenüber Geschlechtsidentitäten erkennen, wenn das Modell zur Bewertung von Bewerbungsunterlagen eingesetzt wird. 
 

Der Artikel erschien erstmals am 24. März 2026 im x.press 26.2. 

Hier können Sie sich die gesamte x.press-Ausgabe 26.2 herunterladen.