Ethische KI im Arbeitsumfeld durch wertebasierte Labels?

Lessons Learned aus der Anwendung des VCIO-Frameworks auf einen KI-basierten Assistenten

ZeitschriftIndustry 4.0 Science
Ausgabe42. Jahrgang, 2026, Ausgabe 1, Seite 30-38
Open Accesshttps://doi.org/10.30844/I4SD.26.1.30
Literatur Teilen Zitieren Download

Abstract

Systeme der Künstlichen Intelligenz (KI) unterstützen Mitarbeitende zunehmend bei komplexen Entscheidungsprozessen. Dazu müssen Mitarbeitende die Vertrauenswürdigkeit von KI-basierten Empfehlungen valide beurteilen. KI-Ethik-Labels sollen Mitarbeitenden bei dieser Einschätzung helfen und die Entwicklung vertrauenswürdiger KI-Lösungen befördern. Die AI Ethics Impact Group entwickelte hierfür ein Label, das auf dem VCIO-Framework (Values, Criteria, Indicators, Observables) basiert und dezidiert relevante ethische Werte adressiert. Jedoch sind solche Labels noch wenig verbreitet, weshalb kaum Erfahrungswerte aus der praktischen Anwendung vorliegen. Damit bleiben die praktische Umsetzbarkeit und der Nutzen von KI-Labels unklar. Der geplante Beitrag bietet einen Überblick über existierende Labels für KI-Systeme, beleuchtet das VCIO-Framework in der Anwendung auf einen konkreten Anwendungsfall aus der Praxis und leitet Handlungsempfehlungen für die Gestaltung ethischer KI ab.

Keywords

Artikel

Vertrauen in KI-Systeme 

In Unternehmen greifen Mitarbeitende beispielsweise im Gesundheits- oder Finanzwesen, der Strafverfolgung und der Strategieentwicklung bei der Entscheidungsfindung zunehmend auf KI-Systeme zurück [1]. Dies betrifft auch moralisch relevante Entscheidungen [2]. Deswegen ist es essenziell, dass Entscheidungstragende in Unternehmen in der Lage sind, die Vertrauenswürdigkeit einer KI-basierten Empfehlung valide und akkurat zu beurteilen und ggf. kritisch zu hinterfragen. Entsprechend stellen sich zunehmend die Fragen, wie vertrauenswürdig aktuelle KI-Systeme sind und inwiefern es Menschen gelingt, KI-generierte Empfehlungen kritisch zu bewerten [3].

Bisher scheint es Nutzenden allerdings schwerzufallen, KI-Systeme in einem angemessenen Maße zu vertrauen [4]. Ein zu geringes Vertrauen in die KI-generierten Ergebnisse führt zu einer ablehnenden Haltung oder einer zögerlichen Nutzung. Dies ist ebenso bedenklich wie ein zu hohes, sog. blindes Vertrauen, das die unreflektierte Übernahme von Fehleinschätzungen der KI zur Folge hat [5]. Eine angemessene Vertrauenskalibrierung, wie bspw. auch im EU AI Act gefordert [6], ist allerdings angesichts der hohen Komplexität und mitunter intransparenten Funktionsweise moderner Technologien schwer zu erreichen [5]. 

Die vertrauenswürdige KI-Gestaltung ist ein zentrales Merkmal zahlreicher Ethikrichtlinien und -grundsätze. Um eine angemessene Einschätzung der Vertrauenswürdigkeit von KI-Systemen voranzutreiben, haben verschiedene Organisationen wie die EU „ethische Leitlinien für vertrauenswürdige KI“ entwickelt [6]. Solche Leitlinien erweisen sich allerdings für Unternehmen häufig als zu abstrakt, zumal sie zu wenig konkrete Handlungsanweisungen bieten [7]. Dementsprechend bleibt es unklar, wie Organisationen solche Grundsätze in der Praxis umsetzen können [8]. In diesem Zusammenhang spielen sog. Labels oder „Zertifizierungskennzeichen“ eine wichtige Rolle, um den Anwendern die Vertrauenswürdigkeit eines Systems transparent zu vermitteln [9]. 

KI-Labels als Mittel für angemessenes Vertrauen?

KI-Labels fungieren als Instrument, um die Implementierung von ethischen Grundsätzen und Werten transparent nachzuweisen und damit ein angemessenes Vertrauen in KI-Systeme zu befördern [8]. Vor diesem Hintergrund sind in den vergangenen Jahren verschiedene Ansätze für KI-Labels und Zertifizierungen entstanden. Im Wesentlichen dienen Labels der Vergleichbarkeit von Produkten oder fungieren als Qualitätsnachweis. Die AI Ethics Impact Group entwickelte etwa ein Label nach dem Vorbild des Energieeffizienzlabels, welches dezidiert relevante ethische Werte berücksichtigt und darstellt [8].

Das Label basiert auf dem VCIO-Framework (Werte, Kriterien, Indikatoren und beobachtbare Größen), das darauf abzielt, ethische Grundsätze praktikabel, vergleichbar und messbar zu machen. Dazu werden Werte in relevante Kriterien, Indikatoren und in beobachtbare Messgrößen (engl. observables) übersetzt. Diese Übersetzung befähigt Entwicklern dazu, eigenständig zu evaluieren, inwiefern die Werte in Systemen implementiert und berücksichtigt wurden. Dazu müssen die Erfüllungsgrade vorgegebener Indikatoren auf einer Skala von A bis G bewertet werden. Nach der Einstufung einzelner Indikatoren lassen sich diese aggregieren, um den Erfüllungsgrad der übergeordneten Kriterien und schlussendlich der Werte zu berechnen.

Folglich stellt die Bewertung „A“ die vollständige Implementierung eines Wertes im System dar. Ziel des Labels ist es, die Vertrauenswürdigkeit von KI-Systemen schnell und intuitiv zu vermitteln und die Vergleichbarkeit von KI-Systemen zu erhöhen [10]. 

Neben der AI Ethics Impact Group haben auch andere Akteure Labeling- bzw. Zertifizierungsansätze entwickelt, um ethische KI zu fördern. Beispielsweise verfolgt das Positive AI Label einen stärker organisationsbezogenen Ansatz, der auf sechs Prinzipien verantwortungsvoller KI basiert und Unternehmen hinsichtlich ihres Reifegrads sowie ihrer ethischen Entwicklungspotenziale bewertet. Darüber hinaus unterstützt das Label Organisationen bei der Implementierung von Daten- und Algorithmus-Governance und fördert eine Kultur auf Grundlage gemeinsamer Werte innerhalb der Unternehmen [11].

Im Gegensatz zu diesem organisationalen Ansatz richtet sich das Label IEEE CertifAIEd der IEEE Standards Association (IEEE SA) auf die Zertifizierung konkreter KI-Systeme. IEEE CertifAIEd ist ein Produktzertifizierungsprogramm, das darauf abzielt, Standards für Zertifizierungsprozesse zu etablieren, die unterschiedliche Werte in Systemen fördern. In diesem Zusammenhang wurde eine Zertifizierungsmethodik zur Bewertung der ethischen Auswirkungen von KI-Systemen entwickelt und eingeführt. Das Ziel besteht darin, die sichere, vertrauenswürdige und ethische Nutzung von KI-Produkten oder -Dienstleistungen zu gewährleisten. Zu diesem Zweck wurden strenge Kriterien für die Bewertung und Zertifizierung von Systemen im Hinblick auf ethische Risiken festgelegt [12]. Eine Übersicht zu den diskutierten Labels findet sich in der folgenden Tabelle.

Bild 1: Übersicht der diskutierten Labels.
Bild 1: Übersicht der diskutierten Labels.

Durch die vielfältigen Labels und Zertifizierungen im Bereich der KI-Ethik fehlt bislang ein einheitlicher Standard, der Nutzenden die zuverlässige und vergleichbare Beurteilung der Vertrauenswürdigkeit von KI-Systemen ermöglicht. Daher haben sich VDE, IEEE, Positive AI und IRT SystemX (Koordinator von Confiance.ai) zusammengeschlossen, um eine gemeinsame Spezifikation zu entwickeln und so die Bewertung von KI-Systemen weltweit zu vereinheitlichen und zu optimieren. Diese Joint Specification befindet sich derzeit noch in Entwicklung, soll aber künftig die Stärken von IEEE CertifAIEd, VDE VDESPEC 90012 (VDE Publikation des AI Ethics Labels) und dem Positive AI Framework vereinen, um die Einhaltung globaler regulatorischer Anforderungen und Rahmenbedingungen zu erleichtern [13]. 

Aufgrund ihrer statischen Gestaltung weisen die meisten KI-Labels systematische Schwächen auf. Ursprünglich als Instrument der Differenzierung gedacht, verlieren sie mit der Zeit an Aussagekraft, wenn durch technologische Fortschritte alle Produkte oder Systeme die bestmögliche Bewertungskategorie erzielen [14] oder durch zu konservativ gestaltete Kriterien und fehlende Referenzsysteme die bestmöglichen Bewertungen nach aktuellem Stand der Technik nicht erzielt werden können und dadurch eine intuitiv negative Wahrnehmung des Systems entsteht. Besonders im schnelllebigen Bereich der KI kann dies zu Missinterpretationen und ständigem Anpassungsbedarf führen. Außerdem führt eine steigende Anzahl von Labels zu Verständnisschwierigkeiten und Einschränkungen des praktischen Nutzens [15].

Somit zeigt sich, dass KI-Labels wie das AI Ethics Label zwar Potenzial bieten, die Vertrauenswürdigkeit von KI zu fördern, ihre Wirksamkeit jedoch von weiteren Faktoren wie Benchmarks und Hintergrundwissen zur adäquaten Interpretation bei den Rezipienten abhängt. Insgesamt sind dynamische und nachvollziehbare Bewertungen sowie eine gezielte Einführung in die Bedeutung der zugrundeliegenden Werte zentrale Voraussetzungen, um Missverständnisse zu vermeiden und die praktische Relevanz solcher Labels zu gewährleisten.

KI-basierte Entscheidungsunterstützung im öffentlichen Nahverkehr als Anwendungsfall 

Um die Praxistauglichkeit eines Labels realistisch einschätzen zu können, ist dessen Erprobung in einem konkreten Anwendungsfall unerlässlich. Der vorliegende Beitrag beschreibt daher Lessons Learned aus der konkreten Anwendung des beschriebenen AI Ethics Label auf ein KI-basiertes Entscheidungsunterstützungssystem, das in Leitstellen des öffentlichen Personennahverkehrs (ÖPNV) eingesetzt werden soll [16].

In der Leitstelle eines Verkehrsbetriebes beobachten Disponenten die Busse und Bahnen mithilfe einer Leitstellen-Software, dem sog. Intermodal Traffic Control System (ITCS), und überwachen so die Situation im gesamten ÖPNV der Stadt bzw. der Region. Falls Störungen auftreten (bspw. durch einen Unfall), Schienen blockiert oder Fahrzeuge verspätet sind, greifen die Disponenten ein, um die Auswirkung auf den Fahrgastbetrieb möglichst gering zu halten.

Hierzu lösen die Disponenten sogenannte dispositive Maßnahmen in der Leitstellen-Software aus. Diese äußern sich bspw. in Form von Umleitungen, Kurzwenden oder kleineren Maßnahmen wie dem Warten auf ein verspätetes Fahrzeug, um Fahrgästen das Umsteigen in eine andere Linie zu ermöglichen. In einem Störungsfall müssen die Disponenten schnell reagieren und dabei sehr viele Faktoren gleichzeitig berücksichtigen. Dies verursacht Stress und erfordert einen breiten Erfahrungsschatz.

Auf Basis von historischen operativen Daten aus dem Betrieb wurde ein KI-gestützter Vorschlagsassistent entwickelt. Dieses System soll Disponenten dabei helfen, schwere Entscheidungen über dispositive Maßnahmen in Ruhe und gut überlegt zu treffen. Die KI wird dabei derart trainiert, dass sie eine Vielzahl an relevanten Faktoren einbezieht und in der Folge exakt an die jeweilige Situation angepasste dispositive Maßnahmen vorschlägt. Außerdem soll das System derart mit der Leitstellen-Software verknüpft werden, dass die dispositiven Maßnahmen automatisch ausgelöst werden, wenn die Disponenten den KI-Vorschlag annehmen.

Es handelt sich folglich um ein KI-gestütztes Vorschlagswesen mit dem Ansinnen, die Disponenten zu entlasten und ihnen gleichzeitig die volle Kontrolle über die Vorgänge zu lassen. Demnach soll der KI-basierte Vorschlagsassistent zu einer Stressreduktion in der Leitstelle und einer Verbesserung der Betriebsabläufe führen. Dabei sind die Disponenten durch die Zusammenarbeit mit dem interdisziplinären Projektteam dafür sensibilisiert, dass ein uneingeschränktes Vertrauen in die KI-basierten Empfehlungen unangebracht ist, zumal der KI einige Informationen, bspw. zu regionalen Veranstaltungen oder den Dienstplänen der Fahrer, nicht vorliegen. Die Disponenten wurden allerdings zu diesem Zeitpunkt nicht dezidiert für die Interaktion mit KI-Systemen geschult.

Bedingt durch die inzwischen gemäß Art. 4 des EU-AI Acts gesetzlich verankerte Pflicht zum Aufbau und Nachweis von KI-Kompetenzen ist davon auszugehen, dass in Zukunft ein gesteigertes Verständnis für den zielführenden Umgang mit solchen Systemen vorliegen wird. 

In Hinblick auf ethische KI und menschenzentrierte KI-Gestaltung ist der Anwendungsfall u. a. aufgrund der vielen indirekt betroffenen Personengruppen und des Eingriffs in Entscheidungsprozesse am Arbeitsplatz spannend. So schilderten einige Disponenten in Gesprächen zur Anforderungsanalyse bspw. die Vermutung, dass eine KI ihr intuitives Erfahrungswissen nicht hinreichend abbilden kann. Trotz der verbleibenden Entscheidungshoheit bei den Disponenten erleben diese die KI-Unterstützung mitunter als Abwertung der eigenen Expertise.

Darüber hinaus könnte die Gefahr bestehen, dass das Erfahrungswissen durch eine zu starke Abhängigkeit vom KI-System verloren geht, was wiederum langfristig einen Wissens- und Erfahrungsverlust zur Folge hätte. Neben den Disponenten sind von KI-basierten Umleitungsempfehlungen mittelbar auch die ÖPNV-Fahrer, die Fahrgäste und letztlich die gesamte lokale Bevölkerung betroffen, die am Straßenverkehr teilnimmt. Dadurch kommen partizipative Ansätze der Technikgestaltung unweigerlich an ihre Grenzen und es stellen sich Fragen nach der Gerechtigkeit, wenn die Interessen verschiedener Personengruppe gegeneinander abzuwägen sind.

Es besteht bspw. das Risiko, dass das System bei Umleitungen Linien und Regionen priorisiert, ohne dass diese Entscheidungen von den Fahrern und Fahrgästen als gerecht und nachvollziehbar erlebt werden. Weiterführende Informationen hierzu finden sich in [16] und [17]. 

Bild 2: KI-basierte Entscheidungsunterstützung im ITCS.
Bild 2: KI-basierte Entscheidungsunterstützung im ITCS.

Lessons Learned bei der Erstellung des AI Ethics Label für den Anwendungsfall

Die Grundlage für die Erstellung des AI Ethics Labels für den beschriebenen Anwendungsfall liefert die Spezifikation VDE SPEC 90012 V1.0 (en) aus dem Jahr 2022. Diese berücksichtigt die fünf Werte Transparenz, Rechenschaftspflicht, Privatsphäre, Fairness/Gerechtigkeit und Zuverlässigkeit und übersetzt diese im Rahmen des VCIO-Frameworks in relevante Kriterien, Indikatoren sowie zugehörige Messgrößen.

In einem gemeinsamen Diskussionsprozess legten Vertreter aus dem Entwicklungsteam der KI-Lösung sowie Forschende der Hochschule Karlsruhe die jeweiligen Einstufungen für die Messgrößen auf der vorgegebenen Skala für den Erfüllungsgrad von A (voll erfüllt) bis G (nicht erfüllt) fest. Das bewertete System lag im Prototypen-Stadium vor. Grundlage der Bewertung war jeweils der erwartete Systemzustand beim anvisierten Übergang des Systems in den Produktivbetrieb. Die Bewertungen der einzelnen Messgrößen wurden nachfolgend auf Werte-Ebene aggregiert und entsprechend das Label erstellt. 

Im Rahmen der Anwendung zeigte sich, dass das Framework einem ausgeprägt konservativen Bewertungsansatz folgt. Dies erwies sich insbesondere dann als problematisch, wenn abgefragte Maßnahmen für den untersuchten Anwendungskontext nicht relevant erschienen und entsprechend nicht durchgeführt wurden. So werden im Kriterium „Fairness“ beispielsweise Maßnahmen gegen voreingenommene Daten abgefragt, die schädlich für Menschen sein könnten.

Das vorliegende System beinhaltet allerdings keine personenbezogenen Daten, sondern ausschließlich die relevanten Daten des Bahnnetzes wie Streckenpläne und Verkehrsaufkommen, die für die Planungsarbeit der Disponenten von entscheidender Bedeutung sind. Entgegen vorigen Überlegungen wurde bewusst darauf verzichtet, qualitative Beschreibungen von Einzelereignissen wie Unfällen zu integrieren, die unter Umständen personenbezogene Daten wie KFZ-Kennzeichen o.Ä. enthalten. 

Entsprechend kann keine personenbezogene Voreingenommenheit der Daten vorliegen und es bestand kein Bedarf, spezifische Maßnahmen zu ergreifen. In diesen Fällen führte die fehlende Relevanz zu einer Bewertung mit „G“. Dies beeinflusste das Gesamtergebnis negativ, zumal sich die Erfüllungsgrade der Kriterien aus dem Durchschnitt der Messgrößen mit Aufrundung von Nachkommastellen ergeben. So musste daher bspw. das Kriterium „Reliability“ mit „D“ (=3) bewertet werden, da die beiden zugrundeliegenden Indikatoren die Bewertung „C“ (=2) und „D“ (=3) erhalten hatten. Das Framework ermöglicht ebenfalls eine Vorgehensweise nach dem „minimum requirement“-Prinzip, bei dem zusätzlich die Risiken des Anwendungskontexts miteinfließen, das für diesen Beitrag allerdings vernachlässigt wurde.

Bild 3: Das VCIO-Framework und die Berechnung des Labels am Beispiel des Werts „Reliability“.
Bild 3: Das VCIO-Framework und die Berechnung des Labels am Beispiel des Werts „Reliability“.

Anhand der konkreten Anwendung zeigt sich außerdem, dass die Entwicklung generischer Labels für KI-Systeme herausfordernd ist. Die Bewertungslogik des Frameworks ließ wenig Anpassungsspielraum für den technischen und organisationalen Anwendungskontext, sodass die umgebende Systemlandschaft unzureichend beleuchtet werden konnte. Zudem erschien eine Anpassung der Gewichtung der Indikatoren sinnvoll, da ansonsten Messgrößen, die etwa die Herkunft und Sicherheit der Daten beschreiben, mit der Dokumentation der Entwicklungsschritte gleichgesetzt werden. Grundsätzlich legte das Framework großen Wert auf das Vorliegen von Dokumentation zu getroffenen Entscheidungen, verwendeten Daten und Algorithmen im Vergleich zur Bewertung der tatsächlichen Implementierung von Werten.

Diese mangelnde Kontextsensitivität erzwingt die Bewertung von Indikatoren, selbst wenn diese nur mäßig zum Anwendungskontext passen. Ferner scheint es ebenfalls relevant zu sein, welche Person eine solche Bewertung gemäß dem VCIO-Framework durchführt, da unterschiedliche Qualifikationen zu abweichenden Interpretationen und Bewertungen führen können. So würden Entwickler womöglich ein anderes Label als Resultat erhalten als andere Mitarbeitende in einem Unternehmen. Schlussendlich bleibt unklar, wer eine solche Bewertung im Optimalfall durchführt und welche Eignung hierfür notwendig ist.

Der konservative Bewertungsansatz und die begrenzte Kontextsensitivität des Frameworks werfen Fragen hinsichtlich seiner Akzeptanz und strategischen Nutzbarkeit auf. So kann eine negative Einstufung im Label daraus resultieren, dass Bewertungsmechanismen nicht ausreichend kontextsensitiv sind, Dokumentationspflichten nachlässig behandelt wurden oder schlicht mathematisch ungünstige Aufrundungseffekte auf den verschiedenen Aggregationsebenen entstehen.

In diesem Zusammenhang ist es fraglich, inwiefern Entwickler dazu bereit sind, ihr eigenes System so ehrlich und kritisch zu beurteilen, dass insgesamt womöglich ein negativ wirkendes Label entsteht. Dies birgt die Gefahr einer missbräuchlichen Verwendung. Entwickler, die bemüht sind, ethische Aspekte in die Entwicklung einfließen zu lassen, könnten sich aufgrund einer als zu negativ wahrgenommenen Bewertung dazu verleitet sehen, das eigene System besser zu bewerten. Gleichermaßen könnten Organisationen, die keinerlei Wert auf ethische Systementwicklung legen, die Selbstbewertung dazu nutzen, sich im Markt von Konkurrenten positiv abzugrenzen (sog. ethics washing).

Figure 4:The AI Ethics Label for the ITCS AI Troubleshooting Assistant.
Bild 4: Das AI Ethics Label für den ITCS KI-Störungsassistenten.

In Anbetracht der heterogenen Branchen könnten diese Herausforderungen künftig durch die Entwicklung konfigurierbarer Referenzmodelle adressiert werden, die eine kontext- und anwendungsspezifische Gewichtung von Indikatoren ermöglichen, ohne dabei die Vergleichbarkeit zu beeinträchtigen.

Um dem bestehenden Missbrauchspotenzial weiter entgegenzuwirken und akkurate Interpretationen zu ermöglichen, sollten über die kontextsensitiven Bewertungsmöglichkeiten hinaus klare Regularien und Rollen für den Vergabeprozess der Labels definiert, eine transparente Darlegung der Berechnungsschritte eingefordert und Benchmarks geschaffen werden. Eine Pflicht zur externen Auditierung oder Prüfung könnte ein wirksames Mittel sein, um (bewusste oder unbewusste) Verzerrungen durch Eigeninteressen der Bewertenden zu reduzieren. Derartige Mechanismen sollten im Rahmen laufender Standardisierungsmaßnahmen wie der Joint Specification berücksichtigt werden, um Labels langfristig praktikabel und vertrauenswürdig zu gestalten.

Fazit

Das AI Ethics Label basierend auf dem VCIO-Framework ist ein vielversprechender Ansatz, um ethische Aspekte in der Entwicklung und Bewertung von KI-Systemen zu identifizieren und transparent zu machen. Die praktische Anwendung im konkreten Fall führte zu einer stärkeren Sensibilität für die relevanten ethischen Aspekte, offenbarte jedoch auch einige spezifische und generelle Herausforderungen.

Es lässt sich feststellen, dass der konservative Bewertungsansatz sowie eine mangelnde Kontextsensitivität zu Missbrauchspotenzialen und Fehlinterpretationen führen können, was den Nutzenden eine angemessene Einordnung der Bewertung erschwert. Um das Potenzial des Labels vollständig zu nutzen, ist ein dynamisches Bewertungsmodell mit klaren Rahmenbedingungen und transparenten Berechnungen, das Vorliegen von Benchmarks zur Vergleichbarkeit sowie ggfs. eine Rechenschaftspflicht unabdingbar. Kontextspezifische Anpassungsmöglichkeiten könnten schlussendlich dazu führen, dass das Label nicht nur vertrauenswürdig und vergleichbar, sondern auch praktikabel ist.

Die Publikation entstand im Projekt „Kompetenzzentrum KARL – Künstliche Intelligenz für Arbeit und Lernen in der Region Karlsruhe“. Das Projekt wird durch das Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) im Programm „Zukunft der Wertschöpfung – Forschung zu Produktion, Dienstleistung und Arbeit“ (Förderkennzeichen: 02L19C250) gefördert.


Literatur

[1] Csaszar, F. A.; Ketkar, H.; Kim, H.: Artificial Intelligence and Strategic Decision-Making: Evidence from Entrepreneurs and Investors. In: Strategy Science 9 (2024) 4, S. 322–345. DOI: https://doi.org/10.1287/stsc.2024.0190.
[2] Poszler, F.; Lange, B.: The impact of intelligent decision-support systems on humans’ ethical decision-making: A systematic literature review and an integrated framework. In: Technological Forecasting and Social Change 9 (2024), S. 123403. DOI: https://doi.org/10.1016/j.techfore.2024.123403.
[3] Thorne, S.: Understanding the Interplay Between Trust, Reliability, and Human Factors in the Age of Generative AI. In: International journal of simulation: systems, science & technology (2024). DOI: https://doi.org/10.5013/IJSSST.a.25.01.10.
[4] Lyons, J. B.; Guznov, S. Y.: Individual differences in human–machine trust: A multi-study look at the perfect automation schema. In: Theoretical Issues in Ergonomics Science 20 (2019) 4, S. 440–458. DOI: https://doi.org/10.1080/1463922X.2018.1491071.
[5] Lee, J. D.; See, K. A.: Trust in automation: designing for appropriate reliance. In: Human factors 46 (2004) 1, S. 50–80, 2004. DOI: https://doi.org/10.1518/hfes.46.1.50_30392.
[6] Europäische Kommission: Ethikleitlinien für vertrauenswürdige KI. URL: https://digital-strategy.ec.europa.eu/de/library/ethics-guidelines-trustworthy-ai, Abrufdatum 16.04.2025.
[7] Spiekermann, S.: Value-based Engineering: Prinzipien und Motivation für bessere IT-Systeme. In: Informatik Spektrum 44 (2021) 4, S. 247–256. DOI: https://doi.org/10.1007/s00287-021-01378-4.
[8] AI Ethics Impact Group: From Principles to Practice: An interdisciplinary framework to operationalise AI ethics. URL: https://www.bertelsmann-stiftung.de/fileadmin/files/BSt/Publikationen/GrauePublikationen/WKIO_2020_final.pdf, Abrufdatum 20.06.2025.
[9] Scharowski, N.; Benk, M.; Kühne, S. J.; Wettstein, L.; Brühlmann, F.: Certification Labels for Trustworthy AI: Insights From an Empirical Mixed-Method Study. In: Proceedings of the 2023 ACM Conference on Fairness, Accountability, and Transparency (2023), S. 248–260. DOI: https://doi.org/10.1145/3593013.3593994.
[10] VDE: VCIO based description of VCIO based description of systems for AI trustworthiness characterisation: VDE SPEC 90012 V1.0 (en). URL: https://www.vde.com/resource/blob/2337818/a24b13db01773747e6b7bba4ce20ea60/vcio-based-description-of-systems-for-ai-trustworthiness-characterisationvde-spec-90012-v1-0–en–data.pdf, Abrufdatum 20.06.2025.
[11] Positive AI: The Positive AI Label. URL: https://positive.ai/the-ai-label, Abrufdatum 20.06.2025.
[12] A. Jedlickova: Ensuring Ethical Standards in the Development of Autonomous and Intelligent Systems. In: IEEE Trans. Artif. Intell. 5 (2024) 12, S. 5863–5872. DOI: https://doi.org/10.1109/TAI.2024.3387403.
[13] Businesswire – A Birkshire Hathaway Company: IEEE Standards Association kündigt Joint Specification V1.0 für die Bewertung der Vertrauenswürdigkeit von KI-Systemen an. URL: https://www.businesswire.com/news/home/20241121943713/de, Abrufdatum 20.06.2025
[14] Bakirtzis, G.; Tubella, A. A.; Theodorou, A.; Danks, D.; Topcu, U.: Navigating the sociotechnical labyrinth: dynamic certification for responsible embodied AI. In: Bi-directionality in Human-AI Collaborative Systems (2025), S. 333–348. DOI: https://doi.org/10.1016/B978-0-44-340553-2.00019-8.
[15] Harbaugh, R.; Maxwell, J. W.; Roussillon, B.: Label Confusion: The Groucho Effect of Uncertain Standards: In: Management Science 57 (2011) 9, S. 1512–1527. DOI: https://doi.org/10.1287/mnsc.1110.1412.
[16] Kopp, T.; Weitemeyer, R.; Beyer, J.; Ziegler, D.; Hess, R.: Künstliche Intelligenz zur Entscheidungsunterstützung in Leitstellen des Personennahverkehrs – Technische und sozio-technische Herausforderungen. In: HMD 60 (2023) 6, S. 1156–1173. DOI: https://doi.org/10.1365/s40702-023-00996-8.
[17] Kinkel, S.; Kopp, T.: Menschenzentrierte und transparente KI-Lösungen gestalten und einführen – Erkenntnisse aus dem Kompetenzzentrum KARL. In: GFA – Gesellschaft für Arbeitswissenschaft (Hrsg): Arbeitswissenschaft in-the-loop. Mensch-Technologie-Integration und ihre Auswirkung auf Mensch, Arbeit und Arbeitsgestaltung. 70. Arbeitswissenschaftlicher Kongress. Stuttgart, 6.–8. März 2024. Sankt Augustin: GfA-Press 2024.

Ihre Downloads


Potenziale: Führung Qualifizierung
Lösungen: Prozessmanagement

Das könnte Sie auch interessieren

Kompetenzentwicklung für die Zukunft

Kompetenzentwicklung für die Zukunft

Trendiation als strategischer Ansatz für die Qualifizierung und Weiterbildung
Jürgen Fritz, Sebastian Busse, Ingo Dieckmann, Torsten Laub
Da Industrie 4.0 und Künstliche Intelligenz die Fähigkeiten von Organisationen neu gestalten, müssen traditionelle Schulungssysteme an die sich wandelnden Qualifikationsanforderungen angepasst werden. In diesem Beitrag wird Trendiation vorgestellt – eine strukturierte Methodik zur Umsetzung neuer Trends in umsetzbare Strategien – als systematischer Ansatz für diese Herausforderung. Anhand einer workshopbasierten Anwendung, die sich mit Edutainment, Human-Centered Design und Workforce Transformation befasst, zeigen wir, wie Organisationen von der abstrakten Trendidentifizierung zu konkreten Qualifikationsanforderungen und priorisierten Schulungsinitiativen gelangen können. Die Methode erzeugt eine nachvollziehbare Ergebniskette, die Trenddefinition, Bewertung von Kompetenzlücken und Implementierungspläne umfasst. Aus Sicht der Teilnehmer zeichnet sich der Ansatz durch hohe Klarheit und praktischen Nutzen aus. Durch die Verbindung von prospektivischer Trendanalyse und ...
Industry 4.0 Science | 42. Jahrgang | 2026 | Ausgabe 2 | Seite 22-29 | DOI 10.30844/I4SD.26.2.22
Operationalisierung ethischer KI mit tachAId

Operationalisierung ethischer KI mit tachAId

Validierung eines interaktiven Beratungstools in zwei Anwendungsfällen aus der Fertigungsindustrie
Pavlos Rath-Manakidis, Henry Huick, Björn Krämer ORCID Icon, Laurenz Wiskott ORCID Icon
Die Integration künstlicher Intelligenz (KI) in Arbeitsprozesse verspricht erhebliche Effizienzsteigerungen, doch Unternehmen stehen dabei vor zahlreichen ethischen Herausforderungen, die den Beteiligten zunächst oft nicht bewusst sind – von Intransparenz in der Entscheidungsfindung über algorithmische Verzerrungen bis hin zu Risiken einer verfrühten Automatisierung. Dieser Beitrag stellt das Design und die Validierung von tachAId vor, einem interaktiven Beratungstool, das darauf abzielt, menschenzentrierte ethische Überlegungen in die Entwicklung von KI-Lösungen einzubetten. Es wird eine Validierungsstudie vorgestellt, die für zwei unterschiedliche industrielle KI-Anwendungen mit variierendem KI-Reifegrad durchgeführt wurde. tachAId lenkt die Aufmerksamkeit gezielt auf kritische ethische Überlegungen im gesamten Lebenszyklus von KI-Lösungen, die bei einer technisch orientierten Entwicklung möglicherweise übersehen werden. Die Ergebnisse zeigen jedoch auch eine zentrale ...
Industry 4.0 Science | 42. Jahrgang | 2026 | Ausgabe 1 | Seite 50-59 | DOI 10.30844/I4SD.26.1.50
JOCAT (Job Change Acceptance Toolbox)

JOCAT (Job Change Acceptance Toolbox)

Ein Change-Management-Ansatz für die ethische und nachhaltige Implementierung von KI-Systemen
Sophie Berretta ORCID Icon, Pauline Nolte, Annette Kluge ORCID Icon, Skrolan Kopka
KI-Systeme stellen aufgrund ihrer dynamischen, undurchsichtigen und ethisch sensiblen Natur eine Herausforderung für das konventionelle Chanage-Management dar. Dieser Artikel wendet etablierte Change-Management-Modellen auf KI-spezifische Herausforderungen an und veranschaulicht den resultierenden Anpassungsbedarf anhand eines realen Anwendungsfalls. Die daraus resultierenden Erkenntnisse werden durch sechs Interviews mit Expertinnen und Experten aus der Praxis untermauert. Zusammen bilden sie die Grundlage für die Entwicklung der Job Change Acceptance Toolbox (JOCAT), einem modularen, praxisorientierten Hilfsmittel, das die Umsetzung von humanzentrierten, ethischen und nachhaltigen KI-bezogenen Veränderungsprozessen unterstützen soll.
Industry 4.0 Science | 42. Jahrgang | 2026 | Ausgabe 1 | Seite 80-91 | DOI 10.30844/I4SD.26.1.80
Mitbestimmungsdialoge zur humanzentrierten KI-Einführung

Mitbestimmungsdialoge zur humanzentrierten KI-Einführung

Dialogisches Verfahren der Entwicklung einer betriebsspezifischen Mitbestimmungspraxis
Manfred Wannöffel ORCID Icon, Fabian Hoose ORCID Icon, Alexander Ranft, Claudia Niewerth ORCID Icon, Dirk Stüter
Im Rahmen des vom Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) geförderten regionalen Kompetenzzentrums „humAIne“ wurde mit dem Instrument der Mitbestimmungsdialoge ein Verfahren entwickelt, mit dem ein gemeinsames Verständnis über die komplexen Herausforderungen bei der Einführung von Künstlicher Intelligenz (KI) zwischen Management, Beschäftigten und Interessenvertretungen schrittweise im Dialog erarbeitet wird. Erfahrungen aus Projektpartnerbetrieben – wie Doncasters Precision Castings-Bochum GmbH (DPC) – zeigen exemplarisch auf, wie mit den Mitbestimmungsdialogen nicht nur rechtlich verbindliche Regelungen zu einer handhabbaren, betrieblich verankerten, nachhaltigen Praxis der Mitbestimmung bei KI entwickelt, sondern zugleich auch kontinuierliche Qualifizierungsprozesse für alle beteiligten Akteursgruppen im Sinne des Art. 4 und 5 des EU AI Act angestoßen werden.
Industry 4.0 Science | 42. Jahrgang | 2026 | Ausgabe 1 | Seite 92-98 | DOI 10.30844/I4SD.26.1.92
Regulierung von humanzentrierter KI in Betrieben

Regulierung von humanzentrierter KI in Betrieben

Die HUMAINE Muster-Betriebsvereinbarung
Alexander Ranft, Fabian Hoose ORCID Icon, Claudia Niewerth ORCID Icon, Mathias Preuß, Manfred Wannöffel ORCID Icon
Die Einführung von Systemen der Künstlichen Intelligenz (KI) in Betrieben stellt neue Anforderungen an Regulierung und Mitbestimmung. Mit dem EU AI Act gelten seit 2025 verbindliche Vorgaben, die national mit dem Betriebsverfassungsgesetz (BetrVG) verknüpft werden müssen. Das regionale Kompetenzzentrum HUMAINE hat hierzu eine Muster-Betriebsvereinbarung KI (MBV KI) nach § 77 BetrVG entwickelt, die betriebliche Mitbestimmungsrechte stärkt und die europäische Regulierungspraxis praxisnah umsetzt. Flankiert durch Mitbestimmungsdialoge ermöglicht die MBV KI eine betriebsspezifische Anpassung für einen verantwortungsvollen und humanzentrierten KI-Einsatz. Der Beitrag zeigt am Beispiel ausgewählter Teile der MBV KI, wie eine Rahmen-Betriebsvereinbarung KI konkret gestaltet werden kann und diskutiert die Übertragbarkeit auch auf Betriebe ohne Betriebsrat. Die so vorgestellte MBV KI leistet einen Beitrag zur nachhaltigen, sozialpartnerschaftlich abgesicherten Gestaltung der ...
Industry 4.0 Science | 42. Jahrgang | 2026 | Ausgabe 1 | Seite 14-21 | DOI 10.30844/I4SD.26.1.14