Vertrauen in KI-Systeme
In Unternehmen greifen Mitarbeitende beispielsweise im Gesundheits- oder Finanzwesen, der Strafverfolgung und der Strategieentwicklung bei der Entscheidungsfindung zunehmend auf KI-Systeme zurück [1]. Dies betrifft auch moralisch relevante Entscheidungen [2]. Deswegen ist es essenziell, dass Entscheidungstragende in Unternehmen in der Lage sind, die Vertrauenswürdigkeit einer KI-basierten Empfehlung valide und akkurat zu beurteilen und ggf. kritisch zu hinterfragen. Entsprechend stellen sich zunehmend die Fragen, wie vertrauenswürdig aktuelle KI-Systeme sind und inwiefern es Menschen gelingt, KI-generierte Empfehlungen kritisch zu bewerten [3].
Bisher scheint es Nutzenden allerdings schwerzufallen, KI-Systeme in einem angemessenen Maße zu vertrauen [4]. Ein zu geringes Vertrauen in die KI-generierten Ergebnisse führt zu einer ablehnenden Haltung oder einer zögerlichen Nutzung. Dies ist ebenso bedenklich wie ein zu hohes, sog. blindes Vertrauen, das die unreflektierte Übernahme von Fehleinschätzungen der KI zur Folge hat [5]. Eine angemessene Vertrauenskalibrierung, wie bspw. auch im EU AI Act gefordert [6], ist allerdings angesichts der hohen Komplexität und mitunter intransparenten Funktionsweise moderner Technologien schwer zu erreichen [5].
Die vertrauenswürdige KI-Gestaltung ist ein zentrales Merkmal zahlreicher Ethikrichtlinien und -grundsätze. Um eine angemessene Einschätzung der Vertrauenswürdigkeit von KI-Systemen voranzutreiben, haben verschiedene Organisationen wie die EU „ethische Leitlinien für vertrauenswürdige KI“ entwickelt [6]. Solche Leitlinien erweisen sich allerdings für Unternehmen häufig als zu abstrakt, zumal sie zu wenig konkrete Handlungsanweisungen bieten [7]. Dementsprechend bleibt es unklar, wie Organisationen solche Grundsätze in der Praxis umsetzen können [8]. In diesem Zusammenhang spielen sog. Labels oder „Zertifizierungskennzeichen“ eine wichtige Rolle, um den Anwendern die Vertrauenswürdigkeit eines Systems transparent zu vermitteln [9].
KI-Labels als Mittel für angemessenes Vertrauen?
KI-Labels fungieren als Instrument, um die Implementierung von ethischen Grundsätzen und Werten transparent nachzuweisen und damit ein angemessenes Vertrauen in KI-Systeme zu befördern [8]. Vor diesem Hintergrund sind in den vergangenen Jahren verschiedene Ansätze für KI-Labels und Zertifizierungen entstanden. Im Wesentlichen dienen Labels der Vergleichbarkeit von Produkten oder fungieren als Qualitätsnachweis. Die AI Ethics Impact Group entwickelte etwa ein Label nach dem Vorbild des Energieeffizienzlabels, welches dezidiert relevante ethische Werte berücksichtigt und darstellt [8].
Das Label basiert auf dem VCIO-Framework (Werte, Kriterien, Indikatoren und beobachtbare Größen), das darauf abzielt, ethische Grundsätze praktikabel, vergleichbar und messbar zu machen. Dazu werden Werte in relevante Kriterien, Indikatoren und in beobachtbare Messgrößen (engl. observables) übersetzt. Diese Übersetzung befähigt Entwicklern dazu, eigenständig zu evaluieren, inwiefern die Werte in Systemen implementiert und berücksichtigt wurden. Dazu müssen die Erfüllungsgrade vorgegebener Indikatoren auf einer Skala von A bis G bewertet werden. Nach der Einstufung einzelner Indikatoren lassen sich diese aggregieren, um den Erfüllungsgrad der übergeordneten Kriterien und schlussendlich der Werte zu berechnen.
Folglich stellt die Bewertung „A“ die vollständige Implementierung eines Wertes im System dar. Ziel des Labels ist es, die Vertrauenswürdigkeit von KI-Systemen schnell und intuitiv zu vermitteln und die Vergleichbarkeit von KI-Systemen zu erhöhen [10].
Neben der AI Ethics Impact Group haben auch andere Akteure Labeling- bzw. Zertifizierungsansätze entwickelt, um ethische KI zu fördern. Beispielsweise verfolgt das Positive AI Label einen stärker organisationsbezogenen Ansatz, der auf sechs Prinzipien verantwortungsvoller KI basiert und Unternehmen hinsichtlich ihres Reifegrads sowie ihrer ethischen Entwicklungspotenziale bewertet. Darüber hinaus unterstützt das Label Organisationen bei der Implementierung von Daten- und Algorithmus-Governance und fördert eine Kultur auf Grundlage gemeinsamer Werte innerhalb der Unternehmen [11].
Im Gegensatz zu diesem organisationalen Ansatz richtet sich das Label IEEE CertifAIEd der IEEE Standards Association (IEEE SA) auf die Zertifizierung konkreter KI-Systeme. IEEE CertifAIEd ist ein Produktzertifizierungsprogramm, das darauf abzielt, Standards für Zertifizierungsprozesse zu etablieren, die unterschiedliche Werte in Systemen fördern. In diesem Zusammenhang wurde eine Zertifizierungsmethodik zur Bewertung der ethischen Auswirkungen von KI-Systemen entwickelt und eingeführt. Das Ziel besteht darin, die sichere, vertrauenswürdige und ethische Nutzung von KI-Produkten oder -Dienstleistungen zu gewährleisten. Zu diesem Zweck wurden strenge Kriterien für die Bewertung und Zertifizierung von Systemen im Hinblick auf ethische Risiken festgelegt [12]. Eine Übersicht zu den diskutierten Labels findet sich in der folgenden Tabelle.

Durch die vielfältigen Labels und Zertifizierungen im Bereich der KI-Ethik fehlt bislang ein einheitlicher Standard, der Nutzenden die zuverlässige und vergleichbare Beurteilung der Vertrauenswürdigkeit von KI-Systemen ermöglicht. Daher haben sich VDE, IEEE, Positive AI und IRT SystemX (Koordinator von Confiance.ai) zusammengeschlossen, um eine gemeinsame Spezifikation zu entwickeln und so die Bewertung von KI-Systemen weltweit zu vereinheitlichen und zu optimieren. Diese Joint Specification befindet sich derzeit noch in Entwicklung, soll aber künftig die Stärken von IEEE CertifAIEd, VDE VDESPEC 90012 (VDE Publikation des AI Ethics Labels) und dem Positive AI Framework vereinen, um die Einhaltung globaler regulatorischer Anforderungen und Rahmenbedingungen zu erleichtern [13].
Aufgrund ihrer statischen Gestaltung weisen die meisten KI-Labels systematische Schwächen auf. Ursprünglich als Instrument der Differenzierung gedacht, verlieren sie mit der Zeit an Aussagekraft, wenn durch technologische Fortschritte alle Produkte oder Systeme die bestmögliche Bewertungskategorie erzielen [14] oder durch zu konservativ gestaltete Kriterien und fehlende Referenzsysteme die bestmöglichen Bewertungen nach aktuellem Stand der Technik nicht erzielt werden können und dadurch eine intuitiv negative Wahrnehmung des Systems entsteht. Besonders im schnelllebigen Bereich der KI kann dies zu Missinterpretationen und ständigem Anpassungsbedarf führen. Außerdem führt eine steigende Anzahl von Labels zu Verständnisschwierigkeiten und Einschränkungen des praktischen Nutzens [15].
Somit zeigt sich, dass KI-Labels wie das AI Ethics Label zwar Potenzial bieten, die Vertrauenswürdigkeit von KI zu fördern, ihre Wirksamkeit jedoch von weiteren Faktoren wie Benchmarks und Hintergrundwissen zur adäquaten Interpretation bei den Rezipienten abhängt. Insgesamt sind dynamische und nachvollziehbare Bewertungen sowie eine gezielte Einführung in die Bedeutung der zugrundeliegenden Werte zentrale Voraussetzungen, um Missverständnisse zu vermeiden und die praktische Relevanz solcher Labels zu gewährleisten.
KI-basierte Entscheidungsunterstützung im öffentlichen Nahverkehr als Anwendungsfall
Um die Praxistauglichkeit eines Labels realistisch einschätzen zu können, ist dessen Erprobung in einem konkreten Anwendungsfall unerlässlich. Der vorliegende Beitrag beschreibt daher Lessons Learned aus der konkreten Anwendung des beschriebenen AI Ethics Label auf ein KI-basiertes Entscheidungsunterstützungssystem, das in Leitstellen des öffentlichen Personennahverkehrs (ÖPNV) eingesetzt werden soll [16].
In der Leitstelle eines Verkehrsbetriebes beobachten Disponenten die Busse und Bahnen mithilfe einer Leitstellen-Software, dem sog. Intermodal Traffic Control System (ITCS), und überwachen so die Situation im gesamten ÖPNV der Stadt bzw. der Region. Falls Störungen auftreten (bspw. durch einen Unfall), Schienen blockiert oder Fahrzeuge verspätet sind, greifen die Disponenten ein, um die Auswirkung auf den Fahrgastbetrieb möglichst gering zu halten.
Hierzu lösen die Disponenten sogenannte dispositive Maßnahmen in der Leitstellen-Software aus. Diese äußern sich bspw. in Form von Umleitungen, Kurzwenden oder kleineren Maßnahmen wie dem Warten auf ein verspätetes Fahrzeug, um Fahrgästen das Umsteigen in eine andere Linie zu ermöglichen. In einem Störungsfall müssen die Disponenten schnell reagieren und dabei sehr viele Faktoren gleichzeitig berücksichtigen. Dies verursacht Stress und erfordert einen breiten Erfahrungsschatz.
Auf Basis von historischen operativen Daten aus dem Betrieb wurde ein KI-gestützter Vorschlagsassistent entwickelt. Dieses System soll Disponenten dabei helfen, schwere Entscheidungen über dispositive Maßnahmen in Ruhe und gut überlegt zu treffen. Die KI wird dabei derart trainiert, dass sie eine Vielzahl an relevanten Faktoren einbezieht und in der Folge exakt an die jeweilige Situation angepasste dispositive Maßnahmen vorschlägt. Außerdem soll das System derart mit der Leitstellen-Software verknüpft werden, dass die dispositiven Maßnahmen automatisch ausgelöst werden, wenn die Disponenten den KI-Vorschlag annehmen.
Es handelt sich folglich um ein KI-gestütztes Vorschlagswesen mit dem Ansinnen, die Disponenten zu entlasten und ihnen gleichzeitig die volle Kontrolle über die Vorgänge zu lassen. Demnach soll der KI-basierte Vorschlagsassistent zu einer Stressreduktion in der Leitstelle und einer Verbesserung der Betriebsabläufe führen. Dabei sind die Disponenten durch die Zusammenarbeit mit dem interdisziplinären Projektteam dafür sensibilisiert, dass ein uneingeschränktes Vertrauen in die KI-basierten Empfehlungen unangebracht ist, zumal der KI einige Informationen, bspw. zu regionalen Veranstaltungen oder den Dienstplänen der Fahrer, nicht vorliegen. Die Disponenten wurden allerdings zu diesem Zeitpunkt nicht dezidiert für die Interaktion mit KI-Systemen geschult.
Bedingt durch die inzwischen gemäß Art. 4 des EU-AI Acts gesetzlich verankerte Pflicht zum Aufbau und Nachweis von KI-Kompetenzen ist davon auszugehen, dass in Zukunft ein gesteigertes Verständnis für den zielführenden Umgang mit solchen Systemen vorliegen wird.
In Hinblick auf ethische KI und menschenzentrierte KI-Gestaltung ist der Anwendungsfall u. a. aufgrund der vielen indirekt betroffenen Personengruppen und des Eingriffs in Entscheidungsprozesse am Arbeitsplatz spannend. So schilderten einige Disponenten in Gesprächen zur Anforderungsanalyse bspw. die Vermutung, dass eine KI ihr intuitives Erfahrungswissen nicht hinreichend abbilden kann. Trotz der verbleibenden Entscheidungshoheit bei den Disponenten erleben diese die KI-Unterstützung mitunter als Abwertung der eigenen Expertise.
Darüber hinaus könnte die Gefahr bestehen, dass das Erfahrungswissen durch eine zu starke Abhängigkeit vom KI-System verloren geht, was wiederum langfristig einen Wissens- und Erfahrungsverlust zur Folge hätte. Neben den Disponenten sind von KI-basierten Umleitungsempfehlungen mittelbar auch die ÖPNV-Fahrer, die Fahrgäste und letztlich die gesamte lokale Bevölkerung betroffen, die am Straßenverkehr teilnimmt. Dadurch kommen partizipative Ansätze der Technikgestaltung unweigerlich an ihre Grenzen und es stellen sich Fragen nach der Gerechtigkeit, wenn die Interessen verschiedener Personengruppe gegeneinander abzuwägen sind.
Es besteht bspw. das Risiko, dass das System bei Umleitungen Linien und Regionen priorisiert, ohne dass diese Entscheidungen von den Fahrern und Fahrgästen als gerecht und nachvollziehbar erlebt werden. Weiterführende Informationen hierzu finden sich in [16] und [17].

Lessons Learned bei der Erstellung des AI Ethics Label für den Anwendungsfall
Die Grundlage für die Erstellung des AI Ethics Labels für den beschriebenen Anwendungsfall liefert die Spezifikation VDE SPEC 90012 V1.0 (en) aus dem Jahr 2022. Diese berücksichtigt die fünf Werte Transparenz, Rechenschaftspflicht, Privatsphäre, Fairness/Gerechtigkeit und Zuverlässigkeit und übersetzt diese im Rahmen des VCIO-Frameworks in relevante Kriterien, Indikatoren sowie zugehörige Messgrößen.
In einem gemeinsamen Diskussionsprozess legten Vertreter aus dem Entwicklungsteam der KI-Lösung sowie Forschende der Hochschule Karlsruhe die jeweiligen Einstufungen für die Messgrößen auf der vorgegebenen Skala für den Erfüllungsgrad von A (voll erfüllt) bis G (nicht erfüllt) fest. Das bewertete System lag im Prototypen-Stadium vor. Grundlage der Bewertung war jeweils der erwartete Systemzustand beim anvisierten Übergang des Systems in den Produktivbetrieb. Die Bewertungen der einzelnen Messgrößen wurden nachfolgend auf Werte-Ebene aggregiert und entsprechend das Label erstellt.
Im Rahmen der Anwendung zeigte sich, dass das Framework einem ausgeprägt konservativen Bewertungsansatz folgt. Dies erwies sich insbesondere dann als problematisch, wenn abgefragte Maßnahmen für den untersuchten Anwendungskontext nicht relevant erschienen und entsprechend nicht durchgeführt wurden. So werden im Kriterium „Fairness“ beispielsweise Maßnahmen gegen voreingenommene Daten abgefragt, die schädlich für Menschen sein könnten.
Das vorliegende System beinhaltet allerdings keine personenbezogenen Daten, sondern ausschließlich die relevanten Daten des Bahnnetzes wie Streckenpläne und Verkehrsaufkommen, die für die Planungsarbeit der Disponenten von entscheidender Bedeutung sind. Entgegen vorigen Überlegungen wurde bewusst darauf verzichtet, qualitative Beschreibungen von Einzelereignissen wie Unfällen zu integrieren, die unter Umständen personenbezogene Daten wie KFZ-Kennzeichen o.Ä. enthalten.
Entsprechend kann keine personenbezogene Voreingenommenheit der Daten vorliegen und es bestand kein Bedarf, spezifische Maßnahmen zu ergreifen. In diesen Fällen führte die fehlende Relevanz zu einer Bewertung mit „G“. Dies beeinflusste das Gesamtergebnis negativ, zumal sich die Erfüllungsgrade der Kriterien aus dem Durchschnitt der Messgrößen mit Aufrundung von Nachkommastellen ergeben. So musste daher bspw. das Kriterium „Reliability“ mit „D“ (=3) bewertet werden, da die beiden zugrundeliegenden Indikatoren die Bewertung „C“ (=2) und „D“ (=3) erhalten hatten. Das Framework ermöglicht ebenfalls eine Vorgehensweise nach dem „minimum requirement“-Prinzip, bei dem zusätzlich die Risiken des Anwendungskontexts miteinfließen, das für diesen Beitrag allerdings vernachlässigt wurde.

Anhand der konkreten Anwendung zeigt sich außerdem, dass die Entwicklung generischer Labels für KI-Systeme herausfordernd ist. Die Bewertungslogik des Frameworks ließ wenig Anpassungsspielraum für den technischen und organisationalen Anwendungskontext, sodass die umgebende Systemlandschaft unzureichend beleuchtet werden konnte. Zudem erschien eine Anpassung der Gewichtung der Indikatoren sinnvoll, da ansonsten Messgrößen, die etwa die Herkunft und Sicherheit der Daten beschreiben, mit der Dokumentation der Entwicklungsschritte gleichgesetzt werden. Grundsätzlich legte das Framework großen Wert auf das Vorliegen von Dokumentation zu getroffenen Entscheidungen, verwendeten Daten und Algorithmen im Vergleich zur Bewertung der tatsächlichen Implementierung von Werten.
Diese mangelnde Kontextsensitivität erzwingt die Bewertung von Indikatoren, selbst wenn diese nur mäßig zum Anwendungskontext passen. Ferner scheint es ebenfalls relevant zu sein, welche Person eine solche Bewertung gemäß dem VCIO-Framework durchführt, da unterschiedliche Qualifikationen zu abweichenden Interpretationen und Bewertungen führen können. So würden Entwickler womöglich ein anderes Label als Resultat erhalten als andere Mitarbeitende in einem Unternehmen. Schlussendlich bleibt unklar, wer eine solche Bewertung im Optimalfall durchführt und welche Eignung hierfür notwendig ist.
Der konservative Bewertungsansatz und die begrenzte Kontextsensitivität des Frameworks werfen Fragen hinsichtlich seiner Akzeptanz und strategischen Nutzbarkeit auf. So kann eine negative Einstufung im Label daraus resultieren, dass Bewertungsmechanismen nicht ausreichend kontextsensitiv sind, Dokumentationspflichten nachlässig behandelt wurden oder schlicht mathematisch ungünstige Aufrundungseffekte auf den verschiedenen Aggregationsebenen entstehen.
In diesem Zusammenhang ist es fraglich, inwiefern Entwickler dazu bereit sind, ihr eigenes System so ehrlich und kritisch zu beurteilen, dass insgesamt womöglich ein negativ wirkendes Label entsteht. Dies birgt die Gefahr einer missbräuchlichen Verwendung. Entwickler, die bemüht sind, ethische Aspekte in die Entwicklung einfließen zu lassen, könnten sich aufgrund einer als zu negativ wahrgenommenen Bewertung dazu verleitet sehen, das eigene System besser zu bewerten. Gleichermaßen könnten Organisationen, die keinerlei Wert auf ethische Systementwicklung legen, die Selbstbewertung dazu nutzen, sich im Markt von Konkurrenten positiv abzugrenzen (sog. ethics washing).

In Anbetracht der heterogenen Branchen könnten diese Herausforderungen künftig durch die Entwicklung konfigurierbarer Referenzmodelle adressiert werden, die eine kontext- und anwendungsspezifische Gewichtung von Indikatoren ermöglichen, ohne dabei die Vergleichbarkeit zu beeinträchtigen.
Um dem bestehenden Missbrauchspotenzial weiter entgegenzuwirken und akkurate Interpretationen zu ermöglichen, sollten über die kontextsensitiven Bewertungsmöglichkeiten hinaus klare Regularien und Rollen für den Vergabeprozess der Labels definiert, eine transparente Darlegung der Berechnungsschritte eingefordert und Benchmarks geschaffen werden. Eine Pflicht zur externen Auditierung oder Prüfung könnte ein wirksames Mittel sein, um (bewusste oder unbewusste) Verzerrungen durch Eigeninteressen der Bewertenden zu reduzieren. Derartige Mechanismen sollten im Rahmen laufender Standardisierungsmaßnahmen wie der Joint Specification berücksichtigt werden, um Labels langfristig praktikabel und vertrauenswürdig zu gestalten.
Fazit
Das AI Ethics Label basierend auf dem VCIO-Framework ist ein vielversprechender Ansatz, um ethische Aspekte in der Entwicklung und Bewertung von KI-Systemen zu identifizieren und transparent zu machen. Die praktische Anwendung im konkreten Fall führte zu einer stärkeren Sensibilität für die relevanten ethischen Aspekte, offenbarte jedoch auch einige spezifische und generelle Herausforderungen.
Es lässt sich feststellen, dass der konservative Bewertungsansatz sowie eine mangelnde Kontextsensitivität zu Missbrauchspotenzialen und Fehlinterpretationen führen können, was den Nutzenden eine angemessene Einordnung der Bewertung erschwert. Um das Potenzial des Labels vollständig zu nutzen, ist ein dynamisches Bewertungsmodell mit klaren Rahmenbedingungen und transparenten Berechnungen, das Vorliegen von Benchmarks zur Vergleichbarkeit sowie ggfs. eine Rechenschaftspflicht unabdingbar. Kontextspezifische Anpassungsmöglichkeiten könnten schlussendlich dazu führen, dass das Label nicht nur vertrauenswürdig und vergleichbar, sondern auch praktikabel ist.
Die Publikation entstand im Projekt „Kompetenzzentrum KARL – Künstliche Intelligenz für Arbeit und Lernen in der Region Karlsruhe“. Das Projekt wird durch das Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) im Programm „Zukunft der Wertschöpfung – Forschung zu Produktion, Dienstleistung und Arbeit“ (Förderkennzeichen: 02L19C250) gefördert.
Literatur
[1] Csaszar, F. A.; Ketkar, H.; Kim, H.: Artificial Intelligence and Strategic Decision-Making: Evidence from Entrepreneurs and Investors. In: Strategy Science 9 (2024) 4, S. 322–345. DOI: https://doi.org/10.1287/stsc.2024.0190.[2] Poszler, F.; Lange, B.: The impact of intelligent decision-support systems on humans’ ethical decision-making: A systematic literature review and an integrated framework. In: Technological Forecasting and Social Change 9 (2024), S. 123403. DOI: https://doi.org/10.1016/j.techfore.2024.123403.
[3] Thorne, S.: Understanding the Interplay Between Trust, Reliability, and Human Factors in the Age of Generative AI. In: International journal of simulation: systems, science & technology (2024). DOI: https://doi.org/10.5013/IJSSST.a.25.01.10.
[4] Lyons, J. B.; Guznov, S. Y.: Individual differences in human–machine trust: A multi-study look at the perfect automation schema. In: Theoretical Issues in Ergonomics Science 20 (2019) 4, S. 440–458. DOI: https://doi.org/10.1080/1463922X.2018.1491071.
[5] Lee, J. D.; See, K. A.: Trust in automation: designing for appropriate reliance. In: Human factors 46 (2004) 1, S. 50–80, 2004. DOI: https://doi.org/10.1518/hfes.46.1.50_30392.
[6] Europäische Kommission: Ethikleitlinien für vertrauenswürdige KI. URL: https://digital-strategy.ec.europa.eu/de/library/ethics-guidelines-trustworthy-ai, Abrufdatum 16.04.2025.
[7] Spiekermann, S.: Value-based Engineering: Prinzipien und Motivation für bessere IT-Systeme. In: Informatik Spektrum 44 (2021) 4, S. 247–256. DOI: https://doi.org/10.1007/s00287-021-01378-4.
[8] AI Ethics Impact Group: From Principles to Practice: An interdisciplinary framework to operationalise AI ethics. URL: https://www.bertelsmann-stiftung.de/fileadmin/files/BSt/Publikationen/GrauePublikationen/WKIO_2020_final.pdf, Abrufdatum 20.06.2025.
[9] Scharowski, N.; Benk, M.; Kühne, S. J.; Wettstein, L.; Brühlmann, F.: Certification Labels for Trustworthy AI: Insights From an Empirical Mixed-Method Study. In: Proceedings of the 2023 ACM Conference on Fairness, Accountability, and Transparency (2023), S. 248–260. DOI: https://doi.org/10.1145/3593013.3593994.
[10] VDE: VCIO based description of VCIO based description of systems for AI trustworthiness characterisation: VDE SPEC 90012 V1.0 (en). URL: https://www.vde.com/resource/blob/2337818/a24b13db01773747e6b7bba4ce20ea60/vcio-based-description-of-systems-for-ai-trustworthiness-characterisationvde-spec-90012-v1-0–en–data.pdf, Abrufdatum 20.06.2025.
[11] Positive AI: The Positive AI Label. URL: https://positive.ai/the-ai-label, Abrufdatum 20.06.2025.
[12] A. Jedlickova: Ensuring Ethical Standards in the Development of Autonomous and Intelligent Systems. In: IEEE Trans. Artif. Intell. 5 (2024) 12, S. 5863–5872. DOI: https://doi.org/10.1109/TAI.2024.3387403.
[13] Businesswire – A Birkshire Hathaway Company: IEEE Standards Association kündigt Joint Specification V1.0 für die Bewertung der Vertrauenswürdigkeit von KI-Systemen an. URL: https://www.businesswire.com/news/home/20241121943713/de, Abrufdatum 20.06.2025
[14] Bakirtzis, G.; Tubella, A. A.; Theodorou, A.; Danks, D.; Topcu, U.: Navigating the sociotechnical labyrinth: dynamic certification for responsible embodied AI. In: Bi-directionality in Human-AI Collaborative Systems (2025), S. 333–348. DOI: https://doi.org/10.1016/B978-0-44-340553-2.00019-8.
[15] Harbaugh, R.; Maxwell, J. W.; Roussillon, B.: Label Confusion: The Groucho Effect of Uncertain Standards: In: Management Science 57 (2011) 9, S. 1512–1527. DOI: https://doi.org/10.1287/mnsc.1110.1412.
[16] Kopp, T.; Weitemeyer, R.; Beyer, J.; Ziegler, D.; Hess, R.: Künstliche Intelligenz zur Entscheidungsunterstützung in Leitstellen des Personennahverkehrs – Technische und sozio-technische Herausforderungen. In: HMD 60 (2023) 6, S. 1156–1173. DOI: https://doi.org/10.1365/s40702-023-00996-8.
[17] Kinkel, S.; Kopp, T.: Menschenzentrierte und transparente KI-Lösungen gestalten und einführen – Erkenntnisse aus dem Kompetenzzentrum KARL. In: GFA – Gesellschaft für Arbeitswissenschaft (Hrsg): Arbeitswissenschaft in-the-loop. Mensch-Technologie-Integration und ihre Auswirkung auf Mensch, Arbeit und Arbeitsgestaltung. 70. Arbeitswissenschaftlicher Kongress. Stuttgart, 6.–8. März 2024. Sankt Augustin: GfA-Press 2024.
Ihre Downloads
Potenziale: Führung Qualifizierung
Lösungen: Prozessmanagement
