Zu meinem Masterstudiengang gehört auch ein wissenschaftliches Praktikum. Ich entschied mich dafür das Praktikum außerhalb von der eigenen Universität zu absolvieren. Damit wollte ich insbesondere die wissenschaftliche Arbeitsweise an einer anderen Universität erfahren. Auch meine Englisch Kenntnisse wollte ich damit ausbauen.
Dabei kam es zur Zusammenarbeit mit Misha Sra an der Universität von Kalifornien in Santa Barbara. Das von Misha Sra geführte Human-AI Integration Lab fokusiert ihre Forschung besonders auf Künstliche Intelligenz (KI) und Extened Reality (XR).
Mit meiner bisherigen Erfahrung mit Media Bias und auch der Entwicklung von VR-Applikationen, entschieden wir uns zusammen eine Studie zur Wahrnehmung von KI Agenten durchzuführen. In meinem 3-monatigen Praktikum führen ich deshalb mit der Unterstützung von Misha Sra und anderen Mitarbeitern des Labors eine Laborstudie durch. Die Ergebnisse sollen anschließend in einem wissenschaftlichen Paper dokumentiert werden.
Die Studie soll Fragen klären wie:
Wie wird ein KI-Agent, der über kontroverse Themen spricht, wahrgenommen?
Ist die Wahrnehmung je nach Interaktionsmethode unterschiedlich?
Beinflusst die Meinung des KI-Agenten die Wahrnehmung?
In der Studie werden die Versuchspersonen eine 5 minütige Unterhaltung mit einem KI Agenten in einer VR Umgebung führen. Thema des Gesprächs sind die aktuellen Gesetze zu Waffenbesitz und Nutzung in den USA. Nach der Unterhaltung werden die Versuchspersonen verschiedene Fragen zur Wahrnehmung des KI-Agenten beantworten.
Bei der durchgeführten Studie gibt es 2 Between-subject Faktoren. Ein Faktor ist die Eingabe Methode, welche die beiden Abstufungen Texteingabe und Spracheingabe hat. Der andere Faktor ist die Meinung des KI-Agenten. Der KI-Agent ist entweder der kongruenten oder inkongruenten Meinung zu den Waffengesetzen. Das bedeutet der KI-Agent hat bei manchen Versuchspersonen die gleiche Meinung oder die gegensätzliche Meinung wie diese. Die unterschiedlichen Meinungen sind dabei das Aussprechen für lockere oder strengere Waffengesetze. Das Geschlecht des KI-Agenten wird zufällig entschieden, um auftretende Effekte auszugleichen.
Der KI-Agent ist mit Hilfe von der ChatGPT API umgesetzt. Alle Eingaben werden während der Studie live verarbeitet. Dabei werden von OpenAI die Programme Text to speech, Speech to text und GPT-4o verwendet.
In der Veranstaltung Machine Learning bekamen wir eine Einführung in die Grundlagen von Machine Learning. Bei Machine Learning handelt es sich um einen Teilbereich von KI. Im Gegensatz zu KI wird ein Modell trainiert, dass aus Daten und Erfahrungen lernt und sich verbessert. Das Modell wird nicht programmiert für seinen Zweck. Machine Learning ist im Gegensatz zu KI nur auf eine bestimmte Aufgabe trainiert.
Als Projekt implementierten wir ein neuronales Netzwerk mit Python und Numpy, dass für die Klassifizierung von Gesten geeignet ist. Das neuronale Netzwerk musste nach dem trainieren verschiedene Gesten der Nutzer live erkennen, um beispielsweise eine Slideshow Anwendung mit Handgesten steuern zu können. Im Projektvideo sehen Sie eine Demo des Programms.