Wie Maschinen Gefühle verstehen lernen

Stell dir vor, ein Computer könnte deine Stimmung erkennen, auch wenn du nur ein paar Worte sagst. Forschende haben herausgefunden, wie das funktioniert.

Hast du dich schon mal gefragt, wie ein Computer herausfinden kann, ob du glücklich, traurig oder wütend bist? Das ist gar nicht so einfach, besonders wenn du nicht viel sagst oder schreibst. Aber Forschende haben eine neue Methode entwickelt, die das möglich macht. Sie nennen es TF-Mamba. Klingt ein bisschen wie ein exotisches Tier, oder? Aber keine Sorge, es ist eine super coole Technik aus der Welt der Künstlichen Intelligenz.

Was die Forschenden herausgefunden haben

Die Forschenden haben herausgefunden, dass man mit TF-Mamba die Stimmung einer Person auch dann erkennen kann, wenn nicht alle Informationen vorhanden sind. Zum Beispiel, wenn jemand nur ein paar Worte sagt oder schreibt. TF-Mamba kann die fehlenden Informationen ergänzen und so die Stimmung besser verstehen. Das funktioniert sogar dann, wenn die Person nur ein paar Worte sagt oder schreibt.

Wie haben sie das gemacht?

Um das zu erreichen, haben die Forschenden drei wichtige Teile entwickelt. Erstens, ein Text-aware Modality Enhancement (TME) Modul, das die nicht-Text-Informationen, wie Bilder oder Töne, mit den Text-Informationen abgleicht und ergänzt. Zweitens, ein Text-based Context Mamba (TC-Mamba), das die Zusammenhänge innerhalb der Text-Informationen erkennt. Und drittens, ein Text-guided Query Mamba (TQ-Mamba), das die Informationen aus verschiedenen Quellen zusammenführt und eine gemeinsame Darstellung erstellt.

Warum ist das wichtig?

Diese Methode ist wichtig, weil sie hilft, die Stimmung von Menschen besser zu verstehen, auch wenn nicht alle Informationen vorhanden sind. Das kann in vielen Bereichen nützlich sein, zum Beispiel in der Kundenbetreuung, in der Psychologie oder sogar in der Unterhaltungselektronik. Stell dir vor, dein Smartphone könnte erkennen, ob du einen schlechten Tag hast und dir dann ein lustiges Video vorschlägt.

Du willst mehr über die Studie wissen?

Die Forschenden, die diese Methode entwickelt haben, heißen Xiang Li, Xianfu Cheng, Dezhuang Miao, Xiaoming Zhang und Zhoujun Li. Der Artikel mit dem Titel „TF-Mamba: Text-enhanced Fusion Mamba with Missing Modalities for Robust Multimodal Sentiment Analysis“ wurde 2025 veröffentlicht.

Zum Original-Paper auf ArXiv