Virtuelle Assistenten sind bereits seit einiger Zeit in der Lage, unsere Sprache mit unheimlicher Präzision zu entschlüsseln. Wir sagen Alexa oder Siri, welchen Song wir hören wollen, und schwuppdiwupp wird das Lied abgespielt.
Die Entwicklungen im Bereich künstlicher Intelligenzen gehen aber noch viel weiter. Forscher der University of California in San Francisco (UCSF) beschäftigen sich seit einiger Zeit damit, Gedanken mithilfe von künstlicher Intelligenz in gesprochene Sprache umzusetzen. Und sie sind ihrem Ziel nun einen großen Schritt nähergekommen.
Dem Neurochirurgen Edward Chang vom Chang Lab der UCSF und seinem Team ist es in einem Experiment gelungen, Gehirnaktivitäten in Sprache umzuwandeln – und das, ohne dass dabei auch nur ein Wort gesprochen wurde. Sie nutzten elektrische Impulse.
Das Forscherteam hat hierfür mit vier Epilepsiepatienten zusammengearbeitet. Ihnen wurden Elektroden in die Hirnrinde implantiert. Die Versuchsteilnehmer sollten dann mehrere Male 30 bis 50 einfache Sätze laut aufsagen. Das Team verfolgte ihre neuronale Aktivität, während sie sprachen. Auf diese Weise konnten die Forscher die Hirnaktivität messen und ein Elektrokortikogramm, ein sogenanntes Hirnstrombild, erstellen.
Diese Daten wurden daraufhin in einen Algorithmus für maschinelles Lernen eingespeist, eine Art künstliches Intelligenzsystem, das die Gehirnaktivitätsdaten für jeden gesprochenen Satz analysierte. Heraus kamen Zahlen, die bestimmten Sprachsignaturen wie Vokalen, Konsonanten oder Mundbewegungen entsprachen. Danach entschlüsselte eine zweite KI diese Darstellungen und wandelte die Daten in Wörter um.
Zunächst erzeugte das System nur unsinnige Sätze. Doch dann verglich die KI jede Folge von Wörtern mit den tatsächlich vorgelesenen Sätzen, verbesserte sich und lernte, wie sich die Zahlenfolge auf Wörter bezog und welche Wörter typischerweise aufeinanderfolgen.
Das Team testete die KI und erzeugte nur aus der Gehirnaktivität während des Sprechens einen geschriebenen Text – et voila:
Das System lag im Idealfall in 97 Prozent der Fälle richtig, hatte also nur eine Wortfehlerrate von drei Prozent.
Die Forscher lieferten in ihrer Untersuchung natürlich auch Beispiele, in denen die KI falsch lag. So machte sie kleine Fehler wie im Satz: „Ein Teil des Kuchens wurde vom Hund gefressen“. Dieser wurde zu: „Ein Teil des Kuchens war der Keks“. Es gab aber auch grobe Fehler, wie beim Satz: „Sie trug einen warmen, flauschigen Wolloverall“. Diesen übersetzte die KI wie folgt: „Die Oase war ein Trugbild“.
Dennoch werten die Forscher die Ergebnisse als großen Erfolg. Bisher habe die Wortfehlerquote bei KIs bei 60 Prozent gelegen, schreiben sie in ihrer Studie, die im März 2020 im Fachblatt „Nature Neuroscience“ veröffentlicht wurde. Typische Programme zur Spracherkennung hätten eine Fehlerquote von fünf Prozent. Im Fall des aktuellen Experiments lieferte die KI also deutlich bessere und genauere Ergebnisse.
Allerdings, das muss einschränkend betont werden, umfasste die aktuelle Untersuchung nur rund 250 Wörter.
Es können vorerst also immer nur wenige, zuvor festgelegte Worte erkannt werden. Dennoch könnte der Ansatz, den die US-Forscher verfolgen, irgendwann einmal Menschen helfen, die nicht mehr in der Lage sind, sich zu artikulieren. Die KI sei laut der Forscher in der Lage, schnell und genau auch größere Mengen an Wörtern und Sätzen zu kodieren.
Wir sind noch nicht am Ende, aber wir glauben, dass dies die Grundlage für eine Sprachprothese sein könnte.
Und keine Sorge, niemand wird nun einfach so deine Gedanken lesen können. Das Ganze funktioniert natürlich nur, wenn die Versuchsperson dem Implantat der Gehirnelektrode zugestimmt hat.
Dieser Artikel wurde erstmals im April 2020 veröffentlicht.