SeamlessM4T: Metas neue Übersetzungs-KI beherrscht 100 Sprachen
Der Facebook-Mutterkonzern Meta hat mit SeamlessM4T eine Übersetzungs-KI vorgestellt, die mit fast 100 verschiedenen Sprachen umgehen kann. Laut t3n soll der Algorithmus sowohl aus Texten als auch aus Gesprochenem Text-Übersetzungen herstellen können. Bei der Präsentation der Anwendung hat sich Meta auf den „Babelfisch“ aus Douglas Adams‘ berühmter Science-Fiction-Satire „Per Anhalter durch die Galaxis“ bezogen. Der Babelfisch kann im Buch jede Sprache im Universum übersetzen – SeamlessM4T soll zumindest einen großen Teil der gesprochenen Sprachen auf der Erde beherrschen.
Quelle von Daten nicht völlig klar
Per Sprache lassen sich laut Meta 36 verschiedene Sprachen (Text-to-Speech und Speech-to-Speech) als Übersetzung ausgeben. Das Tool könne auch dann seine Arbeit verrichten, wenn User:innen während der Aufnahme oder Eingabe der zu übersetzenden Inhalte die Sprache wechseln. Trainiert habe man die Übersetzungs-KI mit Audioaufnahmen im Umfang von vier Millionen Stunden. Das Material stamme laut dem entsprechenden Forschungspapier „aus einem öffentlich zugänglichen Speicher für Daten, die im Internet per Scraping gesammelt wurden.“
Woher genau Meta die Daten hat, verriet der Konzern aber auch auf konkrete Nachfrage der Nachrichtenagentur Reuters nicht. Für die textbasierten Trainingsdaten griff Meta jedenfalls auf Wikipedia und andere Websites zu. Inwiefern Meta und andere Konzerne für das Training ihrer KI solche und andere Daten verwenden dürfen, ist hochumstritten. Darüber hinaus weist SeamlessM4T auch typische Bias-Probleme auf. So tendiere die KI-Software dazu, Begriffe in ihre männliche Form zu übersetzen.
Meta lässt SeamlessM4T frei verwenden
Meta-Chef Mark Zuckerberg sieht die neue Übersetzungs-KI als Teil einer Tool-Sammlung, die Menschen bei der virtuellen Begegnung im Metaverse helfen soll. Ähnlich wie Metas Sprachmodell Llama können User:innen auch SeamlessM4T zu nicht kommerziellen Zwecken frei verwenden. Die Übersetzungs-KI lässt sich hier in einer Demoversion ausprobieren. Dort kann man eine bis zu 15 Sekunden lange Audiodatei mit dem zu übersetzenden Inhalt auswählen. Anschließend kann man sich diesen Inhalt in bis zu drei Sprachen übersetzen lassen – je nach Verfügbarkeit als Sprach- oder Textversion. Im Kurztest funktioniert die KI speziell bei kürzeren Sätzen tatsächlich sehr gut.