Künstliche Intelligenz

SeamlessM4T: Metas neue Übersetzungs-KI beherrscht 100 Sprachen

Meta-Logo © Dima Solomin on Unsplash
Meta-Logo © Dima Solomin on Unsplash
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Der Facebook-Mutterkonzern Meta hat mit SeamlessM4T eine Übersetzungs-KI vorgestellt, die mit fast 100 verschiedenen Sprachen umgehen kann. Laut t3n soll der Algorithmus sowohl aus Texten als auch aus Gesprochenem Text-Übersetzungen herstellen können. Bei der Präsentation der Anwendung hat sich Meta auf den „Babelfisch“ aus Douglas Adams‘ berühmter Science-Fiction-Satire „Per Anhalter durch die Galaxis“ bezogen. Der Babelfisch kann im Buch jede Sprache im Universum übersetzen – SeamlessM4T soll zumindest einen großen Teil der gesprochenen Sprachen auf der Erde beherrschen.

New York Times will OpenAI wegen Content-Scraping verklagen

Quelle von Daten nicht völlig klar

Per Sprache lassen sich laut Meta 36 verschiedene Sprachen (Text-to-Speech und Speech-to-Speech) als Übersetzung ausgeben. Das Tool könne auch dann seine Arbeit verrichten, wenn User:innen während der Aufnahme oder Eingabe der zu übersetzenden Inhalte die Sprache wechseln. Trainiert habe man die Übersetzungs-KI mit Audioaufnahmen im Umfang von vier Millionen Stunden. Das Material stamme laut dem entsprechenden Forschungspapier „aus einem öffentlich zugänglichen Speicher für Daten, die im Internet per Scraping gesammelt wurden.“

Woher genau Meta die Daten hat, verriet der Konzern aber auch auf konkrete Nachfrage der Nachrichtenagentur Reuters nicht. Für die textbasierten Trainingsdaten griff Meta jedenfalls auf Wikipedia und andere Websites zu. Inwiefern Meta und andere Konzerne für das Training ihrer KI solche und andere Daten verwenden dürfen, ist hochumstritten. Darüber hinaus weist SeamlessM4T auch typische Bias-Probleme auf. So tendiere die KI-Software dazu, Begriffe in ihre männliche Form zu übersetzen.

ChatGPT: Sprachmodell soll künftig Folgefragen stellen

Meta lässt SeamlessM4T frei verwenden

Meta-Chef Mark Zuckerberg sieht die neue Übersetzungs-KI als Teil einer Tool-Sammlung, die Menschen bei der virtuellen Begegnung im Metaverse helfen soll. Ähnlich wie Metas Sprachmodell Llama können User:innen auch SeamlessM4T zu nicht kommerziellen Zwecken frei verwenden. Die Übersetzungs-KI lässt sich hier in einer Demoversion ausprobieren. Dort kann man eine bis zu 15 Sekunden lange Audiodatei mit dem zu übersetzenden Inhalt auswählen. Anschließend kann man sich diesen Inhalt in bis zu drei Sprachen übersetzen lassen – je nach Verfügbarkeit als Sprach- oder Textversion. Im Kurztest funktioniert die KI speziell bei kürzeren Sätzen tatsächlich sehr gut.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Deep Dives

#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Austrian Startup Investment Tracker

Die Finanzierungsrunden 2024

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe

2 Minuten 2 Millionen | Staffel 11

Die Startups - die Investoren - die Deals - die Hintergründe

The Top 101

Die besten Startups & Scale-ups Österreichs im großen Voting

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen