Perplexity

Forscherteam bringt unzensierte Version von DeepSeek-R1 als Open Source

DeepSeek am Smartphone. © DeepSeek / Canva
DeepSeek am Smartphone. © DeepSeek / Canva
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Ein Forschungsteam des AI-Startups Perplexity hat eine modifizierte Version des chinesischen KI-Sprachmodells DeepSeek-R1 entwickelt, die ohne die ursprünglichen Zensur-Beschränkungen arbeitet. Das neue Modell mit der Bezeichnung „R1 1776“ wurde jetzt als Open Source verfügbar gemacht. Perplexity war eine der ersten US-Firmen, die DeepSeek-R1 in das eigene Produkt integrierte (mehr dazu hier).

Das ursprüngliche DeepSeek-R1 verweigerte Antworten zu bestimmten heiklen Themen wie Taiwan, die uigurische Minderheit in China oder die Geschehnisse am Tian’anmen Square 1989 – das AI-Modell folgte dabei ganz klar den Zensurrichtlinien Pekings, oder gab vorgefertigte PR-Stellungnahmen aus. Die Forscher entwickelten daher ein spezielles Post-Training-Verfahren, um diese Einschränkungen zu entfernen.

DeepSeek-R1 hat den AI-Sektor ordentlich aufgerüttelt, weil es ein zuvor eher unbekanntes chinesisches Unternehmen mit deutlich weniger Ressourcen als die Silicon-Valley-Riesen es schaffte, ein KI-Modell auf Augenhöhe mit jenen von OpenAI, Google, xAI und Co auf den Markt zu bringen. Die Veröffentlichung sorgte auch dafür, dass wieder verstärkt auf Open Source im Bereich der Foundation Models gesetzt wird.

Modell soll nun neingeschränkt auf sensitive Themen reagieren

Für das Training identifizierten die Entwickler zunächst rund 300 zensierte Themenbereiche und erstellten darauf basierend einen mehrsprachigen Zensur-Klassifizierer. Mit diesem sammelten sie einen Datensatz von 40.000 mehrsprachigen Prompts. Anschließend erfolgte das Post-Training des Modells mittels einer angepassten Version des Nvidia NeMo 2.0 Frameworks.

Umfangreiche Tests mit über 1.000 Beispielen in verschiedenen Sprachen sollen bestätigen, dass das neue Modell nun uneingeschränkt auf sensitive Themen reagieren kann. Die ursprünglichen Fähigkeiten im Bereich Mathematik und logisches Denken blieben dabei erhalten, wie Benchmark-Tests zeigten. Das Modell ist ab sofort über das HuggingFace Repository verfügbar und kann auch über die Sonar API genutzt werden. Der Quellcode wurde unter Open-Source-Lizenz veröffentlicht.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick
#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2025

Österreichs größter Startup-Wettbewerb - 13 Top-Investoren mit an Bord
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen