Aussteller & Produkte
Events
Speakers

Was ist DeepSeek?

DeepSeek ist ein von chinesischen Forschern entwickeltes LLM, das mit relativ geringen Kosten trainiert wurde. Nur 5 Millionen US-Dollar habe das Training der finalen Version gekostet – ein Bruchteil dessen, was westliche Tech-Giganten wie OpenAI oder Google investieren. Die Folge: Talfahrt an den Börsen und eine hitzige Debatte über Chinas Fortschritte in der KI.

Klambauer: „Als ich mir die Architektur anschaute, dachte ich: Das ist ein riesiges Chaos und ein gigantischer Hack. Aber erstaunlicherweise funktioniert es.“ Und er meint das nicht despektierlich. Klambauer ist nur verwundert. Der Ansatz von DeepSeek basiert auf mehreren Stufen des Reinforcement Learning, wodurch das Modell besonders gut mathematische und logische Aufgaben lösen kann. Anders als bei GPT-Modellen, die hauptsächlich auf Textvorhersagen optimiert sind, hat DeepSeek seine Stärke in der Problemlösung.

Warum ist DeepSeek besonders?

Das Besondere an DeepSeek ist nicht eine revolutionäre neue Architektur, sondern eine clevere Kombination bekannter Methoden:

  • Reinforcement Learning mit Belohnungssystem: Das Modell lernt durch Versuch und Irrtum, wobei richtige Antworten belohnt werden.
  • Automatisierte Problemstellung: Anstatt auf bereits vorhandene Daten zu setzen, generierten die Forscher neue Aufgaben und lösten sie mit dem Modell selbst.
  • Mehrstufiges Training: DeepSeek wurde nicht nur trainiert, sondern mehrfach mit seinen eigenen Erkenntnissen nachgeschärft.
  • Die Ergebnisse sind beeindruckend. Das Modell kann komplexe Aufgaben lösen, die herkömmliche LLMs oft vor Probleme stellen. „Es kann High-School-Matheaufgaben lösen, die vorherige Modelle nicht hinbekommen haben“, sagt Klambauer.

    Was bedeutet das für die Industrie?

    Die Technologie hat weitreichende Auswirkungen. Zum einen zeigt DeepSeek, dass auch mit geringen Mitteln leistungsfähige KI-Modelle entwickelt, werden können. Zum anderen stellt sich die Frage, ob westliche Unternehmen nachziehen und ihre Trainingsmethoden anpassen müssen.

    Darüber hinaus ist es ein Weckruf für Europa. Während die USA und China Milliarden in KI investieren, scheint Europa den Anschluss zu verlieren.

    Trotz der Begeisterung gibt es auch Kritik – auch was die kommunizierten Ressourcen betrifft. DeepSeek verwendet weiterhin Transformer-Architekturen, die enorme Rechenleistung benötigen. Zudem ist der Code hinter dem Modell nicht offen, sodass Unklarheit darüber besteht, wie genau das Training ablief.

    Ein weiteres Problem: Die Sicherheitsrisiken. Ein Experiment von Prof. Dr. Sigurd Schacht zeigte, dass KI-Modelle innerhalb weniger Minuten ungewünschte Verhaltensweisen entwickeln können.

    Fazit

    DeepSeek ist ein Beweis dafür, dass China im KI-Rennen aufholt. Es ist ein technologischer Fortschritt, aber kein Gamechanger. Vielmehr zeigt es, dass intelligente Kombinationen bestehender Methoden große Fortschritte bringen können. Westliche Unternehmen sollten sich darauf einstellen, dass die Konkurrenz größer wird.

    Ob DeepSeek die großen Player herausfordert, bleibt abzuwarten. Sicher ist jedoch: Die KI-Welt bleibt in Bewegung, und Europa muss dringend aufholen, um nicht den Anschluss zu verlieren.