Mimic Robotics entwickelt KI-gesteuerte, hochbewegliche Roboterhände, Dyna Robotics will repetitive, stationäre Aufgaben mit intelligenten Roboterarmen automatisieren und Physical Intelligence baut Vision-Language-Action-Modelle, die verschiedenste Robotertypen über ein gemeinsames „Gehirn“ steuern sollen.

Europas neue Robotik-Hoffnung setzt auf physische KI

Am 3. November berichtete das Handelsblatt unter der Überschrift „Europas neue Robotik-Hoffnung“, dass das Züricher Startup Mimic Robotics 20 Millionen Euro von Investoren eingesammelt hat, um lernfähige Roboterhände zu entwickeln, die sich an gängige Industrieroboterarme montieren lassen. Das generative KI-Modell von Mimic Robotics greift auf umfassende Datensätzen menschlicher Handbewegungen zurück, um komplexe Greif- und Manipulationsaufgaben zu imitieren. Die Geldgeber wollen den drei Gründern Stephan-Daniel Gravert, Elvis Nava und Stefan Weirich nun ermöglichen, ihre „frontier physical AI“ in Branchen wie Fertigung, Montage und Logistik auszurollen und ihre KI-Hände in erste Serienprozesse zu bringen. Dort sollen sie mit einer Fingerfertigkeit, die der des Menschen gleicht, komplexe Aufgaben übernehmen, die bisher nicht ausreichend automatisiert werden konnten. Ihre geschickte, leistungsstarke und präzise Roboterhand-Hardware soll, so die Entwickler, die Lücke zwischen Mensch und Roboter überbrücken. Das humanoide Design ermögliche maximale Kompatibilität, um sowohl schwierige Arbeitsbedingungen als auch empfindliche Objekte zuverlässig zu bewältigen. Ihre Roboterhand sei, so das Gründerteam, die perfekte Plattform, um ihren KI-Modellen menschenähnliche Manipulationsfähigkeiten zu ermöglichen. Zu den möglichen Anwendungen der KI-Hand gehören beispielsweise die Montage von Kleinteilen, bei denen klassische Greifer an ihre Grenzen stoßen, oder das Kommissionieren und Umpacken empfindlicher Waren im Lager.

Alter Falter: KI befähigt Roboter zu komplexen Faltprozessen (in der engl. Version bitte ohne „Alter Falter“)

Ein Foundation Model für Roboter, das speziell auf langandauernde Aufgaben ausgelegt ist, die ebenfalls viel manipulatives Geschick erfordern, entwickelt derzeit auch Dyna Robotics mit Sitz in den USA. Wie Mimic Robotics hat sich dieses junge Unternehmen zum Ziel gesetzt, eine physische KI zu etablieren, die in der Praxis trainiert und mit der Nutzung immer besser wird. Das Modell DYNA-1 der US-Amerikaner wird derzeit direkt in realen Umgebungen erprobt und jede neue Installation soll weitere Daten für einen kontinuierlichen Reinforcement-Learning-Kreislauf liefern. In einem Demonstrationslauf faltete ein Roboter mit DYNA-1 bereits mehr als 24 Stunden vollautonom gut 900 Servietten mit rund 99 % Erfolgsquote, was die Fähigkeit zur robusten, wiederholgenauen Manipulation über lange Zeiträume eindrucksvoll belegt. Mit dieser KI-basierten Technik könnte folglich auch das Wäsche- und Textilhandling in Großwäschereien oder Hotels automatisiert werden, ebenso komplexe Verpackungs- und Faltprozessen in der Konsumgüterindustrie. Auch Assistenzaufgaben in Kantinen oder Servicebereichen, bei denen viele gleichartige Handgriffe anfallen, sind denkbar. Das eigentlich Faszinierende an der Lösung von Dyna Robotics aber ist, dass Anwender nicht länger für jede Aufgabe ein eigenes Steuerungsprogramm entwickeln müssen, wenn ein etabliertes Modell für neue Workflows lediglich feinjustiert werden muss.

Schritte hin zu „Open-World“-Fähigkeiten

Einen noch allgemeineren Ansatz verfolgt Physical Intelligence (PI) aus San Francisco. Denn das Unternehmen realisiert Vision-Language-Action-Modelle, die unterschiedlichste Robotertypen über ein gemeinsames „Gehirn“ steuern sollen. Mit π₀ (pi-zero) stellte PI bereits ein generelles Robotik-Foundation-Modell vor, das aus Kamera-, Bewegungs- und Textdaten gelernt hat und per natürlicher Sprache instruiert werden kann. Im April dieses Jahres folgte mit π₀.₅ ein weiteres Modell, das Aufgaben auch in zuvor unbekannten Umgebungen besser generalisieren können soll. PI will damit einen Schritt hin zu sogenannten „Open-World“-Fähigkeiten gehen. Elemente von π₀ wurden inzwischen als Open Source veröffentlicht, um Forschung und Industrieanwendungen zu beschleunigen. Dass der Ansatz von PI viel Potenzial birgt, zeigt nicht zuletzt der Umstand, dass zu den Investoren des Startups unter anderem Jeff Bezos von Amazon, OpenAI sowie die Risikokapitalgesellschaften Thrive Capital und Lux Capital gehören sollen.

Perspektivisch könnten OEMs das PI Modell in eigene Plattformen integrieren, beispielsweise in mobile Transportroboter, kollaborative Arme oder Serviceroboter in der Produktion.

Es ist soweit: KI-Agenten erledigen physische Arbeit

Mimic Robotics, Dyna Robotics und Physical Intelligence stehen somit für drei komplementäre Ansätze der aktuellen Entwicklung physischer KI und überzeugen mit hochspezialisierten, lernfähigen Greifmodellen, einem auf Daueraufgaben optimierten Foundation Model sowie einem universellen „Robotik-Betriebssystem“ für viele Plattformen. Gemeinsam skizzieren sie ein Bild der nahen Zukunft, in der KI-Agenten nicht nur Daten analysieren, sondern physische Arbeit in Fabriken, Lagern und Serviceumgebungen immer selbstständiger übernehmen.