Aussteller & Produkte
Events
Speakers

Frank Hutter ist seit über einem Jahrzehnt Professor für maschinelles Lernen an der Universität Freiburg. Er beschäftigt sich intensiv mit AutoML und automatisierter Algorithmusgestaltung und hat unter anderem die erste MOOC (Massive Open Online Course) und ein Buch zu AutoML mitentwickelt. Sein jüngstes Projekt TabPFN zeigt vielversprechende Fortschritte für die Verarbeitung von Tabellendaten und wurde kürzlich in der renommierten Fachzeitschrift Nature veröffentlicht.

Was ist TabPFN?

TabPFN ist ein tabulares Foundation Model, das auf Millionen von synthetischen Datensätzen trainiert wurde, um aus kleinen, realen Datensätzen exakte Vorhersagen zu treffen. Es übertrifft bewährte Methoden wie XGBoost oder Auto-Sklearn deutlich und liefert innerhalb einer Sekunde Ergebnisse, für die andere Modelle Stunden benötigen.

Warum sind Tabellendaten so wichtig?

Tabellendaten sind in nahezu jeder Branche von zentraler Bedeutung, sei es in der Industrie, im Gesundheitswesen, im Finanzsektor oder im Handel. Typische Anwendungen reichen von der Kundenabwanderungsanalyse bis hin zur vorausschauenden Wartung in der Produktion. Trotzdem hat die Revolution des Deep Learnings, die Sprach- und Bildverarbeitung erfasst hat, tabulare Daten bisher kaum erreicht. TabPFN will genau das ändern.

Von Open Source zur Kommerzialisierung

Das Modell steht Open Source zur Verfügung, unterliegt aber einer speziellen Lizenz, die eine Attribution erfordert („Built with TabPFN“). Wer dies vermeiden möchte oder professionelle Unterstützung benötigt, kann auf PriorLabs zurückgreifen, das Hutter gegründet hat. Das Unternehmen fokussiert sich darauf, TabPFN weiterzuentwickeln und in kommerzielle Anwendungen zu integrieren.

TabPFN und Zeitreihenanalyse

Eine Überraschung war die Feststellung, dass TabPFN nicht nur für tabulare Daten, sondern auch für Zeitreihenanalysen hervorragend geeignet ist – ohne jegliche Anpassung. Erste Tests haben gezeigt, dass es spezialisierte Zeitreihenmodelle übertrifft, indem es auf Basis einfacher Merkmale Prognosen erstellt. Dies könnte weitreichende Auswirkungen auf Predictive Maintenance und Anomalieerkennung in industriellen Anwendungen haben.

Zukunftsperspektiven und Wachstum

PriorLabs plant, TabPFN weiterzuentwickeln, um es auf größere Datenmengen und komplexere Anwendungsfälle auszuweiten. Das Unternehmen sucht aktuell nach Talenten im Bereich maschinelles Lernen und Software-Engineering, um das Potenzial dieser Technologie weiter auszuschöpfen.

Fazit

Mit TabPFN könnte sich die Analyse von Tabellendaten grundlegend verändern. Die Kombination aus hoher Geschwindigkeit, einfacher Anwendbarkeit und Open-Source-Zugänglichkeit macht es zu einer spannenden Alternative zu herkömmlichen Methoden. Interessierte können es direkt ausprobieren oder sich bei PriorLabs für kommerzielle Unterstützung melden.

Links & Ressourcen:

• GitHub: PriorLabs

• Website: PriorLabs.ai