
Josef Chen behauptet, er habe die gesamte menschliche Kochkunst auf zwei Megabyte komprimiert. Das ist eine kühne Behauptung. Und es stimmt auch.
Chen, Mitbegründer und CEO des Londoner Food-KI-Startups KAIKAKU.AI, veröffentlichte diese Woche zusammen mit dem Forscher Jakub Radzikowski ein Papier auf arXiv, in dem Epicure vorgestellt wird – drei KI-Modelle, die auf 4,14 Millionen Rezepten trainiert wurden, die aus 11 Datensätzen in sieben Sprachen stammen. Das Ergebnis: eine Karte von 1.790 Zutaten, jede beschrieben durch 300 Zahlen, die locker in Ihr E-Mail-Anhangslimit passt.
„4,1 Mio. Rezepte. 7 Sprachen. 1.790 Zutaten. 300 Dimensionen“, schrieb Chen auf X. „Die gesamte menschliche Kochkunst auf 2 Megabyte komprimiert.“
Launching our new paper on arXiv: we trained the largest multilingual food model ever built.
4.1M recipes. 7 languages. 1,790 ingredients. 300 dimensions.
All of human cooking compressed into 2 megabytes. pic.twitter.com/b4GiZ62UMt
— Josef Chen (@josefchen) May 26, 2026
Es speichert keine Rezepte
Bevor Sie sich einen Zwei-Megabyte-USB-Stick vorstellen, der mit Wok-Anleitungen vollgestopft ist, speichert das Modell kein einziges Rezept. Die zwei Megabyte sind eher eine Koordinatentabelle als ein Kochbuch.
Stellen Sie es sich wie eine Karte vor. Jede Zutat erhält einen präzisen Ort, basierend darauf, wie sie sich in Millionen von echten Gerichten weltweit verhält. Die Mathematik ist klar: 1.790 Zutaten × 300 Zahlen pro Zutat × 4 Bytes pro Stück ≈ 2,05 Megabyte. Diese Zahlen kodieren, welche Zutaten zusammen auftauchen, welche Geschmacksverbindungen teilen und welche zur selben kulinarischen Tradition gehören. Sobald das Modell all dies aus den Rezepten gelernt hat, können die Rezepte gelöscht werden. Das Wissen lebt in den Koordinaten.
Dies ist im Wesentlichen derselbe Trick, den word2vec 2013 bei der Sprache angewendet hat, als Google-Forscher zeigten, dass man mit Bedeutung rechnen kann. Epicure tut dies für Lebensmittel. Nehmen Sie Rindfleisch, richten Sie es auf Amerika aus und Sie erhalten Brot, Salat, vielleicht Bier. Richten Sie es auf Südostasien aus und das Modell hört auf, an Burger und Grills zu denken, und beginnt, an Sojasauce, Ingwer und Sesamöl zu denken.
Dies geschieht durch das, was das Papier als einen Lenkungsoperator namens SLERP-Rotation beschreibt. Nehmen Sie eine Ausgangszutat – Hühnchen – und drehen Sie sie mathematisch in Richtung einer Küchenrichtung. Bei 30 Grad sehen Sie das Tex-Mex-Gebiet. Bei 60 Grad konvergieren Hühnchen und Rindfleisch in derselben mexikanischen Speisekammer: Maistortilla, Salsa, Monterey Jack, Poblano-Paprika. Der Winkel ist ein Drehregler zwischen „bleiben Sie in der Nähe dieser Zutat“ und „landen Sie irgendwo neu“.
Epicure gibt es in drei Versionen, und die Wahl der richtigen hängt davon ab, was Sie tatsächlich fragen. Cooc lernt aus dem gemeinsamen Auftreten von Rezepten – was in echten Gerichten zusammen vorkommt. Chem lernt aus der Geschmackschemie – welche Zutaten Aromastoffe aus der FlavorDB-Chemiedatenbank teilen. Core ist eine Mischung aus den beiden vorherigen.
Fragen Sie Cooc, was zu Schokolade passt, und Sie erhalten vielleicht Dessert-Begleiter aus der Speisekammer: Kakaopulver, Vanille, Mandel. Fragen Sie Chem, und Sie erhalten geschmackschemische Entsprechungen: Toffee, Fudge, Ganache.
Dieselbe Zutat, andere Frage. Ein Koch, der einen Ersatz sucht, hat andere Bedürfnisse als ein Koch, der die Geschmacksverträglichkeit kartiert.
Warum dies nicht ChatGPT für Lebensmittel ist
Epicure verfügt über kein allgemeines Wissen, keine Sprachgenerierung und keine Fähigkeit, eine Zutat zu halluzinieren, die es noch nie gesehen hat. Es kennt 1.790 Zutaten. Das ist die ganze Welt, was dieses Modell betrifft. Was es an Breite einbüßt, gewinnt es an Zuverlässigkeit – im Gegensatz zu Rezept-Chatbots, die selbstbewusst Gift als Kochzutat vorschlagen, wenn man sie falsch steuert.
Der bisherige Stand der Technik war FlavorGraph, ein Modell aus dem Jahr 2021, das chemische Daten mit dem ausschließlich englischen Recipe1M+-Datensatz kombinierte. Epicure verwendet ein mehrsprachiges Korpus, das mehr als viermal größer ist, und bereinigt das Vokabular für mehr Effizienz.
Praktische Anwendungen sind leicht vorstellbar. Ein Koch fragt, wie das ostasiatische Äquivalent einer mediterranen Zutat aussieht. Ein Lebensmittelproduktentwickler fragt, welcher minimal verarbeitete Austausch in derselben Geschmackszone wie ein Zusatzstoff landet. Eine Rezept-App benötigt einen kohärenten Ersatz, wenn eine Zutat in der Speisekammer fehlt. Letzteres ist die Lücke, wo speziell entwickelte kleine Modelle die großen Generalisten still übertreffen.
Das Epicure-Papier ist eine Forschungsveröffentlichung. Die trainierten Modelle sind live auf Hugging Face verfügbar, und eine interaktive Zutatenkarte ist öffentlich zugänglich unter epicure.kaikaku.ai. Sie haben sogar einen MCP für Ihre Agenten veröffentlicht. Der vollständige Trainingscode wird derzeit nicht veröffentlicht.