tether-medical-ai-runs-on-phone-outperforms-models-16x
Tethers medizinische KI läuft auf Ihrem Telefon und übertrifft Modelle, die 16-mal größer sind
QVAC MedPsy bringt klinische KI auf ein Smartphone und übertrifft dabei Googles MedGemma-27B in realen Szenarien, während es dreimal weniger Rechenressourcen verwendet.
2026-05-07 Quelle:decrypt.co

Kurz gesagt

  • Tethers QVAC MedPsy mit 1,7 Milliarden Parametern übertraf Googles MedGemma-4B und schlug MedGemma-27B auf HealthBench Hard, einem OpenAI-Benchmark zur Überprüfung realistischer klinischer Gespräche, die von 262 Ärzten bewertet wurden.
  • Das Modell mit 4 Milliarden Parametern generiert Antworten in ca. 909 Tokens gegenüber ca. 2.953 bei vergleichbaren Systemen – eine Reduzierung um das 3,2-fache, die den Einsatz in lokalen Krankenhäusern und auf mobilen Geräten praktikabel macht.
  • Die Modelle werden im quantisierten GGUF-Format (1,2 GB und 2,6 GB) ausgeliefert und laufen vollständig auf Consumer-Hardware ohne Cloud-Infrastruktur.


Tether, das Stablecoin-Unternehmen, das am besten für USDT bekannt ist, hat gerade ein medizinisches KI-Modell veröffentlicht, das in die Tasche passt und Rivalen, die mehr als ein Dutzend Mal so groß sind, möglicherweise übertrifft. QVAC MedPsy wurde heute von Tethers AI Research Group als eine neue Klasse medizinischer Sprachmodelle vorgestellt, die für Smartphones, Wearables und Edge-Geräte entwickelt wurden – keine Cloud erforderlich.

Die Schlagzeile: Ein winziges Modell mit 1,7 Milliarden Parametern, das Googles MedGemma-4B in medizinischen Benchmarks schlagen kann, obwohl es weniger als halb so groß ist. Auf HealthBench Hard – OpenAIs Benchmark, der KI anhand realistischer, mehrstufiger klinischer Gespräche bewertet, die von 262 Ärzten benotet wurden – übertrifft Tethers 1,7-Milliarden-Parameter-Modell laut Tether das MedGemma-27B, ein fast sechzehnmal größeres Modell.

Parameter sind alle Konfigurationen und Werte, die ein Modell während des Trainings lernt. Je mehr Parameter, desto besser sollte das Modell theoretisch sein.

Quelle: Tether

Die Testsuite reicht von MedQA-USMLE, das klinisches Wissen anhand von Fragen im Stil der US-amerikanischen medizinischen Zulassungsprüfung mit prozentualer Genauigkeit misst, bis hin zu AfriMedQA, das die Leistung speziell für unterversorgte afrikanische Gesundheitssysteme testet.

Tether CEO Paolo Ardoino führte die Fortschritte auf Effizienz statt auf Skalierung zurück. "Mit QVAC MedPsy konzentrierten wir uns darauf, die Effizienz auf Modellebene zu verbessern, anstatt die Größe zu skalieren", sagte er in einer Erklärung. "Unser 4-Milliarden-Modell übertraf die Ergebnisse von Modellen, die fast siebenmal so groß waren, und verwendete dabei bis zu dreimal weniger Tokens pro Antwort."

Diese Token-Effizienz ist die andere Schlagzeile. Das 4B-Modell benötigt durchschnittlich etwa 909 Tokens pro Antwort gegenüber 2.953 für vergleichbare Systeme – eine Reduzierung um das 3,2-fache. Weniger Tokens bedeuten geringere Rechenkosten, schnellere Antworten und, was entscheidend ist, die Möglichkeit, lokal ohne Cloud-Backend zu laufen.

"Man kann medizinische Schlussfolgerungen dort durchführen, wo die Daten bereits existieren, in einem Krankenhaussystem oder auf einem Gerät, ohne sensible Informationen über die Cloud zu verschieben oder auf externe Verarbeitung zu warten", sagte Ardoino.

Die Modelle werden als quantisierte GGUF-Dateien ausgeliefert – 1,2 GB für das Modell mit 1,7 Milliarden Parametern und 2,6 GB für das 4-Milliarden-Modell – wobei komprimierte Versionen den größten Teil der Benchmark-Leistung beibehalten und auf Standard-Consumer-Hardware passen. Das bedeutet, dass ein Krankenhaussystem, eine ländliche Klinik oder ein einzelner Kliniker das Modell vollständig auf dem Gerät ausführen könnte, wodurch Patientenakten außerhalb der Cloud-Infrastruktur von Drittanbietern und fern von HIPAA-Risiken bleiben.

Das Datenschutzargument mag für einige ein großer Vorteil sein, aber der Einsatz von KI für medizinische Meinungen ist selbst nach heutigen Standards alles andere als ideal. Eine im Februar veröffentlichte Oxford-Studie ergab, dass LLMs routinemäßig gefährliche medizinische Ratschläge mit falschen Antworten, verwirrenden Anweisungen und schlechtem Umgang mit nuancierten Symptomen geben. Die Forscher verzichteten darauf, die Technologie gänzlich abzulehnen, argumentierten jedoch, dass KI eine Rolle als "Sekretär, nicht Arzt" spielen sollte. Das Compliance-Problem verschärft die Situation: Die meisten medizinischen KIs leiten Patientendaten heute über Cloud-Server, was bei jeder Abfrage eines Arztes ein HIPAA-Risiko darstellt.

Die Veröffentlichung passt zu Tethers Muster des letzten Jahres. Letzten Monat wurde das QVAC SDK ausgeliefert, ein Open-Source-Toolkit zum Erstellen lokaler, Offline-KI-Apps für iOS, Android, Windows und Linux. Zuvor wurde QVAC Health gestartet, eine Consumer-Wellness-App, die biometrische Daten vollständig auf dem Gerät speichert. MedPsy ist das erste QVAC-Modell, das speziell für klinische Schlussfolgerungen trainiert wurde.

Der Markt für medizinische KI beläuft sich heute auf etwa 36 Milliarden US-Dollar, wobei Prognosen bis 2033 auf über 500 Milliarden US-Dollar hindeuten, so Tethers eigene Ankündigung. Modelle und GGUF-Gewichte sind ab sofort unter qvac.tether.io/models verfügbar.