
Tether, het stablecoin-bedrijf dat vooral bekend is van USDT, heeft zojuist een medisch AI-model uitgebracht dat in je zak past en mogelijk beter presteert dan rivalen die meer dan twaalf keer zo groot zijn. QVAC MedPsy werd vandaag gelanceerd door Tether's AI Research Group als een nieuwe klasse van medische taalmodellen, ontworpen om te draaien op smartphones, wearables en randapparaten – geen cloud vereist.
Het belangrijkste cijfer: een minuscuul model van 1,7 miljard parameters dat in staat is om Google's MedGemma-4B te verslaan op medische benchmarks, ondanks dat het minder dan de helft zo groot is. Op HealthBench Hard – OpenAI's benchmark die AI beoordeelt op realistische, meerstaps klinische gesprekken die door 262 artsen zijn beoordeeld – zegt Tether dat zijn model van 1,7 miljard parameters beter scoort dan MedGemma-27B, een model dat bijna zestien keer zo groot is.
Parameters zijn alle configuraties en waarden die een model leert tijdens de training. Hoe meer parameters, hoe beter het model in theorie zou moeten zijn.
De testsuite omvat MedQA-USMLE, die klinische kennis meet aan de hand van vragen in de stijl van het Amerikaanse medische licentie-examen, gescoord als percentage nauwkeurigheid, tot en met AfriMedQA, dat de prestaties specifiek test voor achtergestelde Afrikaanse gezondheidszorgcontexten.
Tether CEO Paolo Ardoino schreef de winst toe aan efficiëntie in plaats van schaalgrootte. "Met QVAC MedPsy was onze focus het verbeteren van de efficiëntie op modelniveau, in plaats van de omvang op te schalen," zei hij in een verklaring. "Ons 4 miljard model overtrof de resultaten van modellen die bijna zeven keer zo groot waren, terwijl het tot drie keer minder tokens per antwoord gebruikte."
Die token-efficiëntie is het andere opvallende punt. Het 4B-model genereert gemiddeld ongeveer 909 tokens per antwoord, vergeleken met 2.953 voor vergelijkbare systemen – een vermindering van 3,2x. Minder tokens betekent lagere rekenkosten, snellere reacties en, cruciaal, de mogelijkheid om lokaal te draaien zonder een cloud-backend.
"Je kunt medische redenering uitvoeren waar de gegevens al aanwezig zijn, binnen een ziekenhuissysteem of op een apparaat, zonder gevoelige informatie via de cloud te verplaatsen of te wachten op externe verwerking," aldus Ardoino.
De modellen worden geleverd als gekwantiseerde GGUF-bestanden – 1,2 GB voor het model met 1,7 miljard parameters en 2,6 GB voor het model met 4 miljard – waarbij gecomprimeerde versies de meeste benchmarkprestaties behouden terwijl ze passen op standaard consumentenhardware. Dat betekent dat een ziekenhuissysteem, plattelandskliniek of individuele clinicus het model volledig op het apparaat kan draaien, waardoor patiëntgegevens buiten de cloudinfrastructuur van derden en weg van HIPAA-blootstelling blijven.
Het privacy-argument kan voor sommigen een groot pluspunt zijn, maar het gebruik van AI voor medische adviezen is zelfs naar huidige standaarden verre van ideaal. Een Oxford-studie die in februari werd gepubliceerd, toonde aan dat LLM's routinematig gevaarlijk medisch advies geven met verkeerde antwoorden, verwarde begeleiding en een slechte omgang met genuanceerde symptomen. De onderzoekers zagen af van een volledige afwijzing van de technologie, maar stelden dat AI een rol heeft als "secretaris, geen arts". Het compliance-probleem maakt het nog complexer: de meeste medische AI van vandaag leidt patiëntgegevens via cloudservers, wat bij elke query van een arts leidt tot risico op HIPAA-schending.
De release past in het patroon van Tether van het afgelopen jaar. Vorige maand lanceerde het de QVAC SDK, een open-source toolkit voor het bouwen van lokale, offline AI-apps voor iOS, Android, Windows en Linux. Daarvoor lanceerde het QVAC Health, een consumentenwelzijnsapp die biometrische gegevens volledig op het apparaat bewaart. MedPsy is het eerste QVAC-model dat specifiek is getraind voor klinische redenering.
De medische AI-markt bedraagt momenteel ongeveer $36 miljard, met projecties die wijzen op meer dan $500 miljard tegen 2033, volgens de eigen aankondiging van Tether. Modellen en GGUF-gewichten zijn nu beschikbaar op qvac.tether.io/models.