
Tether, la société de stablecoins surtout connue pour l'USDT, vient de lancer un modèle d'IA médicale qui tient dans votre poche et pourrait surpasser des rivaux plus d'une douzaine de fois plus grands. QVAC MedPsy a été lancé aujourd'hui par le groupe de recherche en IA de Tether comme une nouvelle catégorie de modèles de langage médical conçus pour fonctionner sur smartphones, objets connectés et appareils de périphérie – aucun cloud n'est requis.
Le chiffre clé : un minuscule modèle de 1,7 milliard de paramètres capable de battre le MedGemma-4B de Google sur les benchmarks médicaux, bien qu'il soit moins de la moitié de sa taille. Sur HealthBench Hard – le benchmark d'OpenAI qui évalue l'IA sur des conversations cliniques réalistes et multi-tours, notées par 262 médecins – Tether affirme que son modèle de 1,7 milliard de paramètres surpasse le MedGemma-27B, un modèle presque seize fois plus grand.
Les paramètres sont toutes les configurations et valeurs qu'un modèle apprend pendant son entraînement. Plus il y a de paramètres, meilleur devrait être le modèle, en théorie.
La suite de tests s'étend du MedQA-USMLE, qui mesure les connaissances cliniques à l'aide de questions de type examen de licence médicale américaine notées en pourcentage de précision, jusqu'à l'AfriMedQA, qui teste les performances spécifiquement pour les contextes de soins de santé africains mal desservis.
Paolo Ardoino, PDG de Tether, a attribué ces gains à l'efficacité plutôt qu'à l'échelle. « Avec QVAC MedPsy, notre objectif était d'améliorer l'efficacité au niveau du modèle, plutôt que d'augmenter la taille », a-t-il déclaré dans un communiqué. « Notre modèle de 4 milliards a dépassé les résultats de modèles près de sept fois plus grands, tout en utilisant jusqu'à trois fois moins de tokens par réponse. »
Cette efficacité en matière de tokens est l'autre point majeur. Le modèle 4B génère en moyenne environ 909 tokens par réponse, contre 2 953 pour des systèmes comparables – une réduction de 3,2x. Moins de tokens signifie des coûts de calcul inférieurs, des réponses plus rapides et, surtout, la capacité de fonctionner localement sans backend cloud.
« Vous pouvez effectuer un raisonnement médical là où les données existent déjà, au sein d'un système hospitalier ou sur un appareil, sans déplacer d'informations sensibles via le cloud ou attendre un traitement externe », a déclaré Ardoino.
Les modèles sont livrés sous forme de fichiers GGUF quantifiés – 1,2 Go pour le modèle de 1,7 milliard de paramètres et 2,6 Go pour celui de 4 milliards – avec des versions compressées conservant la majeure partie des performances de benchmark tout en s'adaptant au matériel grand public standard. Cela signifie qu'un système hospitalier, une clinique rurale ou un clinicien individuel pourrait faire fonctionner le modèle entièrement sur l'appareil, protégeant ainsi les dossiers des patients de l'infrastructure cloud tierce et de l'exposition au HIPAA.
L'argument de la confidentialité peut être un avantage majeur pour certaines personnes, mais l'utilisation de l'IA pour des avis médicaux est loin d'être idéale, même selon les normes actuelles. Une étude d'Oxford publiée en février a révélé que les LLM donnent régulièrement des conseils médicaux dangereux avec des réponses erronées, des directives confuses et une mauvaise gestion des symptômes nuancés. Les chercheurs n'ont pas pour autant rejeté la technologie dans son ensemble, mais ont soutenu que l'IA a un rôle de « secrétaire, pas de médecin ». Le problème de conformité s'y ajoute : la plupart des IA médicales actuelles acheminent les données des patients via des serveurs cloud, créant ainsi une exposition au HIPAA chaque fois qu'un médecin saisit une requête.
Cette publication s'inscrit dans la lignée des actions de Tether au cours de la dernière année. Le mois dernier, elle a lancé le QVAC SDK, une boîte à outils open-source pour créer des applications d'IA locales et hors ligne sur iOS, Android, Windows et Linux. Avant cela, elle avait lancé QVAC Health, une application de bien-être grand public qui conserve les données biométriques entièrement sur l'appareil. MedPsy est le premier modèle QVAC spécifiquement entraîné pour le raisonnement clinique.
Le marché de l'IA médicale représente aujourd'hui environ 36 milliards de dollars, avec des projections dépassant les 500 milliards de dollars d'ici 2033, selon l'annonce de Tether. Les modèles et les poids GGUF sont disponibles dès maintenant sur qvac.tether.io/models.