
Tether, la empresa de stablecoins más conocida por USDT, acaba de lanzar un modelo de IA médica que cabe en tu bolsillo y que puede superar a rivales más de una docena de veces mayores. QVAC MedPsy fue lanzado hoy por el Grupo de Investigación de IA de Tether como una nueva clase de modelos de lenguaje médico diseñados para ejecutarse en smartphones, dispositivos wearables y dispositivos de borde, sin necesidad de la nube.
El número principal: un pequeño modelo de 1.700 millones de parámetros capaz de superar al MedGemma-4B de Google en benchmarks médicos a pesar de tener menos de la mitad de su tamaño. En HealthBench Hard—el benchmark de OpenAI que evalúa la IA en conversaciones clínicas realistas y multi-turno calificadas por 262 médicos—Tether afirma que su modelo de 1.700 millones de parámetros supera al MedGemma-27B, un modelo casi dieciséis veces más grande.
Los parámetros son todas las configuraciones y valores que un modelo aprende durante el entrenamiento. Cuantos más parámetros, mejor debería ser el modelo, en teoría.
El conjunto de pruebas abarca desde MedQA-USMLE, que mide el conocimiento clínico utilizando preguntas al estilo del examen de licencia médica de EE. UU. puntuadas como precisión porcentual, hasta AfriMedQA, que evalúa el rendimiento específicamente para contextos de atención médica africanos desatendidos.
El CEO de Tether, Paolo Ardoino, atribuyó las ganancias a la eficiencia más que a la escala. "Con QVAC MedPsy, nuestro enfoque fue mejorar la eficiencia a nivel del modelo, en lugar de aumentar el tamaño", dijo en un comunicado. "Nuestro modelo de 4 mil millones superó los resultados de modelos casi siete veces su tamaño, mientras usaba hasta tres veces menos tokens por respuesta".
Esa eficiencia de tokens es el otro titular. El modelo de 4B promedia alrededor de 909 tokens por respuesta frente a 2.953 para sistemas comparables, una reducción de 3.2x. Menos tokens significan un menor costo computacional, respuestas más rápidas y, fundamentalmente, la capacidad de ejecutarse localmente sin un backend en la nube.
"Puedes ejecutar razonamiento médico donde los datos ya existen, dentro de un sistema hospitalario o en un dispositivo, sin mover información sensible a través de la nube o esperar un procesamiento externo", dijo Ardoino.
Los modelos se distribuyen como archivos GGUF cuantizados—1.2 GB para el modelo de 1.700 millones de parámetros y 2.6 GB para el de 4 mil millones—con versiones comprimidas que mantienen la mayor parte del rendimiento del benchmark mientras caben en hardware de consumo estándar. Esto significa que un sistema hospitalario, una clínica rural o un médico individual podrían ejecutar el modelo completamente en el dispositivo, manteniendo los registros de pacientes fuera de la infraestructura de la nube de terceros y lejos de la exposición a HIPAA.
El argumento de la privacidad puede ser un gran punto a favor para algunas personas, pero usar la IA para opiniones médicas está lejos de ser ideal, incluso según los estándares actuales. Un estudio de Oxford publicado en febrero encontró que los LLM dan rutinariamente consejos médicos peligrosos con respuestas erróneas, guía confusa y mal manejo de síntomas matizados. Los investigadores no llegaron a descartar la tecnología por completo, pero argumentaron que la IA tiene un papel como "secretaria, no médico". El problema de cumplimiento lo agrava: la mayoría de la IA médica hoy en día enruta los datos de los pacientes a través de servidores en la nube, creando exposición a HIPAA cada vez que un médico escribe una consulta.
El lanzamiento encaja con el patrón de Tether durante el último año. El mes pasado, lanzó el QVAC SDK, un kit de herramientas de código abierto para construir aplicaciones de IA locales y sin conexión para iOS, Android, Windows y Linux. Antes de eso, lanzó QVAC Health, una aplicación de bienestar para el consumidor que mantiene los datos biométricos completamente en el dispositivo. MedPsy es el primer modelo QVAC específicamente entrenado para el razonamiento clínico.
El mercado de la IA médica se sitúa hoy en aproximadamente 36 mil millones de dólares, con proyecciones que superan los 500 mil millones para 2033, según el propio anuncio de Tether. Los modelos y los pesos GGUF están disponibles ahora en qvac.tether.io/models.