tether-medical-ai-runs-on-phone-outperforms-models-16x
A IA Médica da Tether Funciona no Seu Telefone e Supera Modelos 16x Maiores
QVAC MedPsy integra IA clínica em um smartphone, superando o MedGemma-27B do Google em cenários do mundo real, utilizando três vezes menos recursos computacionais.
2026-05-07 Fonte:decrypt.co

Em resumo

  • O QVAC MedPsy de 1,7 bilhão de parâmetros da Tether superou o MedGemma-4B do Google e venceu o MedGemma-27B no HealthBench Hard, um benchmark da OpenAI que testa conversas clínicas realistas avaliadas por 262 médicos.
  • O modelo de 4 bilhões de parâmetros gera respostas em aproximadamente 909 tokens versus aproximadamente 2.953 para sistemas comparáveis – uma redução de 3,2x que torna a implementação em hospitais locais e dispositivos móveis prática.
  • Os modelos são enviados no formato GGUF quantizado (1,2 GB e 2,6 GB) e rodam inteiramente em hardware de consumidor sem infraestrutura de nuvem.


A Tether, a empresa de stablecoin mais conhecida por seu USDT, acaba de lançar um modelo de IA médica que cabe no seu bolso e pode superar rivais mais de doze vezes maiores. O QVAC MedPsy foi lançado hoje pelo Grupo de Pesquisa de IA da Tether como uma nova classe de modelos de linguagem médica projetados para funcionar em smartphones, wearables e dispositivos de borda – sem necessidade de nuvem.

O número principal: um minúsculo modelo de 1,7 bilhão de parâmetros capaz de superar o MedGemma-4B do Google em benchmarks médicos, apesar de ter menos da metade do seu tamanho. No HealthBench Hard – o benchmark da OpenAI que avalia a IA em conversas clínicas realistas e multi-turno avaliadas por 262 médicos – a Tether afirma que seu modelo de 1,7 bilhão de parâmetros supera o MedGemma-27B, um modelo quase dezesseis vezes maior.

Parâmetros são todas as configurações e valores que um modelo aprende durante o treinamento. Quanto mais parâmetros, melhor o modelo deveria ser, em teoria.

Fonte: Tether

O conjunto de testes abrange desde o MedQA-USMLE, que mede o conhecimento clínico usando questões estilo exames de licenciamento médico dos EUA pontuadas por precisão percentual, até o AfriMedQA, que testa o desempenho especificamente para contextos de saúde africanos carentes.

O CEO da Tether, Paolo Ardoino, atribuiu os ganhos à eficiência, e não à escala. "Com o QVAC MedPsy, nosso foco foi melhorar a eficiência no nível do modelo, em vez de aumentar o tamanho", disse ele em um comunicado. "Nosso modelo de 4 bilhões superou os resultados de modelos quase sete vezes maiores, enquanto usava até três vezes menos tokens por resposta."

Essa eficiência de tokens é o outro destaque. O modelo de 4B tem uma média de cerca de 909 tokens por resposta versus 2.953 para sistemas comparáveis – uma redução de 3,2x. Menos tokens significa menor custo de computação, respostas mais rápidas e, crucialmente, a capacidade de rodar localmente sem um backend na nuvem.

"Você pode executar o raciocínio médico onde os dados já existem, dentro de um sistema hospitalar ou em um dispositivo, sem mover informações sensíveis pela nuvem ou aguardar processamento externo", disse Ardoino.

Os modelos são distribuídos como arquivos GGUF quantizados – 1,2 GB para o modelo de 1,7 bilhão de parâmetros e 2,6 GB para o de 4 bilhões – com versões compactadas mantendo a maior parte do desempenho do benchmark, enquanto se adaptam a hardware de consumidor padrão. Isso significa que um sistema hospitalar, clínica rural ou clínico individual poderia executar o modelo inteiramente no dispositivo, mantendo os registros dos pacientes fora da infraestrutura de nuvem de terceiros e longe da exposição ao HIPAA.

O apelo à privacidade pode ser um grande ponto positivo para algumas pessoas, mas usar a IA para opiniões médicas está longe de ser ideal, mesmo para os padrões atuais. Um estudo de Oxford publicado em fevereiro descobriu que LLMs rotineiramente dão conselhos médicos perigosos com respostas erradas, orientações confusas e tratamento inadequado de sintomas nuances. Os pesquisadores não chegaram a descartar a tecnologia inteiramente, mas argumentaram que a IA tem um papel de "secretário, não médico". O problema de conformidade agrava a situação: a maioria das IAs médicas hoje direciona dados de pacientes através de servidores em nuvem, criando exposição ao HIPAA toda vez que um médico digita uma consulta.

O lançamento se encaixa no padrão da Tether ao longo do último ano. No mês passado, ela lançou o QVAC SDK, um kit de ferramentas de código aberto para construir aplicativos de IA locais e offline em iOS, Android, Windows e Linux. Antes disso, lançou o QVAC Health, um aplicativo de bem-estar para o consumidor que mantém dados biométricos inteiramente no dispositivo. O MedPsy é o primeiro modelo QVAC especificamente treinado para raciocínio clínico.

O mercado de IA médica está avaliado em aproximadamente US$ 36 bilhões atualmente, com projeções apontando para mais de US$ 500 bilhões até 2033, de acordo com o próprio anúncio da Tether. Os modelos e pesos GGUF estão disponíveis agora em qvac.tether.io/models.