tether-medical-ai-runs-on-phone-outperforms-models-16x
AI Medis Tether Berjalan di Ponsel Anda dan Mengungguli Model 16x Ukurannya
QVAC MedPsy menempatkan AI klinis ke dalam smartphone, mengalahkan MedGemma-27B milik Google dalam skenario dunia nyata sekaligus menggunakan sumber daya komputasi tiga kali lebih sedikit.
2026-05-07 Sumber:decrypt.co

Singkatnya

  • QVAC MedPsy 1,7 miliar parameter milik Tether mengungguli MedGemma-4B Google dan mengalahkan MedGemma-27B pada HealthBench Hard, sebuah tolok ukur OpenAI yang menguji percakapan klinis realistis yang dinilai oleh 262 dokter.
  • Model 4 miliar parameter menghasilkan respons dalam sekitar 909 token dibandingkan sekitar 2.953 untuk sistem sejenis—pengurangan 3,2 kali lipat yang membuat implementasi di rumah sakit lokal dan perangkat seluler menjadi praktis.
  • Model dikirimkan dalam format GGUF terkuantisasi (1,2 GB dan 2,6 GB) dan berjalan sepenuhnya pada perangkat keras konsumen tanpa infrastruktur cloud.


Tether, perusahaan stablecoin yang paling dikenal dengan USDT, baru saja merilis model AI medis yang muat di saku Anda dan mungkin mengungguli pesaing yang ukurannya lebih dari belasan kali lipat. QVAC MedPsy diluncurkan hari ini dari AI Research Group Tether sebagai kelas baru model bahasa medis yang dirancang untuk berjalan di smartphone, perangkat wearable, dan perangkat edge—tanpa memerlukan cloud.

Angka utamanya: model 1,7 miliar parameter yang kecil yang mampu mengalahkan MedGemma-4B Google dalam tolok ukur medis meskipun ukurannya kurang dari separuhnya. Pada HealthBench Hard—tolok ukur OpenAI yang mengevaluasi AI dalam percakapan klinis multi-giliran yang realistis yang dinilai oleh 262 dokter—Tether menyatakan model 1,7 miliar parameternya mengungguli MedGemma-27B, model yang ukurannya hampir enam belas kali lebih besar.

Parameter adalah semua konfigurasi dan nilai yang dipelajari model selama pelatihan. Semakin banyak parameternya, semakin baik model seharusnya, secara teori.

Sumber: Tether

Rangkaian uji ini mencakup MedQA-USMLE, yang mengukur pengetahuan klinis menggunakan soal-soal ujian lisensi medis AS yang dinilai berdasarkan akurasi persentase, hingga AfriMedQA, yang menguji kinerja secara khusus untuk konteks perawatan kesehatan Afrika yang kurang terlayani.

CEO Tether, Paolo Ardoino, mengaitkan pencapaian ini dengan efisiensi daripada skala. "Dengan QVAC MedPsy, fokus kami adalah meningkatkan efisiensi pada tingkat model, daripada meningkatkan ukuran," katanya dalam sebuah pernyataan. "Model 4 miliar kami melampaui hasil dari model yang ukurannya hampir tujuh kali lipat, sambil menggunakan token hingga tiga kali lebih sedikit per respons."

Efisiensi token itulah sorotan lainnya. Model 4B rata-rata sekitar 909 token per respons dibandingkan 2.953 untuk sistem sejenis—pengurangan 3,2 kali lipat. Lebih sedikit token berarti biaya komputasi lebih rendah, respons lebih cepat, dan yang terpenting, kemampuan untuk berjalan secara lokal tanpa backend cloud.

"Anda dapat menjalankan penalaran medis di mana data sudah ada, di dalam sistem rumah sakit atau pada perangkat, tanpa memindahkan informasi sensitif melalui cloud atau menunggu pemrosesan eksternal," kata Ardoino.

Model-model ini dikirimkan sebagai file GGUF terkuantisasi—1,2 GB untuk model 1,7 miliar parameter dan 2,6 GB untuk 4 miliar—dengan versi terkompresi yang mempertahankan sebagian besar kinerja tolok ukur sambil tetap muat pada perangkat keras konsumen standar. Artinya, sistem rumah sakit, klinik pedesaan, atau dokter individu dapat menjalankan model ini sepenuhnya di perangkat, menjaga catatan pasien dari infrastruktur cloud pihak ketiga dan menjauhkan dari paparan HIPAA.

Janji privasi ini mungkin menjadi nilai tambah utama bagi sebagian orang, namun penggunaan AI untuk opini medis masih jauh dari ideal bahkan menurut standar saat ini. Sebuah studi Oxford yang diterbitkan pada bulan Februari menemukan bahwa LLM secara rutin memberikan nasihat medis yang berbahaya dengan jawaban yang salah, panduan yang membingungkan, dan penanganan gejala yang bernuansa yang buruk. Para peneliti tidak serta merta menolak teknologi ini sepenuhnya, tetapi berpendapat bahwa AI memiliki peran sebagai "sekretaris, bukan dokter." Masalah kepatuhan memperparah hal ini: Sebagian besar AI medis saat ini merutekan data pasien melalui server cloud, menciptakan risiko paparan HIPAA setiap kali dokter mengetikkan pertanyaan.

Rilis ini sesuai dengan pola Tether selama setahun terakhir. Bulan lalu, Tether mengirimkan QVAC SDK, sebuah toolkit open-source untuk membangun aplikasi AI lokal dan offline di iOS, Android, Windows, dan Linux. Sebelumnya, mereka meluncurkan QVAC Health, aplikasi kesehatan konsumen yang menyimpan data biometrik sepenuhnya di perangkat. MedPsy adalah model QVAC pertama yang secara khusus dilatih untuk penalaran klinis.

Pasar AI medis saat ini bernilai sekitar $36 miliar, dengan proyeksi menunjukkan melampaui $500 miliar pada tahun 2033, menurut pengumuman Tether sendiri. Model dan bobot GGUF kini tersedia di qvac.tether.io/models.