tether-medical-ai-runs-on-phone-outperforms-models-16x
AI Y tế của Tether chạy trên điện thoại và vượt trội hơn các mô hình lớn gấp 16 lần
QVAC MedPsy tích hợp trí tuệ nhân tạo lâm sàng vào điện thoại thông minh, vượt trội hơn MedGemma-27B của Google trong các tình huống thực tế đồng thời chỉ sử dụng một phần ba tài nguyên tính toán.
2026-05-07 Nguồn:decrypt.co

Tóm tắt

  • Mô hình QVAC MedPsy 1,7 tỷ tham số của Tether đã vượt trội hơn MedGemma-4B của Google và đánh bại MedGemma-27B trên HealthBench Hard, một tiêu chuẩn của OpenAI kiểm tra các cuộc hội thoại lâm sàng thực tế được chấm điểm bởi 262 bác sĩ.
  • Mô hình 4 tỷ tham số tạo ra phản hồi với khoảng 909 token so với khoảng 2.953 token của các hệ thống tương đương – giảm 3,2 lần, giúp việc triển khai tại bệnh viện địa phương và trên thiết bị di động trở nên khả thi.
  • Các mô hình được xuất dưới định dạng GGUF đã lượng tử hóa (1,2 GB và 2,6 GB) và chạy hoàn toàn trên phần cứng tiêu dùng mà không cần cơ sở hạ tầng đám mây.


Tether, công ty stablecoin nổi tiếng nhất với USDT, vừa phát hành một mô hình AI y tế có thể nằm gọn trong túi của bạn và có thể vượt trội hơn các đối thủ lớn gấp hàng chục lần. QVAC MedPsy ra mắt hôm nay từ Nhóm Nghiên cứu AI của Tether như một lớp mô hình ngôn ngữ y tế mới được thiết kế để chạy trên điện thoại thông minh, thiết bị đeo và thiết bị biên – không cần đám mây.

Con số đáng chú ý nhất: một mô hình nhỏ chỉ 1,7 tỷ tham số có khả năng đánh bại MedGemma-4B của Google trên các tiêu chuẩn y tế mặc dù kích thước chỉ bằng một nửa. Trên HealthBench Hard—tiêu chuẩn của OpenAI đánh giá AI về các cuộc hội thoại lâm sàng đa chiều, thực tế được chấm điểm bởi 262 bác sĩ—Tether cho biết mô hình 1,7 tỷ tham số của họ đạt điểm cao hơn MedGemma-27B, một mô hình lớn gấp gần mười sáu lần.

Tham số là tất cả các cấu hình và giá trị mà một mô hình học được trong quá trình đào tạo. Càng nhiều tham số, mô hình càng tốt, về lý thuyết.

Nguồn: Tether

Bộ thử nghiệm bao gồm MedQA-USMLE, đo lường kiến thức lâm sàng bằng các câu hỏi theo phong cách kỳ thi cấp phép y tế của Hoa Kỳ được chấm điểm theo phần trăm độ chính xác, cho đến AfriMedQA, kiểm tra hiệu suất đặc biệt cho các bối cảnh chăm sóc sức khỏe thiếu thốn ở châu Phi.

CEO Tether Paolo Ardoino đã ghi nhận những thành tựu đạt được nhờ hiệu quả thay vì quy mô. "Với QVAC MedPsy, trọng tâm của chúng tôi là cải thiện hiệu quả ở cấp độ mô hình, thay vì tăng quy mô," ông nói trong một tuyên bố. "Mô hình 4 tỷ của chúng tôi đã vượt qua kết quả từ các mô hình lớn gấp gần bảy lần, trong khi sử dụng ít token hơn tới ba lần cho mỗi phản hồi."

Hiệu quả token đó là điểm nhấn khác. Mô hình 4B trung bình khoảng 909 token cho mỗi phản hồi so với 2.953 token của các hệ thống tương đương – giảm 3,2 lần. Ít token hơn có nghĩa là chi phí tính toán thấp hơn, phản hồi nhanh hơn và quan trọng là khả năng chạy cục bộ mà không cần backend đám mây.

"Bạn có thể thực hiện suy luận y tế ở nơi dữ liệu đã tồn tại, bên trong hệ thống bệnh viện hoặc trên thiết bị, mà không cần di chuyển thông tin nhạy cảm qua đám mây hoặc chờ đợi quá trình xử lý bên ngoài," Ardoino nói.

Các mô hình được cung cấp dưới dạng tệp GGUF đã lượng tử hóa – 1,2 GB cho mô hình 1,7 tỷ tham số và 2,6 GB cho mô hình 4 tỷ – với các phiên bản nén vẫn giữ được hầu hết hiệu suất tiêu chuẩn trong khi vẫn có thể chạy trên phần cứng tiêu dùng thông thường. Điều đó có nghĩa là một hệ thống bệnh viện, phòng khám nông thôn hoặc một bác sĩ cá nhân có thể chạy mô hình hoàn toàn trên thiết bị, giữ hồ sơ bệnh nhân tránh xa cơ sở hạ tầng đám mây của bên thứ ba và khỏi rủi ro tiếp xúc với HIPAA.

Lời kêu gọi về quyền riêng tư có thể là một điểm cộng lớn đối với một số người, nhưng việc sử dụng AI cho ý kiến y tế vẫn còn xa mới đạt lý tưởng ngay cả theo tiêu chuẩn hiện nay. Một nghiên cứu của Oxford được công bố vào tháng 2 đã phát hiện ra rằng các LLM thường xuyên đưa ra lời khuyên y tế nguy hiểm với câu trả lời sai, hướng dẫn gây nhầm lẫn và xử lý kém các triệu chứng tinh tế. Các nhà nghiên cứu không hoàn toàn bác bỏ công nghệ này, nhưng lập luận rằng AI có vai trò như "thư ký, không phải bác sĩ." Vấn đề tuân thủ còn phức tạp hơn: Hầu hết AI y tế hiện nay định tuyến dữ liệu bệnh nhân qua các máy chủ đám mây, tạo ra rủi ro tiếp xúc với HIPAA mỗi khi bác sĩ gõ một truy vấn.

Sự ra mắt này phù hợp với xu hướng của Tether trong năm qua. Tháng trước, họ đã phát hành QVAC SDK, một bộ công cụ mã nguồn mở để xây dựng các ứng dụng AI cục bộ, ngoại tuyến trên iOS, Android, Windows và Linux. Trước đó, họ đã ra mắt QVAC Health, một ứng dụng chăm sóc sức khỏe tiêu dùng giữ dữ liệu sinh trắc học hoàn toàn trên thiết bị. MedPsy là mô hình QVAC đầu tiên được đào tạo đặc biệt cho lý luận lâm sàng.

Thị trường AI y tế hiện nay có giá trị khoảng 36 tỷ USD, với các dự báo cho thấy con số này sẽ vượt mốc 500 tỷ USD vào năm 2033, theo thông báo của Tether. Các mô hình và trọng số GGUF hiện có sẵn tại qvac.tether.io/models.