tether-medical-ai-runs-on-phone-outperforms-models-16x
هوش مصنوعی پزشکی Tether روی گوشی شما اجرا می‌شود و عملکردی 16 برابر مدل‌های بزرگ‌تر دارد
QVAC MedPsy هوش مصنوعی بالینی را روی یک تلفن هوشمند فشرده می‌کند و در سناریوهای واقعی از MedGemma-27B گوگل پیشی می‌گیرد در حالی که از منابع محاسباتی سه برابر کمتر استفاده می‌کند.
2026-05-07 منبع:decrypt.co

به طور خلاصه

  • مدل ۱.۷ میلیارد پارامتری QVAC MedPsy تتر، از MedGemma-4B گوگل پیشی گرفت و حتی MedGemma-27B را در HealthBench Hard شکست داد؛ HealthBench Hard یک معیار ارزیابی OpenAI است که مکالمات بالینی واقعی را مورد آزمایش قرار می‌دهد و توسط ۲۶۲ پزشک ارزیابی شده است.
  • این مدل با ۴ میلیارد پارامتر، پاسخ‌هایی را با حدود ۹۰۹ توکن تولید می‌کند، در حالی که سیستم‌های مشابه حدود ۲,۹۵۳ توکن نیاز دارند – این کاهش ۳.۲ برابری، استقرار محلی در بیمارستان‌ها و دستگاه‌های موبایل را عملی می‌سازد.
  • این مدل‌ها در قالب کوانتیزه شده GGUF (۱.۲ گیگابایت و ۲.۶ گیگابایت) عرضه می‌شوند و به طور کامل روی سخت‌افزارهای مصرفی بدون نیاز به زیرساخت ابری اجرا می‌شوند.


تتر، شرکت استیبل‌کوین که بیشتر به خاطر USDT شناخته می‌شود، به تازگی یک مدل هوش مصنوعی پزشکی منتشر کرده که در جیب شما جا می‌شود و ممکن است از رقبای خود که بیش از ده‌ها برابر بزرگ‌تر هستند، عملکرد بهتری داشته باشد. QVAC MedPsy امروز توسط گروه تحقیقاتی هوش مصنوعی تتر به عنوان کلاس جدیدی از مدل‌های زبان پزشکی معرفی شد که برای اجرا بر روی گوشی‌های هوشمند، دستگاه‌های پوشیدنی و دستگاه‌های لبه طراحی شده‌اند – بدون نیاز به فضای ابری.

نکته اصلی: یک مدل کوچک با ۱.۷ میلیارد پارامتر که قادر است MedGemma-4B گوگل را در معیارهای پزشکی شکست دهد، با وجود اینکه کمتر از نصف اندازه آن است. در HealthBench Hard – معیار OpenAI که هوش مصنوعی را در مکالمات بالینی واقعی و چند مرحله‌ای که توسط ۲۶۲ پزشک ارزیابی شده‌اند، ارزیابی می‌کند – تتر می‌گوید مدل ۱.۷ میلیارد پارامتری آن از MedGemma-27B که تقریباً شانزده برابر بزرگ‌تر است، امتیاز بیشتری کسب کرده است.

پارامترها تمام پیکربندی‌ها و مقادیری هستند که یک مدل در طول آموزش (training) یاد می‌گیرد. هرچه تعداد پارامترها بیشتر باشد، از لحاظ تئوری، مدل باید بهتر باشد.

منبع: تتر

مجموعه تست‌ها شامل MedQA-USMLE است که دانش بالینی را با استفاده از سوالات سبک آزمون مجوز پزشکی ایالات متحده اندازه‌گیری می‌کند (با دقت درصدی امتیازدهی می‌شود)، تا AfriMedQA که عملکرد را به طور خاص برای زمینه‌های مراقبت‌های بهداشتی محروم آفریقا آزمایش می‌کند.

پائولو آردوینو، مدیر عامل تتر، این دستاوردها را ناشی از کارایی و نه مقیاس دانست. او در بیانیه‌ای گفت: «با QVAC MedPsy، تمرکز ما بر بهبود کارایی در سطح مدل بود، نه افزایش اندازه.» وی افزود: «مدل ۴ میلیاردی ما از مدل‌هایی که تقریباً هفت برابر بزرگ‌تر بودند، فراتر رفت، در حالی که تا سه برابر توکن کمتری برای هر پاسخ استفاده می‌کرد.»

این کارایی توکن، نکته مهم دیگر است. مدل ۴B به طور متوسط حدود ۹۰۹ توکن در هر پاسخ استفاده می‌کند، در حالی که سیستم‌های مشابه ۲,۹۵۳ توکن مصرف می‌کنند – این کاهش ۳.۲ برابری است. توکن‌های کمتر به معنای هزینه محاسباتی پایین‌تر، پاسخ‌های سریع‌تر و مهم‌تر از همه، قابلیت اجرا به صورت محلی بدون نیاز به پشتیبانی ابری است.

آردوینو گفت: «می‌توانید استدلال پزشکی را در جایی که داده‌ها از قبل وجود دارند، در داخل یک سیستم بیمارستانی یا روی یک دستگاه، اجرا کنید، بدون اینکه اطلاعات حساس را از طریق فضای ابری منتقل کنید یا منتظر پردازش خارجی باشید.»

این مدل‌ها به صورت فایل‌های GGUF کوانتیزه شده – ۱.۲ گیگابایت برای مدل ۱.۷ میلیارد پارامتری و ۲.۶ گیگابایت برای مدل ۴ میلیاردی – عرضه می‌شوند، با نسخه‌های فشرده‌ای که بیشتر عملکرد معیار را حفظ کرده و روی سخت‌افزار مصرفی استاندارد جا می‌شوند. این بدان معناست که یک سیستم بیمارستانی، کلینیک روستایی یا پزشک انفرادی می‌تواند مدل را به طور کامل روی دستگاه اجرا کند، و سوابق بیمار را از زیرساخت‌های ابری شخص ثالث و دور از خطر افشای HIPAA نگه دارد.

پیشنهاد حفظ حریم خصوصی ممکن است برای برخی افراد یک مزیت بزرگ باشد، اما استفاده از هوش مصنوعی برای نظرات پزشکی حتی با استانداردهای امروزی نیز هنوز ایده‌آل نیست. یک مطالعه آکسفورد که در فوریه منتشر شد، نشان داد که LLMها به طور معمول توصیه‌های پزشکی خطرناک با پاسخ‌های اشتباه، راهنمایی‌های گیج‌کننده و مدیریت ضعیف علائم ظریف ارائه می‌دهند. محققان از رد کامل این فناوری خودداری کردند، اما استدلال کردند که هوش مصنوعی نقشی «دبیر، نه پزشک» دارد. مشکل انطباق‌پذیری این مسئله را پیچیده‌تر می‌کند: بیشتر هوش مصنوعی پزشکی امروزه داده‌های بیمار را از طریق سرورهای ابری منتقل می‌کند و هر بار که پزشک یک پرسش را تایپ می‌کند، خطر افشای HIPAA را ایجاد می‌کند.

این انتشار با الگوی تتر در طول سال گذشته مطابقت دارد. ماه گذشته، این شرکت QVAC SDK را عرضه کرد، یک کیت توسعه نرم‌افزار متن‌باز برای ساخت برنامه‌های هوش مصنوعی محلی و آفلاین در iOS، اندروید، ویندوز و لینوکس. پیش از آن، QVAC Health را راه‌اندازی کرده بود، یک برنامه سلامت مصرف‌کننده که داده‌های بیومتریک را کاملاً روی دستگاه نگه می‌دارد. MedPsy اولین مدل QVAC است که به طور خاص برای استدلال بالینی آموزش دیده است.

بازار هوش مصنوعی پزشکی امروز تقریباً ۳۶ میلیارد دلار ارزش دارد، با پیش‌بینی‌هایی که طبق اعلام خود تتر، تا سال ۲۰۳۳ از ۵۰۰ میلیارد دلار فراتر خواهد رفت. مدل‌ها و وزن‌های GGUF اکنون در qvac.tether.io/models در دسترس هستند.

رمزارز های محبوب
همین حالا ثبت‌نام کنید، هیچ به‌روزرسانی‌ای را از دست ندهید!