
تتر، شرکت استیبلکوین که بیشتر به خاطر USDT شناخته میشود، به تازگی یک مدل هوش مصنوعی پزشکی منتشر کرده که در جیب شما جا میشود و ممکن است از رقبای خود که بیش از دهها برابر بزرگتر هستند، عملکرد بهتری داشته باشد. QVAC MedPsy امروز توسط گروه تحقیقاتی هوش مصنوعی تتر به عنوان کلاس جدیدی از مدلهای زبان پزشکی معرفی شد که برای اجرا بر روی گوشیهای هوشمند، دستگاههای پوشیدنی و دستگاههای لبه طراحی شدهاند – بدون نیاز به فضای ابری.
نکته اصلی: یک مدل کوچک با ۱.۷ میلیارد پارامتر که قادر است MedGemma-4B گوگل را در معیارهای پزشکی شکست دهد، با وجود اینکه کمتر از نصف اندازه آن است. در HealthBench Hard – معیار OpenAI که هوش مصنوعی را در مکالمات بالینی واقعی و چند مرحلهای که توسط ۲۶۲ پزشک ارزیابی شدهاند، ارزیابی میکند – تتر میگوید مدل ۱.۷ میلیارد پارامتری آن از MedGemma-27B که تقریباً شانزده برابر بزرگتر است، امتیاز بیشتری کسب کرده است.
پارامترها تمام پیکربندیها و مقادیری هستند که یک مدل در طول آموزش (training) یاد میگیرد. هرچه تعداد پارامترها بیشتر باشد، از لحاظ تئوری، مدل باید بهتر باشد.
مجموعه تستها شامل MedQA-USMLE است که دانش بالینی را با استفاده از سوالات سبک آزمون مجوز پزشکی ایالات متحده اندازهگیری میکند (با دقت درصدی امتیازدهی میشود)، تا AfriMedQA که عملکرد را به طور خاص برای زمینههای مراقبتهای بهداشتی محروم آفریقا آزمایش میکند.
پائولو آردوینو، مدیر عامل تتر، این دستاوردها را ناشی از کارایی و نه مقیاس دانست. او در بیانیهای گفت: «با QVAC MedPsy، تمرکز ما بر بهبود کارایی در سطح مدل بود، نه افزایش اندازه.» وی افزود: «مدل ۴ میلیاردی ما از مدلهایی که تقریباً هفت برابر بزرگتر بودند، فراتر رفت، در حالی که تا سه برابر توکن کمتری برای هر پاسخ استفاده میکرد.»
این کارایی توکن، نکته مهم دیگر است. مدل ۴B به طور متوسط حدود ۹۰۹ توکن در هر پاسخ استفاده میکند، در حالی که سیستمهای مشابه ۲,۹۵۳ توکن مصرف میکنند – این کاهش ۳.۲ برابری است. توکنهای کمتر به معنای هزینه محاسباتی پایینتر، پاسخهای سریعتر و مهمتر از همه، قابلیت اجرا به صورت محلی بدون نیاز به پشتیبانی ابری است.
آردوینو گفت: «میتوانید استدلال پزشکی را در جایی که دادهها از قبل وجود دارند، در داخل یک سیستم بیمارستانی یا روی یک دستگاه، اجرا کنید، بدون اینکه اطلاعات حساس را از طریق فضای ابری منتقل کنید یا منتظر پردازش خارجی باشید.»
این مدلها به صورت فایلهای GGUF کوانتیزه شده – ۱.۲ گیگابایت برای مدل ۱.۷ میلیارد پارامتری و ۲.۶ گیگابایت برای مدل ۴ میلیاردی – عرضه میشوند، با نسخههای فشردهای که بیشتر عملکرد معیار را حفظ کرده و روی سختافزار مصرفی استاندارد جا میشوند. این بدان معناست که یک سیستم بیمارستانی، کلینیک روستایی یا پزشک انفرادی میتواند مدل را به طور کامل روی دستگاه اجرا کند، و سوابق بیمار را از زیرساختهای ابری شخص ثالث و دور از خطر افشای HIPAA نگه دارد.
پیشنهاد حفظ حریم خصوصی ممکن است برای برخی افراد یک مزیت بزرگ باشد، اما استفاده از هوش مصنوعی برای نظرات پزشکی حتی با استانداردهای امروزی نیز هنوز ایدهآل نیست. یک مطالعه آکسفورد که در فوریه منتشر شد، نشان داد که LLMها به طور معمول توصیههای پزشکی خطرناک با پاسخهای اشتباه، راهنماییهای گیجکننده و مدیریت ضعیف علائم ظریف ارائه میدهند. محققان از رد کامل این فناوری خودداری کردند، اما استدلال کردند که هوش مصنوعی نقشی «دبیر، نه پزشک» دارد. مشکل انطباقپذیری این مسئله را پیچیدهتر میکند: بیشتر هوش مصنوعی پزشکی امروزه دادههای بیمار را از طریق سرورهای ابری منتقل میکند و هر بار که پزشک یک پرسش را تایپ میکند، خطر افشای HIPAA را ایجاد میکند.
این انتشار با الگوی تتر در طول سال گذشته مطابقت دارد. ماه گذشته، این شرکت QVAC SDK را عرضه کرد، یک کیت توسعه نرمافزار متنباز برای ساخت برنامههای هوش مصنوعی محلی و آفلاین در iOS، اندروید، ویندوز و لینوکس. پیش از آن، QVAC Health را راهاندازی کرده بود، یک برنامه سلامت مصرفکننده که دادههای بیومتریک را کاملاً روی دستگاه نگه میدارد. MedPsy اولین مدل QVAC است که به طور خاص برای استدلال بالینی آموزش دیده است.
بازار هوش مصنوعی پزشکی امروز تقریباً ۳۶ میلیارد دلار ارزش دارد، با پیشبینیهایی که طبق اعلام خود تتر، تا سال ۲۰۳۳ از ۵۰۰ میلیارد دلار فراتر خواهد رفت. مدلها و وزنهای GGUF اکنون در qvac.tether.io/models در دسترس هستند.