
Tether, firma stojąca za stablecoinem USDT, właśnie wypuściła medyczny model AI, który mieści się w kieszeni i może przewyższać rywali wielokrotnie większych. QVAC MedPsy został dziś zaprezentowany przez Grupę Badawczą AI Tether jako nowa klasa medycznych modeli językowych zaprojektowanych do działania na smartfonach, urządzeniach noszonych i urządzeniach brzegowych – bez potrzeby chmury.
Główna wiadomość: niewielki model z 1,7 miliarda parametrów, zdolny do pokonania Google MedGemma-4B w medycznych benchmarkach, mimo że jest mniejszy o ponad połowę. W teście HealthBench Hard – benchmarku OpenAI, który ocenia AI w realistycznych, wieloturowych rozmowach klinicznych ocenianych przez 262 lekarzy – Tether twierdzi, że jego model z 1,7 miliarda parametrów przewyższa MedGemma-27B, model niemal szesnastokrotnie większy.
Parametry to wszystkie konfiguracje i wartości, których model uczy się podczas treningu. Im więcej parametrów, tym lepszy powinien być model, teoretycznie.
Zestaw testów obejmuje MedQA-USMLE, który mierzy wiedzę kliniczną za pomocą pytań w stylu amerykańskiego egzaminu licencjonowania medycznego, ocenianych procentowo, aż po AfriMedQA, który testuje wydajność specjalnie w słabo rozwiniętych afrykańskich kontekstach opieki zdrowotnej.
Prezes Tether, Paolo Ardoino, przypisał osiągnięcia wydajności, a nie skali. „Z QVAC MedPsy skupiliśmy się na poprawie wydajności na poziomie modelu, a nie na zwiększaniu jego rozmiarów” – powiedział w oświadczeniu. „Nasz model z 4 miliardami parametrów przewyższył wyniki modeli niemal siedmiokrotnie większych, jednocześnie wykorzystując do trzech razy mniej tokenów na odpowiedź.”
Ta wydajność tokenów to kolejna kluczowa informacja. Model 4B generuje średnio około 909 tokenów na odpowiedź w porównaniu do 2953 w przypadku porównywalnych systemów – to redukcja o 3,2x. Mniejsza liczba tokenów oznacza niższe koszty obliczeniowe, szybsze odpowiedzi i, co najważniejsze, możliwość działania lokalnie bez zaplecza chmurowego.
„Możesz prowadzić wnioskowanie medyczne tam, gdzie dane już istnieją, w systemie szpitalnym lub na urządzeniu, bez przenoszenia wrażliwych informacji przez chmurę lub czekania na zewnętrzne przetwarzanie” – powiedział Ardoino.
Modele są dostarczane jako skwantyzowane pliki GGUF – 1,2 GB dla modelu z 1,7 miliarda parametrów i 2,6 GB dla modelu z 4 miliardami – przy czym skompresowane wersje zachowują większość wydajności benchmarkowej, jednocześnie mieszcząc się na standardowym sprzęcie konsumenckim. Oznacza to, że system szpitalny, wiejska klinika lub indywidualny lekarz mógłby uruchomić model całkowicie na urządzeniu, utrzymując dane pacjentów poza infrastrukturą chmurową stron trzecich i z dala od zagrożeń związanych z HIPAA.
Kwestia prywatności może być dla niektórych dużym plusem, ale wykorzystywanie AI do opinii medycznych jest dalekie od ideału, nawet według dzisiejszych standardów. Badanie Oxfordu opublikowane w lutym wykazało, że duże modele językowe (LLM) rutynowo udzielają niebezpiecznych porad medycznych, zawierających błędne odpowiedzi, zdezorientowane wskazówki i słabe radzenie sobie z subtelnymi objawami. Naukowcy powstrzymali się od całkowitego odrzucenia technologii, ale argumentowali, że AI ma pełnić rolę „sekretarza, a nie lekarza”. Problem zgodności go potęguje: większość dzisiejszych medycznych systemów AI przesyła dane pacjentów przez serwery chmurowe, tworząc ryzyko naruszenia HIPAA za każdym razem, gdy lekarz wprowadza zapytanie.
To wydanie wpisuje się w wzorzec działań Tethera z ostatniego roku. W zeszłym miesiącu firma wypuściła QVAC SDK, zestaw narzędzi open-source do tworzenia lokalnych, offline'owych aplikacji AI na iOS, Androida, Windowsa i Linuksa. Wcześniej uruchomiła QVAC Health, aplikację wellness dla konsumentów, która przechowuje dane biometryczne w całości na urządzeniu. MedPsy to pierwszy model QVAC specjalnie przeszkolony do wnioskowania klinicznego.
Rynek AI w medycynie szacowany jest obecnie na około 36 miliardów dolarów, z prognozami wskazującymi na przekroczenie 500 miliardów dolarów do 2033 roku, według własnych zapowiedzi Tether. Modele i wagi GGUF są dostępne już teraz pod adresem qvac.tether.io/models.