مطالعات اخیر نشان میدهد که چتجیپیتی در تشخیص بیماریها از پروندههای پزشکی بهتر از پزشکان عمل کرده است، حتی در مواردی که پزشکان به این چتبات بهعنوان یک منبع دسترسی داشتند.
دکتر «آدام رادمن»، متخصص پزشکی داخلی در بوستون، در ابتدا معتقد بود که چتباتهای مجهز به هوش مصنوعی مولد میتوانند به پزشکان در تشخیص بیماریها کمک کنند. اما او از کشف اینکه چتجیپیتی-۴ بهتنهایی عملکرد بهتری از پزشکان در یک محیط آزمایشی داشت، شگفتزده شد.
توانایی هوش مصنوعی در تشخیص بیماری
در این مطالعه، چتجیپیتی بهطور میانگین به دقت تشخیصی ۹۰٪ دست یافت. در مقابل، پزشکانی که از چتبات استفاده میکردند، امتیاز ۷۶٪ و پزشکان بدون کمک آن امتیاز ۷۴٪ کسب کردند. این یافتهها نه تنها تواناییهای چتبات را برجسته کرد، بلکه نشان داد که بسیاری از پزشکان حتی زمانی که هوش مصنوعی گزینه بهتری ارائه میدهد، از تغییر نظر خود اجتناب میکنند.
علاوه بر این، پزشکان در استفاده کامل از ویژگیهای پیشرفته چتبات با چالش مواجه بودند و این شکاف دانشی، مانعی برای ادغام مؤثر ابزارهای هوش مصنوعی در پزشکی ایجاد کرد.
این آزمایش، که در مجله JAMA Network Open منتشر شد، شامل ۵۰ پزشک از بیمارستانهای مختلف ایالات متحده، از جمله رزیدنتها و پزشکان مجرب بود. شرکتکنندگان شش پرونده پزشکی پیچیده دریافت کردند که بر اساس تاریخچه واقعی بیماران اما منتشرنشده طراحی شده بود تا اطمینان حاصل شود که چتجیپیتی از قبل با آنها آموزش ندیده است. عملکرد پزشکان بر اساس توانایی آنها در ارائه تشخیص، توجیه دلایل خود، و شناسایی یافتههایی که با نتیجهگیری آنها هماهنگ یا در تضاد بود، ارزیابی شد. ارزیابیکنندگان بدون اطلاع از منبع پاسخها (پزشک یا چتبات) نتایج را بررسی کردند.
یکی از موارد نمونه، مردی ۷۶ ساله را توصیف میکرد که پس از یک عمل قلبی با درد شدید در کمر و پاها مواجه شده بود. تشخیص درست این پرونده، آمبولی کلسترولی بود؛ وضعیتی که در آن ذرات پلاک باعث انسداد رگهای خونی میشوند. چتجیپیتی بهطور مداوم پیشنهادات تشخیصی دقیق و کاملی ارائه داد و از بسیاری از پزشکان پیشی گرفت.
چالشهای پذیرش هوش مصنوعی
مطالعه دو مانع کلیدی در استفاده مؤثر از هوش مصنوعی را آشکار کرد:
- تعصب شناختی: بسیاری از پزشکان به تشخیص اولیه خود پایبند بودند، حتی زمانی که چتجیپیتی شواهد متناقضی ارائه میداد.
- عدم استفاده بهینه از هوش مصنوعی: پزشکان اغلب چتبات را بهعنوان یک موتور جستجوی ساده برای پرسشهای جزئی به کار میبردند، بهجای اینکه از قابلیت آن برای تجزیهوتحلیل جامع کل پرونده استفاده کنند.
دکتر «جاناتان چن»، پزشک و دانشمند علوم رایانه در دانشگاه استنفورد، اشاره کرد که تنها تعداد کمی از شرکتکنندگان متوجه شدند که میتوانند کل پرونده را در چتبات قرار داده و یک پاسخ جامع دریافت کنند.
نگاه تاریخی به هوش مصنوعی در پزشکی
تلاشها برای توسعه ابزارهای تشخیصی هوش مصنوعی به دهه ۱۹۷۰ بازمیگردد، زمانی که برنامههایی مانند INTERNIST-1 به دقت قابل توجهی دست یافتند. اما این سیستمها به دلیل مشکلات در استفاده و کمبود اعتماد پزشکان موفق به گسترش نشدند. مدلهای زبان بزرگ مانند چتجیپیتی اکنون نقطه عطفی محسوب میشوند، زیرا در درک و پردازش زبان طبیعی بسیار مهارت دارند.
دکتر چن اظهار داشت که “رابط چت ابزار کلیدی است.” برخلاف سیستمهای قبلی، چتجیپیتی تلاش نمیکند تفکر تشخیصی انسان را تقلید کند، بلکه با استفاده از توانایی پیشبینی زبان، تشخیصهای دقیقی ارائه میدهد.
آینده هوش مصنوعی در پزشکی
با وجود عملکرد امیدوارکننده، این مطالعه نشان میدهد که آموزش پزشکان برای ادغام ابزارهای هوش مصنوعی در عمل بالینی ضروری است. به گفته دکتر رادمن، سیستمهای هوش مصنوعی باید بهعنوان «گسترشدهنده پزشک» عمل کنند و نظرات دوم قابل اعتمادی ارائه دهند. اما اعتماد بیشازحد پزشکان به قضاوت خود و ناآشنایی با این فناوریها همچنان موانع بزرگی محسوب میشوند.
با پیشرفت ابزارهایی مانند چتجیپیتی، این فناوری پتانسیل تبدیل تشخیص بیماری را دارد – اگر پزشکان بتوانند این چالشها را برطرف کرده و قابلیتهای آن را بهطور کامل بپذیرند.