Her gün bizi daha da şaşırtan yapay zekâ teknolojileri, farklı alanlarda insanların yerini doldurabilecek yetenekler kazanıyor. Tıp da bunlardan biri. Daha önce birkaç kez yapay zekânın doktorlardan daha iyi performans verdiğini görmüştük. Şimdi bunlara bir yenisi daha eklendi.
Google, kendi geliştirdiği bir dil modelini (LLM) temel alan bir sohbet botu hakkında çalışma yayımladı. Çalışmada, sohbet botunun tıbbi görüşmelerde doktorlardan daha iyi performans sergilediği görüldü.
Doktorlardan daha iyi hastalık teşhis etti, daha iyi empati kurdu
Articulate Medical Intelligence Explorer (AMIE) ismi verilen model, hastalarla konuşma ve hastaların tıbbi geçmişine dayanarak olası teşhisleri listeleme konusunda doktorlardan daha başarılı oldu. Henüz akran değerlendirmesinden geçmeyen çalışma, 11 Ocak’ta arXiv’de ön baskı olarak yayımlandı.
Google araştırmacıları, modelin solunum ve kardiyovasküler hastalıkları daha iyi teşhis edebildiğini söylüyor. Ayrıca görüşmelerde gerçek doktorlarla benzer miktar bilgiyi elde edebildiğini, hatta daha iyi empati kurabildiğini de ekliyor.
Ancak modelin henüz gerçek hastalar üzerinde test edilmediğini vurgulamak gerek. Çalışmada, sadece hastaları canlandıran aktörler kullanıldı. Zaten araştırmacılar da modeli “deneysel” olarak nitelendirdi ve henüz bir şey söylemek için çok erken olduğunu aktardı.
20 oyuncu, çalışma kapsamında 149 farklı klinik senaryoyu simüle ettiler. Görüşmeler de yüz yüze değil, metin tabanlı olarak gerçekleştirildi. Oyuncular, görüşmeler sırasında gerçek doktorlarla mı yoksa sohbet botuyla mı konuştuklarını bilmiyorlardı. Bir grup uzman da AMIE’nin ve doktorların performansını değerlendirdi. Nezaket, durumu ve tedaviyi açıklama, dürüst görünme, teşhis gibi şeylerin incelendiği çalışmalar sonucunda ise sohbet botunun 26 kriterin 24’ünde doktorları geçtiği görüldü.
AMIE, doktorlardan daha iyi sonuçlar verse de onların yerini almayacak
Tabii ki bu sonuçlar yapay zekânın doktorların yerini alacağı anlamına gelmiyor. Google araştırmacısı Alan Karthikesalingam da konuya ilişkin “Bu, hiçbir şekilde bir dil modelinin tıbbi görüşmelerde doktorlardan daha iyi olduğu anlamına gelmez.” ifadelerini kullandı. Öte yandan Harvard’da doktor olarak görev yapan Adam Rodman da aracın faydalı olabileceğini ancak doktorların yerine geçemeyeceğini söyledi: “Tıp, bilgi toplamaktan daha fazlasıdır. Tamamen insan ilişkileriyle alakalıdır.”
Araştırmayla ilgili şunu da eklemek gerek. Katılan doktorlar hiç böyle metin tabanlı görüşmeler gerçekleştirmeye alışık değillerdi. Bu da performanslarını etkileyip yapay zekânın öne geçmesine neden olmuş olabilir.
Yine de çalışma, yapay zekânın empati kurabilen ve hastanın geçmişinden yola çıkarak tanı koyabilen bir doktorlara benzer şekilde performans gösterme potansiyelinin olduğunun göstergesi. Bu araştırmanın sonraki adımı da potansiyel ön yargıları değerlendirmek ve sistemin farklı popülasyonlarda benzer sonuçlar vermesini sağlamak için daha ayrıntılı çalışmalar yapmak.
Daha önce de tıp alanında benzer yapay zekâ gelişmeleri görmüştük. Bunlardan bazılarına aşağıdaki içeriklerimizden göz atabilirsiniz: