Harvard-ის კვლევა: AI-მ სასწრაფო დახმარების განყოფილებაში ორ ექიმზე უფრო ზუსტი დიაგნოზი დასვა

ახალი კვლევა შეისწავლის, თუ როგორ მუშაობენ დიდი ენობრივი მოდელები (LLM) სხვადასხვა სამედიცინო კონტექსტში, მათ შორის რეალურ სასწრაფო დახმარების შემთხვევებში. კვლევის თანახმად, სულ მცირე ერთი მოდელი ადამიან ექიმებზე უფრო ზუსტი აღმოჩნდა.

კვლევა ჟურნალ Science-ში გამოქვეყნდა. ის ჩაატარა ჰარვარდის სამედიცინო სკოლისა და Beth Israel Deaconess Medical Center-ის ექიმებისა და კომპიუტერული მეცნიერების მკვლევართა გუნდმა. მათ ჩაატარეს ექსპერიმენტები, რათა შეედარებინათ OpenAI-ის მოდელების მუშაობა ადამიან ექიმებთან.

ერთ-ერთ ექსპერიმენტში, მკვლევარებმა ფოკუსირება მოახდინეს Beth Israel-ის სასწრაფო დახმარების განყოფილების 76 პაციენტზე. მათ შეადარეს შინაგანი მედიცინის ორი ექიმის მიერ დასმული დიაგნოზები OpenAI-ის o1 და 4o მოდელების მიერ გენერირებულ დიაგნოზებს. ეს დიაგნოზები შეაფასა ორმა სხვა ექიმმა, რომლებმაც არ იცოდნენ, რომელი დიაგნოზი ეკუთვნოდა ადამიანს და რომელი - AI-ს.

AI-ის უპირატესობა ტრიაჟის ეტაპზე

„თითოეულ სადიაგნოსტიკო ეტაპზე, o1 მოდელმა აჩვენა ოდნავ უკეთესი ან თანაბარი შედეგი ორ ექიმთან და 4o მოდელთან შედარებით“, - აღნიშნულია კვლევაში. განსხვავება განსაკუთრებით თვალსაჩინო იყო პირველ სადიაგნოსტიკო ეტაპზე (საწყისი ტრიაჟი), როდესაც პაციენტის შესახებ ყველაზე ნაკლები ინფორმაციაა ხელმისაწვდომი და გადაწყვეტილების მიღების სისწრაფე კრიტიკულია.

მკვლევარებმა ხაზგასმით აღნიშნეს, რომ მათ მონაცემები წინასწარ არ დაუმუშავებიათ. AI მოდელებს მიეწოდათ ზუსტად იგივე ინფორმაცია, რაც ელექტრონულ სამედიცინო ჩანაწერებში იყო ხელმისაწვდომი თითოეული დიაგნოზის დასმის მომენტში.

ამ ინფორმაციით, o1 მოდელმა შეძლო „ზუსტი ან ძალიან მიახლოებული დიაგნოზის“ დასმა ტრიაჟის შემთხვევების 67%-ში. შედარებისთვის, ერთმა ექიმმა ზუსტი ან მიახლოებული დიაგნოზი შემთხვევების 55%-ში, ხოლო მეორემ 50%-ში დასვა.

საჭიროა მეტი კვლევა რეალურ გარემოში

მნიშვნელოვანია აღინიშნოს, რომ კვლევა არ ამტკიცებს, თითქოს AI მზად არის სასწრაფო დახმარების განყოფილებაში რეალური, სასიცოცხლო მნიშვნელობის გადაწყვეტილებების მისაღებად. პირიქით, მკვლევარების თქმით, მიღებული შედეგები მიუთითებს „რეალურ პაციენტებზე ზრუნვის პირობებში ამ ტექნოლოგიების შესაფასებლად პერსპექტიული ტესტირებების გადაუდებელ აუცილებლობაზე“.

კვლევის ერთ-ერთმა წამყვანმა ავტორმა, ექიმმა ადამ როდმანმა აღნიშნა, რომ ამჟამად AI დიაგნოზებთან დაკავშირებით „პასუხისმგებლობის ფორმალური ჩარჩო არ არსებობს“ და პაციენტებს კვლავ სურთ, რომ სასიცოცხლო და რთული სამკურნალო გადაწყვეტილებების მიღებისას მათ ადამიანები ხელმძღვანელობდნენ.

წყარო: techcrunch.com