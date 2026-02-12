Modeller, uydurulmuş tıbbi iddiaların ortalama yüzde 32’sini doğru kabul etti. Daha küçük ve az gelişmiş modellerde bu oran yüzde 60’ların üzerine çıkarken, daha güçlü sistemlerde hata oranı belirgin biçimde düşse de tamamen ortadan kalkmadı.

Çalışmanın dikkat çeken bir diğer bulgusu ise, “tıbbi olarak ince ayarlanmış” modellerin, genel amaçlı modellere kıyasla her zaman daha iyi performans göstermemesi oldu. Araştırmacılara göre sorun, bilginin doğruluğundan çok nasıl ifade edildiği ile ilgili. Kendinden emin, teknik ve otoriter bir dil kullanıldığında yanlış bir iddia bile model tarafından sorgulanmadan kabul edilebiliyor.