Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

LG, yeni nesil taşınabilir monitörünü tanıttı!

LG, akıllı monitör serisini yeni Smart Monitor Swing modeliyle genişletiyor. Taşınabilir kullanım deneyimini merkeze alan yeni model, küçük tekerleklerle donatılmış özel bir stand üzerinde geliyor. Marka, bu tasarımda daha önce piyasaya sürdüğü …

Yeni güncellemeyle gelen büyük sürpriz: PlayStation 5’e retro dokunuş!

PlayStation 5’in yeni güncellemesi, nostalji ve modern teknolojiyi bir araya getiriyor: Retro temalar ve “Audio Focus” ses özelliği, bu güncellemeyi kullanıcılar için oldukça çekici hale getiriyor.

DJI Mini 5 sızdırıldı: LiDAR sensörlü kompakt drone geliyor

DJI’ın merakla beklenen yeni kompakt dronu Mini 5, beklenmedik bir şekilde Çin sokaklarında test edilirken görüntülendi ve drone dünyasında heyecan yarattı. DroneXL ve Jasper Ellens tarafından paylaşılan bu sızıntı, yeni modelin önemli teknolojik …

Motorola, kristallerle süslediği kablosuz kulaklığını tanıttı

Motorola Moto Buds Loop, Sound by Bose, uzamsal ses ve 8 saate kadar pil ömrü gibi özelliklere sahip Motorola’nın ilk açık tasarımlı kulak içi kulaklık modeli. Kulaklık, lüks tutkunlarının ilgisini çekecek, Swarovski kristallerinin yer aldığı …

OnePlus, 150W hızlı şarj destekli powerbank geliştirdi!

OnePlus, yeni amiral gemisi telefonu OnePlus 13T ile birlikte SuperVOOC 150W hızlı şarj destekli powerbank’ini de tanıttı. Yüksek kapasiteli taşınabilir şarj cihazı, hem gücü hem de kullanım kolaylığıyla öne çıkıyor. OnePlus, 150W hızlı şarj …

Android 16 HyperOS 3.0 alacak Xiaomi, Redmi ve POCO cihazlar

Xiaomi, Android 15’i yayınlamakta hızlı davrandı. Diğer markalardan milyonlarca Android kullanıcısı hala Android 15’i beklerken ve Xiaomi tarafından güncelleme listesi tamamlanmak üzere. Öte yandan Xiaomi, Android 16 beta sürümünü de seçili …

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir