Yapay zeka, sudokuda rakiplerini yenmeyi başaramadı

Colorado Üniversitesi’nden bir araştırma ekibi, yapay zeka modellerinin güvenilirliğini test etmek amacıyla 6×6 formatında oluşturdukları 2.300 yeni Sudoku bulmacasını kullandı.

Yapılan testlerde, OpenAI’nin “o1” modeli en iyi performansı göstererek toplam bulmacaların yalnızca %65’ini doğru şekilde çözebildi. Diğer modellerde bu oran daha da düşük kaldı.

Yapay zeka modellerinin temel oyunlarda ve bulmacalarda başarısız olduğunu daha önce gördük. OpenAI’nin ChatGPT’si (ve diğerleri), 1979 tarihli bir Atari oyununda bilgisayar rakibi tarafından satrançta tamamen ezildi. Apple’ın yakın tarihli bir araştırma makalesi, modellerin Hanoi Kulesi gibi bulmacalarda zorlanabileceğini de ortaya koydu.

Yapay zekayı sohbet dışında çok zorlamayın

Sohbet robotları da satranç eğitimi olmadığı için kötü sonuçlar alabilir. Mantıklı hamleler bulurlar, ancak üç, dört veya beş hamle sonrasını düşünmezler. Bu, iyi satranç oynamak için gereken temel beceridir. Sohbet robotları ayrıca bazen satranç taşlarını kurallara uymayan veya onları anlamsız bir tehlikeye atan şekillerde hareket ettirme eğilimindedir.

Dolayısıyla, yapay zeka araçları, eğitimleri olmayan konularda ve şimdilik cevaplarını internette bulamayacakları detaylarda pek de başarılı sayılmazlar. Ama yakın gelecekte bunun da değişeceğine emin olabiliriz.

Related Posts

Neden uyuyoruz? Vücudumuz neden uykuya ihtiyaç duyuyor?

Oxford Üniversitesi’nden araştırmacılar, uykunun yalnızca dinlenme değil, hücrelerdeki enerji fazlasına karşı bir savunma mekanizması olduğunu gösteren bulgulara ulaştı. Mitokondrilerin içindeki enerji yükü, beynin uyku sinyali üretmesini sağlıyor.

BYD’den süper otomobil… Fiyat ve süratiyle şaşırttı

BYD’nin markalarından Yangwang iki katına çıkarılmış motor gücüne sahip yeni U9 süper otomobil için başvuruda bulundu.

Amazon’dan Wondery hakkında ilk açıklama geldi

Amerikan teknoloji devi Amazon’un, 2020 sonunda satın aldığı Wondery podcast stüdyosunu kapatacağına dair çıkan haberler şirket tarafından yalanlandı. Bloomberg’in geçtiğimiz günlerde yayımladığı bir haberde, Amazon’un Wondery’yi kapatma kararı …

Kazanç raporları şaşırttı: Silikon Vadisi’nde kimler kazandı, kimler kaybetti?

2025’in ikinci çeyreğinde en büyük etkiyi Microsoft yarattı. Teknoloji devinin piyasa değeri ilk kez 4 trilyon doları aştı. Böylece Microsoft, yapay zeka çipleriyle tanınan Nvidia’dan sonra bu eşiği aşabilen ikinci şirket oldu. Samsung ise kan kaybetmeye devam ediyor.

Köpekler, Parkinson hastalığının “kokusunu” tespit edebiliyor

Yeni bir araştırma, özel olarak eğitilmiş köpeklerin Parkinson hastalığının kokusunu tespit edebildiğini gösterdi. Bu keşif, erken teşhis süreçlerine yeni bir ışık tutacak gibi görünüyor.

En çok değer kaybeden 10 model açıklandı! Aracınız listede olabilir

Yayımlanan bir rapora göre bazı 2020 model araçlar beş yıl içinde yüzde 65’i aşan oranlarda değer kaybetti. Sürücüler “satarken zarar etmeyin” uyarısıyla listeye göz atmaya çağrılıyor. Aracınızda bu listede yer alabilir…