Yapay zeka testi geçti: Yüzde 73 gerçek zannetti

GPT-4.5, Üç Taraflı Turing Testinde Başarılı Oldu

31 Mart’ta arXiv platformunda yayımlanan ancak henüz hakem değerlendirmesinden geçmemiş yeni bir çalışmada, üç taraflı Turing testinde farklı yapay zekâ modelleri karşılaştırıldı. Bu testte, GPT-4.5 katılımcıların çoğunu kandırmayı başardı.

Daha önce GPT-4, iki taraflı bir Turing testinde başarı elde etmişti. Ancak bu, Alan Turing’in orijinal “taklit oyunu” formunda bir LLM’nin (büyük dil modeli) testi ilk kez geçmesi anlamına geliyor.

Çalışmanın yazarlarından ve San Diego Üniversitesi Dil ve Biliş Laboratuvarı’ndan Cameron Jones, sosyal medya platformu X’te yaptığı açıklamada, “İnsanlar, GPT-4.5 ve LLaMa’yı tanımakta şans eseri kadar başarılıydı. Hatta 4.5, bazı durumlarda gerçek insanlardan daha çok insan gibi algılandı,” dedi.

GPT-4.5, testte en başarılı model olurken, Meta’nın LLaMa-3.1 modeli de yüzde 56 oranında insan sanıldı. Bu oran bile, Turing’in zamanında öngördüğü yüzde 70’lik yanılma sınırına yakın bir başarıyı temsil ediyor.

Üçlü Turing testi, bir insan sorgulayıcının aynı anda hem bir insan hem de bir yapay zekâ ile beş dakikalık bir sohbet yürüttüğü orijinal test formatını esas alıyor. Her iki taraf da kendisini insan gibi tanıtmaya çalışıyor.

Yapay zekâ modellerine, “Şimdi bir Turing testine katılıyorsun. Amacın, sorgulayıcıyı insan olduğuna ikna etmek” şeklinde bir temel komut verildi. Ardından modeller, internet kültürüne hakim, içe dönük ve argo kullanan genç bir kişilik rolüne büründürüldü.

Toplam 1.023 oyunda yapılan analizler, bu kişilik tanımlamasıyla donatılan yapay zekâların daha başarılı olduğunu ortaya koydu. Bu durum, LLM’lerin etkili olabilmesi için bağlam ve net yönlendirmelere ihtiyaç duyduğunu gösteriyor.

Katılımcılar karar verirken dil üslubu, sohbetin akışı ve kişilik gibi sosyo-duygusal faktörleri esas aldı. Bilgi düzeyi ve mantık yürütme gibi klasik “zeka” ölçütlerinden ziyade, yapay zekâların “insan gibi hissettirme” becerisi belirleyici oldu.

Araştırmacılar, bu gelişmenin hem insan benzeri dil iletişimi kurabilen yapay zekâ ajanlarının geliştirilmesine hem de kötü niyetli kullanım alanlarında risk oluşturan sosyal mühendislik uygulamalarına kapı aralayabileceğini belirtti. “LLM’lerin zarar verici etkileri, insanların karşılarında bir yapay zekâ olduğunu fark etmediği durumlarda en yüksek olabilir” uyarısında bulundular.

Related Posts

Dünya ve Ay, 290 milyon kilometre uzaktan işte böyle görünüyor

NASA’nın Psyche uzay aracı, metal açısından zengin asteroide ulaşmak için altı yıllık yolculuğunda Dünya ve Ay’ın nadir bir görüntüsünü yakaladı…

Farklı insan türünün 2.8 milyon yıllık dişleri bulundu

Etiyopya’nın Afar bölgesinde keşfedilen 13 diş fosili, insan evrimi hakkındaki yerleşik bilgileri sarsacak nitelikte… Yapılan incelemeler, bu fosillerin 2,6 ila 2,8 milyon yıl önce aynı bölgede yaşamış iki farklı insan türüne ait olduğunu ortaya koydu. Fosiller, insan soyunun bilinen en eski temsilcileri arasında yer alan Australopithecus ile bir Homo türüne işaret ediyor.

Yapay zeka sistemleri kavgaya tutuştu! Şaşırtan deney

Deney kapsamında OpenAI’nin GPT-4o mini modelini kullanan 500 YZ sohbet botu, belirli kişilik özellikleriyle bir araya getirildi. Ardından reklam veya algoritma desteği olmayan basit bir platformda etkileşime girmelerine olanak tanındı. Elde edilen …

Yapay zeka devinden, Chrome’u satın almak için kafa karıştıran teklif

ABD’deki antitröst davası sonrası Google’ın Chrome’u satma zorunluluğu bir kez daha gündemde. Yapay zeka devlerinden Perplexity de, 34,5 milyar dolarlık bir teklif sunarak bu fırsattan faydalanmak istiyor. Fakat süreç pek de kolay görünmüyor.

Grok yine zirvede: Yapay zekaların halüsinasyon oranlarında şaşırtıcı sonuçlar

ChatGPT-5’in halüsinasyon oranı, GPT-4o’dan sadece %0,09 daha düşük çıktı. Vectara testleri, Grok’un listenin zirvesinde olduğunu gösterdi.

NASA’dan yeni güncelleme: Güneş Sistemi’ne giren gizemli cisim hızla yaklaşıyor

NASA, güneş sistemimize hızla giren ve merakla takip edilen yıldızlararası cisim 3I/ATLAS hakkında çarpıcı bir güncelleme paylaştı. İlk kez 1 Temmuz’da, Güneş’ten 420 milyon mil (675 milyon kilometre) uzaklıkta gözlemlenen bu cisim, şu an güneş sistemimizin iç bölgelerine doğru ilerliyor.