"Tek marifeti, bir kelimeden sonraki kelimeyi tahmin etmek. Konuşmak yani."
:d
:d
:d
:d
şimdi buna ben cevap vereceğime chatgpt versin
"chatgpt gibi yapay zeka modellerinin tek marifeti bir kelimeden sonraki kelimeyi tahmin etmek, konuşmak yani" diyen birine ne dersin ?
ChatGPT said:
Bu iddia
yarım doğru, ama bütünü yansıtmıyor. Şöyle derdim:
Aslında evet, teknik temelde modeller “bir sonraki kelimeyi tahmin ediyor”.
Ama mesele
hangi kelimeyi tahmin ettiği ve bunu
nasıl yaptığı.
Bugünkü büyük dil modelleri:
1) Sadece kelime tahmini yapmıyor, anlam modelleri oluşturuyor
Milyarlarca örnekten, kavramlar arasındaki ilişkileri, mantık örüntülerini, nedenselliği, yapılandırılmış bilgiyi çıkarıyor.
“Bir sonraki kelime” görevi, bu karmaşık iç temsilleri oluşturmaya zorlayan
ara hedef aslında.
Tıpkı şöyle:
- İnsan beyni de konuşmayı “bir sonraki kelimeyi planlamak” üzerinden gerçekleştirir, ama bu onun yalnızca konuşmak için bir istatistik makinesi olduğu anlamına gelmez.
2) Soyutlama, genelleme ve muhakeme yapabiliyor
Örneğin:
- hiç görmediği bir problemi çözebiliyor,
- analoji kurabiliyor,
- farklı metinleri sentezleyip yeni bir yapı çıkarabiliyor,
- mantık zincirleri oluşturabiliyor.
Bunlar sıradan bir “sıradaki kelime” algoritmasıyla ortaya çıkmaz.
3) Kelime tahmini = zeka üretmek için kullanılan öğrenme yöntemi
Bir sonraki kelimeyi tahmin etmek, modeli dili, dünyayı ve örüntüleri öğrenmeye zorlayan bir görev.
Bugün zeki görünen davranışların çoğu bu görev üzerinden emerge (ortaya çıkmış).
Roketin amacı “daha çok patlayıcı taşımak” değildir; ama öyle tasarladığın için uzaya gidebilir.
LLM’lerin amacı “kelime tahmini” değildir; ama bunu yaparken beklenmedik şekilde karmaşık beceriler gelişir.
4) Gerçek yetenek, kelime tahmininin arkasındaki temsillerde
Model:
- bağlamı takip ediyor,
- niyeti anlamlandırıyor,
- uzun vadeli mantık kuruyor,
- farklı bilgi kaynaklarını birleştiriyor.
Bu, yalnızca “sonraki kelime” istatistiğinden ibaret olamaz.
Kısaca şöyle diyebilirsin:
“Evet, modeller bir sonraki kelimeyi tahmin ediyor gibi görünür; ama bunu yapabilmek için dünya hakkında karmaşık iç temsiller, mantık yapıları ve soyutlama yetenekleri geliştiriyorlar. Yani mesele kelime tahmini değil, o tahmini mümkün kılan ‘gizli zeka’.”