1930 Sonrasını Bilmeyen Cahil Yapay Zekâ Modeli: Talkie
Yapay zekâ modelleri genellikle bilgi güncelliğiyle öne çıkıyor. Ancak Talkie adlı model, tam tersi bir yaklaşımla geliştirildi. Bu model, modern dünyayı bilmemesi için özel olarak tasarlandı. 1931 öncesine ait metinlerle eğitilen Talkie, interneti, akıllı telefonları, YouTube’u veya sosyal medyayı hiç tanımıyor.
İçindekiler tablosu
Talkie Nedir ve Nasıl Geliştirildi?
Talkie, Nick Levine, David Duvenaud ve Alec Radford (GPT-2 ve Whisper’ın mimarlarından biri) tarafından geliştirilen 13 milyar parametreli bir yapay zekâ modelidir. Model, yalnızca 1931 öncesi İngilizce metinlerle eğitilmiştir. Toplam 260 milyar token’lık eğitim verisi, eski kitaplar, gazeteler, dergiler, bilimsel yayınlar, patentler ve hukuk metinlerinden oluşuyor. Bu sayede Talkie’nin bilgi kesme tarihi 31 Aralık 1930 olarak sabitlenmiştir.
Proje, kamu malı (public domain) metinleri kullanmak için özellikle 1930 yılını seçmiş. Çünkü ABD telif hakkı kurallarına göre 1930’da yayımlanan eserler 2026 itibarıyla kamu malı kapsamına giriyor. Bu yaklaşım, modelin tamamen yasal ve temiz bir veri setiyle eğitilmesini sağlamış.
Talkie’nin İki Farklı Sürümü Var
Proje iki ana sürüm sunuyor. İlk sürüm talkie-1930-13b-base, temel model olarak yalnızca tarihî metinlerle eğitildi. İkinci sürüm talkie-1930-13b-it ise sohbet odaklı. Bu sürüm, eski görgü kuralları kitapları, mektup yazma kılavuzları, ansiklopediler ve benzeri kaynaklardan çıkarılan talimat-yanıt çiftleriyle ince ayarlandı. Böylece model, daha doğal ve anlaşılır sohbetler üretebiliyor.
Her iki model de Apache 2.0 lisansı altında açık kaynak olarak Hugging Face ve GitHub üzerinden erişime açık. Geliştiriciler, yeterli donanımı olan herkesin modeli indirip deneyebileceğini belirtiyor.
Projenin Asıl Amacı: Araştırma ve Bilimsel Keşif
Talkie sadece eğlenceli bir “geçmişten gelen yapay zekâ” değil. Araştırmacılar, modelle yapay zekâların bilgiyi nasıl öğrendiğini, genelleme yaptığını ve veri sızıntılarından nasıl etkilendiğini incelemek istiyor. Modern modellerin çoğu internet verisiyle beslendiği için ezberleme mi yoksa gerçek anlama mı yaptığı belirsiz kalıyor. Talkie ise tamamen farklı bir veri dağılımıyla bu soruları test etme imkânı sunuyor.
Özellikle şu sorular araştırılıyor:
- Model, eğitim verisinden sonra gelen olayları (örneğin II. Dünya Savaşı) tahmin edebiliyor mu?
- 1911’e kadar eğitilmiş bir model, Einstein’ın Genel Görelilik Teorisi’ni bağımsız olarak keşfedebilir mi?
- Modern programlama dillerini (Python gibi) birkaç örnekle öğrenebiliyor mu?
Bu tür testler, yapay zekânın temel yeteneklerini daha iyi anlamamıza yardımcı oluyor.
İlginç Özellikler ve Veri Sızıntıları
Talkie’nin modern dünyadan tamamen habersiz olması beklenirken, bazı veri sızıntıları gözlemlenmiş. Eğitim setine yanlış tarihli metinler veya sonradan eklenen notlar karışabiliyor. Bu yüzden model bazen Franklin D. Roosevelt, New Deal veya II. Dünya Savaşı gibi konularda kısmi bilgi verebiliyor. Araştırmacılar bu sorunu minimize etmek için özel OCR sistemleri geliştiriyor.
Ayrıca model, eski metinlerin taranması sırasında ortaya çıkan zorluklarla da mücadele ediyor. Yıpranmış sayfalar, eski baskı stilleri ve düşük kaliteli taramalar nedeniyle metin tanıma hataları oluşabiliyor. Bu noktada proje, tarihî belgeleri daha doğru dijitalleştirmek için yeni teknolojiler üzerinde çalışıyor.
Talkie ile Deney Yapmak Mümkün
Talkie’yi denemek oldukça kolay. Resmi sitedeki sohbet arayüzü üzerinden doğrudan konuşabilirsiniz. Modelin 1930’lar İngilizcesi ve bakış açısıyla verdiği yanıtlar oldukça eğlenceli ve düşündürücü. Ayrıca güçlü bir ekran kartına sahipseniz modeli yerel bilgisayarınıza indirip kendi denemelerinizi yapabilirsiniz.
Gelecek planları arasında daha büyük modeller var. Ekip, GPT-3 seviyesine yaklaşan ve 1 trilyon token’dan fazla veriyle eğitilecek vintage modeller üzerinde çalışıyor. Bu gelişmeler, “tarihî yapay zekâ” alanını daha da büyütecek.
Talkie, yapay zekâ dünyasında farklı bir soluk getiriyor. Modern bilgiden mahrum bırakılarak eğitilen bu model, hem eğlenceli sohbetler sunuyor hem de bilimsel araştırmalara derinlik katıyor. 1930’lardan gelmiş gibi konuşan bir yapay zekâyla modern kavramları tartışmak, teknolojinin ve bilginin doğasını sorgulamamızı sağlıyor.