Haber Detayı
Yapay zeka en çok hangi kaynaktan yararlanıyor? Zirvedeki isim şaşırttı!
ChatGPT, Gemini, Llama gibi yapay zeka modellerinin başarısının ardındaki en tartışmalı konulardan biri olan veri kaynakları, çarpıcı bir gerçeği ortaya koydu. Statista'nın 2024 ilk çeyrek verilerine göre, LLM'lerin yanıt oluştururken yüzde 40,11 oranla en çok alıntıladığı site reddit.com oldu. Uzmanlar, geliştiricilerin resmi kaynaklardan çok "gerçek insan dili"ne odaklandığının kanıtı olarak yorumluyor.
ChatGPT'nin piyasaya çıkışıyla birlikte dikkatleri üzerine çeken büyük dil modelleri, sonrasında Gemini, DeepSeek, Llama ve Grok gibi farklı örneklerle günlük yaşamın bir parçası haline geldi.
Ancak bu modellerin eğitildiği veri kaynakları, uzun süredir yapay zeka alanındaki en çok tartışılan konulardan biri olmaya devam ediyor.Derlenen bilgilere göre, ChatGPT dahil olmak üzere birçok dil modeli yanıtlarını oluştururken kamuya açık internet sitelerinden faydalanıyor.Reddit yüzde 40 ile ilk sıradaOnline istatistik platformu Statista'nın Haziran ayında yayımladığı verilere göre, 2024'ün ilk çeyreğinde büyük dil modelleri tarafından en fazla alıntı yapılan web sitesi yüzde 40,11 oranla reddit.com oldu.Uzmanlar, yapay zekaların Reddit gibi gerçek kullanıcıların doğal konuşmalarının yer aldığı ortamlardan veri toplamasını, geliştiricilerin resmi kaynaklardan çok 'gerçek insan dili”ne odaklandığının bir göstergesi olarak değerlendiriyor.Reddit'i yüzde 26,3 ile 'internet ansiklopedisi' olarak tanımlanan Wikipedia izliyor.
Düzenlenmiş içeriklerle öne çıkan Wikipedia, denetimsiz kullanıcı tartışmalarının yer aldığı Reddit'in gerisinde kaldı.Statista verilerine göre, en çok başvurulan diğer kaynaklar ise şöyle sıralandı:YouTube: Yüzde 23,5Google: Yüzde 23,2Yelp: Yüzde 21Facebook: Yüzde 19,9Amazon: Yüzde 18,7Tripadvisor: Yüzde 12,4Mapbox: Yüzde 11,2OpenStreetMap: Yüzde 11,2Google ve Reddit arasında yapay zeka anlaşmasıYapay zeka modellerinin eğitilmesi için teknoloji devleriyle sosyal medya platformları arasında çeşitli iş birlikleri de yapılıyor.2024 yılında Google ile Reddit arasında imzalanan anlaşma kapsamında, Google'ın yapay zeka sistemlerinin Reddit verileriyle de beslenmesi kararlaştırıldı.
Reuters'ın haberine göre, anlaşma gereği Google her yıl Reddit'e 60 milyon dolar ödeme yapacak.Aynı zamanda Reddit, OpenAI ile de ChatGPT'nin eğitimi için veri paylaşımı anlaşması imzaladı.
Böylece yapay zeka modellerinin yanıtlarında görülen "Reddit etkisi", bu iş birlikleriyle birlikte daha da güçlenmiş oldu.