Büyük Dil Modelleri Hayatımızın Merkezine Oturuyor ChatGPT’nin piyasaya sürülmesiyle başlayan büyük dil modelleri furyası, sonrasında Gemini, DeepSeek, Llama ve Grok gibi modellerin de geliştirilmesiyle günlük hayatımızın vazgeçilmez bir parçası haline geldi. Büyük Dil Modellerinin Kaynakları Uzun Süredir Tartışma Konusu Tüm dünyada ses getiren büyük dil modellerinin yetenekleri kadar bu modellerin beslendiği kaynaklar da uzun zamandır…
ChatGPT’nin piyasaya sürülmesiyle başlayan büyük dil modelleri furyası, sonrasında Gemini, DeepSeek, Llama ve Grok gibi modellerin de geliştirilmesiyle günlük hayatımızın vazgeçilmez bir parçası haline geldi.
Tüm dünyada ses getiren büyük dil modellerinin yetenekleri kadar bu modellerin beslendiği kaynaklar da uzun zamandır tartışmaların merkezinde yer alıyor. Derlenen verilere göre, ChatGPT ve benzeri modeller cevaplarını üretirken çoğunlukla kamuya açık internet sitelerinden yararlanıyor.
Online istatistik portalı Statista’nın haziran ayındaki araştırmasına göre, büyük dil modelleri tarafından en çok alıntı yapılan web siteleri arasında reddit.com yüzde 40,11 ile ilk sırada yer alıyor. Reddit’in, gerçek kişilerin doğal konuşmalarından alıntı yapılması yapay zeka model geliştiricilerinin tercihlerini değiştiriyor.
Google ve Reddit arasında yapılan anlaşmaya göre, Google’ın yapay zekaları Reddit verileriyle besleniyor. 2024 yılında yapılan anlaşma kapsamında Google, Reddit’e yıllık 60 milyon dolar ödeme yapacak. Böylece yapay zeka üretiminde Reddit’in etkisi daha da artmış olacak.