Yapay Zeka eğitimiyle ilgili YouTube videoları: “The Pile”dan alınan veriler olmadan Apple Intelligence

Apple Intelligence, yaratıcılarına sorulmadan binlerce YouTube videosunun altyazılarını içeren ücretsiz veritabanı The Pile ile eğitilmedi. Şirket, Apple blogu 9to5Mac'e bunu söyledi. Şirket, OpenELM serisindeki yüksek verimli modelleri hakkında bilimsel bir makalede veri setini kullandığını yazmıştı. Ancak OpenELM, Apple Intelligence veya makine öğrenimi alanındaki diğer teknolojiler dahil olmak üzere şirketin kullandığı AI sistemlerinin bir parçası değildir.


Reklamcılık



170.000 YouTube videosundan altyazılar


9to5Mac'e göre Apple, OpenELM'yi AI araştırmalarına ve açık kaynaklı dil modellerinin ilerlemesine bir katkı olarak geliştirdiğini söyledi. Şirket o zamanlar teknolojiyi “son teknoloji açık dil modeli” olarak tanımlamıştı. Ancak OpenELM yalnızca araştırma amaçlı geliştirilmişti, herhangi bir Apple Intelligence işlevini çalıştırmak için değil. OpenELM hala Apple'ın AI araştırma web sitesinde mevcuttur.

Kâr amacı gütmeyen EleutherAI kuruluşundan gelen “The Pile” eğitim veri kümesine yönelik eleştiriler, The Proof tarafından hazırlanan bir raporda ortaya çıktı. Bu rapora göre Nvidia, Anthropic ve Salesforce gibi diğer büyük şirketler de bu bilgileri kullanıyor. “The Pile”ın 170.000 YouTube videosundan altyazılarla beslendiği söyleniyor. Bunun için herhangi bir izin alınmadığı söyleniyor.

Eğitim verilerinin sorusu


Apple'ın Apple Intelligence için tam olarak hangi ve ne kadar eğitim verisi kullandığı hala belirsiz. Şirket yalnızca “belirli işlevleri iyileştiren veriler de dahil olmak üzere lisanslı içerik” kullandığını belirtiyor. Ancak, Apple'ın web tarayıcısı ile genel İnternet'ten elde ettiği veriler de var.

Çıkmak için, web sitesi operatörleri özel “Applebot-Extended”a kendi içeriklerini görmezden gelmesi talimatını vermelidir. AppleBot'un (AI amaçları için değil, diğer hizmetler için kullanılan) web sitelerini taraması, çıkma işlemi yapılsa bile, aynı anda “robots.txt” dosyasında reddedilmediği sürece devam edecektir, şirket Apple.com'da yazıyor. Ayrıca şirketin eğitime kullanıcılardan kişisel veriler ve “kullanıcı etkileşimleri” dahil etmediği de biliniyor. Ayrıca kredi kartı verileri veya “müstehcenlik” ve düşük kaliteli içerik için filtreler de var – ancak bunların nasıl hariç tutulduğu belirsiz.





(lisans)
 
Üst