Harvard ve Google, 1 milyon kamuya açık kitap yayınlayacak

Harvard’dan Büyük Veri Seti Müjdesi

Yapay zeka eğitim verileri elde etmenin yüksek maliyetleri, çoğunlukla yalnızca büyük teknoloji şirketlerini ilgilendiriyor. Bu nedenle, Harvard Üniversitesi, içeriğinde yaklaşık 1 milyon kamu malı kitabı barındıran bir veri seti yayınlamayı planlıyor. Bu kitaplar, Charles Dickens, Dante ve Shakespeare gibi yazarların eserlerini kapsıyor ve telif hakkı korumasından kurtulmuş durumda.

Henüz Yayınlanmadı

Yeni veri setinin çıkış tarihi veya yayınlanma şekli henüz net değil. Ancak, bu veri setinin Google’ın uzun süreli kitap tarama projesi olan Google Books’tan elde edildiği biliniyor. Dolayısıyla, Google da bu “hazineyi” geniş bir kitleye ulaştırma sürecine dahil olacak.

Kurumsal Veri İnisiyatifi

Harvard, Kurumsal Veri İnisiyatifi (IDI) hakkında Mart ayında ilk kez bilgi vermişti. Bu inisiyatif, “yapay zeka için hukuki verilerin güvenilir bir kanalı” oluşturmayı hedefliyor. Ancak, kısa bir süre içinde fazla bilgilenemedik. Nihayet bugün yapılan resmi lansmanla birlikte, IDI’nin Microsoft ve OpenAI tarafından mali destek aldığını öğrendik.

Adil Bir Oyun Alanı Yaratmak

IDI’nin yürütücü direktörüGreg Leppert, bu veri setinin “oyun alanını düzleştirmek” amacıyla tasarlandığını belirtti. Böylece, veri seti, büyük dil modelleri (LLM’ler) eğitmek isteyen araştırma laboratuvarlarından AI girişimlerine kadar birçok kullanıcının erişimine sunulacak.

Harvard’dan Büyük Veri Seti Müjdesi

Henüz Yayınlanmadı

Kurumsal Veri İnisiyatifi

Adil Bir Oyun Alanı Yaratmak

Benzer Haberler

Kim Kardashian, ChatGPT'yi 'düşman dostu' olarak nitelendirdi.

Spotify, haftalık dinleme istatistiklerinizi görmenizi sağlıyor!

Motion Picture Association, Meta’ya 'PG-13' etiketini kullanmaması için ihtar gönderdi

Amazon Müzik Uygulamasında Alexa+ Özelliği Kullanıma Sunuldu

Spotify'da 500 bin video podcast, 400 milyon kullanıcı tarafından izleniyor!

Netflix, iHeartMedia ile video podcast lisanslama görüşmeleri yapıyor