Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Zaten bir üyeliğiniz mevcut mu ? Giriş yapın
Sitemize üye olarak beğendiğiniz içerikleri favorilerinize ekleyebilir, kendi ürettiğiniz ya da internet üzerinde beğendiğiniz içerikleri sitemizin ziyaretçilerine içerik gönder seçeneği ile sunabilirsiniz.
Üyelerimize Özel Tüm Opsiyonlardan Kayıt Olarak Faydalanabilirsiniz
Facebook’un başı önemli manada dertte! Bu nasıl ceza?
Kamuya duyurulan öbür yapay zeka projelerinin birden fazla üzere, Meta da bugün lisan çeşitliliğini müdafaaya yardımcı olmak ve araştırmacıları temellerini geliştirmeye teşvik etmek için açık kaynaklı MMS. Şirket, “Bugün, araştırma topluluğundaki öbür bireylerin çalışmalarımızı geliştirebilmesi için modellerimizi ve kodlarımızı herkese açık bir formda paylaşıyoruz” diye yazdı. “Bu çalışma sayesinde, dünyadaki inanılmaz lisan çeşitliliğini korumak için küçük bir katkı yapmayı umuyoruz.”
Konuşma tanıma ve metinden konuşmaya modelleri, tipik olarak, eşlik eden transkripsiyon etiketleriyle birlikte binlerce saatlik ses eğitimi gerektiriyor. Lakin model, endüstrileşmiş ülkelerde yaygın olarak kullanılmayan ve birden fazla önümüzdeki on yıllarda yok olma tehlikesiyle karşı karşıya olan lisanlar için Meta’nın da dediği üzere “bu datalar basitçe mevcut değil”.
Meta’nın yeni yapay zeka dayanaklı lisan modeli 4000 lisanı tanıyabiliyor!
Meta, ses datalarını toplamak için alışılmadık bir yaklaşım kullandı: çeviri edilmiş dini metinlerin ses kayıtlarından yararlanmak. Şirket, “İncil üzere birçok farklı lisana çevrilmiş ve çevirileri metin tabanlı lisan çevirisi araştırması için geniş çapta incelenmiş dini metinlere yöneldik” dedi. “Bu çeviriler, bu metinleri farklı lisanlarda okuyan şahısların halka açık ses kayıtlarına sahip.” İncil’in etiketlenmemiş kayıtlarını ve misal metinleri birleştiren Meta’nın araştırmacıları, modelin mevcut lisanlarını 4.000’in üzerine çıkardı.
Meta ayrıyeten “Ses kayıtlarının içeriği dini olsa da, tahlilimiz bunun modeli daha fazla dini lisan üretmeye yönlendirmediğini gösteriyor” diye yazdı. “Bunun, konuşma tanıma için büyük lisan modellerine (LLM’ler) yahut diziden diziye modellere kıyasla çok daha kısıtlı olan bağlantıcı bir zamansal sınıflandırma (CTC) yaklaşımı kullanmamızdan kaynaklandığına inanıyoruz.” Ayrıyeten, dinî kayıtların birçoklarının erkek konuşmacılar tarafından okunmasına karşın, bu da bir erkek önyargısı yaratmadı: bayan ve erkek seslerinde eşit derecede uygun performans gösteriyor.