Meta’nın ChatGPT Rakibi Teknolojisi LLaMA, İnternete Sızdı

150 okunma — 08 Mart 2023 18:23

uzmanblog

ChatGPT, yapay zekâ takviyeli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen lisan modeline rakip olan lisan modelleri de öbür teknoloji şirketlerinin ağırlaştığı bir alan olmaya başlamıştı.

Bir yanda Google, kendi lisan modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük haber gelmişti. Meta, bilim dünyasına katkı sağlamayı hedefleyen lisan modeli LLaMA’yı tanıtmıştı. Sadece bilimsel çalışmalara açık olan lisan modeli, birinci haftasında sızdırıldı.

LLaMA, şimdiden isteyen herkes tarafından kullanılabilir oldu:

‘llamanon’ isimli 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan lisan modeli, GitHub’da yayımlanan bir kütüphane aracılığıyla erişilebilir oldu.

Kısa bir mühlet sonra ise GitHub’da ‘shawwn’ isimli bir kullanıcı tarafından, LLaMA’nın tüm sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın tüm sürümleri, toplam 219 GB’lık boyuta sahip.

Tabii lisan modelini verimli bir formda çalıştırmak için fazlasıyla yüksek süreç gücüne, hasebiyle ziyadesiyle tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.

Meta, sızıntıyı internetten kaldırmak için şimdi bir aksiyon almadı.

LLaMA, OpenAI’ın lisan modellerine rakip olabilir mi?

LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren birtakım kullanıcılar, lisan modelinin en az ‘davinci’ modeli kadar gelişmiş olduğunu söz etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir lisan modeliydi.

Dil modelinin tam olarak ne kadar gelişmiş olduğunu şimdi bilemiyoruz. Ancak o denli görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo’ lisan modeli ise tepede yer almaya devam ediyor.

Meta, bu lisan modelini neden herkese açmadı?

ChatGPT’nin verdiği cevaplar, lisan modelinin bir formda berbata kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve ismini karalamak istemediğinden aslında bu kötüye kullanımı dolaylı olarak desteklemek istemedi.

Şirket, bu nedenle lisan modelini sadece yapay zekâ alanında çalışan bilim insanlarının kullanımına açtı. Lisan modelinin maksadı, daha gelişmiş gelecekte daha gelişmiş lisan modellerinin geliştirilmesini sağlamak için bir temel olmak idi.

Sıradaki içerik:

Meta’nın ChatGPT Rakibi Teknolojisi LLaMA, İnternete Sızdı

Hızlı Yorum Yap