ChatGPT alternatifi: Metas LLaMA açık kaynak eğitimi alıyor

Saberie

Active member


  1. ChatGPT alternatifi: Metas LLaMA açık kaynak eğitimi alıyor

AI sistemleri optimizasyonu için nebullvm açık kaynak proje topluluğu, Metas LLaMA’ya dayalı olarak kendi sohbet botlarınızı oluşturmanıza yardımcı olmayı amaçlayan bir araç olan ChatLLaMA’yı piyasaya sürdü. ChatGPT için OpenAI kullandığı için “İnsan Geri Bildiriminden Güçlendirmeli Öğrenim”e (RLHF) dayanmaktadır.


Meta, OpenAI’nin GPT-3 ve Google’ın PaLM (Pathways Language Model) gibi dil modellerine rakip olarak Şubat 2023’ün sonlarında LLaMA’yı (Büyük Dil Modeli Meta AI) piyasaya sürdü. LLaMA hakkında bir makale yayınlayan Meta’nın AI ekibine göre, birçok kıyaslamada önemli ölçüde daha iyi performans gösteriyor.


7 ila 65 milyar parametre arasında değişen sonuçlarla model, son yıllarda Büyük Dil Modellerinin (LLM’ler) daha da büyüdüğü eğilimine karşı çıkıyor. GPT-3, 175 milyar parametre ve 540 milyar olan PaLM’nin üç katından fazlasını içerir. Mayıs 2022’de Meta, 125 milyon ile 175 milyar arasında parametreye sahip bir dizi dil modeli olan Open Pre-trained Transformers’ı (OPT) tanıttı.

Eğitim seviyesi ChatLLaMA


ChatLLaMA kitaplığı ayrı bir model değildir, Meta modeli temel alır. LLaMA’ya erişim, ilgili tarafların Meta’daki bir form aracılığıyla talep edebileceği kullanım için gereklidir. Kütüphane 7, 13, 33 ve 65 milyar parametre ile tüm dil modeli mimarileri ile çalışır.

ChatLLaMA, önceden eğitilmiş LLaMA modelleri için bir RLHF süreci ile eğitim sağlar. İnsanları eğitim modellerine dahil etme ilkesi, başından beri ChatGPT gibi diğer araçlar tarafından kullanılmaktadır. OpenAI, DeepMind ile birlikte arXiv’de “Deep Reinforcement Learning from Human Preferences” adlı makaleyi yayınladı. Arka plan, OpenAI’nin modeli uzun süre yayınlamamasının ana nedeni olan GPT-3 sistemindeki zayıflıklardı.

insan yardımcı antrenör



2022’nin başlarında OpenAI, eğitime insanları dahil ettiği gelişmiş bir model olan InstructGPT’yi yayınladı. Şirket, ChatGPT’nin oluşumu için aynı prensibi genişletilmiş bir biçimde kullanıyor.







ChatGPT gibi, ChatLLaMA da insan geri bildirimlerinden güçlendirilmiş öğrenmeyi temel alır.


(Resim: OpenAI)



ChatGPT ve ChatLLaMA’nın RLHF yaklaşımında, insan eğitmenleri sohbet sırasında dönüşümlü olarak kullanıcı ve yapay zeka asistanı rolünü üstlenirler. Takviyeli öğrenmedeki ödül sistemi için, insan eğiticileri bir yönlendirmeye verilen farklı tepkileri derecelendirir. Son olarak, harcamaları optimize etmek için bir yakın politika optimizasyonu (PPO) modeli kullanılır.

Meta, LLaMA’nın yaklaşımının “açık kaynak uyumlu ve tekrarlanabilir” olduğuna dikkat çekiyor çünkü eğitim, Project Gutenberg kitapları da dahil olmak üzere yalnızca halka açık veri kümelerine dayanıyor. Ancak şu ana kadar Meta, RLHF süreciyle eğitilmiş bir model sunmadı.

OpenAI’de modellendi


Bu kısım, OpenAI ile aynı prensibi kullanan ve hatta nasıl çalıştığını göstermek için proje sayfasında OpenAI diyagramını gösteren açık kaynak projesi ChatLLaMA’dan alınmıştır. Kitaplığın, önceden eğitilmiş LLaMA şablonlarına dayalı ChatGPT tarzı sohbet robotları oluşturmaya yardımcı olması amaçlanmıştır.

Meta, LLaMA’ya erişim izni verdiğinde ve modeller için ağırlıklar sağladığında, modelin gerçekte nasıl ilerleyeceği henüz belli değil.

GitHub’daki proje sayfası, ChatLLaMA’nın açık kaynaklı bir proje olarak uygulanmasını ve kendi model eğitiminizi başlatmak için basit bir kod örneği sunar.


(rm)



Haberin Sonu
 
Üst