Yeni OpenAI GPT-4o mini modeli GPT-3.5'i kullanımdan kaldırıyor

Saberie

Active member
ChatGPT'nin temeli olan GPT-3.5 muhtemelen en etkili çekirdek dil modelidir. Artık OpenAI'nin sunduğu halefinin yerini alması gerekiyor. GPT-4o mini, Mayıs ayında OpenAI tarafından piyasaya sürülen GPT-4o'nun daha küçük bir versiyonudur. Ağabeyi gibi multimodal bir model olarak tasarlanmış ancak şu anda bu açıdan sınırlı. Artık grafik girişini API aracılığıyla işleyebilir. Gelecekte görüntü, video ve ses üretimi bunu takip edecek.


Duyuru



Fiyatına göre yüksek performans sunan çok modlu model


GPT-4o mini, Ekim 2023'e kadar uzanan veriler üzerinde eğitilmiştir. Bağlam penceresi, 128.000 jetonla GPT-3.5 Turbo'dan yaklaşık sekiz kat daha büyük olmasına rağmen, yine de Anthropic'ten daha küçük model olan Claude 3 Haiku'nunkinden daha küçüktür. Bununla birlikte, çoğu karşılaştırılabilir modelden çok daha fazla olan 16.000 token çıktı üretebilir. Bir sonraki beden kategorisinde yarışan Claude Sonnet bile bunun yalnızca yarısını alabiliyor. Çıkış hızı açısından da GPT-4o mini, saniyede 166 token ile popüler LLM'ler arasında başı çekiyor.

Beklendiği gibi, Haiku veya Google'ın Gemini Flash'ı gibi daha küçük modeller de OpenAI tarafından yayınlanan kıyaslamalarda üst sıralarda yer alıyor ancak aradaki farklar çok büyük değil. OpenAI, en azından şimdilik paranın karşılığını vererek gerçekten puan toplayabilir. Çünkü Anthropic ve Google'ın ikisi de GPT-3.5'in fiyat beklentilerini temel alıyor ve bu nedenle şu anda çok daha pahalı.







Yaygın yapay zeka kıyaslamalarında GPT-4o şu anda “küçük” ve büyük dil modellerine öncülük ediyor. Ancak mesafeler özellikle büyük değil.


(Resim: OpenAI)



GPT-4o mini, bir milyon giriş jetonu için 15 sent, bir milyon çıkış jetonu için ise 60 sent ücret alıyor. Bu, önceki modele göre yaklaşık %60 daha az. Karşılaştırma için: Büyük GPT-4.o için OpenAI, bir milyon giriş tokenı başına 5 ABD Doları ve bir milyon çıkış tokenı başına 15 ABD Doları ücret almaktadır. Yani otuz katından fazla.

OpenAI'ye göre GTP-4o mini, şirketin talimat hiyerarşisini kullanan ilk yapay zeka modelidir. Bu teknik, modelin bazı talimatlara diğerlerine göre öncelik vermesine olanak tanır. Bunun amacı, kullanıcıların yerleşik değişiklikleri veya sistem istemi tarafından sağlanan talimatları göz ardı eden istem enjeksiyonu, jailbreak veya sistem istemi çıkarma saldırıları gerçekleştirmesini zorlaştırmaktır.




(ulw)
 
Üst