Orta Çağ Şövalyesi, bir ballad tarzında bir metin gerçekleştirir – “Arama lezzetli olabilir”. Dumanlı bir erkek sesi, gerçek suç hikayelerini sunmak için özellikle uygun olmalıdır. İyi gece tarihi elbette hassas bir kadın sesidir. Ve sörfçüler: “vay dud” kelimeleriyle başlar. Openi bu ses örneklerini yayınladı. Ancak, yeni metin-konuşma modeli sizinle sınırlı değildir. Gelecekte, geliştiriciler modele kendileri tarafından tanımlanan belirli bir şekilde konuşmalarını öğretebilirler.
Metin-konuşma modeli ve vokal testi modeli API'da mevcuttur. Çok şeylerin iyileştiği söyleniyor. Bu, blog yazısında Openii yazıyor, transkripsiyon modelinin kelimesinin hata oranını ifade eder. Anahtarı belirlemenin yeni yolu, örneğin “hassas müşteri hizmetleri çalışanı” nı ayarlamaya yardımcı olabilir.
Fısıldamak ve ucuzdan daha iyi
Modellerin arkasında GPT-4O ve GPT-4O mini vardır, en azından modelin en iyi damıtılması, yani büyük bir model bilgisinin daha küçük ve verimli bir modele aktarılmasından kaynaklanan önceki sürümlere kıyasla maliyetler açısından daha verimli olmalıdırlar. Ayrıca ses verileri ile ayrı bir eğitim vardı. OpenAAI'ye göre, metin dili modeli fısıltmadan daha iyi. Bu, OpenAAI'nin önceki transkripsiyon aracıdır. Bunun nedeni, takviye öğreniminin entegrasyonu, yani bir modelin onaylanmasının öğrenilmesinden kaynaklanmalıdır.
Geliştiriciler için artık modelleri deneyebileceğiniz bir demo sayfası var. Openi.fm'de bulunabilir. Agents SDK ile, metin tabanlı bir ajan da bir ses aracısı olabilir.
(EMW)
Metin-konuşma modeli ve vokal testi modeli API'da mevcuttur. Çok şeylerin iyileştiği söyleniyor. Bu, blog yazısında Openii yazıyor, transkripsiyon modelinin kelimesinin hata oranını ifade eder. Anahtarı belirlemenin yeni yolu, örneğin “hassas müşteri hizmetleri çalışanı” nı ayarlamaya yardımcı olabilir.
Fısıldamak ve ucuzdan daha iyi
Modellerin arkasında GPT-4O ve GPT-4O mini vardır, en azından modelin en iyi damıtılması, yani büyük bir model bilgisinin daha küçük ve verimli bir modele aktarılmasından kaynaklanan önceki sürümlere kıyasla maliyetler açısından daha verimli olmalıdırlar. Ayrıca ses verileri ile ayrı bir eğitim vardı. OpenAAI'ye göre, metin dili modeli fısıltmadan daha iyi. Bu, OpenAAI'nin önceki transkripsiyon aracıdır. Bunun nedeni, takviye öğreniminin entegrasyonu, yani bir modelin onaylanmasının öğrenilmesinden kaynaklanmalıdır.
Geliştiriciler için artık modelleri deneyebileceğiniz bir demo sayfası var. Openi.fm'de bulunabilir. Agents SDK ile, metin tabanlı bir ajan da bir ses aracısı olabilir.
(EMW)