ChatGPT’den daha dikkatli: Azure OpenAI, Qdrant ve Rust ile yerleştirme

Saberie

Active member
İnsanlar Büyük Dil Modelleri (kısaca LLM) ile ilk kez karşılaştıklarında, bir kullanıcı arabirimi genellikle ilgili uygulamanın teknik ayrıntılarını gizler. Birisi bir doğal dil sorusu girer ve sonuç genellikle bir metin yanıtı veya oluşturulmuş bir resimdir. OpenAI’nin ChatGPT’si ile LLM, bilgisayarın sohbetin ilerleyişini bildiği ve takip eden sorular için dikkate aldığı bir diyalog yürütmeyi bile mümkün kılar.


Kamera ARKASI


OpenAI’deki gibi dil modellerinin cephesinin ardında, sayılar dil bağlamlarını temsil eder. Gömme kavramı burada belirleyici bir rol oynar. Yapay zeka alanında, yerleştirme vektörleri metin, resim veya müzik gibi içeriğin sayısal temsillerini temsil eder. Teknik olarak, n-boyutlu uzayda vektörlerdir. ChatGPT gibi sistemlerin kalitesinin sırrı, yalnızca bir metin veya sorunun sözcüklerini değil, aynı zamanda bağlamı da vektörlere dönüştürmede son derece iyi olmalarıdır. Anlam bağlamları benzer olan metinler benzer vektörlere yol açar. Birbiriyle ilgisi olmayan metinler, önemli ölçüde farklı vektörlerle sonuçlanır.


İnsanlar vektörleri üç boyutlu uzayda hayal etmede oldukça iyidir. OpenAI LLM’ler üç boyutta paçayı sıyırırsa, ki bu durumdan çok uzaktır, benzer içeriğe sahip iki metin, uzayda kabaca aynı noktada biten iki vektörle sonuçlanacaktır. Bu, AI uygulamaları geliştirirken kullanılabilir. Uygulamalar, örneğin kopyaları, anormallikleri veya sorulara dayalı ilgili metni bulmak için vektörleri karşılaştırabilir, gruplandırabilir veya sıralayabilir.

Gömme kavramını daha ayrıntılı olarak açıklamak için aşağıda bir alıştırma problemi kullanılmıştır. Özetlenen yaklaşım, OpenAI dil modellerine dayanmaktadır. Uygulama, ilgili web API’lerini doğrudan OpenAI’den almaz, ancak Ocak 2023’te sunulan ve özellikle kurumsal kullanımda bir dizi avantajı olan Azure OpenAI Hizmetlerini kullanır. Diğer şeylerin yanı sıra, şirketler veri işleme yerini seçebilir (AB’de bir veri merkezi mevcuttur) ve uygulamayı, örneğin sanal ağlardaki özel uç noktalar aracılığıyla kurumsal ağ yapılarına entegre edebilir. Ek olarak, mevcut Azure sözleşmeleri ve kredileri üzerinden faturalandırılırsınız. Uygulama örneği, yerleştirmeleri kaydetmek ve aramak için Berlin şirketi Qdrant Solutions’ın açık kaynaklı vektör veritabanı Qdrant’ı kullanır.

Zayıflıkları olan iyi metin üreteçleri


ChatGPT gibi modeller, metin oluşturma ve hatta soruları yanıtlama konusunda kendilerini kanıtlamıştır. Bununla birlikte, doğaları gereği metin oluşturucu olduklarından ve bu nedenle, son derece gelişmiş oluşturma becerileri sayesinde çoğu zaman makul görünen şeyler icat ettiklerinden, yanıtlar söz konusu olduğunda zayıflık gösterirler. İkinci zayıflıkları, her şeyi bilmemeleridir. Birincisi, şirketlerin gizli tuttuğu hiçbir veri dil modellerinin oluşumuna dahil edilmemiştir ve ikincisi, LLM’lerin sözde bitiş tarihleri vardır. Bu, ilgili modelin eğitildiği zamandır. Ancak daha sonra herkese açık hale gelen bilgiler, yalnızca ChatGPT’nin İnternette arama yapmasına veya harici web API’lerine erişmesine izin veren eklentilere sahip sistem tarafından dikkate alınabilir.


Her iki dezavantajı da büyük ölçüde telafi etmesi veya en azından azaltması amaçlanan yapay bir yapay zeka uygulaması, yerleştirmeleri daha ayrıntılı incelemek için aşağıda kullanılmaktadır. Amaç, bir doğal dil sorusuna dayalı olarak bir bilgi veritabanında en alakalı girdileri bulmaktır. Bu nedenle Prompt Design, AI’yı bir LLM aracılığıyla bilgi tabanını kullanarak soruyu yanıtlamak için almak için kullanılır. Bir veritabanından ilgili belgeleri tanımlamak için önceden eğitilmiş bir LLM kullanma ve ardından bilgileri bir soruyu yanıtlamak için bağlam olarak kullanma kavramına genellikle Geri Alma-Augmented Generation (kısaca RAG) denir. Teknik yapı aşağıdaki gibidir:







Uygulama, Azure OpenAI Embeddings ve Qdrant vektör veritabanını kullanır (Şekil 1).



Uygulama, bir bilgi veri tabanından metin bölümleri için yerleştirmeleri hesaplamalı ve bunları bir vektör veri tabanına kaydetmelidir. Test amacıyla, Stanford Question Answering Dataset’ten (SQuAD) alıntılar kullanılmıştır. Veri kümesi verileri, Hugging Face’te mevcuttur. SQuAD, Wikipedia makalelerinden, her biri ilgili sorular ve yanıtlar içeren geniş bir pasaj yelpazesi içerir.

Bunun yerine şirketler, uygulamaları için şirket içi oluşturulmuş bir bilgi tabanı kullanabilir. Yazar, SQuAD veri kümesine froxium adlı hayali bir kimyasal hakkında bilgi ekledi çünkü ChatGPT LLM, Wikipedia makaleleri hakkındaki soruları yanıtlamada doğası gereği iyidir. Froxium hayali olduğu için LLM’nin bu konuda herhangi bir bilgisi olamaz. Test kurulumu, Internet’te bulunmayan şirket içi bilgileri içeren bir senaryoyu simüle eder.

Dil modeli, örnek olarak aşağıdaki metni oluşturdu, özelliklerin anlamlı olması gerektiğini belirtmeden dikkat edin:

“Froxium, mevcut periyodik tablonun ötesinde ikamet ettiği teorize edilen süper ağır elementlerden oluşan varsayımsal bir grup olan sideron ailesinin bir üyesidir. Froxium, gözlemcinin duygusal durumuna bağlı olarak değişen canlı, yanardöner bir renk tonu sergiler. Katı bir oda sıcaklığı olmasına rağmen , erime noktası dikkate değer bir -42.7°C’dir ve bu da onu daha sonra parıldayan, sedefli bir sıvıya dönüştürür.”

Bilgi bankanız için yerleştirmeleri belirledikten sonra, kullanıcılar sorularını gönderebilir. Ancak uygulama, soruları ChatGPT gibi bir LLM’ye değiştirmeden basitçe iletmez. Bunun yerine, soru için yerleştirme vektörünü belirler ve soruya en çok benzeyen ve dolayısıyla sorunun cevabını içermesi en muhtemel olan bilgi tabanı girişlerini bulmak için bir vektör karşılaştırması kullanır.

Uygulama, bilgi veri tabanındaki metin bölümünü, bilgi istemi tasarımı aracılığıyla girilen soruyla birlikte, bir yanıt bulmak için şu anda önizleme aşamasında olan en son OpenAI GPT-4 metin tamamlama şablonuna aktarır. LLM cevabı gerçeklerden çıkaramıyorsa, modelin bir cevap vermesi gerekmez.

Şekil 2, Azure OpenAI Studio’da bilgi istemi tasarımıyla sorgulama ilkesini göstermektedir. Şekil, modelin Amerika Birleşik Devletleri’nde uygulandığını göstermektedir. Bunun nedeni ise GPT 4 modelinin şu anki ön izleme aşamasında sadece orada test edilebilmesi. Verimli olarak kullanılabilen modeller ise Azure veri merkezi “Batı Avrupa” da kullanılabilir.







Bilgi isteminin tasarımı, Azure OpenAI şablonu “gpt-4” ile yapılır (Şekil 2).



Foxium hakkında bilgi, belirtilen metin pasajında bulunmaktadır. LLM’ye metinde olmayan kurgusal unsur hakkında bir gerçek sorulursa, “Bilmiyorum” şeklinde doğru bir şekilde yanıt verirler:







LLM, gerçeklerden bir cevap çıkaramadığı zaman doğru cevap verir (Şekil 3).



Sağlanan bilgiler üzerindeki kısıtlama, iddia edilen gerçeklerin ortaya çıkarılmasını ve sorgulama sisteminin kötüye kullanılmasını önlemeyi amaçlamaktadır. Soruları cevaplarken LLM’leri belirli bilgi kaynaklarıyla sınırlandırma kavramına genellikle cevabın temeli denir. Gerçek bir projede, sorgu parametrelerini ayarlamak için kapsamlı testler gerekir. Bu tür testleri kolaylaştırmak için Microsoft, diğer şeylerin yanı sıra hızlı yapılandırılmış ve otomatik testi Prompt Flow gibi yeni çıkacak yapay zeka ürünlerine entegre ediyor.



Haberin Sonu
 
Üst