LLMS tarayıcıyı fethediyor: Chrome, APIS'in

Saberie

Active member


  1. LLMS tarayıcıyı fethediyor: Chrome, APIS'in

Üretken yapay zeka, daha önce zor olan veya uygulanmayan çok sayıda uygulamanın temellerini koyar. Otomatik öğrenme modellerinin yardımıyla metin, görüntüler, ses ve video gibi içeriğin detaylandırılmasına ve oluşturulmasına odaklanır: eğitim aşamasında, önemli miktarlarda normal tabanlı algoritmalarla eğitildiniz.


Duyuru








Christian Liebel (@christianliebel) Karlsruhe'de bir ThinkTecture yazılım geliştiricisidir. Müşterilerini dijitalleştirme projelerinde ve kurumsal uygulamaların modernizasyonunda desteklemektedir. Hobi atı, Angolar, Progresif, Project Fugu ve Web Bileşenleri gibi modern web teknolojilerine dayanan çapraz platform uygulamalarıdır.







Büyük dildeki modeller bin sacas


Büyük Dil Modelleri (LLM), metnin doğal dilde detaylandırılması ve oluşturulması ile sınırlıdır. Yazılım mimarisinde zaten önemli bir bileşen haline geldiler: LLM'ler içeriği çevirebilir, yapılandırılmamış metinden verileri ayıklayabilir, metnin daha uzun bölümlerini tam olarak özetleyebilir, kod yazabilir veya kullanıcı ile etkileşimli diyalogları aktarabilir.

Şimdiye kadar, LLMS kullanmanın yolu neredeyse her zaman buluta getirdi. Bununla birlikte, cihazlar üreticileri LLMS'ye cihazlarını ve işletim sistemlerini sağlamak için geçti: farklı bildirimlerin kombinasyonu gibi Apple istihbarat fonksiyonları yerel bir LLM tarafından gerçekleştirilir. Google, LLM Gemini Nano ile yüksek uçlu akıllı telefonlar sunuyor ve Microsoft, Windows Copilot çalışma zamanı ile Windows cihazlarına Silica LLM Phi'yi getiriyor.

Llms çekim gizliliği yerel olarak gerçekleştirildi


Yerel olarak gerçekleştirilen LLM'ler de çevrimdışı olarak kullanılabilir, ağın kalitesinden bağımsız olarak güvenilir bir yanıt davranışına sahiptirler ve kullanıcının verileri, kullanıcının gizliliğini koruyan cihazı terk etmez. Bununla birlikte, LLM'nin büyük bir depolama alanı gereksinimi olduğundan, daha düşük bir yanıt kalitesine sahip daha küçük LLM'ler kullanılır. Performans ayrıca son cihaza da bağlıdır.

Altı entegre arı mevcuttur


AI'daki entegre girişimin bir parçası olarak Google, Google Chrome tarayıcısıyla test amacıyla KI modelleri sunuyor. Kurulum için Windows 10 veya 11, sürüm 13'ten (Ventura), 6 GB video RAM ve krom profil hacminde en az 22 GB ücretsiz sert disk alanı olan macOS, ancak indirilecek modeller önemli ölçüde daha küçüktür.

İlk indirmeden sonra, tüm web siteleri, W3C topluluk grubunun Web Makinesi Öğreniminde (WebML) belirtilen altı inşa edilmiş arı aracılığıyla bu modellere erişimi paylaşır. Arılardan biri genellikle kullanılabilirken, geri kalanı görevlerdir:

  • API istemi: Genel olarak LLM konuşmalarının yürütülmesi ve sohbet botlarının uygulanması, fikirler, duyguların analizi veya çıkarma ve veri sınıflandırması gibi uygulama vakaları için kullanılabilir.
  • Yardım Yazma Arılar:
    • Özetleyici API, metin bölümlerini özetler.
    • Yazar API derhal bir veri için bir metin yazar.
    • Yeniden yazılmış kalçalar bir metni bazı arzulara göre yeniden yazar.
  • Tercüman ve dil dedektörünün API'si:
    • Tercümanın arıları bir metni bir dilden diğerine çevirir.
    • Dil dedektörünün arıları, bir metnin yazıldığı dili tanır.
Yardım arıları derhal arılar ve yazı şu anda LLM Gemini Nano 2'yi 3,25 milyar parametreyle kullanırken, çeviri ve dil algılama arıları için dahili olarak kullanılmaktadır.

Geliştirici zaten ilk arıları test edebilir


Chrome ekibi şu anda bir menşe kanıtının bir parçası olarak arılar sunuyor. Bu, web platformunun yeni arıları için bir test aşamasıdır. Google, bir Google orijinal deneme jetonu almalı ve bunları web sitelerine sunmalıdır.

Bu şekilde, ilgili taraflar çevirmenin, dil dedektörünün ve özet arıların arılarını zaten test edebilirler. API için derhal bir menşe testi de vardır, ancak sadece Chrome'un uzantıları için.

Arıların hepsi spesifikasyon sürecinde olduğundan ve AI alanı sürekli hareket halinde olduğundan, arayüzlerdeki değişiklikler çok muhtemeldir. Örneğin, arılar derhal gelecekte multimodal sesleri işleyebilmelidir (metne de ek olarak görüntüler veya ses kayıtları).

Dactyloscript paketleri kolay kullanım için kullanılabilir


@Types/Dom-Cromium-ai paketi ile, yazıcıların tanımları, arılara en tipik kodlarından rahatça erişebilmek için zaten mevcuttur. Paket şu anda Chrome 128.0.6545.0'da uygulanan API'ya karşılık geliyor. Değişiklikler Chrome'un yeni sürümleri ile sağlanır.

Aşağıdaki örnek, bir web uygulamasında dil dedektörünün API'sının kullanımını göstermektedir:


const languageDetector = await self.ai.languageDetector.create();
const review = "こんにちは!Hier esse ich einfach am liebsten Sushi."
+ "Immer super 美味しい!";
const result = await languageDetector.detect(review);
// result[0]: {confidence: 0.800081193447113,
detectedLanguage: 'de'}
// result[1]: {confidence: 0.0267348475754261,
detectedLanguage: 'ja'}


Çözüm


Arıları dahil etmek, üretken yapay zeka becerilerini doğrudan cihazınıza getiren heyecan verici bir deneydir. Geliştiriciler, entegre yoğunlaştırma geri bildirimi için erken önizleme programının bir parçası olarak sorumlu Chrome ekibiyle karşılaşabilirler.

Thomas Steiner'a bu blog gönderisinin gözden geçirilmesi için teşekkürler.


(RME)
 
Üst