Kitap İncelemesi: DuckDB İş Başında | merhaba çevrimiçi

Saberie

Active member


  1. Kitap incelemesi: DuckDB iş başında

Mark Needham, Michael Hunger, Michael Simons
DuckDB iş başında
Manning Erken Erişim Programı (MEAP) 2023, Ağustos 2024'te yayınlanması planlanıyor
310 sayfa, yaklaşık 22 Euro'dan (e-kitap)
ISBN: 978-1-63343725-8


Duyuru



Peki ya farklı kaynaklardan gelen veri kümelerini işlemeyi, bunları SQL kullanarak analiz etmeyi ve sonucu çeşitli formatlarda dışa aktarmayı inanılmaz derecede kolaylaştıran bir araç olsaydı? Ve bunu, tipik ilişkisel veritabanlarından veya özel uygulamalardan bildiğimiz tüm karmaşıklık olmadan yapar.







(Resim:

Thorben Janssen

)



Thorben Janssen, serbest danışman ve eğitmen olarak JPA ve Hibernate ile kalıcılık sorunlarını çözüyor. Amazon'un en çok satan kitabı “Hazırda Bekletme İpuçları – Yaygın Hazırda Bekletme Sorunlarına 70+ Çözüm” kitabının yazarıdır ve JPA ve Hazırda Bekletme konusunda 20 yıllık deneyime sahip uluslararası bir konuşmacıdır. thorben-janssen.com'da haftalık olarak kalıcılık konuları üzerine yazılar yazıyor ve geliştiricilerin Kalıcılık Merkezi'ndeki becerilerini geliştirmelerine yardımcı oluyor.







Gerçek olamayacak kadar iyi geliyor kulağa değil mi?

Michael Simons bana “DuckDB in Action” kitabının bölümleri hakkında fikrimi sorduğunda bunu düşündüm. Ve hemen yanıldığım kanıtlandı.

Yasal Uyarı: Bir eleştirmen olarak, birkaç bölüm hakkında geri bildirimde bulunmak ve kitabın dürüst bir incelemesini yazmak için bu kitabın ücretsiz bir kopyasını aldım.

“DuckDB İş Başında” ile Mark Needham, Michael Hunger ve Michael Simons eğlenceli bir kitap yazdılar. Yalnızca DuckDB'nin temellerini aktarmakla kalmıyor, aynı zamanda çok çeşitli pratik gereksinimlerin nasıl uygulanabileceğini göstermek için birçok örnek kullanıyorlar.

Kitabın içeriği kısaca


“DuckDB İş Başında”, yazarların çeşitli görevleri uygulamak için DuckDB'yi nasıl kullanacaklarını gösterdiği eğlenceli, anlaşılması kolay bir kitaptır. Kitap, okuyuculara doğrudan bir giriş sağlayan ve onları kendi başlarına denemeye ve denemeye teşvik eden küçük kod örnekleriyle doludur.

DuckDB, çeşitli kaynaklardan gelen verileri işleyebilen, dönüştürebilen, analiz edebilen ve sonuçları farklı formatlarda dışa aktarabilen yerleşik bir analitik veritabanıdır. Kitabı okurken, özellikle bu tür işlemlerin uygulanma kolaylığı ve DuckDB'nin çok çeşitli verileri işleyebilme esnekliği beni büyüledi.

Kitap, birçok örnek kullanarak tam olarak nasıl çalıştığını açıklıyor.

Bireysel bölümlere daha derinlemesine bir bakış


Bu yazının yazıldığı sırada DuckDB in Action hala Manning Erken Eylem Programının bir parçası, yani yayın öncesi bir sürüm. Ancak on bir bölümün tamamı ve ekin ilk kısmı halihazırda mevcuttur.

Bölüm 1 ve 2: Başlarken

Kitabın başında yazarlar DuckDB'ye kısa bir giriş ve içindekiler bölümünde ele alınan konulara genel bir bakış sunuyorlar. Daha sonra DuckDB'nin nasıl kurulacağını, ilk veri kümelerinin nasıl içe aktarılacağını ve basit sorguların nasıl çalıştırılacağını gösteriyorlar.

Bölüm 3 ve 4: Veri analizi

Bölüm 3'te yazarlar SQL'in en önemli kavramlarını aktarıyorlar. DuckDB'de tablo modelinin nasıl oluşturulacağını, verilerin nasıl içe aktarılacağını ve bazı temel sorguların nasıl çalıştırılacağını gösterirler. Okuyucular ayrıca DuckDB'ye özgü bazı SQL uzantılarına da aşinadır.

Yazarlar daha sonra veri analizi için daha gelişmiş SQL sorgusu ve DuckDB'ye özgü işlevler üzerinde duruyorlar. Pencere işlevlerini, PIVOT ifadelerini, tablo işlevlerini, yan birleştirmeleri ve daha fazlasını açıklarlar.

Günlük çalışmalarımda esas olarak kalıcılık seviyelerini optimize etmekle ilgileniyorum. Bu nedenle bu bölümler çok ilgimi çekti. Her iki bölümden de gerçekten keyif aldım. Henüz bir SQL uzmanı değilseniz, bu iki bölümde kesinlikle yeni bir şeyler öğrenecek ve SQL anlayışınızı derinleştirebileceksiniz.

Bölüm 5: Verileri saklamadan işleme

Kitabı okurken beni en çok etkileyen bölüm burası oldu. Geçmişte çeşitli uygulamalar için içe ve dışa aktarma işlevleri oluşturdum. Çeşitli formatları desteklemek ve gerekli dönüşümleri uygulamak genellikle karmaşık bir işti.

Yazarların gösterdiği gibi DuckDB bu durumlarda ilginç bir araç olabilir. Verileri DuckDB'de depolamak ve ardından analiz etmek yerine, çeşitli kaynaklardan da okunabilir, dönüştürülebilir ve doğrudan tercih ettiğiniz formata aktarılabilir. Bu formatlar Parquet, JSON ve CSV gibi yaygın dosya formatları ve hatta ilişkisel bir veritabanındaki tablolar olabilir.

Bir dahaki sefere farklı formatları destekleyen içe veya dışa aktarmalar oluşturmam gerektiğinde DuckDB'yi kesinlikle deneyeceğim.

Bölüm 6: DuckDB'yi Python ile Kullanmak

Bir Java geliştiricisi olarak Python ile ilgili uygulamalı deneyimim yok. Bu yüzden bu bölüme sadece kısa bir göz attım. Python'a aşina olan okuyucular bu bölümde DuckDB'yi Python ile nasıl kullanacaklarını ve çeşitli kütüphanelerle nasıl entegre edeceklerini öğrenecekler.

Ek A, tüm Java geliştiricileri için çok daha ilgi çekicidir. Burada DuckDB'nin çeşitli istemci API'leriyle nasıl birleştirilebileceğini öğrenebilirsiniz.




Kitap incelemesi: Hatalı değil, çıkartmalı




(Resim: Manning)



Bölüm 7: Buluttaki DuckDB

DuckDB, MotherDuck'a kaydolduktan sonra bilgisayarınızda yerel olarak çalıştırılabilir veya bulutta yönetilebilir. Bölüm 7'de yazarlar neye ihtiyaç duyulduğunu ve farklı DuckDB API'lerinin nasıl kullanılabileceğini gösteriyor.

Bölüm 8 ve 9: İşlem hatları ve uygulamalar oluşturma

Önceki bölümlerde öğrendiklerinize dayanarak DuckDB'yi kullanarak veri hatları ve uygulamalar oluşturabilirsiniz. Bölüm 8'de veri hatları ele alınmakta, DuckDB'nin çeşitli durumlardaki rolü açıklanmakta ve bunun dbt ve Dagster gibi yaygın olarak kullanılan araçlarla nasıl entegre edileceği gösterilmektedir.

Kullanıcılarınızın SQL sorguları yazmak zorunda kalmadan verileri analiz etmelerini sağlamak istiyorsanız Bölüm 9'u okumalısınız. StreamLit ile özel veri uygulamaları oluşturmak, Plot.ly ile verileri görselleştirmek ve Apache Superset ile kontrol panelleri oluşturmak için DuckDB'yi nasıl kullanacağınızı öğrenin.

Bölüm 10: Büyük veri kümeleriyle çalışma

Her geliştirici, artan miktarda verinin mevcut uygulama sorunlarını nasıl kötüleştirdiğini ve görünüşte yenilerini yarattığını mutlaka deneyimlemiştir. Büyük miktarda veri, zaten karmaşık olan işleme mantığına ek performans zorlukları ekler. Bu tabii ki DuckDB kullanılırken de geçerlidir.

Bölüm 10'da yazarlar büyük miktarlarda verinin nasıl ele alınacağı konusunda çok sayıda ipucu ve tavsiye sunmaktadır. Konunun kendisi karmaşık olmasına ve bu nedenle bölümün anlaşılması kitabın diğer bölümlerine göre biraz daha zor olmasına rağmen, deneyimli geliştiriciler (ve geliştirici olmak isteyen herkes) için zorunlu okuma olarak önerilmektedir.

Bölüm 11: Sonuç

Kitabın son bölümünde kitapta ele alınan tüm konuların kısa bir özeti sunulur ve ek kaynaklara bağlantılar sunulur.

Ek A: İstemci API'leri (Java dahil)

Daha önce de belirtildiği gibi Ek A, tüm Java geliştiricileri için ilginç bir bölümdür. Burada DuckDB'yi çeşitli istemci API'leriyle nasıl kullanacağınızı öğreneceksiniz. Buna Java ve DuckDB'nin JDBC sürücüsü hakkında nispeten uzun bir bölüm dahildir. Eğer Python'a aşina değilseniz bu bölümü mutlaka okumalısınız ve mutlaka sonuna kadar beklememelisiniz.

Okumanız tavsiye edilir, çünkü DuckDB'nin sunabileceği çok daha fazlası var


DuckDB ilginç bir veritabanıdır ve “DuckDB İş Başında” kitabı iyi bir giriş sağlar. Kitabı okumaya başladığımda çoğunlukla 3. ve 4. bölümleri açıklayan SQL kısımları ilgimi çekti. Ancak kısa sürede DuckDB'nin sunabileceği çok daha fazlasının olduğunu keşfettim ve kitabın tamamını büyük bir ilgiyle okudum.

İlginç bir veritabanı hakkında bilgi edinmek isteyen veya farklı kaynaklardan verileri işlemenin ve dönüştürmenin yeni bir yolunu arayan herkese “DuckDB İş Başında” kitabını okumanızı tavsiye ederim.


(harita)



Haberin Sonu
 
Üst