Postgres pgvector RAG Pipeline

PostgreSQL + pgvector üzerinde her aşamayı kapsayan uçtan uca bir RAG hattı: parçalama, gömme (embedding), indeksleme, getirme ve kalite değerlendirmesi.

Zor mühendislik kararlarını somutlaştırır: HNSW mı IVFFLAT mı, özyinelemeli mi anlamsal parçalama mı, İngilizce mi çok dilli gömme mi: maliyet tavanı, kişisel veri maskeleme ve yeniden-gömme göç planı içine işlenmiş halde. Kırılgan bir prototip yerine üretim seviyesinde bir anlamsal arama katmanı elde edersiniz.

₺369 tek seferlik
Bir kit içine ekle →

Fiyatlara KDV (%20) dahildir. · Gerçek ajans işinden çıkarıldı · tek seferlik, kilit yok

  • Tür Skill
  • Kategori Veri & Analitik
  • Teslimat E-posta · anında
  • Lisans Tek seferlik
Çalışma önizlemesi
forgehouse, postgres-pgvector-rag-pipeline

Çalışmanın içinden · kara kutu yok

Satın almadan önce işin kendisini gör.

Skill'in PostgreSQL ve pgvector üzerinde kurduğu hattın tamamı, şemadan haftalık kalite cron'una. Kara kutu yok, yaptığı iş tam olarak bu:

  1. Önce şema: vector extension açılır, documents tablosu embedding_version kolonu ve JSONB metadata ile kurulur, HNSW indeksi m=16 ve ef_construction=64 ile oluşturulur, metadata filtreleri tablo taramasına düşmesin diye GIN indeksi eklenir, admin ile public chunk'ları ayıran satır seviyesi güvenlik politikaları yazılır.
  2. Besleme hattı şu sırayla çalışır: parçala, maskele, vektörle, yaz. 1024 token ve 256 örtüşmeyle özyinelemeli bölme (hukuki veya finansal belgede anlam sınırından bölme), ardından kişisel veri maskeleme embedding'den ÖNCE yapılır, çünkü bir kez vektörlenen kişisel veri vektör uzayının içinde kalır ve geri çıkarılamaz. Embedding 64'lük gruplar halinde gider, kayıt kaynak dosya, parça sırası ve sürüm anahtarıyla upsert edilir.
  3. Getirme üç kontrolle çalışır: 0.7 alaka eşikli kosinüs benzerliği (altında kalan sonuç yerine kullanıcıya dürüst 'bulunamadı' döner), sorgu başına ayarlanan ef_search ile gecikme ve isabet dengesi, ve tek kaynak dosyanın ilk 5'i ele geçirmemesi için MMR çeşitliliği.
  4. Haftalık değerlendirme cron'u 100'den fazla insan etiketli sorgu çifti üzerinde recall@k, MRR ve nDCG ölçer. Yüzde 10 isabet düşüşü alarm tetikler, kalite kayması hissedilmez, ölçülür.
  5. Embedding modeli yükseltmeleri blue-green yürür: paralel v2 kolonu ve indeksi, yeni kayıtlarda çift yazım, arka planda parti parti yeniden vektörleme, ve yalnızca v2 isabeti v1'i yakalayınca geçiş. Sıfır kesinti, tam geri dönüş yolu.
  6. Maliyet tavanları hatta gömülüdür: plan kapasitesinin yüzde 80'ine gelen depolama ve bütçeyi aşan aylık embedding harcaması, fatura gelmeden uyarı üretir.
Kullanım senaryoları · taktığında neler oluyor

Tek güç kaynağı. 6 hat dışarı.

postgres-pgvector-rag-pipeline · çekirdek

çekirdek aktif · 6 hat

  1. Dokümanlar, blog veya destek içeriği için anlamsal arama katmanı kurma

    ✓ dokümanlar, blog veya de…
  2. RAG sohbet botu için getirme arka ucu oluşturma

    ✓ rag sohbet botu için get…
  3. Recall artırmak için indeksi IVFFLAT'tan HNSW'e taşıma

    ✓ recall artırmak için ind…
  4. Kesintisiz yeniden-gömme ile embedding modeli yükseltme

    ✓ kesintisiz yeniden-gömme…
  5. HNSW ef_search ile recall ve gecikme dengesini ayarlama

    ✓ hnsw ef_search ile recall
  6. recall@k, MRR ve nDCG ile hat kalitesini değerlendirme

    ✓ recall@k, mrr ve ndcg ile
Kazanımlar · elinde kalanlar

Aldıkların sende kalır.

Zamanı ileri sar. Ne kaldığını izle.

Sonsuza dek

Sahip olmak tam olarak bu.

Kiralık yığın

yapay zekâ yazım aracı: abonelik

süresi doldu · erişim gitti

analiz paketi: abonelik

süresi doldu · erişim gitti

tasarım platformu: abonelik

süresi doldu · erişim gitti

(geriye bir şey kalmadı)

Senin ocağın

  1. Bilinçli parçalama, indeksleme ve çeşitlilik (MMR) seçimleriyle daha yüksek getirme doğruluğu

    lisans: kalıcı
  2. Gömme jetonu bütçeleri ve tavan alarmlarıyla öngörülebilir maliyet

    lisans: kalıcı
  3. Geri alınamaz hale gelmeden önce kişisel veriyi gömme öncesi maskeleyen gizlilik güvenli alım

    lisans: kalıcı
  4. Zamanlanmış değerlendirme sayesinde kalitenin varsayılmadığı, ölçüldüğü güven

    lisans: kalıcı

abonelikler biter · tapular bitmez

Ne içerir · eksiksiz manifest

Kutudaki her şey.

Bir parçayı eline al. Çalışırken izle.

HNSW indeksi, metadata GIN indeksi ve embedding sürümleme içeren pgvector şeması

parça 01 / 06 · kutuda

6 parça · tek çalışan sistem · e-postayla anında teslim

Sahadan · yaşanmış vaka

Bu, masa başında yazılmadı.

Sorun

Müdahale

Sonuç

Kimler için

Bu herkes için dövülmedi.

  • Araç kiralamayı sahip olmaya tercih ediyorsan, sana göre değil.
  • Yığınını senin yerine başkası yönetsin istiyorsan, sana göre değil.
  • Tahmin etmekten memnunsan, sana göre değil.
Hâlâ burada mısın? Güzel.

PostgreSQL üzerinde güvenilir, maliyeti kontrollü anlamsal arama veya RAG getirme kuran arka uç ve yapay zeka mühendisleri için.

o zaman bu senin için dövüldü.

Hangi AI ile çalışır

Tasarımı gereği evrensel: her yapay zekada çalışır. Açık Agent Skills + MCP biçiminde gelir (Claude’da yerleşik); ChatGPT, Gemini, Cursor ve Copilot aynı dosyaları kendine uyarlar.

  • Claude Yerleşik biçim
  • ChatGPT Açık standartla uyarlanır
  • Gemini Açık standartla uyarlanır
  • Cursor Açık standartla uyarlanır
  • Copilot Açık standartla uyarlanır
Sorular · hâlâ havada

Aklındakini yakala.

hava temizlendi. seninle ocak arasında hiçbir şey kalmadı.
bir kıvılcım yakala: ocak cevaplar

  1. Supabase şart mı, yoksa herhangi bir PostgreSQL çalışır mı?

    pgvector eklentili her PostgreSQL çalışır; şema, HNSW indeksleme, alım hattı ve değerlendirme aracı düz Postgres'tir. Supabase, yaygın bir yönetilen sunucu olduğu için maliyet tavanı örneklerinde geçer; hiçbir parça ona bağımlı değildir.

  2. Getirmenin gerçekten çalıştığını ummak yerine nasıl bilirim?

    Kalite varsayılmaz, ölçülür: değerlendirme aracı gerçek referans sorgulara karşı recall@k, MRR ve nDCG'yi düzenli hesaplar; HNSW ef_search de recall ile gecikme arasında açık bir ayar kolu verir. İndeks ve parçalama kararları, IVFFLAT'tan HNSW'e geçiş yolu dahil, ölçülebilir ödünleşimler olarak ele alınır.

  3. Sohbet botu veya LLM yanıt katmanı dahil mi?

    Hayır. Getirmenin bittiği yerde biter: parçalama, kişisel veri maskeleme, gömme, indeksleme, MMR çeşitlilikli benzerlik araması ve değerlendirme. Getirilen parçaları yanıta çeviren üretim katmanı bunun üstünde duran ayrı bir iştir.

  4. Nasıl teslim edilir?

    Satın alımdan hemen sonra e-posta ile iletilir, kuruluma hazır, anında indirilir; bekleme yok.

  5. Tek seferlik mi, abonelik mi?

    Tek seferlik alımdır; abonelik veya gizli ücret yoktur. Fiyata KDV (%20) dahildir.

  6. İade alabilir miyim?

    Dijital ürün olduğu için indirildikten sonra iade yapılmaz. Bu yüzden ne içerdiğini ve kime uygun olduğunu burada açıkça paylaşıyoruz.