RAG Pipeline עם Supabase pgvector
שיעור זה עוסק בבניית RAG pipeline עם pgvector ב-Supabase לחיפוש סמנטי.
כמו ספרייה שממפה ספרים לפי נושא ולא רק לפי שם — RAG ממיר טקסט למספרים שמייצגים משמעות, ומוצא מסמכים דומים גם אם המילים שונות.
- Embedding
- ייצוג מספרי של טקסט ב-vector space שמשמר את משמעות הטקסט.
- pgvector
- הרחבת PostgreSQL לאחסון וחיפוש של vectors ישירות במסד הנתונים.
- HNSW
- Hierarchical Navigable Small World — אלגוריתם index לחיפוש מהיר של nearest neighbors.
- Cosine similarity
- מדד דמיון בין vectors לפי הזווית ביניהם — 1 = זהים, 0 = ניצבים.