前言
在前一篇使用 Kernel Memory 和 MSSQL 快速建立 RAG 服務可以很快建立出 RAG 服務,並讓使用者進行問答。
接下來我們來看一下它在 SQLServer 中是如何處理
研究
ImportDocumentAsync
從 await kmClient.ImportDocumentAsync(docPath, index: tenantId, documentId: documentId);
開始,
它會呼叫 Kernel Memory 的/upload
API,
呼叫MemoryServerless.ImportDocumentAsync
(因為OrchestrationType
設定成 InProcess
),
呼叫BaseOrchestrator.ImportDocumentAsync
執行Pipeline的處理,
因為沒設定 Pipeline 自定的 Steps,所以會使用預設的 Steps,
預設的 Steps 為extract
(讀取文件內容), partition
(將文件內容切成多個 Chunks), gen_embeddings
(將各 Chunks 轉成 Embedding) 及 save_records
(將 Chunks 及 Embeddings 存到 MSSQL)
在save_records時,會做以下幾個步
1.建立基本 Tables
建立KMCollections
及KMMemories
(config 中 SqlServer 區段MemoryCollectionTableName
及MemoryTableName
的設定值)這 2 個 Table(SqlServerMemory.CreateTablesIfNotExistsAsync
)。KMCollections
Table 只有一個id nvarchar(256)
這個欄位,是記錄index
的值。KMMemories
Table 會記錄文件 Chunks 的相關內容。

1 | IF OBJECT_ID(N'[dbo].[KMCollections]', N'U') IS NULL |
2.新增index資料及建立index所需的 Tables(DefaultQueryProvider.PrepareCreateIndexQuery
)
2.1.將index(gss
)新增到KMCollections
Table 中
2.2.建立KMEmbeddings_[index]
及KMMemoriesTags_[index]
(config 中 SqlServer 區段EmbeddingsTableName
及TagsTableName
的設定值)這 2 個 Table。(如果不存在才建立)

index 相關的 Table 是將Tags及Embeddings每項存成一筆資料。
1 | BEGIN TRANSACTION; |
3.刪除documentId
為 hr001 的資料(如果有的話)
讀取_files/gss/hr001/__pipeline_status.json
將舊的 Embeddings 資料刪除(artifact_type為TextEmbeddingVector的資料)。
Loop 去執行刪除,
1 | BEGIN TRANSACTION; |
4.將 Chunks 資料新增/修改到KMMemories
,KMEmbeddings_gss
及KMMemoriesTags_gss
資料表
Loop 執行
1 | BEGIN TRANSACTION; |
AskStreamingAsync
從 kmClient.AskStreamingAsync(question, minRelevance: 0.7, options: new SearchOptions { Stream = true }, index: tenantId)
開始,先將問題轉成 Embeddings ,再到資料庫找出相似度大於0.7
的 Chunks 資料,
1 | WITH |

將這些內容組成 Prompt 來生成答案,如下,
1 | Facts: |
所以最後就從 LLM 就依 Search 到的內容來得到結果。
結論
embeddings 就是一堆的數值,比較難的是將文字計算出這些 embeddings,但許多 Embeddings Models 已經可以幫我們做到這些事。
所以我們可以將這些數值存到 Table 中,並建立columnstore index來加快它的查詢,計算出文字的相似度。
Cosine similarity [-1,1]的 SQL 如下,
1 | SELECT |
數值越接近 1,代表兩個向量越相似。
詳細請參考Vector Similarity Search with Azure SQL database and OpenAI
- 註:如果使用 MSSQL 建議使用 Azure SQL,或是等待 SQL 2025,使用 Vector 資料型態效能比較好,因為我用 LocalDB 來處理,常常會有 SQL Timeout 的狀況
參考資源
SQL 資料庫 引擎中的向量概觀
Vector Similarity Search with Azure SQL database and OpenAI
RAG with SQL Vector Store: A Low-Code/No-Code Approach using Azure Logic Apps