政府法規 AI 知識庫

Azure + M365 全雲端架構 — 公部門數位轉型 PoC

需求背景

假想情境

數位發展部(moda)— 跨機關法規知識庫共用平台建置案

數位發展部推動政府機關數位轉型,發現各機關在執行業務時經常需要查閱大量法規、 行政命令與作業基準,但缺乏統一的智慧查詢工具。承辦人員只能逐條翻閱 PDF, 或私下使用 ChatGPT 得到不精確的解讀。moda 規劃建置一套 「政府法規 AI 知識庫共用平台」, 以標準化架構讓各機關將管轄法規匯入系統,提供承辦人員即時、精確的法規查詢服務。 本 PoC 以「金融機構辦理電子銀行業務安全控管作業基準」為試點法規, 驗證此架構能否確保 AI 回答中的法規術語 100% 保真,並符合政府資安規範。

現有痛點

法規術語理解不一致
不同機關的承辦人員對同一法規術語的解讀不同。例如「電子銀行」常被誤解為「網路銀行」,實際上法規涵蓋 ATM、電話銀行等所有電子管道
跨條文比對耗時
一個政策研擬可能涉及多條法規交叉引用(加密、風險分級、信賴等級、安全設計),承辦人員手動翻閱 PDF 比對需數天
公務員私用 ChatGPT
承辦人員私下用通用 AI 查法規,但 AI 會用通俗說法取代法規專有名詞,產出看似合理但法律上不精確的解讀
政府資安合規要求
政府機關系統須符合資通安全管理法,資料不得存放於未經核准的境外區域,需部署在通過認證的雲端環境

Live Demo — 直接體驗

法規查詢(全程 Azure 雲端處理)

點擊查詢後,系統依序執行以下 pipeline,每一步都在 Azure 上完成:


解決方案:為什麼用微軟?

公部門系統需要資料主權可控、企業級安全、政府合規認證

需求為什麼需要Azure 服務為什麼選它
混合檢索 法規查詢同時需要精確術語匹配(「第八條第六款」)和語意理解(「轉帳安全要求」) Azure AI Search 原生支援 Vector + BM25 + metadata filter 三路混合檢索,內建 RRF 融合和 Semantic Ranker
術語保真 「電子銀行」≠「網路銀行」,AI 回答必須使用法規原文定義 AI Search Synonym Map
+ Cosmos DB
Synonym Map 在查詢階段攔截禁用替代詞;Cosmos DB 存放 99 個術語完整詞典,動態注入 System Prompt
知識圖譜 法規術語之間有上下位、依賴、易混淆等關係 Cosmos DB (graph) Serverless 計費,47 條關係的圖查詢成本趨近零
LLM 生成 繁體中文法規理解 + 精確條文引用 + 術語保真規則 Azure OpenAI GPT-4o 繁中最佳 LLM 之一;部署在 Azure 上資料不離開企業邊界
Embedding 將法規條文和查詢轉為向量,實現語意搜尋 Azure OpenAI text-embedding-3-large 3072 維度,中文語意理解優秀,與 AI Search 原生整合
API 服務化 系統需對外提供 HTTP API Azure Functions Serverless,按呼叫計費,不查詢時零成本
資料主權 政府法規資料不得離開核准區域 Azure Region: East US 所有資源部署在同一區域,資料不跨區傳輸

全雲端架構

所有元件皆部署於 Azure,零地端依賴。

使用者(瀏覽器 / 各機關內部系統) Azure Functions (Consumption Plan, Serverless) Python 3.11 runtime | HTTP API | Function Key 認證 ┌────────────┼────────────┐ Azure AI Search Cosmos DB Azure OpenAI Free tier Serverless S0 (pay-per-use) 63 chunks indexed 99 terms (glossary) text-embedding-3-large Vector + BM25 47 relations (graph) GPT-4o (2024-11-20) Synonym Map (5) NoSQL + graph query 10K TPM rate limit Semantic Ranker zh-Hant.lucene Storage Account (Standard LRS) Application Insights (Free 5GB/月) Functions runtime 儲存 API 監控 + 日誌 Pipeline: Query → Synonym Rewrite → Hybrid Search (RRF) → Cosmos DB Term Injection → GPT-4o → Answer
6
Azure 服務
63
法規 Chunks
99
術語定義
47
知識圖譜關係
5
Synonym 規則

查詢處理循序圖 (Sequence Diagram)

一次查詢的完整呼叫流程,展示各 Azure 服務之間的互動:

Browser Azure Functions AI Search Cosmos DB Azure OpenAI 1 2 3 4 5 POST /api/query Function Key auth + rate limit + budget check Synonym Map rewrite "network banking" → "electronic banking" embed query (text-embedding-3-large) query vector (3072 dim) hybrid search Vector + BM25 + Metadata → RRF Fusion (k=60) → Semantic Ranker rerank top 5 chunks + scores query glossary + knowledge graph term lookup + 1-hop expansion 3-tier injection (Full/Med/Short) term definitions + relations GPT-4o (system prompt + terms + chunks + query) 8 term-fidelity rules article citation required answer + usage tokens JSON response answer + search results + terms + usage + budget

術語保真方法論

本系統基於自研的「企業知識庫術語保真方法論 v2.1」,確保 AI 回答中的專有名詞保真度接近 100%。 學術依據:HalluGraph (arxiv 2512.01659)、CRAG (arxiv 2401.15884)、SAT-Graph RAG (arxiv 2505.00039)。 已通過金融法規試點驗證 — 6 題術語保真測試全數通過。

核心機制

機制作用Azure 服務
Synonym Map 查詢改寫自動將「網路銀行」改寫為「電子銀行」,在查詢階段攔截錯誤術語AI Search Synonym Map
三路混合檢索 + RRFVector(語意)+ BM25(關鍵字)+ Metadata(術語 ID 精確匹配),定義型 chunk 加權AI Search Hybrid + Semantic Ranker
動態術語注入查詢偵測術語 → 知識圖譜 1-hop 擴展 → 三級格式注入 System Prompt(6,000 token budget)Cosmos DB (glossary + graph)
術語保真 System Prompt8 條規則:禁用替代詞、首次出現全稱格式、條文引用、不確定性三級判斷Azure OpenAI GPT-4o

Teams Bot — 在工作環境中直接查法規

M365 整合

從「另開網頁查」到「在 Teams 直接問」

公務員的日常工作環境是 Microsoft Teams。 將知識庫以 Teams Bot 形式嵌入工作流程 — 承辦人員在 Teams 對話中直接輸入法規問題,Bot 即時呼叫後端 Azure Functions API, 回傳包含法規引用和術語說明的 Adaptive Card。 不需切換應用程式、不需記住網址、不需管理 API Key。

架構

公務員(Microsoft Teams / Web Chat) Azure Bot Service (F0 Free) Bot Framework | Adaptive Cards | Teams + Direct Line Channel Azure Functions (既有 RAG API — /api/messages) 同一套 Pipeline,同一份資料,零額外基礎設施 ┌────────────┼────────────┐ AI Search Cosmos DB Azure OpenAI

技術實作

元件技術選型說明
Bot RegistrationAzure Bot Service F0免費,支援 Teams / Web Chat / Slack 多通道
Bot Hosting既有 Azure FunctionsBot endpoint 直接加在 Function App,零額外基礎設施
回應格式Adaptive Cards v1.5結構化卡片:回答 + 法規引用 + 術語統計 + 預算餘額
後端整合內部呼叫 RAG Pipeline零重複開發 — 同一套 Pipeline

Live Web Chat — 直接體驗 Bot

這就是公務員在 Teams 中看到的體驗。透過 Azure Bot Service Direct Line 通道嵌入網頁:

公部門價值

零學習成本
公務員已經在用 Teams。法規查詢直接嵌入既有工作流程,不需額外帳號或培訓
統一資料來源
所有人查到的法規解讀來自同一套 RAG Pipeline + 術語詞典,消除各自解讀的落差
稽核可追蹤
每筆查詢都經過 Azure Functions 記錄,符合資安稽核要求
M365 生態整合
未來可串接 Power Automate(公文簽核)、SharePoint(法規文件庫)、Power BI(查詢分析)

Power Automate — 公文法規審查自動化

M365 流程自動化

公文簽核流程中自動觸發法規合規檢查

當承辦人員在 SharePoint 上傳公文草稿後,Power Automate 自動觸發: (1) 擷取公文中的關鍵法規術語 → (2) 呼叫知識庫 API 檢查術語使用是否正確 → (3) 產生合規報告送至主管 Teams 頻道 → (4) 若有術語使用錯誤,自動建立修改建議並通知承辦人。 全程自動化,減少人工審查時間。

自動化流程架構

承辦人員上傳公文至 SharePoint Power Automate (觸發器:SharePoint 新增檔案) 自動擷取公文內容 → 偵測法規術語 → 呼叫 API 檢查 ┌────────────┼────────────┐ Azure Functions Approvals Teams 法規合規檢查 主管簽核 通知結果 術語保真驗證 核准/退回/加簽 合規報告卡片

Flow 設計步驟

Step動作M365 / Azure 服務說明
1. 觸發 SharePoint 新增/修改文件 SharePoint Trigger 當承辦人員上傳公文至指定文件庫時自動啟動
2. 擷取 讀取公文內容 SharePoint Get File Content 取得 Word/PDF 公文全文
3. 術語檢查 呼叫知識庫 API HTTP Connector → Azure Functions 將公文段落送至 /api/query,檢查術語使用是否符合法規定義
4. 報告生成 組裝合規報告 Compose + Adaptive Card 列出:正確術語、錯誤用詞、建議修正、引用條文
5. 簽核 主管審核 Approvals 若發現術語錯誤,自動發起審核流程,主管可核准/退回/加簽
6. 通知 Teams 訊息通知 Teams Post Adaptive Card 將合規報告以 Adaptive Card 發送至承辦人或部門頻道

公部門應用場景

公文法規用詞審查
承辦人員起草公文時,自動檢查是否使用正確的法規術語(如「電子銀行」而非「網路銀行」),避免法律文件用詞不精確
政策研擬輔助
新政策草案上傳後,自動比對相關法規條文,標記可能衝突或遺漏的法規引用
合規稽核自動化
定期掃描既有文件庫中的公文,產生合規狀態報告,減少人工稽核工作量
跨機關協作
不同機關的公文經過同一套術語保真檢查,確保跨機關溝通時法規用語一致

技術整合

元件技術選型說明
流程引擎Power AutomateLow-code 拖拉設定,公務員可自行調整流程,不需寫程式
文件儲存SharePoint Online政府機關已有 M365 授權,零額外成本
法規檢查既有 Azure Functions API複用第一個 Tab 的知識庫 API,同一套 RAG Pipeline
簽核流程ApprovalsM365 內建審核功能,整合 Teams 通知
通知Teams Adaptive Card結構化報告卡片,與 Teams Bot 共用同一套卡片格式