2024-08-19 | Simon Liu
Notion 介紹
Notion 是一個功能強大的生產力工具,結合了筆記、文件管理、知識庫等多種功能,非常適合給個人使用和團隊的協作需求。它以其高度靈活的界面和模組化設計著稱,用戶可以根據自己的需求來訂製工作空間,並創建符合特定用途的頁面和數據庫。

而在日前 Notion 也公佈中文版上線了,其中不論是網頁、App 都能使用,現在只要利用瀏覽器打開 Notion,登入帳號後應該就會發現整個介面都已經改用繁體中文呈現,包含官方的說明文件也都全面中文化了,如果沒有,也只要到側邊欄的「Settings & members」>「Language & region」即可在下拉選單中選擇「繁體中文」。
RAG 是什麼?
其實我有寫了一篇 RAG 的重點整理,簡單一句話就是翻譯人類的語言變成機器的語言。
都有 Notion AI 了,為何要自己做 RAG 呢?
Notion AI 是 Notion 官方推出的一項 AI 服務,旨在透過人工智慧幫助使用者撰寫筆記和文件的內容。在實際測試後,發現它具有幾個實用且有趣的功能:
- 能夠生成中文內容,並且能理解中文問題,這對於台灣使用者非常友好和實用。
- 可以根據不同的需求,如會議記錄、簡報報告、任務計畫、宣傳文案等,撰寫相應格式的內容。
- 生成的內容具備基本的重點和流暢性,非常適合用來激發想法或作為草稿準備的基礎。
但是,當今天這些筆記或者會議記錄完成後,你就會發現這些資訊就只會擺在那邊就不使用了,那如果我要搜尋裡面的知識,其實也是要費一些時間才能夠完成,而且常常在工作上,你會使用的是 Slack, line, telegram,也因此,整合這些知識與資訊,並且讓社群溝通軟體可以使用,或許是一個很好的解決方式
Notion2RAG 整體架構思考方向

整體來說,會分為以下4點:
- 將知識整理至 Notion Database:我覺得第一部最重要的就是這件事情,因為 Notion Database 可以幫助我們整理這些文件創建日期、創建人、維護者、是否能夠公開、權限控管、版本號碼、資訊來源等等,來幫助我們對資料庫進行控管
- Notion API 匯出資料:透過 Notion 自身有提供的 API 功能,讓我們能夠取得 Notion 內的文件資料,並且進行 Embedding 的處理。
- Chunking、Embedding:接著,將文章分段後,翻譯成向量群,並且透過工具進行儲存,你就可以得到一個 Notion 知識的向量資料庫。
- 透過向量資料庫的比對,你就可以透過詢問問題,並且找尋相似知識,來請大型語言模型進行回覆。
實驗 — 目前實際成果
- 以下是我所製作過的筆記簡略版本:

- 經過處理後,你就可以將此知識放到向量資料庫

- 而且你可以詢問問題,並且獲得對應的知識:

資料來源: https://medium.com/@simon3458/notion-rag-application-concept-02a33cf07c38