前兩天和朋友一起吃飯,朋友是個小老板,主要接一些行業項目來做,公司不大,二三十人,但是在這個行業做久了,也積累了大量的行業資料。
這些資料蘊含著大量行業知識,對于售前、競標、客服來說都是很寶貴的,可惜的是它們都以Word,PDF等方式散落在硬盤里,不成體系,知識搜索起來很麻煩。
朋友說:“能不能建個知識庫?引入AI技術,精準地搜索一下。”
我說:“沒問題啊,現在RAG技術太成熟了,不少互聯網大廠都有云端RAG服務,把資料傳上去就行了。”
朋友搖頭:“不行,這些資料也是我們公司的機密了,不能往云端傳。”
我又給他介紹了另一家大廠的解決方案,從硬件到軟件到應用,一應俱全,可以部署在本地。
朋友一看就拒了:“價格太高,我們小蝦米玩不起啊!”
我明白了,朋友公司所需要的是一個“小而美”的知識庫,最好是免費的。
我上網搜了一下,發現了這么一個演示:PandaWiki品三國。
這個品三國很有意思,它就是個小知識庫,里邊上傳了《三國演義》和《三國志》等書籍,然后可以問一些有趣的知識類問題:
諸葛亮去世的時候是什么季節?
曹丕和曹植的關系很差嗎?
從回答中可以看出,它檢索了《三國演義》的相關章節,這個系統背后肯定用到了RAG技術。
它是怎么構建起來的呢?
再仔細一看,原來是個免費開源軟件,叫PandaWiki,兩個多月時間,已經有4500顆星星了,增長速度飛快。
PandaWiki 是一款 AI 大模型驅動的開源知識庫搭建系統,可以快速構建智能化的產品文檔、技術文檔、FAQ、博客系統,借助大模型的力量為你提供 AI 創作、AI 問答、AI 搜索 等能力。
好家伙,簡直就是為朋友公司定制的。
安裝
我馬上試了一下,安裝配置的過程也非常簡單,找一臺Linux服務器,一行命令就可以安裝完成。
如果你沒有Linux,也可以用虛擬機。
bash -c "$(curl -fsSLk https://release.baizhi.cloud/panda-wiki/manager.sh)"安裝結束,終端就貼心地輸出了可以訪問的控制臺URL,用戶名和密碼。
SUCCESS 控制臺信息:
SUCCESS 訪問地址(內網): http://*.*.*.*:2443
SUCCESS 訪問地址(外網): http://*.*.*.*:2443
SUCCESS 用戶名: admin
SUCCESS 密碼: **********************從安裝的過程來看,不得不說,現在的開源系統在用戶體驗方面遠遠超過了一些巨頭做的商業系統。
首次登錄,PandaWiki會提示配置AI模型,畢竟這是一個AI大模型驅動的系統,為了實現RAG,肯定需要一個Embedding模型,Rerank模型。為了實現智能對話,肯定需要一個Chat模型。
我這里選擇了百智云提供的相關模型:
到百智云上注冊一下,拿到API Key, 就可以用了。
ps.現在注冊,可以薅5塊錢羊毛。
使用
配置完AI模型以后,剩下的事情就非常非常簡單了,簡單到我都懶得介紹了。
無非就是創建一個知識庫,導入文檔,然后就可以用起來了。
讓我印象深刻的是,這里有著花樣繁多的導入方式,可以看出PandaWiki在這方面是非常用心的:
我創建了一個歷史名人知識庫,上傳了幾個文檔,測試一下:
接著追問:
效果相當不錯,整個過程前后花費的時間應該不到半個小時。
總結
我之前也介紹過不少優秀的軟件系統,PandaWiki第一次讓我感到,在安裝、配置上沒啥可說的!它確實是做得太好了,把復雜性全部隱藏了起來,一行命令就把所有東西搞定了。
在后臺管理上,用戶面對的也就是知識庫、文檔、發布、導入等幾個非常簡單的概念,毫無障礙。
一句話:PandaWiki就是一個小而美的、AI驅動的知識庫的典范。
如果你也想建一個低成本的、私有的、AI驅動的知識庫,那PandaWiki是不二之選。
建議大家也試一試,支持一下這個國產開源的知識庫:
https://github.com/chaitin/PandaWiki,給它點一個Star:
如果有什么問題或者建議,歡迎加入官方交流群:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.