瀏覽器自動(dòng)化工具!開(kāi)源 AI 瀏覽器助手讓你效率翻倍 前言
在 AI 自動(dòng)化快速發(fā)展的當(dāng)下,瀏覽器早已不再只是“用來(lái)點(diǎn)點(diǎn)點(diǎn)”的工具。越來(lái)越多的網(wǎng)頁(yè)任務(wù)——信息抓取、表單填寫(xiě)、跨站流程處理——都開(kāi)始依賴自動(dòng)化來(lái)提升效率。而最近,一款開(kāi)源的瀏覽器自動(dòng)化工具 Nanobrowser 引起了不少技術(shù)圈的關(guān)注。
它不僅免費(fèi)、開(kāi)源,還能在本地瀏覽器中直接運(yùn)行 AI 自動(dòng)化流程,讓網(wǎng)頁(yè)操作真正做到“像人一樣執(zhí)行”。如果你正在尋找一款安全、靈活、可控的瀏覽器自動(dòng)化工具,那么它絕對(duì)值得一試。
![]()
Nanobrowser是什么?
Nanobbrowser 是一款基于瀏覽器擴(kuò)展運(yùn)行的開(kāi)源 AI 自動(dòng)化工具,定位類(lèi)似于 OpenAI Operator 的免費(fèi)替代方案。它的核心理念是:讓多個(gè) AI 代理協(xié)同工作,自動(dòng)完成復(fù)雜的網(wǎng)頁(yè)任務(wù)。
它的特點(diǎn)非常鮮明:
核心優(yōu)勢(shì)
? 完全免費(fèi) :無(wú)需訂閱,只需使用自己的 LLM API Key。
? 隱私安全 :所有操作在本地瀏覽器執(zhí)行,敏感信息不會(huì)上傳云端。
? 多模型支持 :兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。
? 開(kāi)源透明 :自動(dòng)化邏輯完全公開(kāi),可審計(jì)、可擴(kuò)展。
? 多代理協(xié)作 :Planner 規(guī)劃、Navigator 執(zhí)行、Validator 校驗(yàn),流程清晰可控。
相比傳統(tǒng)的腳本自動(dòng)化(如 Selenium),Nanobrowser 更像是“AI 驅(qū)動(dòng)的智能瀏覽器助手”,無(wú)需寫(xiě)代碼即可完成復(fù)雜任務(wù)。
安裝方式:三種模式
Nanobrowser 提供三種安裝方式,適合不同用戶需求。
1. Chrome Web Store(推薦)
適合普通用戶,安裝即用。
![]()
2. 手動(dòng)安裝最新版本
適合想體驗(yàn)最新功能的用戶:
? 從 GitHub Releases 下載 zip
? 解壓后,打開(kāi) Chrome 瀏覽器,進(jìn)入
chrome://extensions/? 開(kāi)啟右上角 “開(kāi)發(fā)者模式”,點(diǎn)擊 “加載已解壓的擴(kuò)展程序”,選擇解壓后的
nanobrowser文件夾;? 配置 API Key 和模型即可使用
適合二次開(kāi)發(fā)或想深度定制的用戶。
實(shí)際使用體驗(yàn)安裝 Node.js(v22.12.0+)和 pnpm(v9.15.1+)
git clone https://github.com/nanobrowser/nanobrowser.git
cd nanobrowser
:
pnpm install
:
pnpm build(構(gòu)建結(jié)果在dist目錄)
:參考手動(dòng)安裝步驟,選擇dist文件夾(可選):
pnpm dev
安裝完成后,只需打開(kāi)側(cè)欄,添加模型服務(wù)商,即可開(kāi)始使用。
點(diǎn)擊“open settings” 添加大模型
![]()
![]()
Windows 下設(shè)置 OLLAMA_ORIGINS 步驟 1:打開(kāi)系統(tǒng)環(huán)境變量
1. 按 Win + S 搜索:
環(huán)境變量2. 點(diǎn)擊: “編輯系統(tǒng)環(huán)境變量”
3. 在彈出的窗口中點(diǎn)擊: “環(huán)境變量(N)…”
在“系統(tǒng)變量”區(qū)域點(diǎn)擊 新建:
? 變量名:
OLLAMA_ORIGINS? 變量值:
chrome-extension://*點(diǎn)擊 確定 保存。
![]()
步驟 3:重啟 Ollama 服務(wù)
你可以直接重啟電腦,或者手動(dòng)重啟 Ollama:
Windows 下設(shè)置(臨時(shí)生效)
如果你只想當(dāng)前 PowerShell 會(huì)話生效,可以用:
powershell:
setx OLLAMA_ORIGINS "chrome-extension://*"?? 注意: setx 會(huì)寫(xiě)入注冊(cè)表,但不會(huì)影響當(dāng)前窗口,需要 重新打開(kāi) PowerShell 或重啟電腦 才生效。
如何驗(yàn)證是否設(shè)置成功?
打開(kāi)新的 PowerShell:
echo $env:OLLAMA_ORIGINS chrome-extension://*說(shuō)明設(shè)置成功。
例如輸入 搜索“人工智能”,AI 會(huì)自動(dòng):
1. 分析當(dāng)前網(wǎng)頁(yè)結(jié)構(gòu)
2. 識(shí)別可操作元素
3. 自動(dòng)執(zhí)行瀏覽、抓取、整理等步驟
4. 最終輸出結(jié)構(gòu)化結(jié)果
整個(gè)過(guò)程無(wú)需你手動(dòng)點(diǎn)擊,AI 會(huì)像一個(gè)熟練的網(wǎng)頁(yè)操作員一樣完成任務(wù)。
打開(kāi)閑魚(yú)
大模型: ollama,qwen3b:20b
給它一個(gè)指令“打開(kāi)閑魚(yú),搜索2T硬盤(pán),并得到結(jié)果”。
![]()
改成
打開(kāi)“https://www.goofish.com/” 搜索2T硬盤(pán),并得到結(jié)果使用大模型: kimi
![]()
報(bào)錯(cuò):你使用的模型不支持 Structured Output
Planning failed: Failed to invoke gpt-oss:20b with structured output:
Could not parse response with structured output例如:
?
gpt-oss:20b? 某些本地模型(Ollama)
? 某些開(kāi)源模型(Qwen、Llama、Mixtral 的部分版本)
這些模型 能聊天,但不能?chē)?yán)格按 JSON / Schema 輸出,導(dǎo)致 Planner 解析失敗。
解決方案
把 Planner 模型 換成一個(gè)支持結(jié)構(gòu)化輸出的模型,例如:
? GPT-4 系列
? GPT-4o 系列
? Claude 3 系列
? Gemini 2 系列
? Qwen2.5(部分版本支持)
不要用本地模型當(dāng) Planner。
Nanobrowser的缺點(diǎn) 1.模型兼容性限制明顯(最大痛點(diǎn))
Planner 必須使用支持 Structured Output 的模型
? 本地模型(Ollama)大多不支持
? Kimi(Moonshot)不支持
? 大部分開(kāi)源模型不支持
? 代理 API(如 gpt-oss)也不完全兼容
導(dǎo)致:Planner 只能用 GPT-4o / Claude / Gemini 等強(qiáng)模型,成本較高。
2. Structured Output 錯(cuò)誤頻發(fā)
常見(jiàn)報(bào)錯(cuò):
? Could not parse response
? Invalid json_schema
? Unsupported keywords: $schema
這些都來(lái)自模型不兼容。
總結(jié)
Nanobrowser 作為一款開(kāi)源、免費(fèi)、隱私友好的 AI 瀏覽器自動(dòng)化工具,正在重新定義網(wǎng)頁(yè)操作方式。
開(kāi)源地址:https://github.com/nanobrowser/nanobrowser
? 它更適合:
不太適合:
? 完全小白
? 企業(yè)級(jí) RPA 場(chǎng)景
? 需要高穩(wěn)定性的任務(wù)
? 技術(shù)用戶
? 自動(dòng)化愛(ài)好者
? 需要本地隱私的場(chǎng)景
? 想用 AI 做網(wǎng)頁(yè)自動(dòng)化的開(kāi)發(fā)者
無(wú)論你是技術(shù)愛(ài)好者、數(shù)據(jù)采集人員、運(yùn)營(yíng)從業(yè)者,還是想提升效率的普通用戶,它都能帶來(lái)顯著的效率提升。
如果你想體驗(yàn)真正的 AI 自動(dòng)化瀏覽器,不妨試試 Nanobrowser。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.