大家好,我是老章
最近比較關(guān)注大模型OCR,很多官方Benchmark不敢全信
發(fā)現(xiàn)一個不錯的網(wǎng)站:https://www.ocrarena.ai/battle
測試了18個開源/閉源模型的OCR能力,排名見圖一、圖二
開源模型有點墊底,不過考慮到模型尺寸和成本,作為開發(fā)者必然還是喜歡開源模型
它的排名比較可信,因為靠的是用戶上傳PDF/圖片/表格識別后的投票
圖3我試了一下,模型完全匿名,model2效果更好,可以投給它
圖4是列出了模型Battle后勝率情況:每個單元格顯示模型 A(行)對模型 B(列)的勝率
這個網(wǎng)站還有功能,它的Playground可以免費使用上面提到的18個模型進行OCR識別,十分良心:https://www.ocrarena.ai/playground
騰訊混元OCR大模型,本地部署,實測
擼了一個 OCR 大模型對比工具:DeepSeekOCR、PaddleOCR 和 混元OCR
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.