<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      大模型 OCR 的黃金時代,騰訊開源混元OCR,文檔解析、視覺問答和翻譯方面達到 SOTA

      0
      分享至



      大家好,我是 Ai 學習的老章

      大模型 OCR 的黃金時代來了,小紅書 dots.ocr-3b、deepseek-ocr-3b、阿里 qwen3-vl-2b、百度 paddleocr-vl-0.9B......

      模型越做越小,精度越來越高

      剛剛,OCR 領域迎來新選手,騰訊的文檔理解模型——混元 OCR 開源了


      端到端訓推一體:不同于其他開源的 OCR 專家模型或系統,HunyuanOCR 模型的訓練和推理均采用全端到端范式。通過規模化的高質量應用導向數據,結合在線強化學習,模型表現出了非常穩健的端到端推理能力,有效規避了級聯方案常見的相關誤差累積問題


      • 在文檔解析、視覺問答和翻譯方面達到 SOTA

      • 1B 參數,端到端運行,大幅降低了部署成本

      在 OCR Bench 數據集上實現了 3B 參數以下模型的 SOTA 分數(860),并在復雜文檔解析的 OmniDocBench 數據集上取得了領先的 94.1 分

      一個很離譜的成績是 HunyuanOCR 僅使用 1B 參數量,在拍照翻譯任務上取得了與 Qwen3-VL-235B 相當的效果。

      它可以處理街道視圖、手寫體、藝術文本的文字識別,復雜文檔處理(HTML/LaTeX 中的表格/公式),視頻字幕提取,以及端到端的照片翻譯(支持 14 種語言)


      放幾個高清的案例







      最后這個案例,后面做論文翻譯,又有新玩法了

      官方提供了不同任務下的提示詞模板


      任務提示詞

      檢測與識別

      檢測并識別圖片中的文字,將文本坐標格式化輸出

      解析

      ? 識別圖片中的公式,用 LaTeX 格式表示
      ? 把圖中的表格解析為 HTML
      ? 解析圖中的圖表,對于流程圖使用 Mermaid 格式表示,其他圖表使用 Markdown 格式表示。
      ? 提取文檔圖片中正文的所有信息用 markdown 格式表示,其中頁眉、頁腳部分忽略,表格用 html 格式表達,文檔中公式用 latex 格式表示,按照閱讀順序組織進行解析

      信息抽取

      ? 輸出 Key 的值
      ? 提取圖片中的:['key1','key2', ...] 的字段內容,并按照 JSON 格式返回
      ? 提取圖片中的字幕

      翻譯

      先提取文字,再將文字內容翻譯為英文。若是文檔,則其中頁眉、頁腳忽略。公式用 latex 格式表示,表格用 html 格式表示


      在線體驗

      https://huggingface.co/spaces/tencent/HunyuanOCR


      我試了一下,拍照圖片 + 雙排顯示 + 公式、圖表情況下,識別的蠻精準的


      看前端樣式是用 Gradio 實現的,如果模型本地化部署了的話,可以直接把代碼 copy 下來,python 運行就能在本機實現這個應用了

      代碼:https://huggingface.co/spaces/tencent/HunyuanOCR/blob/main/app.py

      功能上挺齊全的:多場景文字檢測與識別、多粒度文檔解析、卡證票據識別和結構化輸出、視覺問答、跨語言翻譯


      本地部署

      模型文件只有 2GB,比 DeepSeek-OCR 的 6.7GB 小太多了

      不過我看 HunyuanOCR@GitHub 的 README 中寫需要 GPU 顯存是 80GB,有點離譜啊

      它會不會把顯存和硬盤容量搞反了?


      國內鏡像:https://modelscope.cn/models/deepseek-ai/DeepSeek-OCR


      https://huggingface.co/tencent/HunyuanOCR

      官方建議 vLLM 部署模型以獲取更好的推理性能和精度,因為 Transformers 相比 vLLM 框架存在一定的性能下滑

      但是目前只能安裝 vLLM nightly 了,穩定版的 vLLM 要支持 HunyuanOCR 估計需要 v0.11.3 了

      pip install vllm --extra-index-url https://wheels.vllm.ai/nightly

      在線推理

      vllm serve tencent/HunyuanOCR \
      --no-enable-prefix-caching \
      --mm-processor-cache-gb 0

      OpenAI API 接口調用

      from openai import OpenAI

      client = OpenAI(
      api_key="EMPTY",
      base_url="http://localhost:8000/v1",
      timeout=3600
      )

      messages = [
      {
      "role": "user",
      "content": [
      {
      "type": "image_url",
      "image_url": {
      "url": "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/chat-ui/tools-dark.png"
      }
      },
      {
      "type": "text",
      "text": (
      "Extract all information from the main body of the document image "
      "and represent it in markdown format, ignoring headers and footers."
      "Tables should be expressed in HTML format, formulas in the document "
      "should be represented using LaTeX format, and the parsing should be "
      "organized according to the reading order."
      )
      }
      ]
      }
      ]

      response = client.chat.completions.create(
      model="tencent/HunyuanOCR",
      messages=messages,
      temperature=0.0,
      )
      print(f"Generated text: {response.choices[0].message.content}")

      我實測的話,模型已下載,準備等 vLLM:v0.11.3 出來之后了


      參考:
      官方簡介:https://hunyuan.tencent.com/vision/zh?tabIndex=0
      HunyuanOCR 項目 README:https://huggingface.co/tencent/HunyuanOCR
      vLLM 官方文檔:https://docs.vllm.ai/projects/recipes/en/latest/Tencent-Hunyuan/HunyuanOCR.html

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      名宿:我曾因為糾正C羅、被粉絲拷問幾金幾冠!我說我有世界杯!

      名宿:我曾因為糾正C羅、被粉絲拷問幾金幾冠!我說我有世界杯!

      氧氣是個地鐵
      2025-12-26 17:19:39
      大家斷崖式衰老都是在多少歲? 網友的回答很扎心了,滿是無奈

      大家斷崖式衰老都是在多少歲? 網友的回答很扎心了,滿是無奈

      另子維愛讀史
      2025-12-26 16:31:13
      “堅持計劃生育一百年不動搖”的彭佩云去世,她父親的人生更傳奇

      “堅持計劃生育一百年不動搖”的彭佩云去世,她父親的人生更傳奇

      文史微鑒
      2025-12-24 23:47:43
      克萊:我希望庫里別穿著我的KT11贏獨行俠,但他穿就挺棒的了

      克萊:我希望庫里別穿著我的KT11贏獨行俠,但他穿就挺棒的了

      懂球帝
      2025-12-26 17:35:07
      嚴防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

      嚴防死守36年,利智還是輸了,李連杰終是沒放下一直虧欠的“她”

      法老不說教
      2025-12-24 18:25:17
      不到48小時,高市曝驚天反轉,超90%青年站隊,右翼徹底坐不住了

      不到48小時,高市曝驚天反轉,超90%青年站隊,右翼徹底坐不住了

      知鑒明史
      2025-12-25 19:00:25
      亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

      亞洲周刊曝光徐鶯偽造身份11年,篡改民國收藏史,文博圈大佬站臺

      阿纂看事
      2025-12-25 13:38:27
      中國醫藥健康產業股份有限公司原董事長高渝文接受審查調查

      中國醫藥健康產業股份有限公司原董事長高渝文接受審查調查

      界面新聞
      2025-12-26 16:02:31
      火箭鋒線太恐怖!阿門伊森再現雙鬼拍門,KD強解,電風扇也復出了

      火箭鋒線太恐怖!阿門伊森再現雙鬼拍門,KD強解,電風扇也復出了

      細話籃球
      2025-12-26 12:51:20
      2月27日,美國司法部首次公布了“蘿莉島”相關案件,

      2月27日,美國司法部首次公布了“蘿莉島”相關案件,

      現代小青青慕慕
      2025-12-25 20:14:26
      幸虧中國沒參與,越南南北高鐵受挫,大財團撤資,美國投資商跑路

      幸虧中國沒參與,越南南北高鐵受挫,大財團撤資,美國投資商跑路

      時尚的弄潮
      2025-12-26 12:56:58
      哪些事是外國人到中國后才知道的?網友:你來天朝!你就漲知識吧

      哪些事是外國人到中國后才知道的?網友:你來天朝!你就漲知識吧

      帶你感受人間冷暖
      2025-12-24 00:10:09
      最新通知!陜西新一輪雨雪時間確定

      最新通知!陜西新一輪雨雪時間確定

      環球網資訊
      2025-12-26 17:36:56
      “嫂子,你媽剛好退休,讓她去伺候我婆婆”老公:你算什么東西?

      “嫂子,你媽剛好退休,讓她去伺候我婆婆”老公:你算什么東西?

      多久情感
      2025-12-25 16:55:34
      面對抗議參拜靖國神社,高市選擇充耳不聞

      面對抗議參拜靖國神社,高市選擇充耳不聞

      中國日報網
      2025-12-25 09:52:05
      美國評1979年中越戰爭:打了28天,中國軍隊出現了很多問題

      美國評1979年中越戰爭:打了28天,中國軍隊出現了很多問題

      小豫講故事
      2025-12-24 06:00:04
      南昌起義中,朱德是第九軍副軍長,那軍長是誰?建國后擔任何職?

      南昌起義中,朱德是第九軍副軍長,那軍長是誰?建國后擔任何職?

      方圓文史
      2025-12-25 16:06:56
      約基奇56+16+15創6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      約基奇56+16+15創6大歷史第1神跡,還刷爆紀錄!愛德華茲被驅逐

      一將籃球
      2025-12-26 17:11:11
      海南封關成照妖鏡,東南亞國家挨個現行,新加坡直言不準自給自足

      海南封關成照妖鏡,東南亞國家挨個現行,新加坡直言不準自給自足

      離離言幾許
      2025-12-26 14:16:02
      剛剛!山東省紀委監委發布:2人被處分

      剛剛!山東省紀委監委發布:2人被處分

      魯中晨報
      2025-12-26 12:57:02
      2025-12-26 18:47:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3235文章數 11081關注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      村民稱家中110只懷孕母羊被毒死 投毒者是父親好友

      頭條要聞

      村民稱家中110只懷孕母羊被毒死 投毒者是父親好友

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態度原創

      藝術
      家居
      教育
      時尚
      房產

      藝術要聞

      William Dyce:19世紀蘇格蘭重要的畫家

      家居要聞

      格調時尚 智慧品質居所

      教育要聞

      教育部禁令后學校抽成猛漲3倍!2年食堂返點330萬,竟然存私賬?

      普通人如何“偷偷”變美?她的4個微習慣很好抄

      房產要聞

      炸裂,三亞360億超級清單發布,又一批重大配套要來了!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丝袜精品在线| 亚洲色www永久网站| 91九色TS另类国产人妖| 狠狠色噜噜狠狠狠狠2021| 国产欧美在线观看不卡| 无码中文字幕网| 超碰老司机| 四虎亚洲国产成人久久精品| 亚洲人成色77777| 一本久久88色| 伊人性网| 少妇人妻偷人精品免费| 亚洲一区二区在线无码| 欧美老熟妇videos极品另类| 午夜免费福利小电影| 融水| 久久久久国产精品人妻| 成在线人永久免费视频播放| 欧美丰满熟妇xxxx性| 口爆AV| 91成人在线播放| 色~性~乱~伦~噜| 最新成免费人久久精品| 国产成人AV在线| 国产熟女内射oooo| 久久久综合香蕉尹人综合网 | 一本本月无码-| 2025日韩无码| 亚洲男人的天堂久久香蕉| 中文字幕亚洲乱码熟女一区二区| 51妺嘿嘿午夜福利| av天堂中文字幕| 湾仔区| 综合Av| 性做久久久久久久久| 国产特级毛片aaaaaa高清| 亚洲三区在线观看内射后入 | 国产xxxxx| 密臀AV| 日区中文字幕一区二区| 国模欢欢炮交啪啪150|