<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,蟬聯Future X全球榜首MiroMind發布全球最強搜索智能體模型

      0
      分享至



      機器之心發布

      憑借成功預測 Polymarket 題目,連續登頂 Future X 全球榜首的 MiroMind 團隊,于今日(1 月 5 日)正式發布其自研旗艦搜索智能體模型 MiroThinker 1.5。

      MiroMind 由全球知名創新企業家、慈善家陳天橋,與清華大學知名 AI 青年學者代季峰教授聯合發起。去年陳天橋提出發現式智能才是真正意義上的通用人工智能這一重磅創新理念,引發全球業內人士關注。他同時提出建設發現式智能的 5 種關鍵能力,其中一項能力是在未知條件下重建對世界的理解,這正是 MiroMind 的使命。

      在過去 7 個月里,當全行業都在「卷」參數規模、「卷」百萬長文本的紅海時,MiroMind 卻在思考一個更本質的問題:智能的「奇點」究竟在哪里?他們給出的答案不是「把世界背進參數里」,而是押注「發現式智能」:真正的智能不靠全知,而靠會研究、會查證、會修正—— 像頂級情報官一樣對外極速取證、對內嚴苛去偽存真;像嚴謹研究員一樣在不確定性里逼近真相,最終把「預測未來」從特權變成能力。

      MiroThinker 1.5 性能評測

      MiroMind 團隊在 AGI 競技場上,不信奉 “大力出奇跡”,而是追求以高智效比為核心的 「巧勁」。

      MiroThinker-v1.5-30B 僅用 1/30 的參數規模跑出了比肩眾多 1T 模型的性能表現,其 235B 的版本在多個搜索智能體基準測試中躋身全球第一梯隊。

      實力霸榜:指標是門檻,預測是天花板



      BrowseComp 性能對比



      Agent 搜索評測基準性能對比

      越級挑戰:MiroThinker-v1.5-30B vs Kimi-K2-Thinking

      面對參數量高達 30 倍的萬億參數巨獸 Kimi-K2-Thinking,MiroThinker-v1.5-30B 用極低的成本展示了旗鼓相當的表現:

      • 推理成本: MiroThinker-v1.5-30B 單條調用成本低至 $0.07,僅為 Kimi-K2-Thinking 的 1/20,且推理更快。
      • 性能表現: 在關鍵評測集 BrowseComp-ZH 中實現性能超越,證明「大」 不等于 「強」。

      核心洞察:從 「做題家模式」 轉向 「科學家模式」

      MiroMind 團隊指出,以擴大模型內部參數量(Internal Parameters)為核心的傳統 Scaling Law 已明顯觸及邊際瓶頸;要繼續提升模型性能,必須從「內部參數擴張」轉向以「外部信息交互」(External Interaction)為核心的Interactive Scaling,將智能的增長空間從內部參數擴展到外部世界。

      為什么該模型能在大幅降低成本的同時,性能依然能打?

      因為這不是「大參數碾壓」,而是一次「科學家模式」對「做題家模式」的勝利。以 Scaling Law 為代表的路線,更像「做題家」:試圖把全人類知識(也包括噪聲與錯誤)盡可能背進模型里;一旦遇到生物學等領域的未知問題,就容易基于概率分布「編」出一個看似合理的答案 —— 幻覺往往由此產生。

      MiroThinker 1.0中,MiroMind 團隊首次系統性提出Interactive Scaling:隨著工具交互頻率與深度提升,研究式推理能力也穩定增強 —— 這構成了與模型大小、上下文長度并列的第三個可擴展維度。v1.5 更進一步,把這套機制內化為貫穿訓練與推理全流程的核心能力:將模型訓練成「科學家」,核心不是死記硬背,而是勤查證。遇到難題時,它不會給出概率最高的瞎猜,而是執行慢思考的研究閉環:提出假設 → 向外部世界查數據 / 取證 → 發現對不上 → 修正假設 → 再查證,直到證據收斂。

      主流大模型往往盲目追求萬億參數,試圖把整個互聯網「背」在腦子里。而 MiroThinker 系列選擇了一條反共識的路線:刻意將模型控制在 30B–200B 的輕量級規模。MiroMind 團隊強調,省下的不是算力,而是把算力花在了更刀刃的地方 —— 對外的信息獲取與交互。

      MiroMind 團隊不追求讓模型擁有一顆「最重的腦子」,而是培養它擁有一雙「最勤的手」。當模型同時具備研究式確認機制時序因果約束,這種圍繞外部信息獲取的交互過程才讓「發現式智能」真正落地 —— 也正是對 Interactive Scaling 的深耕,使他們用小得多的模型,做到了大模型才能做到的事。

      MiroThinker 1.5 核心技術揭秘

      傳統的模型思維鏈本質上是在模型內部知識空間的線性外推,推理偏差會隨路徑增長而不斷累積,最終導致邏輯坍塌。

      MiroThinker 1.5 的核心發力點,在于通過 Interactive Scaling 打破孤立推理的僵局,將「推理」與「外部環境」深度耦合。通過構建「推理 - 驗證 - 修正」循環,引入外部信息作為校驗錨點,用確定性的證據流來對沖不確定性的推演,解決邏輯坍塌問題。

      Training-time Interactive Scaling 技術

      當智能的 Scaling 范式不再局限于模型內部龐大的世界知識儲備與縝密的長程邏輯推理,而是依托模型高頻與外部世界中探索與交互并獲得閉環反饋時,小而高效的探索者模型能展現比肩于甚至超出大而嚴謹的思考者模型的智力水平。

      MiroThinker 1.5 正是基于這一判斷,將 Interactive Scaling 從推理階段的外掛能力,前移并內化為訓練階段的核心機制。模型并非被要求「盡量在腦中想清楚一切」,而是被系統性地訓練成一個善于向外求證、敢于否定自己、能夠快速修正路徑的 Agent。

      在訓練過程中,MiroMind 團隊刻意削弱對「單次完美推理」的獎勵,轉而強化以下行為模式:

      • Evidence-Seeking(主動求證): 模型被鼓勵將每一個關鍵判斷拆解為可驗證的子假設,并主動發起對外查詢、檢索與比對。結論本身不再是訓練目標,找到可靠證據的過程才是。缺乏信源支撐的高置信輸出,會在訓練中被系統性地懲罰。
      • Iterative Verification(多輪校驗與自我修正): 推理不被視為一次性路徑,而是一個可反復回溯、修正的過程。模型在交互中被要求不斷對已有判斷進行反證測試,一旦發現證據沖突,必須顯式調整假設,而非「帶著錯誤繼續推下去」。
      • Anti-Hallucination(對捷徑的系統性過濾): 對那些「看起來合理、但缺乏真實依據」的推理捷徑保持零容忍。訓練中不僅評估答案是否正確,更關注答案是如何得到的:任何依賴統計相關性、模式記憶或隱含先驗而繞過證據驗證的路徑,都會被標記為低質量推理。

      通過這種訓練方式,MiroThinker 1.5 逐步形成了一種「本能反應」:在不確定性面前,先交互、再判斷;在高風險結論前,先查證、再收斂。這使得模型不再需要將龐大的世界知識全部內化為參數,而是學會在需要時,快速、精準地向外部世界「借力」。

      最終,團隊用更小的參數規模,換來了更高的智能密度:不是讓模型記住更多,而是讓它學會如何找到、驗證并使用信息。這正是 MiroThinker 1.5 能在顯著降低推理成本的同時,依然保持一線性能的根本原因。

      時序敏感訓練沙盒

      時序敏感訓練沙盒,是破解「因果律」的鑰匙:普通大模型訓練常處在「上帝視角」—— 它在數據里早已「見過結果」,學到的往往是復述與「劇透」,而不是預測。MiroThinker 的訓練則約束模型「只能看過去,不能看未來」,在嚴格的時間可見性約束下做判斷、再用同樣受時序約束的證據去驗證與更新。

      • 可控數據合成引擎: 構建覆蓋多任務類型的、難度與時間戳可控的數據合成體系。每一道題目的「正確答案」并非靜態標簽,而是隨時間戳動態演化;模型必須在嚴格的信息可見性約束下,基于當時可獲取的信息做出判斷,而校驗過程同樣顯式引入時間戳約束,以確保推演與評分均符合真實世界的時序邏輯。
      • 時序敏感訓練機制:采用嚴格的時間戳與信息可見性約束,徹底杜絕 Future Leakage;模型在訓練過程中的每一步只能與發表于當前時間戳之前的信息進行交互。

      在這種訓練范式下,模型被迫學會在信息不完備、噪聲存在、信號延遲的真實條件下進行推演與修正,而不是依賴靜態數據集中的「標準答案」。時間由此從一個背景變量,轉變為塑造模型行為與推理方式的核心約束,使模型更接近真實世界中的認知與決策過程。

      樣例展示

      Case 1: A 股漲停板預測

      據介紹,這不是 「玄學」,更不是事后諸葛亮 —— 而是在信息極度噪聲化、情緒快速切換的盤面里,用開放世界證據 + 因果推斷去賭 「次日正確答案」。(注:以下僅為技術展示,不構成投資建議)

      • 12 月 10 日(周三)



      對話鏈接:https://dr.miromind.ai/share/07430808-d84d-4e40-9615-bf07d6e71365

      • 躍嶺股份| 16 只連板股,當天晉級僅 4 只,晉級率 25%,市場情緒顯著退潮。MiroMind 在 8 支二板股里,精準押中唯一晉級成功的那一支。
      • 12 月 11 日(周四)



      對話鏈接:https://dr.miromind.ai/share/eccc29b9-889b-43f9-b6bf-f4b2b7c8dc1e

      • 再升科技| 9 只連板股,當天晉級僅 2 只,晉級率 22%,市場環境持續降溫。MiroMind 命中 9 支連板股中高位晉級者 —— 退潮里選中 「活口」。
      • 12 月 12 日(周五)



      對話鏈接:https://dr.miromind.ai/share/e9db058d-3e8c-4922-b483-cf5efae2f414

      • 再升科技|13 只連板股,當天晉級 7 只,晉級率 54%,情緒強力回暖。MiroMind 不僅命中市場最高連板,還準確預判其繼續晉級(后續累計漲幅高達 58%)。
      • 12 月 15 日(周一)



      對話鏈接:https://dr.miromind.ai/share/3dc7dae0-78cb-4a97-8f61-359ab2d3e1a0

      • 華菱線纜|13 只連板股,當天晉級 5 只,晉級率 38%,市場再度明顯降溫。MiroMind 繼續命中:在情緒回落時仍能穿透噪聲,給出可復盤的確定性答案。

      Case 2: 下周有哪些大事件會對美股七巨頭產生影響?預期的市場反應和潛在波動方向是什么 ?



      對話鏈接:https://dr.miromind.ai/share/f4afae1a-21e1-4f6d-8eef-16909c2d7b79

      Case 3: GTA 6 明年能按時發布嗎?



      對話鏈接:https://dr.miromind.ai/share/10e5d1fd-c6b6-4b96-a2ed-4b776a3e1dcd

      人才招募

      MiroMind 面向全球持續招募人才,簡歷投遞:talent@miromind.ai

      產品體驗

      立即體驗 MiroMind,免費解鎖預測未來的能力: https://dr.miromind.ai/

      • Discord 頻道(#everything-prediction):https://discord.gg/F7EQFnYscV
      • 微信社群(MiroMind 預測未來):微信添加小助手 miromind001

      • Hugging Face 模型下載:https://huggingface.co/miromind-ai/MiroThinker-v1.5-235B
      • Github 代碼地址:https://github.com/MiroMindAI/MiroThinker
      • MiroFlow 開源框架:https://github.com/MiroMindAI/MiroFlow

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      陪睡陪玩只是冰山一角!萬達蒸發800億后,王思聰再次傳出大丑聞

      陪睡陪玩只是冰山一角!萬達蒸發800億后,王思聰再次傳出大丑聞

      民間平哥
      2025-12-25 14:54:58
      瓦良格號曾讓中國為之震撼的程度有多深?當時在場的專家給出評價:蘇聯采用的鋼材品質極佳

      瓦良格號曾讓中國為之震撼的程度有多深?當時在場的專家給出評價:蘇聯采用的鋼材品質極佳

      老杉說歷史
      2025-12-31 20:55:11
      為了英國永居權我和60歲大爺結婚,誰知領證后大爺說:永居權給你

      為了英國永居權我和60歲大爺結婚,誰知領證后大爺說:永居權給你

      朝暮書屋
      2026-01-04 18:20:07
      中國有可能迎來巨大機遇,美國對委內瑞拉出手,就是在給中國機會

      中國有可能迎來巨大機遇,美國對委內瑞拉出手,就是在給中國機會

      小蔑談事
      2026-01-07 02:32:44
      委內瑞拉慶祝石油工業國有化 1976年1月3日《人民日報》

      委內瑞拉慶祝石油工業國有化 1976年1月3日《人民日報》

      那些看得見的老照片
      2026-01-04 16:57:43
      王毅外長發出統一最強音,向全世界通報兩件事,中國再也不避諱了

      王毅外長發出統一最強音,向全世界通報兩件事,中國再也不避諱了

      蛙斯基娛樂中
      2026-01-06 13:03:35
      臺民調顯示過半民眾不滿意賴清德施政,國臺辦回應

      臺民調顯示過半民眾不滿意賴清德施政,國臺辦回應

      澎湃新聞
      2026-01-07 11:14:26
      章子怡坦言:你幫別人養孩子我管不著,但我兒女的撫養費必須給全

      章子怡坦言:你幫別人養孩子我管不著,但我兒女的撫養費必須給全

      小熊侃史
      2026-01-07 11:13:36
      父親是前外交部部長,妻子是閻維文愛女,他卻拒絕父輩光環靠自己

      父親是前外交部部長,妻子是閻維文愛女,他卻拒絕父輩光環靠自己

      不寫散文詩
      2026-01-03 14:36:15
      宏遠球迷給胡明軒取了一個新外號

      宏遠球迷給胡明軒取了一個新外號

      體育哲人
      2026-01-07 11:26:49
      曹春華任重慶市規劃和自然資源局黨組書記

      曹春華任重慶市規劃和自然資源局黨組書記

      中國經濟網
      2026-01-07 09:37:16
      日本鐵腕整治色情行業!首相放狠話保臉面,背后亂象刷新三觀

      日本鐵腕整治色情行業!首相放狠話保臉面,背后亂象刷新三觀

      天空空啊
      2026-01-06 22:42:06
      “大家的相親都是怎樣黃掉的呢?”網友:他說我太熱情,有壓力

      “大家的相親都是怎樣黃掉的呢?”網友:他說我太熱情,有壓力

      有趣的火烈鳥
      2026-01-07 11:12:06
      意外!國安隊剛往中超冬窗放了兩條鋒線大魚,就相繼被新東家搶走

      意外!國安隊剛往中超冬窗放了兩條鋒線大魚,就相繼被新東家搶走

      振剛說足球
      2026-01-07 10:08:58
      中美再現南海對峙?美航母拉警報:055加轟6來了

      中美再現南海對峙?美航母拉警報:055加轟6來了

      音樂時光的娛樂
      2026-01-07 05:31:35
      這一次來真的?白宮最新表態:特朗普考慮動用美軍獲取格陵蘭島!

      這一次來真的?白宮最新表態:特朗普考慮動用美軍獲取格陵蘭島!

      王爺說圖表
      2026-01-07 09:59:17
      風波升級!閆學晶拒不認錯,再現囂張嘴臉,再多名和利也救不了她

      風波升級!閆學晶拒不認錯,再現囂張嘴臉,再多名和利也救不了她

      以茶帶書
      2026-01-06 18:17:52
      文班復出30分阿爾達馬獻制勝蓋帽 灰熊主場險勝馬刺

      文班復出30分阿爾達馬獻制勝蓋帽 灰熊主場險勝馬刺

      北青網-北京青年報
      2026-01-07 11:46:04
      蔡正元即將坐牢,民進黨又下狠手,鄭麗文破防爆粗口,馬英九表態

      蔡正元即將坐牢,民進黨又下狠手,鄭麗文破防爆粗口,馬英九表態

      博覽歷史
      2026-01-06 17:57:28
      1月8號入三九,今年三九不一般,60年一遇,3大特點,早看早知道

      1月8號入三九,今年三九不一般,60年一遇,3大特點,早看早知道

      智慧生活筆記
      2026-01-06 15:40:29
      2026-01-07 12:08:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12068文章數 142530關注度
      往期回顧 全部

      科技要聞

      馬斯克殺瘋了!xAI官宣200億美元融資

      頭條要聞

      河北農村居民:"煤改氣"后 160平空間燃氣費最少8千元

      頭條要聞

      河北農村居民:"煤改氣"后 160平空間燃氣費最少8千元

      體育要聞

      全明星次輪票數:東契奇票王 詹皇超KD升西部第8

      娛樂要聞

      2026年央視春晚彩排:沈騰確定回歸

      財經要聞

      茅臺為何要和分銷商徹底說拜拜?

      汽車要聞

      蔚來2025百萬臺收官 一場遲到的自我修復

      態度原創

      教育
      本地
      房產
      健康
      公開課

      教育要聞

      果脯咋讀?噘嘴還是撅嘴?《咬文嚼字》發布“2025年十大語文差錯”;快來看看,這些你都讀寫正確了嗎? #咬文嚼字 #語文 #讀音 #錯別字

      本地新聞

      云游內蒙|初見呼和浩特,古今交融的北疆都會

      房產要聞

      海珠雙冠王!中交天翠以強兌現力+生活溫度,筑就長期主義產品

      這些新療法,讓化療不再那么痛苦

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 澜沧| 少妇高潮灌满白浆毛片免费看| jizz日| 国产精品秘?久久久久久| www插插插无码视频网站| 午夜综合网| 国产精品一区久久av| 强行无套内谢大学生初次| 91亚洲视频| 日韩中文字幕人妻无码| 婷婷六月色| 久久精品私人影院免费看 | 爱情岛论坛首页永久入口| 欧美日韩导航| 九一九色国产| 亚洲成人视屏| 无码少妇一区二区三区免费| 情侣作爱视频网站| 册亨县| 一本色道久久88亚洲精品综合| 影音先锋91| 国产无套视频在线观看香蕉| 无码av最新无码av专区| 久久国产自拍一区二区三区| 欧美一区内射最近更新| 91精品人人妻人人澡人人爽人人精东影业| 国产成人综合在线观看| 成全影院电视剧在线观看| 九九热久久只有精品2| 日韩欧美猛交xxxxx无码| 欧美啊v| 日韩无码一卡| 三人成全免费观看电视剧高清| AV国内高清啪啪| 成在线人av免费无码高潮喷水| 97人人模人人爽人人喊网| 亚洲精品无码乱码成人| 日韩A视频| 中文无码第一页| 91在线视频播放| 国产美女久久精品香蕉|