<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      實測豆包1.8后,我終于明白字節為什么要推豆包手機了。

      0
      分享至

      大家好,我是袋鼠帝

      好久沒有因為一款國產模型,產生這種明顯的期待感了。

      這次,是豆包1.8。


      在這個大家都忙著做年終總結的十二月,我本來以為AI圈能消停一會兒。

      沒想到,字節不講武德,又搞事情。

      今早我的朋友圈、各社群直接被火山引擎冬季FORCE原動力大會刷屏了..




      從節奏上看,字節這幾年在AI這條路上,一直走得非常穩。產品和模型并行發展,從文本到多模態,從對話到Agent,再從云端走到端側。

      這次原動力大會,又是一次階段性成果的集中展示。

      其中,豆包大模型1.8,作為字節新一代主力模型,正式接棒。

      注意,是主力模型。

      是接下來一段時間里,字節在企業Agent、應用層、工具鏈上真正要用、要打的那個模型。

      先看看跑分:在教育、客服、金融、法律、審核等多個場景測評中處于領先水平


      Agent能力和多模態理解能力非常強,直逼Gemini3 Pro


      看得出來,這次不是單項能力的突破,明顯沖著一個目標去的:復雜Agent,尤其是企業級Agent。

      比如,我可以讓它全自動幫我獲取apikey,并配置到開源Agent平臺-Fastgpt上了

      雙手離開鍵盤~(順便聽一聽我最近一直單曲循環的歌)

      說實話,第一眼看到豆包1.8的能力,我是有點驚喜的。

      這一看就是能干實事的。因為下面這三個點能同時滿足,這在國產模型里,是獨一檔了。

      >/ 第一:Agent能力往前走了一大步。

      多工具調用能力增強,多輪指令遵循的穩定性大幅提升,長文指令不再容易跑偏,執行規劃能力更強。

      尤其是OS Agent:支持Agent去屏幕上操作,它能幫我干很多事兒。

      在很多真實業務里,最后一公里從來不是推理,而是操作。

      在屏幕上完成一些相對復雜的點點點的任務,這些事情對人來說可能很簡單,但對模型來說一直是難點。

      豆包1.8把這件事當成重點去做,本身就是一個非常務實的信號。也很有可能就是沖著豆包手機去的。

      >/ 第二:256K的超長上下文,是真的好用。

      目前國產的主力大模型,大部分都是200K的上下文長度,而豆包1.8支持了256K~

      但如果只是能讀得多,管理不好也不行,畢竟上給模型的上下文不是越多越好,而是越精準越好。

      豆包1.8的一個關鍵點在于,它支持通過原生API做上下文管理,什么意思?

      你不再需要每次把所有歷史上下文一股腦塞進去,而是可以像整理文件夾一樣,按需清理、按需保留。

      這在企業級 Agent 場景里,價值非常大。

      一方面,成本直線下降。另一方面,模型的注意力更集中,執行穩定性也會更好。

      >/ 第三:多模態能力這次是真的實打實升級了。

      視覺理解精度提升,圖片token消耗更少,視頻理解能力再提升。

      單次視頻理解從640幀提升到1280幀,在1秒1幀的情況下,可以完整理解20分鐘的視頻內容。

      如果再配合火山方舟應用實驗室的Video Cup Tool,可以先低幀率掃全片,再高幀率聚焦關鍵片段。

      這個邏輯,非常像一個聰明人快速學習新知識的方法。先快進掃一遍,再倒回來看重點。

      這三點放在一起,我覺得豆包1.8非常適合搭建復雜Agent,跑真實流程。

      之前,其他模型不太能完成的復雜任務,現在好像可以試著交給它了。

      于是我快速做了幾個測試(難度越來越高),想看看它在復雜、多步驟、容易出錯的真實任務里,表現到底穩不穩。

      因為Agent最怕的不是不行,而是半行不行的。。。要么跑著跑著少一步,要么順序亂,要不就死循環,或者慢慢跑偏。

      目前火山引擎已經支持了豆包1.8的API


      為了方便快速用豆包1.8搭建Agent,我把豆包1.8接入了Trae使用


      并集成了我認為最好用的瀏覽器自動化MCP-Server:playwright mcp


      話不多說,我們開始!

      多平臺電商篩選比價 + 跨平臺加購

      先用這個案例來小試牛刀,如果這個任務跑不出來,后面的也不用看了。

      Prompt:全程使用playwright MCP工具,先在淘寶上尋找一款半入耳式藍牙耳機,價格區間在500-1000元之間。找到滿足以上條件并且銷量第一的那款耳機(可能有百億補貼,導致顯示的價格比500低,也可能是淘寶的bug,反正不管,固定價格區間后選定銷量第一就行了),然后在唯品會和京東進行這款耳機的比價,找到價格最便宜的同款耳機,添加到我的購物車中。

      這個任務里,難點不在于找耳機。

      難在三件事:

      第一,要在平臺篩選、過濾,找到符合要求的正確的商品。

      第二,要能跨平臺識別同款商品。

      第三,最后一步需要實際操作,加購。

      但是某寶有點der啊,為什么選擇了價格區間在500-1000,還有這么多500元以下的?


      這個現象一度讓豆包1.8懷疑自己

      豆包1.8內心:啊???我不是固定了500-1000價格嗎,為什么還有500以下的,不對,我再看看。

      于是我加了一句提示:

      可能有百億補貼,導致顯示的價格比500低,也可能是淘寶的bug,反正不管,固定價 格區間后選定銷量第一就行了

      執行過程見視頻:

      從執行過程來看,豆包1.8在幾個關鍵節點上表現都很穩。

      它先打開了某寶,在搜索欄搜索半入耳式藍牙耳機,并篩選了500-1000的價格區間,以銷量排序,進入商品詳情頁確認了商品名稱。

      然后打開某品會,搜索同款商品,對比價格,最后打開某東,發現某東的價格是最便宜的,并加入了購物車。

      條件鎖定后,它不會反復橫跳。在不同平臺頁面結構差異很大的情況下,正確定位了商品信息。在加購這一步,沒有出現誤點或卡死。

      整個過程像是一個熟練用戶在操作,每一步都比較精準。

      但就是還是Agent的老問題,整個過程有點慢,看得著急(急性子估計用不了),好在最后順利完成了。

      當然這里面有模型推理思考的時間,還有就是playwright MCP雖然已經是目前非常好用的瀏覽器自動化工具了,但是每次打開新頁面,模型都要通過playwright拿到頁面快照,然后分析定位元素,最后執行操作,要調用多個工具協同完成,這個過程也比較耗時。

      B站「影視颶風」互動任務

      既然第一個任務成功了,那接下來難度升級

      正好今天火山的大會Tim也去了,我們來給他的頻道增加點互動~

      這個任務需要打開B站,進入影視颶風主頁,從投稿列表里篩選最近發布且播放量超過500萬的3個視頻,保存鏈接。然后逐個訪問,根據獲取到的信息,分別發出三條貼合內容的評論。

      Prompt:請幫我登錄B站,去“影視颶風”的個人主頁執行一個互動任務。為了防止頁面刷新導致迷路,請你嚴格按照先找齊鏈接,再逐個訪問的順序來操作:

      第一步,篩選視頻。請進入他的“投稿”列表,保持默認的“最新發布”排序。請耐心地從上往下滾動瀏覽,仔細查看每一個視頻的播放數據,直到找出最近發布的、且播放量明確超過500萬的3個視頻。找到后,請先把這3個視頻的鏈接保存下來。

      第二步,發送評論。請依次直接訪問這3個鏈接。每進入一個視頻,先花點時間讀取一下視頻簡介和底下的高贊評論,了解視頻的核心看點。然后,基于這些信息,分別寫一條言之有物、符合科技區粉絲調性的評論并發送。注意,三條評論的內容要完全不同,必須貼合各自的視頻主題。注意:評論的時候你一定要輸入自己思考后的內容,并點擊發布,不要被評論輸入框中自帶的文字誤導了

      執行過程如下:

      這個任務頁面多,信息雜,需要判斷、總結,還要生成貼合視頻的評論內容。

      豆包1.8的表現,像一個知道自己在干嘛的人。

      它在主頁正確的篩選了最新的三條超500萬播放量視頻,并把鏈接收集齊,再逐個訪問。

      在評論生成上,沒有套模板,會根據視頻主題調整語氣和內容,像一個老粉一樣(雖然我是新粉 哈哈哈)。

      創建火山API Key + Fastgpt配置

      這個任務,我刻意選了一個容易翻車的場景。偏向開發者日常。

      我幾個月前用某模型來測試過,一直是死循環,硬是選不中對的按鈕。

      Prompt:進入火山引擎,控制臺,找到火山方舟并進入,在apikey那里,新建一個apikey并復制。打開fastgpt,登錄進去,根據 fastgpt操作截圖.png 新增模型,除了apikey,其他都填test即可。火山引擎地址: https://www.volcengine.com/,fastgpt地址:http://localhost:3000/ 用戶名:root,密碼:1234

      下面是我給豆包1.8的fastgpt的操作截圖


      這個任務,幾乎集齊了Agent所有痛點,非常考驗模型的綜合理解能力。

      難點在于,模型需要識別圖片上的操作指引,而且步驟非常細,任何一步錯了,后面都走不通。

      包括頁面跳轉、字段識別、復制粘貼、表單提交。

      跑下來,一個明顯的感受是,豆包1.8對頁面結構的理解很扎實,視覺能力也很強。

      不會因為頁面稍微復雜,就迷路。

      而且在長指令下,步驟執行順序穩定,沒有出現跳步或重復。

      這些對于Agent應用,非常關鍵。

      如果把視角再拉遠一點,你會發現,豆包1.8的很多能力,其實已經在為另一個方向鋪路。

      那就是端側Agent。

      最近備受爭議的豆包手機,我覺得就是一個非常直觀的嘗試。

      系統級AI助手這件事,跨App自動化,系統級權限,模擬操作。

      這些能力,在技術上是很酷的,但在現實生態里,必然會遇到阻力。

      這不是模型的問題,而是整個行業的博弈。

      豆包手機的意義,也不是賣了多少臺,而是驗證了一件事:

      當模型的Agent能力足夠強,系統級AI助手這條路,是必然走得通的。

      只是,怎么走,走多快,需要時間,也需要一些妥協。

      豆包1.8的出現,無疑讓這條路更好走了

      最后,如果你關心的是,模型能不能真正幫你把事情做好,而不是陪你聊天。

      那這一代豆包,確實已經走到一個很關鍵的位置了。

      接下來,就看大家拿它,能做出什么樣的Agent了~

      我是袋鼠帝,持續分享AI實踐干貨,我們下期見!

      能看到這里的都是鳳毛麟角的存在!

      如果覺得不錯,隨手點個贊、在看、轉發三連吧~

      如果想第一時間收到推送,也可以給我個星標?

      謝謝你耐心看完我的文章~

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2:3惜敗巴薩!皇馬錯失新年首冠,阿隆索的賽后發言真的太low了!

      2:3惜敗巴薩!皇馬錯失新年首冠,阿隆索的賽后發言真的太low了!

      田先生籃球
      2026-01-12 08:56:01
      想要我破產,比爭總冠軍還難!NBA這7人真敢這樣說:都是投資大神

      想要我破產,比爭總冠軍還難!NBA這7人真敢這樣說:都是投資大神

      毒舌NBA
      2026-01-13 10:09:08
      算命人說,家有這3生肖的人財氣纏身,2026年躲不過一富

      算命人說,家有這3生肖的人財氣纏身,2026年躲不過一富

      人閒情事
      2026-01-12 10:41:54
      新中國成立后,清政府遺留7.3億兩白銀爛賬,主席一招便成功化解

      新中國成立后,清政府遺留7.3億兩白銀爛賬,主席一招便成功化解

      嘮叨說歷史
      2026-01-07 14:51:34
      火箭黃蜂探花互換各取所需,是雙贏交易

      火箭黃蜂探花互換各取所需,是雙贏交易

      各生歡喜者
      2026-01-13 07:21:50
      蘇州一商場男廁所海報被指調侃女性,商場致歉

      蘇州一商場男廁所海報被指調侃女性,商場致歉

      深圳晚報
      2026-01-12 23:29:52
      一顆老鼠屎壞一鍋粥!央8《小城大事》被惡評,這位戲混子責任大

      一顆老鼠屎壞一鍋粥!央8《小城大事》被惡評,這位戲混子責任大

      史行途
      2026-01-13 09:25:11
      外交部:目前沒有得到有中國公民在伊朗傷亡的報告

      外交部:目前沒有得到有中國公民在伊朗傷亡的報告

      環球網資訊
      2026-01-12 16:04:42
      互聯網女高管月薪3萬遭裁員,上司送禮盒以為是錢,打開后她哭了

      互聯網女高管月薪3萬遭裁員,上司送禮盒以為是錢,打開后她哭了

      天夢見證
      2025-05-31 20:39:35
      三大“毒害”不去除,老百姓的錢被吸走了,經濟復蘇談何容易?

      三大“毒害”不去除,老百姓的錢被吸走了,經濟復蘇談何容易?

      貓叔東山再起
      2026-01-11 09:10:08
      三分30投僅7中!火箭隊心態崩了?申京賽后表態:提升防守+籃板

      三分30投僅7中!火箭隊心態崩了?申京賽后表態:提升防守+籃板

      熊哥愛籃球
      2026-01-13 10:43:59
      A股:周二上午傳來3大核彈級利空!今天很可能會迎更大級別大行情?

      A股:周二上午傳來3大核彈級利空!今天很可能會迎更大級別大行情?

      股市皆大事
      2026-01-13 08:59:57
      1-3!C羅解鎖3大紀錄,勝利德比遭逆轉,4輪丟11分,奪冠已成奢望

      1-3!C羅解鎖3大紀錄,勝利德比遭逆轉,4輪丟11分,奪冠已成奢望

      我的護球最獨特
      2026-01-13 03:36:28
      宋慶齡拒絕與孫中山合葬,坦言:她陪我53年,我答應要和她葬一起

      宋慶齡拒絕與孫中山合葬,坦言:她陪我53年,我答應要和她葬一起

      史之銘
      2026-01-12 16:26:19
      不老傳奇!NBA官方點贊四大巨星:詹杜庫登攜手刷新得分神跡

      不老傳奇!NBA官方點贊四大巨星:詹杜庫登攜手刷新得分神跡

      羅說NBA
      2026-01-13 06:27:07
      特朗普取打擊伊朗匯報,美國對伊朗的打擊可能隨時開始

      特朗普取打擊伊朗匯報,美國對伊朗的打擊可能隨時開始

      邵旭峰域
      2026-01-12 17:57:06
      女子在廣州遇“換錢騙局”,對方得手后騎車就跑!5公里內,還有2名女子同天被騙

      女子在廣州遇“換錢騙局”,對方得手后騎車就跑!5公里內,還有2名女子同天被騙

      齊魯壹點
      2026-01-12 16:22:09
      為什么不能去干涉別人的因果?網友:我30多了才明白這個道理

      為什么不能去干涉別人的因果?網友:我30多了才明白這個道理

      帶你感受人間冷暖
      2026-01-11 00:05:11
      網約車的戾氣已經到什么程度了:司機奉勸乘客少說話,不然容易出事

      網約車的戾氣已經到什么程度了:司機奉勸乘客少說話,不然容易出事

      六子吃涼粉
      2026-01-12 08:42:18
      曝快船不會拆散登卡祖!明確買家身份補強 剩余賽程第4容易有助北伐

      曝快船不會拆散登卡祖!明確買家身份補強 剩余賽程第4容易有助北伐

      天光破云來
      2026-01-13 10:12:27
      2026-01-13 11:11:00
      袋鼠帝 incentive-icons
      袋鼠帝
      持續分享AI實踐干貨,走超級個體崛起之路
      26文章數 16關注度
      往期回顧 全部

      科技要聞

      每年10億美元!谷歌大模型注入Siri

      頭條要聞

      媒體:巴基斯坦靠殲-10一鳴驚人后 北約成員國求保護

      頭條要聞

      媒體:巴基斯坦靠殲-10一鳴驚人后 北約成員國求保護

      體育要聞

      一場安東尼奧式勝利,給中國足球帶來驚喜

      娛樂要聞

      周杰倫以球員身份參加澳網,C位海報公開

      財經要聞

      中國一口氣申報20萬顆衛星,意味著什么?

      汽車要聞

      吉利持續加碼億咖通 智能化海外布局提速

      態度原創

      教育
      健康
      房產
      公開課
      軍事航空

      教育要聞

      燃動濱州!第二屆山東省中小學生海洋意識和素養展示活動圓滿落幕,少年逐浪向深藍

      血常規3項異常,是身體警報!

      房產要聞

      重磅調規!417畝商改住+教育地塊!海口西海岸又要爆發!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      官方確認:殲10CE在空戰中擊落多架戰機

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 五月花成人网| 二区av| 国产精品亚洲二区在线看| 亚洲成人在线网址| 亚洲精品国产美女久久久99| 亚洲精品久久久久久久久久吃药| 自拍偷拍网站| 亚洲+欧美+视频| 在厨房拨开内裤进入在线视频| 国产亚洲av手机在线观看| 在线视频一区二区三区不卡| 日韩在线不卡免费视频一区| 日本三级理论久久人妻电影| aa片在线观看视频在线播放| 91乱子伦国产乱子伦海的味道| 精品人妻少妇一区二区三区| 五月天婷婷一本到伊人| 2021亚洲爆乳无码专区| 黑人又粗又长又大| 浪漫樱花免费播放高清版在线观看| 内射中出高清晰| 久久精品| 亚洲一区二区精品另类| 亚洲欧美v国产蜜芽tv| 日韩AV中文字幕一区| 成人影片在线观看18| 精品无码国产自产拍在线观看| 唐山市| 9118禁| 亚洲日本国产精品一区| 无码人妻aⅴ一区二区三区蜜桃| 国产精品日本一区二区在线播放| 免费可以在线看a∨网站| 久久国产成人高清精品亚洲| 污污内射在线观看一区二区少妇| 91精品网| 老头边吃奶边弄进去呻吟| 97超碰人人| 国产av不卡一区二区| 色噜噜一区二区三区| 亚洲第一极品精品无码久久|