今天,火山引擎2025冬季FORCE大會(huì)正在上海舉辦。
而地點(diǎn),正是上海世博中心。旁邊500米的地方,有一個(gè)標(biāo)志性的斗拱建筑,叫「中國(guó)館」。
![]()
它以“斗冠”為形,配以“中國(guó)紅”,形成了獨(dú)特的東方之冠。
我用剛剛發(fā)布的豆包1.8模型復(fù)刻了一下,長(zhǎng)這樣。

提示詞:參照 中國(guó)館.jpg 的外觀造型,用Three.js構(gòu)建一個(gè)可交互的【上海世博園·中國(guó)館】的3D頁(yè)面。(工具來(lái)自TRAE)
![]()
幾乎是完全還原,模擬了中國(guó)館的倒梯形結(jié)構(gòu)。
我還用它做了一個(gè)關(guān)于“華”字的3D游戲,很燃、很炸……快把我鍵盤(pán)都擼冒煙了。
提示詞:參考 中國(guó)館.jpeg 的結(jié)構(gòu)和顏色,創(chuàng)建一個(gè)形似“華”字的3D游戲頁(yè)面。“華”字被拆解成霓虹構(gòu)件。屏幕中央是一個(gè)巨大的、旋轉(zhuǎn)的 3D 線框“華”字。含有“華”字的成語(yǔ)(如:風(fēng)華正茂、才華橫溢、樸實(shí)無(wú)華、春華秋實(shí))像彈幕一樣襲來(lái),玩家需要輸入漢字來(lái)“充能”,讓中間的“華”字越來(lái)越亮,最終爆發(fā)成粒子煙花。
豆包1.8,有點(diǎn)東西。
![]()
模型介紹
簡(jiǎn)單介紹一下,剛剛發(fā)布的豆包大模型1.8。
![]()
1)更強(qiáng)的Agent能力
新一代模型,大幅增強(qiáng)了工具調(diào)用(Tool use)能力,比如Search、Computer use、Browser use等,擅長(zhǎng)執(zhí)行復(fù)雜的任務(wù)規(guī)劃和流程理解。
同時(shí),它的Coding能力也有所提升,相信你已在開(kāi)篇的2個(gè)前端case中看到。
而且,它的長(zhǎng)文和多輪指令遵循也有所提升。在benchmark中,相比上一代模型有大幅提升。
![]()
所以,這是一個(gè)非常適合復(fù)雜場(chǎng)景的企業(yè)級(jí)Agent部署的模型。
2)更精準(zhǔn)的多模態(tài)理解
同Gemini 3 Pro、GLM-4.6V一樣,豆包1.8的多模態(tài)理解能力這次也得了顯著增強(qiáng)。
![]()
尤其是視覺(jué)理解方面,不僅視覺(jué)理解的Tokens消耗更少,同步還理解精度更高,單次視頻理解幀數(shù)從640幀提升至1280幀。
同時(shí),思考長(zhǎng)度也支持自調(diào)節(jié),各模式下思考更精簡(jiǎn),Tokens更節(jié)省。
3)更靈活的上下文管理
上下文窗口支持256k,尤其擅長(zhǎng)超長(zhǎng)文本處理、復(fù)雜/多步流程任務(wù)。
據(jù)官方介紹,豆包1.8是國(guó)內(nèi)首個(gè)支持原生API進(jìn)行上下文管理的模型,僅需API傳參就可以靈活清理上下文,減少輸入tokens,大幅降低成本。
中譯中就是,豆包1.8把上下文管理從開(kāi)發(fā)者的負(fù)擔(dān),直接變成了模型API自帶的能力,既省tokens,又省開(kāi)發(fā)工程。
![]()
一句話總結(jié):豆包1.8在模型層面做了很多“工程友好性”的事情,同時(shí)也大幅優(yōu)化了自身在多模態(tài)、Agentic方面的能力,非常適合企業(yè)級(jí)Agent的部署。
![]()
豆包1.8實(shí)測(cè)
下面,我們來(lái)看一些實(shí)測(cè)案例。
首先第一個(gè),是我自己參加豆包1.8內(nèi)測(cè)時(shí)做的。
需求,是這樣的。
假設(shè)我是一名總經(jīng)理助理,現(xiàn)在收到5份AI項(xiàng)目的立項(xiàng)報(bào)告,我需要幫老板從中找出最合適的項(xiàng)目,并給出充分的理由。
這5份報(bào)告,各不相同,有pdf,有word,還有ppt。
![]()
真的,光看見(jiàn)這不同的格式,我頭都大了……還要自己進(jìn)行項(xiàng)目分析、總結(jié),這不得又要熬幾個(gè)晚上才能把方案肝出來(lái)吧。
于是,我把5份報(bào)告直接丟給豆包1.8。
![]()
輸入提示詞:
簡(jiǎn)短、明確、有說(shuō)服力。最終,豆包1.8給出的推薦項(xiàng)目是BT Code。
![]()
給出的理由是:BT Code項(xiàng)目瞄準(zhǔn)了零編程人員的藍(lán)海市場(chǎng),能夠快速釋放中小企業(yè)和非技術(shù)人群的軟件開(kāi)發(fā)需求。其清晰的免費(fèi)+增值商業(yè)模式確保了商業(yè)化可行性,在2000萬(wàn)預(yù)算下可實(shí)現(xiàn)快速落地和規(guī)模化。
全部分析結(jié)果,寫(xiě)成了一個(gè)HTML網(wǎng)頁(yè)。
![]()
全過(guò)程不到2分鐘,直出結(jié)果,這下不用熬夜了。
整個(gè)過(guò)程,我也錄了個(gè)視頻,大家可以看下。
而且,這版豆包的coding能力很強(qiáng),比如我做的這個(gè)3D城市,效果就很驚艷。
優(yōu)化措施:對(duì)所有重復(fù)出現(xiàn)的元素(如汽車、燈光)采用“實(shí)例化網(wǎng)格”技術(shù)進(jìn)行優(yōu)化處理。
![]()
這次,豆包大模型直接從1.6跳到了1.8。
這背后,不難看出字節(jié)對(duì)這一模型的重視。
多模態(tài)+Agent有沒(méi)有得搞?肯定有得搞,企業(yè)要把AI從Demo搬進(jìn)產(chǎn)線,這是繞不過(guò)的基座選擇。
而字節(jié),一直擅長(zhǎng)在性能、價(jià)格和速度之間交付最均衡的模型,豆包1.8就是如此。
![]()
假裝在活動(dòng)現(xiàn)場(chǎng),圖片來(lái)自@蒼何
更關(guān)鍵的是他們的戰(zhàn)略姿態(tài):喊All in AI,就真的All in,不扭扭捏捏,不左右互搏。
在新舊交替的窗口期,方向比速度更重要。
唯有篤定了方向,才能從從容容、游刃有余。
否則,就只能是匆匆忙忙、連滾帶爬。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.