<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      agno v2.3.21版本發(fā)布詳解:AgentOS全面支持Agent As Judge評(píng)測(cè)與多項(xiàng)穩(wěn)定性增強(qiáng)

      0
      分享至




      2025年12月23日,agno 官方發(fā)布了 v2.3.21 版本。本次更新在保持高性能和私有化架構(gòu)優(yōu)勢(shì)的基礎(chǔ)上,重點(diǎn)增強(qiáng)了 AgentOS 對(duì)評(píng)測(cè)體系的支持,同時(shí)修復(fù)了多個(gè)在實(shí)際生產(chǎn)和評(píng)測(cè)場(chǎng)景中可能遇到的問題,并補(bǔ)充了新的 Cookbook 示例。下面將基于本次發(fā)布內(nèi)容,對(duì) v2.3.21 的核心更新進(jìn)行系統(tǒng)梳理。

      一、核心新特性:AgentOS全面集成Agent-as-Judge評(píng)估

      本次更新最核心的增強(qiáng)在于對(duì)“Agent as Judge”(智能體作為評(píng)判者)評(píng)估功能的全面支持,并將其深度集成到了AgentOS控制平面中。

      1. 功能概述
      “Agent as Judge”是一種先進(jìn)的評(píng)估范式,它使用一個(gè)專門的智能體(Judge Agent)來評(píng)估另一個(gè)智能體(或團(tuán)隊(duì))在給定任務(wù)上的輸出質(zhì)量。這通常用于衡量響應(yīng)的準(zhǔn)確性、相關(guān)性、完整性等主觀性較強(qiáng)的指標(biāo)。與傳統(tǒng)的基于規(guī)則或簡(jiǎn)單字符串匹配的評(píng)估方式相比,Agent as Judge能夠利用大語言模型的理解能力,進(jìn)行更接近人類判斷的評(píng)估。

      2. 集成詳情
      在v2.3.21之前,開發(fā)者可能已經(jīng)能夠在Agno框架內(nèi)創(chuàng)建Agent as Judge評(píng)估邏輯,但管理和運(yùn)行這些評(píng)估可能不夠便捷。本次更新后,這一功能在AgentOS中獲得了完整的官方支持:

      • ? 配置與觸發(fā) :用戶現(xiàn)在可以直接在AgentOS的Evals(評(píng)估)頁面中,配置新的Agent as Judge評(píng)估任務(wù)并觸發(fā)其運(yùn)行。這為評(píng)估工作流提供了統(tǒng)一的圖形化界面。

      • ? 統(tǒng)一管理 :Agent as Judge評(píng)估的運(yùn)行記錄將與現(xiàn)有的準(zhǔn)確性、性能、可靠性等評(píng)估結(jié)果一同,集中展示在Evals頁面中。這實(shí)現(xiàn)了對(duì)所有類型評(píng)估的集中監(jiān)控和管理,極大地提升了操作效率。

      • ? API端點(diǎn)增強(qiáng) :對(duì)應(yīng)的GET API端點(diǎn)也已更新,現(xiàn)在可以返回Agent as Judge評(píng)估的相關(guān)數(shù)據(jù),確保了控制平面與后端服務(wù)的數(shù)據(jù)一致性。

      3. 開發(fā)者價(jià)值
      這一集成意味著團(tuán)隊(duì)可以更系統(tǒng)化地對(duì)智能體的輸出質(zhì)量進(jìn)行監(jiān)控和迭代。例如,在產(chǎn)品上線后,可以定期用Agent as Judge評(píng)估客服智能體的回答是否恰當(dāng),或者審核內(nèi)容生成智能體的輸出是否符合安全規(guī)范。所有評(píng)估歷史和結(jié)果都可在AgentOS中追溯,為模型優(yōu)化和提示詞工程提供了數(shù)據(jù)基礎(chǔ)。

      二、關(guān)鍵問題修復(fù)

      v2.3.21版本修復(fù)了兩個(gè)可能影響開發(fā)體驗(yàn)和生產(chǎn)穩(wěn)定性的問題。

      1. RunInput對(duì)象持久化修復(fù)

      • ? 問題描述 :當(dāng)開發(fā)者將 RunInput 對(duì)象的 input_content 屬性設(shè)置為一個(gè) Message 對(duì)象的列表時(shí),框架在嘗試持久化(例如存入數(shù)據(jù)庫)該對(duì)象時(shí)會(huì)發(fā)生錯(cuò)誤。 RunInput 用于封裝單次智能體運(yùn)行的輸入信息,而 Message 是構(gòu)成對(duì)話歷史的基本單元。這個(gè)問題會(huì)導(dǎo)致包含復(fù)雜對(duì)話歷史的運(yùn)行記錄無法正確保存。

      • ? 修復(fù)內(nèi)容 :開發(fā)團(tuán)隊(duì)修復(fù)了 RunInput (及其對(duì)應(yīng)的 TeamRunInput )的 to_dict()input_content_string() 方法中的序列化邏輯。現(xiàn)在,當(dāng) input_content 是一個(gè)混合了 Message 對(duì)象、字典或其他基礎(chǔ)類型的列表時(shí),框架能夠正確地將所有元素遞歸地轉(zhuǎn)換為可JSON序列化的字典結(jié)構(gòu)。修復(fù)確保了無論輸入內(nèi)容多么復(fù)雜,都能被無歧義地轉(zhuǎn)換為字符串或字典格式,從而順利地進(jìn)行網(wǎng)絡(luò)傳輸或數(shù)據(jù)庫存儲(chǔ)。

      • ? 影響 :這個(gè)修復(fù)對(duì)于依賴會(huì)話歷史、實(shí)現(xiàn)復(fù)雜對(duì)話邏輯或進(jìn)行運(yùn)行審計(jì)的應(yīng)用至關(guān)重要。它保證了數(shù)據(jù)管道的可靠性。

      2. MistralEmbedder類超時(shí)設(shè)置修復(fù)

      • ? 問題描述MistralEmbedder 類用于調(diào)用Mistral AI的嵌入模型,將文本轉(zhuǎn)換為向量。在之前的版本中,其 timeout 參數(shù)(用于設(shè)置HTTP請(qǐng)求超時(shí)時(shí)間)的傳遞方式存在錯(cuò)誤,導(dǎo)致設(shè)置可能未生效或格式不正確。

      • ? 修復(fù)內(nèi)容 :修復(fù)了初始化Mistral客戶端時(shí)的參數(shù)映射。現(xiàn)在, timeout 參數(shù)會(huì)被正確地轉(zhuǎn)換并傳遞給底層的客戶端庫( timeout 秒被轉(zhuǎn)換為 timeout_ms 毫秒)。這保證了開發(fā)者可以有效地控制嵌入過程的等待時(shí)間,避免因網(wǎng)絡(luò)問題或服務(wù)延遲導(dǎo)致進(jìn)程無限期掛起。

      • ? 影響 :該修復(fù)提升了使用Mistral嵌入模型進(jìn)行知識(shí)庫構(gòu)建(RAG)時(shí)的穩(wěn)定性和可預(yù)測(cè)性。特別是在處理大量文檔或網(wǎng)絡(luò)環(huán)境不穩(wěn)定時(shí),合理的超時(shí)設(shè)置可以防止整個(gè)工作流阻塞。

      三、新增實(shí)用示例:語音轉(zhuǎn)文本工作流

      本次更新在cookbook中添加了一個(gè)全新的、名為“Speech to Text”的示例目錄,展示了如何利用Agno構(gòu)建一個(gè)端到端的語音轉(zhuǎn)文本應(yīng)用。

      1. 示例結(jié)構(gòu)
      該示例包含了多個(gè)獨(dú)立的腳本和一個(gè)完整的工作流,演示了不同的實(shí)現(xiàn)方式和集成深度:

      • ? 基礎(chǔ)單智能體轉(zhuǎn)錄

        • ? stt_openai_agent_simple.py :使用OpenAI的語音模型(gpt-audio)進(jìn)行簡(jiǎn)單轉(zhuǎn)錄,返回純文本。

        • ? stt_openai_agent.py :同樣使用OpenAI模型,但通過 parser_model (如gpt-5-mini)將轉(zhuǎn)錄結(jié)果解析為結(jié)構(gòu)化的Pydantic模型輸出(包含說話人、每句話文本等字段)。

        • ? stt_gemini_agent.py :使用Google Gemini模型進(jìn)行結(jié)構(gòu)化轉(zhuǎn)錄,展示了模型無關(guān)的特性。

      • ? 高級(jí)工作流stt_workflow.py :演示了如何構(gòu)建一個(gè)Agno Workflow,將音頻URL獲取、音頻格式轉(zhuǎn)換(如MP3轉(zhuǎn)WAV)、智能體轉(zhuǎn)錄、結(jié)構(gòu)化輸出生成等多個(gè)步驟編排成一個(gè)自動(dòng)化流程。該工作流可部署到AgentOS,提供一個(gè)完整的服務(wù)端點(diǎn)。

      2. 技術(shù)亮點(diǎn)

      • ? 多模態(tài)支持 :示例核心利用了Agno智能體原生的多模態(tài)處理能力。通過 agno.media.Audio 類,可以直接將音頻字節(jié)數(shù)據(jù)或文件傳遞給智能體。

      • ? 結(jié)構(gòu)化輸出 :展示了如何通過定義Pydantic output_schema ,讓智能體返回高度結(jié)構(gòu)化的轉(zhuǎn)錄結(jié)果,而非雜亂文本,便于下游系統(tǒng)處理。

      • ? 工作流編排stt_workflow.py 是Agno Workflow能力的典型展示。它將不同的處理單元(函數(shù)、智能體)連接成有向無環(huán)圖,管理狀態(tài)傳遞和錯(cuò)誤處理,適用于生產(chǎn)級(jí)復(fù)雜任務(wù)。

      • ? 模型無關(guān)性 :示例同時(shí)使用了OpenAI和Gemini的模型,強(qiáng)調(diào)了Agno可以輕松切換底層AI提供商。

      3. 開發(fā)者價(jià)值
      這個(gè)示例為開發(fā)者處理音頻輸入場(chǎng)景提供了即用的模板。無論是構(gòu)建會(huì)議記錄工具、客服錄音分析系統(tǒng),還是任何需要將語音轉(zhuǎn)換為可分析文本的應(yīng)用,都可以以此為起點(diǎn)快速開發(fā)。

      四、其他重要變更與文檔更新

      除了上述核心內(nèi)容,v2.3.21版本還包含了一系列細(xì)微但重要的調(diào)整。

      1. 數(shù)據(jù)庫集成調(diào)整
      agent_as_judge_basic.py示例中,數(shù)據(jù)庫從SQLite切換為了PostgreSQL,并提供了標(biāo)準(zhǔn)的連接字符串示例。這引導(dǎo)開發(fā)者從開發(fā)環(huán)境(SQLite)更平滑地過渡到生產(chǎn)環(huán)境(PostgreSQL)。

      2. 評(píng)估邏輯優(yōu)化
      在Agent as Judge評(píng)估運(yùn)行后,將評(píng)估結(jié)果記錄到數(shù)據(jù)庫時(shí),現(xiàn)在正確地將“評(píng)判者智能體”所使用的模型信息(model_id, model_provider)與“被評(píng)估智能體”的模型信息區(qū)分開來并分別存儲(chǔ)。這使得評(píng)估元數(shù)據(jù)更加清晰,便于分析不同評(píng)判者模型對(duì)評(píng)估結(jié)果的影響。

      3. README與文檔優(yōu)化
      項(xiàng)目的主README.md文件以及Cookbook的說明文檔cookbook/README.md都進(jìn)行了大幅重寫,風(fēng)格更加簡(jiǎn)潔、指向性更強(qiáng)。

      • ? 快速定位 :新文檔更明確地根據(jù)用戶目標(biāo)(“我想構(gòu)建單個(gè)智能體”、“我想讓智能體協(xié)作”、“我想部署和管理”)來引導(dǎo)讀者前往相應(yīng)的示例目錄。

      • ? 特性強(qiáng)調(diào) :更突出地強(qiáng)調(diào)了Agno“私有化部署”、“性能極致”、“生產(chǎn)就緒”的核心優(yōu)勢(shì)。

      • ? 入門引導(dǎo) :將“入門指南”和“完整演示”作為最優(yōu)先的路徑,降低新用戶的學(xué)習(xí)曲線。

      4. 依賴項(xiàng)更新

      • ? 將核心 agno 包版本升級(jí)至 2.3.21

      • ? 更新了 fastapifastapi-cliyfinance 等關(guān)鍵依賴的版本,以獲取最新的功能和安全補(bǔ)丁。

      五、總結(jié)與展望

      Agno v2.3.21版本是一次扎實(shí)的迭代,它沒有引入顛覆性的變更,而是在現(xiàn)有強(qiáng)大的基礎(chǔ)上進(jìn)行打磨和增強(qiáng)。

      • ? 對(duì)于評(píng)估與監(jiān)控 :通過將Agent as Judge深度集成到AgentOS,它為團(tuán)隊(duì)提供了企業(yè)級(jí)的智能體性能評(píng)估工具,使得基于LLM的定性評(píng)估變得可配置、可觸發(fā)、可追溯。

      • ? 對(duì)于框架穩(wěn)定性 :對(duì)RunInput序列化和MistralEmbedder超時(shí)的修復(fù),解決了特定場(chǎng)景下的潛在bug,提升了框架在處理復(fù)雜數(shù)據(jù)和外部服務(wù)調(diào)用時(shí)的魯棒性。

      • ? 對(duì)于開發(fā)者生態(tài) :新增的語音轉(zhuǎn)文本示例是一個(gè)高質(zhì)量、可直接復(fù)用的“菜譜”(Cookbook),豐富了Agno的應(yīng)用場(chǎng)景庫,展示了其在多模態(tài)和復(fù)雜工作流方面的強(qiáng)大能力。

      拓展視野:擁抱AI浪潮,關(guān)注行業(yè)前沿

      在鉆研Agno這類前沿多智能體技術(shù)的同時(shí),了解更廣闊的AI行業(yè)動(dòng)態(tài)同樣重要。如今,AI正以前所未有的深度重塑工作和創(chuàng)造力。

      在此為大家推薦一個(gè)高質(zhì)量的行業(yè)信息源——由脈脈平臺(tái)推出的 【脈向AI】 直播欄目。這個(gè)欄目專注于:

      核心價(jià)值:

      • ? 提供最新的AI工具、模型趨勢(shì)和行業(yè)深度解析

      • ? 邀請(qǐng)AI領(lǐng)域 頭部創(chuàng)作者、行業(yè)專家 分享一線經(jīng)驗(yàn)和未來洞見

      • ? 探討AI在內(nèi)容創(chuàng)作、效率提升、產(chǎn)品創(chuàng)新等場(chǎng)景的實(shí)際應(yīng)用

      • ? 提供 實(shí)時(shí)互動(dòng) 機(jī)會(huì),可直接向嘉賓提問并獲得解答

      ? 對(duì)開發(fā)者的意義:
      這不僅是了解行業(yè)趨勢(shì)的窗口,更是拓展技術(shù)視野、連接行業(yè)人脈、把握職業(yè)新機(jī)遇的平臺(tái)。在脈脈這個(gè)覆蓋超2億職場(chǎng)用戶的生態(tài)中,你能接觸到最真實(shí)的行業(yè)聲音和機(jī)會(huì)。

      參與方式:
      歡迎關(guān)注脈脈APP內(nèi)的 「脈向AI」 欄目,預(yù)約最新直播,與AI前沿保持同步。



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      匈牙利總理歐爾班承認(rèn)敗選:選舉結(jié)果令人痛苦,我們將變成反對(duì)派

      匈牙利總理歐爾班承認(rèn)敗選:選舉結(jié)果令人痛苦,我們將變成反對(duì)派

      王姐懶人家常菜
      2026-04-13 09:50:37
      特朗普考慮再打伊朗

      特朗普考慮再打伊朗

      農(nóng)視網(wǎng)
      2026-04-13 10:12:19
      特朗普再出招,霍爾木茲海峽的兩道封鎖線

      特朗普再出招,霍爾木茲海峽的兩道封鎖線

      南文視界
      2026-04-13 08:00:34
      1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

      1959年,18歲陳麗華與北京電信系統(tǒng)某位高管結(jié)婚,生下一子二女

      鑒史錄
      2026-04-12 20:00:55
      48架F-35壓境,美日撕破臉!王毅專機(jī)直插平壤,中朝抄了美軍后路

      48架F-35壓境,美日撕破臉!王毅專機(jī)直插平壤,中朝抄了美軍后路

      基斯默默
      2026-04-11 11:19:29
      以軍士兵在鏡頭前假裝與巴勒斯坦兒童互動(dòng),身旁兒童光著腳丫止不住顫抖

      以軍士兵在鏡頭前假裝與巴勒斯坦兒童互動(dòng),身旁兒童光著腳丫止不住顫抖

      觀威海
      2026-04-12 10:04:16
      美官員稱伊朗拒絕停止鈾濃縮及開放海峽等多項(xiàng)要求

      美官員稱伊朗拒絕停止鈾濃縮及開放海峽等多項(xiàng)要求

      財(cái)聯(lián)社
      2026-04-13 00:22:04
      是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國本土!

      是時(shí)候攤牌了,中方明確信號(hào):要打,戰(zhàn)火必須燒進(jìn)美國本土!

      史說方休
      2026-04-11 01:23:59
      再恩愛也沒用!上海38歲陳成去世,煙酒不沾,死因曝光,妻兒悲痛

      再恩愛也沒用!上海38歲陳成去世,煙酒不沾,死因曝光,妻兒悲痛

      北緯的咖啡豆
      2026-03-09 16:55:53
      上海正大量上市!“放避孕藥養(yǎng)的…”很多人愛吃但不敢吃!真相終于搞清了↗?

      上海正大量上市!“放避孕藥養(yǎng)的…”很多人愛吃但不敢吃!真相終于搞清了↗?

      愛下廚的阿椅
      2026-04-12 08:17:46
      “戲混子”又來霍霍年代劇?老氣橫秋、演技拉胯,難怪觀眾不買賬

      “戲混子”又來霍霍年代劇?老氣橫秋、演技拉胯,難怪觀眾不買賬

      科普100克克
      2026-03-27 00:17:05
      一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

      一夜之間,中國網(wǎng)球連奪2冠!吳易昺破荒,張帥解鎖全新紀(jì)錄!

      劉姚堯的文字城堡
      2026-04-13 10:12:02
      打破越南歷史慣例,蘇林時(shí)代權(quán)力格局已定,對(duì)中國意味著什么?

      打破越南歷史慣例,蘇林時(shí)代權(quán)力格局已定,對(duì)中國意味著什么?

      湘評(píng)中外
      2026-04-10 17:16:52
      王立群教授:用權(quán)力泡女人,女人在你面前服服帖帖,用金錢泡女人,女人是滿臉不服氣,甚至討價(jià)還價(jià)...

      王立群教授:用權(quán)力泡女人,女人在你面前服服帖帖,用金錢泡女人,女人是滿臉不服氣,甚至討價(jià)還價(jià)...

      深度知局
      2026-04-08 07:41:14
      留學(xué)行業(yè)的寒冬已經(jīng)來了!

      留學(xué)行業(yè)的寒冬已經(jīng)來了!

      英國大學(xué)申請(qǐng)中心
      2026-04-12 22:03:42
      牧夫座空洞直徑2.5億光年,卻幾乎什么都沒有,是誰摧毀了這里?

      牧夫座空洞直徑2.5億光年,卻幾乎什么都沒有,是誰摧毀了這里?

      觀察宇宙
      2026-04-11 21:26:55
      特斯拉兩款新車將上市,價(jià)格真的猛!

      特斯拉兩款新車將上市,價(jià)格真的猛!

      新浪財(cái)經(jīng)
      2026-04-12 16:52:49
      真敢說!伊朗談判團(tuán)抵達(dá)當(dāng)天,美國喊話稱中國有“義不容辭之責(zé)”

      真敢說!伊朗談判團(tuán)抵達(dá)當(dāng)天,美國喊話稱中國有“義不容辭之責(zé)”

      安珈使者啊
      2026-04-13 09:51:16
      天后麥當(dāng)娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

      天后麥當(dāng)娜:一生交往一百多猛男,與自己保鏢歡愛視頻,還被拍賣

      七阿姨愛八卦
      2026-04-09 09:32:37
      哇這大體格,目測(cè)身高175,身形如此的勻稱,男人心中的完美伴侶

      哇這大體格,目測(cè)身高175,身形如此的勻稱,男人心中的完美伴侶

      動(dòng)物奇奇怪怪
      2026-04-12 03:42:39
      2026-04-13 11:08:49
      moonfdd incentive-icons
      moonfdd
      福大大架構(gòu)師每日一題
      1177文章數(shù) 64關(guān)注度
      往期回顧 全部

      科技要聞

      李想向黑水軍開炮!連發(fā)5條朋友圈

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      頭條要聞

      牛彈琴:談判失敗美國不惜自殘 用的招夠狠夠損也夠蠢

      體育要聞

      創(chuàng)造歷史!五大聯(lián)賽首位女性主教練誕生

      娛樂要聞

      賭王女兒何超蕸病逝,常年和乳癌斗爭(zhēng)

      財(cái)經(jīng)要聞

      封鎖,還是收費(fèi)站?

      汽車要聞

      不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

      態(tài)度原創(chuàng)

      教育
      親子
      數(shù)碼
      藝術(shù)
      公開課

      教育要聞

      最新消息!加拿大擬放寬留學(xué)生工作限制

      親子要聞

      媽媽的手就是他的阿貝貝

      數(shù)碼要聞

      聯(lián)蕓將開發(fā)PCIe Gen6消費(fèi)級(jí)SSD主控MAP2001,瞄準(zhǔn)28GB/s

      藝術(shù)要聞

      毛主席致楊老太太罕見書信曝光,書法之美引發(fā)熱議!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版