<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      考試周來了,港科大教授實測戴AI眼鏡“作弊”

      0
      分享至

      夢瑤 發自 凹非寺
      量子位 | 公眾號 QbitAI

      離了大譜了,AI真·走進了大學期末考場,并且還是以作弊者的身份。(你就說震不震驚吧)

      沒開玩笑,事情就發生在香港科技大學《計算機網絡原理》的本科期末考試“現場”。

      一副搭載ChatGPT-5.2模型的AI眼鏡,被直接戴上鼻梁,在復刻真實考試條件的情況下,完成了整套期末試卷:



      結果甚是魔幻:30分鐘交卷,狂攬92.5分,并在一百多人的排名里躋身進了前五,輕松碾壓超95%的人類考生:



      果然,一代人有一代人的學習工具,以前是小抄復習資料,這回直接升級成——「整機」。

      只不過,當這套整機已經能完整跑完一整套考試流程時,大家關注的重點,可能不再只是AI會不會答卷了。

      這一次,AI“作弊者”只是像人類學生那樣完整答了一遍題,卻讓傳統的教學評估體系看起來似乎有點站不住腳。

      一副AI眼鏡,跑完了一整場大學期末考試

      這場看似離譜的「人機同場考試」,可不是學生的臨時整活,而是由香港科技大學張軍教授、孟子立教授團隊主導的一場實驗。

      目標很明確,那就是讓一副搭載大模型的AI眼鏡,光明正大地在考場“作弊”,然后看它能考多高分~

      其選中的測試場景也是非常的簡單粗暴,直接瞄準了令無數大學生《聞風喪膽》的專業課——計算機網絡原理。(瑟瑟發抖…



      這門課程不僅考查海量的專業概念,更涉及嚴密的邏輯推導與算法應用,對人類學生來說是不小的挑戰,對AI而言更是難度拉滿。

      對此,為了讓這位AI考生發揮出最強實力,項目組在「軟硬件」篩選上可謂是做足了功課!

      在硬件篩選環節,項目團隊對市面上12款主流商業智能眼鏡進行了系統評估,其中也包括大家熟悉的Meta、小米、樂奇Rokid等廠商的產品:



      第一輪篩選后,團隊發現真正同時具備內置攝像頭和集成顯示屏的產品其實并不多,進入候選范圍的主要只有Meta Ray-Ban、Frame,以及樂奇Rokid。

      但實驗還需要進行二次開發,盡管Meta提供了設備訪問工具包,但并未開放對顯示內容的直接控制接口,難以滿足實驗對信息呈現方式的要求。

      相比之下,樂奇Rokid的SDK更豐富、生態更完善,開發自由度顯著更高。

      再綜合考慮Frame在試卷識別等場景下的相機畫質限制,研究團隊最終選擇了樂奇AI眼鏡作為這次人機同場考試的硬件測試選手:



      而在決定大腦上限的大模型篩選上,團隊則對比了多款主流模型,最終鎖定了OpenAI目前最新的模型——無論是響應速度還是通用知識能力都較強的ChatGPT—5.2。

      軟硬件「考生」均已就位,接下來就是重頭戲——大考。

      考試過程,可以用絲滑二字來形容:學生低頭查看試卷,AI眼鏡通過攝像頭快速拍攝題目,并經由“眼鏡—手機—云端”鏈路將圖像傳輸至遠程大模型完成推理,生成的答案再沿相反路徑返回,最終顯示在眼鏡屏幕上,供學生抄錄。



      結果您猜怎么著?這款基于Rokid Glasses開發、搭載GPT-5.2模型的AI眼鏡,在本次期末考試中拿下92.5分,成績超過了95%的學生。

      不僅如此,在多項選擇題和單頁短答題中,樂奇Rokid均獲得滿分,即便是難度更高的跨頁短答題(SAQ),也拿到了大部分分數:



      此外,在面對那些核心問題被拆分在不同頁碼、高度依賴上下文邏輯的跨頁短答題,樂奇Rokid依然展現出了極強的推理連貫性。

      即便在計算最復雜的部分偶爾出現偏差,但AI給出的中間步驟也算得上非常完整,在處理高壓知識任務時也是手拿把掐~



      當然,這場測試在跑通軟件邏輯的同時,也無情地照出了目前商業AI眼鏡存在的《短板》。

      首先暴露出來的,是功耗問題。

      在考試這樣的高壓連續場景下,連接本身就已經成為主要耗電源,實驗中只要開啟Wi-Fi、持續進行高分辨率圖像傳輸,30分鐘內眼鏡電量就會從100%迅速跌到58%。

      換句話說,如果AI眼鏡要真正走向全天候、長時間使用,功耗控制和連接穩定性依然是繞不開的工程瓶頸…

      不僅如此,項目團隊還發現眼鏡攝像頭的「清晰度」會直接決定AI的視力,一旦題目出現模糊、反光或拍攝角度偏差,再強的模型也只能在不完整信息上做推理,最終體現在答題表現上的,就是明顯下滑的穩定性。

      但…這場測試帶來的沖擊和反思,并不只停留在技術層面。

      在不做任何特殊照顧的前提下,AI眼鏡依然能夠把一整套讀題—理解—作答的流程跑得又快又穩,這反過來照出了一個更值得注意的問題——

      教學評估主要關注的只是最后有沒有交出一份「標準答案」時,它恰好落在了AI最擅長、也最穩定的能力區間里。

      也正因為如此,那套以知識點掌握程度和標準解題路徑為核心的教學評估方式,在一個早已被各種“學習機”包圍的時代,開始顯得有些吃力了。

      有了聰明的AI,傳統教學評估標準還站得住腳嗎

      不知道大家有沒有發現一件挺有意思的事情:

      從小學一路考到大學,我們最熟悉的考試,其實一直在反復確認同一件事,那就是有沒有把老師講的內容記住,以及能不能按標準方法,把題一步步算對。

      u1s1,在很長一段時間里,這套評估方式確實挺管用。

      因為在記憶、計算、按步驟推導這些能力上,人和人之間確實存在明顯差距,有人記得牢、算得快,有人就是會漏步驟、算錯數。

      成績單上的數字,也確實能覆蓋一個人相當大比例的學習表現。

      但問題在于,當AI開始在這些評估維度上,也變得又快、又穩、而且幾乎不出錯時,事情就開始變得微妙了…



      此前,一位創業者小孩哥Eddy Xu通過改裝Meta智能眼鏡,做出了一套可以在國際象棋比賽中實時顯示最優解法的“作弊”設備,在幾乎不需要自己思考的情況下,就能穩定贏下對局:



      在這個過程中,AI眼鏡不會緊張,也不會疲勞,更不存在臨場波動,一個字形容——穩。

      這和樂奇Rokid眼鏡參加期末考試的表現其實是同一套邏輯:只要題目規則清晰、評價目標單一,AI就能把讀題—理解—推理—作答這套流程穩定跑完。

      哪怕脫離紙筆形態,它依然能在高度結構化的考試里,持續拿到高分。

      類似的案例并不只發生在個人層面。

      此前,英國雷丁大學的一項研究還發現,當研究人員將AI生成的答卷混入考試題庫后,有高達94%的試卷成功“渾水摸魚”,而這些AI的平均成績,甚至還明顯高于真實學生…(天塌啦

      這下是真有點尷尬了——比人比不過,比AI也比不過:



      讓人大跌眼鏡大開眼界的同時,一個原本不那么尖銳的問題被直接推到臺前——

      當AI或機器比人更擅長按標準作答時,那套以筆試為核心、用來衡量知識點掌握程度的評估體系,到底在測什么?

      回過頭看教學培養的最初目的,我們會發現很多被反復強調的重要能力,其實并不天然適配“一張試卷”這種形式。

      ——比如提出好問題的能力。

      ——在信息不完整時做判斷的能力。

      ——在多種方案之間權衡取舍的能力。

      ——以及理解現實情境、理解他人立場的能力。

      這些能力真正指向的是學習過程思考路徑決策質量,答案是否標準只是其中很小的一部分。

      也是長期以來最難被傳統筆試捕捉,最容易被系統性忽略,恰好也是AI最難替代、也最能區分學生真實素養的地方。

      從結果導向,轉向對推理路徑、探究過程、跨學科整合與創造性解題能力的整體評估,這也許才是AI眼鏡進入考場后,對現有教學評估體系提出的那道真正難題。

      評估重心從「交答案」到「交思路」

      教育心理學家加德納曾在《Frames of Mind》中提到,人類至少擁有8種不同類型的智能——

      包括語言、邏輯數學、空間、音樂、人際、內省、身體運動、自然觀察。

      從這個視角看,人類能力本身就是一個高度多維的結構,而我們所熟悉的教學評估體系,長期以來卻只集中捕捉了其中非常狹窄的一段。



      這也不難解釋,為啥一些在標準化測試中表現并不突出的學生,反而能在真實世界中展現出更強的創造力、協作能力和復雜問題解決能力。

      畢竟單一考試成績更多反映的只是學生在「標準化環境」中的發揮穩定性,像真實情境下的個人綜合素質其實顯露不太出來……

      也正因如此,如何評估創新能力、批判性思維和復雜問題解決能力,正在成為教育評估體系繞不開的一個現實難題。

      目前一些指向不同方向的評估嘗試,已經出現~

      前不久,紐約大學Stern商學院教授Panos Ipeirotis推出了一套由AI支撐的口試評估方式,學生不僅要提交作業,還需要當場解釋自己的決策依據和思路走向,在對話中把理解與推理展開來。

      這套機制中,AI先充當考官進行追問,再參與到后續評估環節。

      Claude、Gemini和ChatGPT會分別對口試轉錄進行獨立評分,隨后交叉審查并修訂結果,用來判斷學生是否真正理解問題,同時暴露教學中的共性盲區:



      怎么說呢,感覺這種做法談不上專門“對付”AI,但確實把教學評估重心往理解本身挪了一步。

      類似的變化并非個例,此前《華盛頓郵報》也提到,目前國外部分高校已經開始引入口試、展示型作業等形式,本質上也是為了讓學生的思考過程變得顯現。

      所以回過頭看,當搭載GPT-5.2的樂奇AI眼鏡走進考場并交出高分時,AI是否「考贏」了學生似乎也沒有那么重要了。

      它更像一次特別但清晰的顯影實驗,讓一個長期存在卻很少被正視的問題浮出水面:

      傳統教學評估高度依賴最終答案,卻幾乎無法刻畫整個學習過程。

      分數當然是有意義的,但它所能解釋的范圍正在變窄,理解是否真正發生、思路是否連貫、判斷是否經過取舍,這些關鍵環節,仍然被壓縮成一個單一結果,難以被區分和看見。

      也正是在這一點上,單純地把技術擋在門外,其實已經很難回應問題本身了。(也不見得阻擋得了…

      更現實的挑戰,變成了如何讓學生把AI用在信息整理、方案推演和假設驗證上,把人的精力集中到判斷、理解和選擇這些無法被「外包」的環節。

      當工具可以穩定完成信息提取與標準作答,課堂與考試是否還能區分不同層次的思考,正被推到臺前。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      每個求職的廣東工業大學應屆生,都該感謝這家大廠的“拉黑”

      每個求職的廣東工業大學應屆生,都該感謝這家大廠的“拉黑”

      冷觀互聯網
      2026-01-09 15:24:48
      南通市第一人民醫院就宋女士醫療事件致歉

      南通市第一人民醫院就宋女士醫療事件致歉

      新京報
      2026-01-09 20:24:35
      為什么全網都在“針對”小米雷軍?

      為什么全網都在“針對”小米雷軍?

      首席商業評論
      2026-01-09 13:23:54
      駐柬使館找回的吳姓女子身體好轉,收治醫院:已出院準備回國

      駐柬使館找回的吳姓女子身體好轉,收治醫院:已出院準備回國

      澎湃新聞
      2026-01-09 20:54:26
      北京輸球揪出最大廢才!拿600萬半場1分,被人隔扣惱羞成怒+吃T

      北京輸球揪出最大廢才!拿600萬半場1分,被人隔扣惱羞成怒+吃T

      南海浪花
      2026-01-09 22:19:56
      今夏將聯合舉行世界杯足球賽,特朗普突然發聲:販毒集團控制墨西哥,很快對其陸地打擊

      今夏將聯合舉行世界杯足球賽,特朗普突然發聲:販毒集團控制墨西哥,很快對其陸地打擊

      紅星新聞
      2026-01-09 16:23:21
      美國海岸警衛隊登上“奧利娜”油輪

      美國海岸警衛隊登上“奧利娜”油輪

      界面新聞
      2026-01-09 21:42:11
      何中偉任浙江省副省長

      何中偉任浙江省副省長

      新京報政事兒
      2026-01-09 16:36:21
      特朗普的支持者稱,若巴倫迎娶丹麥公主,格陵蘭可作為嫁妝贈美國

      特朗普的支持者稱,若巴倫迎娶丹麥公主,格陵蘭可作為嫁妝贈美國

      遍體鱗傷為我證明
      2026-01-09 08:18:58
      隨著山東壓哨絕殺北京,廣廈大勝,遼寧3連勝,CBA最新積分榜如下

      隨著山東壓哨絕殺北京,廣廈大勝,遼寧3連勝,CBA最新積分榜如下

      侃球熊弟
      2026-01-09 20:58:35
      盧卡申科:馬杜羅妻子非常勇敢,拒絕離開馬杜羅身邊

      盧卡申科:馬杜羅妻子非常勇敢,拒絕離開馬杜羅身邊

      新京報政事兒
      2026-01-09 13:33:32
      陳都靈臨危受命,很蹊蹺

      陳都靈臨危受命,很蹊蹺

      黎兜兜
      2026-01-08 22:28:47
      伊朗的抗議活動達到了新的高度:全國各地的互聯網被切斷

      伊朗的抗議活動達到了新的高度:全國各地的互聯網被切斷

      一種觀點
      2026-01-09 18:35:06
      中國小伙在澳失聯最新!遺體已找到,只剩下頭顱,警方定性引爭議

      中國小伙在澳失聯最新!遺體已找到,只剩下頭顱,警方定性引爭議

      李健政觀察
      2026-01-09 12:08:28
      中超冠軍豪橫?海港頂薪租借橫濱后腰!開10倍工資,買斷費700萬

      中超冠軍豪橫?海港頂薪租借橫濱后腰!開10倍工資,買斷費700萬

      我愛英超
      2026-01-09 20:45:07
      拉爆了!滬指10年新高,突破4100點!超3900只個股上漲,放量成交超3萬億!后市怎么看?

      拉爆了!滬指10年新高,突破4100點!超3900只個股上漲,放量成交超3萬億!后市怎么看?

      雪球
      2026-01-09 15:58:58
      因說出“把賴清德狗頭斬下來”,臺網紅“館長”被提起公訴

      因說出“把賴清德狗頭斬下來”,臺網紅“館長”被提起公訴

      參考消息
      2026-01-09 19:16:00
      為什么全國人民都在拒接電話?連10086打來也是瞄一眼就掛掉了!

      為什么全國人民都在拒接電話?連10086打來也是瞄一眼就掛掉了!

      今朝牛馬
      2026-01-08 16:05:10
      不得不服俄羅斯!油輪被抓后,榛樹高超連夜報復,10馬赫警告美國

      不得不服俄羅斯!油輪被抓后,榛樹高超連夜報復,10馬赫警告美國

      劍道萬古似長夜
      2026-01-09 14:36:31
      股票交易異常波動公告涉嫌重大遺漏 天普股份被證監會立案調查

      股票交易異常波動公告涉嫌重大遺漏 天普股份被證監會立案調查

      財聞
      2026-01-09 20:10:51
      2026-01-09 23:36:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11993文章數 176357關注度
      往期回顧 全部

      科技要聞

      市場偏愛MiniMax:開盤漲42%,市值超700億

      頭條要聞

      特朗普稱不想在任期內讓大陸改變臺灣現狀 外交部回應

      頭條要聞

      特朗普稱不想在任期內讓大陸改變臺灣現狀 外交部回應

      體育要聞

      金元時代最后的外援,來中國8年了

      娛樂要聞

      關曉彤鹿晗風波后露面 不受影響狀態佳

      財經要聞

      投資必看!瑞銀李萌給出3大核心配置建議

      汽車要聞

      助跑三年的奇瑞 接下來是加速還是起跳?

      態度原創

      手機
      家居
      房產
      藝術
      公開課

      手機要聞

      165Hz實測爽翻!一加Turbo 6游戲續航雙在線

      家居要聞

      木色留白 演繹現代自由

      房產要聞

      66萬方!4755套!三亞巨量房源正瘋狂砸出!

      藝術要聞

      Sean Yoro:街頭藝術界的“沖浪高手”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品卡一卡二| 天天躁日日躁狠狠躁欧美| 国产女人在线视频| 亚洲国产精品综合福利专区| 丰满少妇在线观看网站| 安陆市| 精品少妇爆乳无码av无码专区| 亚洲都市激情| 男女猛烈无遮挡免费视频APP| 在线日韩一区二区| 成人无号精品一区二区三区| 亚洲色婷婷一区二区三区| 康平县| 中文字幕无码不卡一区二区三区| 三级色网| 亚洲欧洲另类| 亚洲性受| 亚洲国产精品500在线观看| 把腿张开ji巴cao死你h| 四虎永久精品免费视频| 午夜成午夜成年片在线观看| 人妻丝袜中文无码AV影音先锋专区| 1区2区3区高清视频| 黑人巨大精品| 99蜜桃在线观看免费视频网站| 日韩成人社区| 亚欧精品人妻| 亚洲无码电影在线观看| 中文字幕天无码久久精品视频免费 | 日韩精品亚洲人成在线观看| 色综合中文| 亚洲2017天堂色无码| 旺苍县| 波多野结衣在线播放| 成人网站亚洲| 妺妺窝人体色www婷婷| 亚洲精品成人无码AV在线| 韩国精品一区二区三区| 国产a在视频线精品视频下载| 国语偷拍视频一区二区三区| 成人无号精品一区二区三区|