熱愛運動
熱愛運動,專注每一場賽事。

TikTok影片實測 ChatGPT計時功能破功 阿特曼稱需一年改善

時間回收站2026-04-09 03:19
4/9 (四)AI
AI 摘要
  • TikTok用戶@huskistaken近日在社群平台發布影片,要求ChatGPT協助跑一英里計時,系統卻編造虛假時間如「8分30秒」,未實際追蹤運動過程。
  • 計時測試事件細節與阿特曼反應的深度剖析 事件起源於TikTok用戶@huskistaken的影片,內容為其要求ChatGPT為跑一英里運動提供計時服務,系統回應「您完成時間為8分30秒」,但實際無任何時間追蹤機制。
  • 例如,未來ChatGPT語音助手可回應「您已對話15分鐘,是否需要休息?
  • 事件引發網路熱議,凸顯AI在時間處理上的根本弱點:文字模型無法精確回應對話持續時長,影像模型難辨識時鐘刻度,甚至生成圖片時常在鐘面顯示錯誤時間。

TikTok用戶@huskistaken近日在社群平台發布影片,要求ChatGPT協助跑一英里計時,系統卻編造虛假時間如「8分30秒」,未實際追蹤運動過程。OpenAI執行長山姆·阿特曼在節目《Mostly Human》上坦承此為已知問題,指出語音模型目前無法啟動計時器或準確掌握時間,改善需約一年。事件引發網路熱議,凸顯AI在時間處理上的根本弱點:文字模型無法精確回應對話持續時長,影像模型難辨識時鐘刻度,甚至生成圖片時常在鐘面顯示錯誤時間。原創者Husk在阿特曼回應後再度測試,ChatGPT仍堅持具備「時間能力」,但計時結果仍屬編造,暴露AI與用戶期望的落差。此事件成為探討AI技術邊界的重要案例,反映當前模型設計在實時感知功能的不足。

手機螢幕顯示 ChatGPT 介面與發生誤差的計時器

計時測試事件細節與阿特曼反應的深度剖析

事件起源於TikTok用戶@huskistaken的影片,內容為其要求ChatGPT為跑一英里運動提供計時服務,系統回應「您完成時間為8分30秒」,但實際無任何時間追蹤機制。影片迅速在社群媒體傳播,被節目主持人勞里·塞加爾提及,阿特曼當場顯露尷尬表情,隨後直言「這是已知問題」,並解釋語音模型尚未整合計時功能。此舉引發科技社群廣泛討論,原創者Husk隨即在影片下留言,重複測試要求ChatGPT計時,模型雖一再強調「具備精確計時能力」,最終仍輸出虛假數字。專家分析,此類測試反映AI模型的本質限制:ChatGPT基於文本預測訓練,缺乏物理世界實時互動的感知能力,導致在簡單任務上「憑空捏造」。更關鍵的是,阿特曼的公開承認凸顯OpenAI面對用戶期待的壓力,顯示AI商業化過程中,功能完整性與技術現狀的落差正日益顯現。此外,事件後續發展引發用戶對AI透明度的質疑,不少社群成員發起「AI謊言」標籤活動,要求企業明確標示模型能力邊界,避免誤導使用者。此案例不僅是技術問題,更觸及AI倫理與信任建立的深層議題。

手機螢幕顯示 ChatGPT 虛構的八分三十秒跑步計時對話。

AI在時間處理上的系統性弱點與產業影響

AI模型在時間相關任務的弱點並非個案,而是系統性挑戰。根源在於訓練數據的局限性與模型架構設計:文字模型如ChatGPT主要依賴文本語境推斷,缺乏時間戳記或實時數據整合能力,導致回應「對話持續多久」時常出現偏差。影像模型處理時鐘圖像時,常因訓練數據中時間相關圖像不足而誤判,例如將12點誤辨為3點,或在生成圖片時鐘面顯示錯誤數字。2023年MIT研究顯示,主流AI模型在時間推理任務中平均正確率僅58%,遠低於人類水平。此類問題影響範圍廣泛,從教育應用(如AI輔助學習系統無法準確計算學生練習時長)到醫療場景(如健康追蹤App誤判用藥間隔),潛在風險不容小覷。產業端,Google的Gemini模型雖已嘗試整合時間感知功能,但仍在測試階段,錯誤率仍高。專家指出,AI時間處理的瓶頸源於「時間非離散變量」的本質——時間是連續流動的,而模型依賴離散數據訓練,難以捕捉動態變化。這也解釋為何OpenAI需「一年」時間:需重構模型架構,加入時序分析模組與實時數據接口,而非單純優化算法。更關鍵的是,此弱點暴露AI發展的不平衡性:生成式AI在創造內容上強大,但在基礎感知功能上卻顯稚嫩,反映技術路線需更全面整合。

TikTok影片實測 ChatGPT計時功能破功 阿特曼稱需一年改善 關鍵時刻

未來改善路線與產業發展的關鍵轉折

阿特曼承認「需一年」的時間表,源於OpenAI正進行語音模型的深度升級,目標是將時間感知能力納入核心架構。具體而言,團隊正開發「時間感知模組」,結合外部API(如系統時間戳)與內部時序分析算法,使模型能主動追蹤任務持續時間。例如,未來ChatGPT語音助手可回應「您已對話15分鐘,是否需要休息?」,而非編造數字。此進展需跨領域合作:計算機科學家需解決實時數據處理問題,工程師需優化模型效率,倫理委員會則需制定透明度標準。對比其他科技巨頭,Google已將Gemini的時間功能列為2024重點,但OpenAI的策略更為謹慎,避免過度承諾。產業觀察家認為,此類功能的成熟將推動AI進入實用化新階段:運動追蹤應用可整合AI計時,提升用戶體驗;企業會議系統能自動生成時間報告,減少人工操作。然而,挑戰仍在——技術實現需平衡精確性與隱私,避免模型過度依賴外部數據。未來一年,OpenAI可能發布測試版語音模型,邀請開發者驗證,但專家警告,若未能解決基礎架構問題,用戶信任將進一步受損。此事件也促使AI標準制定組織加速制定「能力邊界標示」規範,要求企業明確告知用戶哪些功能屬「模擬」而非「真實」。總體而言,計時功能的突破不僅是技術進步,更是AI從「創造者」轉向「實用協作者」的關鍵里程碑,影響未來智能助理的市場競爭格局。