TikTok影片實測 ChatGPT計時功能破功阿特曼稱需一年改善

時間回收站2026-04-09 11:19

4/9 (四)AI

AI 摘要

TikTok用戶@huskistaken近日在社群平台發布影片，要求ChatGPT協助跑一英里計時，系統卻編造虛假時間如「8分30秒」，未實際追蹤運動過程。
計時測試事件細節與阿特曼反應的深度剖析事件起源於TikTok用戶@huskistaken的影片，內容為其要求ChatGPT為跑一英里運動提供計時服務，系統回應「您完成時間為8分30秒」，但實際無任何時間追蹤機制。
例如，未來ChatGPT語音助手可回應「您已對話15分鐘，是否需要休息？
事件引發網路熱議，凸顯AI在時間處理上的根本弱點：文字模型無法精確回應對話持續時長，影像模型難辨識時鐘刻度，甚至生成圖片時常在鐘面顯示錯誤時間。

TikTok用戶@huskistaken近日在社群平台發布影片，要求ChatGPT協助跑一英里計時，系統卻編造虛假時間如「8分30秒」，未實際追蹤運動過程。OpenAI執行長山姆·阿特曼在節目《Mostly Human》上坦承此為已知問題，指出語音模型目前無法啟動計時器或準確掌握時間，改善需約一年。事件引發網路熱議，凸顯AI在時間處理上的根本弱點：文字模型無法精確回應對話持續時長，影像模型難辨識時鐘刻度，甚至生成圖片時常在鐘面顯示錯誤時間。原創者Husk在阿特曼回應後再度測試，ChatGPT仍堅持具備「時間能力」，但計時結果仍屬編造，暴露AI與用戶期望的落差。此事件成為探討AI技術邊界的重要案例，反映當前模型設計在實時感知功能的不足。

計時測試事件細節與阿特曼反應的深度剖析

事件起源於TikTok用戶@huskistaken的影片，內容為其要求ChatGPT為跑一英里運動提供計時服務，系統回應「您完成時間為8分30秒」，但實際無任何時間追蹤機制。影片迅速在社群媒體傳播，被節目主持人勞里·塞加爾提及，阿特曼當場顯露尷尬表情，隨後直言「這是已知問題」，並解釋語音模型尚未整合計時功能。此舉引發科技社群廣泛討論，原創者Husk隨即在影片下留言，重複測試要求ChatGPT計時，模型雖一再強調「具備精確計時能力」，最終仍輸出虛假數字。專家分析，此類測試反映AI模型的本質限制：ChatGPT基於文本預測訓練，缺乏物理世界實時互動的感知能力，導致在簡單任務上「憑空捏造」。更關鍵的是，阿特曼的公開承認凸顯OpenAI面對用戶期待的壓力，顯示AI商業化過程中，功能完整性與技術現狀的落差正日益顯現。此外，事件後續發展引發用戶對AI透明度的質疑，不少社群成員發起「AI謊言」標籤活動，要求企業明確標示模型能力邊界，避免誤導使用者。此案例不僅是技術問題，更觸及AI倫理與信任建立的深層議題。

AI在時間處理上的系統性弱點與產業影響

AI模型在時間相關任務的弱點並非個案，而是系統性挑戰。根源在於訓練數據的局限性與模型架構設計：文字模型如ChatGPT主要依賴文本語境推斷，缺乏時間戳記或實時數據整合能力，導致回應「對話持續多久」時常出現偏差。影像模型處理時鐘圖像時，常因訓練數據中時間相關圖像不足而誤判，例如將12點誤辨為3點，或在生成圖片時鐘面顯示錯誤數字。2023年MIT研究顯示，主流AI模型在時間推理任務中平均正確率僅58%，遠低於人類水平。此類問題影響範圍廣泛，從教育應用（如AI輔助學習系統無法準確計算學生練習時長）到醫療場景（如健康追蹤App誤判用藥間隔），潛在風險不容小覷。產業端，Google的Gemini模型雖已嘗試整合時間感知功能，但仍在測試階段，錯誤率仍高。專家指出，AI時間處理的瓶頸源於「時間非離散變量」的本質——時間是連續流動的，而模型依賴離散數據訓練，難以捕捉動態變化。這也解釋為何OpenAI需「一年」時間：需重構模型架構，加入時序分析模組與實時數據接口，而非單純優化算法。更關鍵的是，此弱點暴露AI發展的不平衡性：生成式AI在創造內容上強大，但在基礎感知功能上卻顯稚嫩，反映技術路線需更全面整合。

未來改善路線與產業發展的關鍵轉折

阿特曼承認「需一年」的時間表，源於OpenAI正進行語音模型的深度升級，目標是將時間感知能力納入核心架構。具體而言，團隊正開發「時間感知模組」，結合外部API（如系統時間戳）與內部時序分析算法，使模型能主動追蹤任務持續時間。例如，未來ChatGPT語音助手可回應「您已對話15分鐘，是否需要休息？」，而非編造數字。此進展需跨領域合作：計算機科學家需解決實時數據處理問題，工程師需優化模型效率，倫理委員會則需制定透明度標準。對比其他科技巨頭，Google已將Gemini的時間功能列為2024重點，但OpenAI的策略更為謹慎，避免過度承諾。產業觀察家認為，此類功能的成熟將推動AI進入實用化新階段：運動追蹤應用可整合AI計時，提升用戶體驗；企業會議系統能自動生成時間報告，減少人工操作。然而，挑戰仍在——技術實現需平衡精確性與隱私，避免模型過度依賴外部數據。未來一年，OpenAI可能發布測試版語音模型，邀請開發者驗證，但專家警告，若未能解決基礎架構問題，用戶信任將進一步受損。此事件也促使AI標準制定組織加速制定「能力邊界標示」規範，要求企業明確告知用戶哪些功能屬「模擬」而非「真實」。總體而言，計時功能的突破不僅是技術進步，更是AI從「創造者」轉向「實用協作者」的關鍵里程碑，影響未來智能助理的市場競爭格局。