DeepSeek模型現(xiàn)'極'字異常輸出,技術(shù)團(tuán)隊(duì)確認(rèn)修復(fù)方案
時(shí)間:2025-09-04 來(lái)源: 作者: 我要糾錯(cuò)
DeepSeek V3.1版本近期出現(xiàn)了一個(gè)被開(kāi)發(fā)者稱為"極你太美"的技術(shù)故障,引發(fā)了廣泛關(guān)注。
具體表現(xiàn)為:開(kāi)發(fā)人員在調(diào)用API進(jìn)行編程時(shí),生成的結(jié)果中會(huì)隨機(jī)出現(xiàn)"極"字符號(hào)。
示例如下:
![]()
該問(wèn)題最初在火山引擎、chutes等平臺(tái)被察覺(jué),隨后迅速擴(kuò)散至更多服務(wù)平臺(tái),包括騰訊CodeBuddy以及DeepSeek官方平臺(tái)。
![]()
在國(guó)際開(kāi)發(fā)者社區(qū)Reddit上,這一問(wèn)題也引發(fā)了熱烈討論,主要涉及"extreme"、"極"和"極"等關(guān)鍵詞:
"extreme"(編號(hào):15075)
"極"(編號(hào):2577,中文簡(jiǎn)體中的extreme)
"極"(編號(hào):16411,中文繁體中的extreme)
騰訊CodeBuddy平臺(tái)甚至出現(xiàn)了更特殊的情況,直接插入了包含"極"字的推廣內(nèi)容。
△
圖片來(lái)源:小紅書用戶@奈緒白 Nine-piece shell
如果開(kāi)發(fā)人員未仔細(xì)檢查就直接使用生成的編碼,很可能導(dǎo)致編譯失敗等問(wèn)題,這對(duì)需要高精度、結(jié)構(gòu)化輸出的應(yīng)用場(chǎng)景造成了嚴(yán)重影響。
目前,業(yè)界普遍認(rèn)為問(wèn)題根源在于DeepSeek V3.1模型本身,CodeBuddy方面已表態(tài):
已與DeepSeek技術(shù)團(tuán)隊(duì)建立聯(lián)系,將在近期版本中完成修復(fù)。
△
圖片來(lái)源:微信公眾號(hào)"劉小排r"留言區(qū)
當(dāng)前如何規(guī)避"極"字異常?
雖然徹底解決需要等待官方更新,足球直播無(wú)插件但已有用戶開(kāi)始分享臨時(shí)應(yīng)對(duì)策略。
例如小紅書用戶@大模型產(chǎn)品經(jīng)理提出的提示詞調(diào)整方案:
![]()
關(guān)鍵提示詞設(shè)置為:
禁止以下符號(hào)序列模式:
[空格] [若干標(biāo)識(shí)符] [占位符/省略號(hào)]
該方法主要適用于調(diào)用API的第三方平臺(tái),DeepSeek V3.1官方平臺(tái)則無(wú)需此操作。
技術(shù)原因分析
關(guān)于該問(wèn)題的成因,知乎用戶、階躍星辰黃哲威提供了專業(yè)見(jiàn)解,獲得高度認(rèn)可。
![]()
他指出這種現(xiàn)象并非首次出現(xiàn)。在使用小型模型和開(kāi)源數(shù)據(jù)蒸餾,以及測(cè)試早期R1模型時(shí),就遇到過(guò)類似問(wèn)題。
黃哲威認(rèn)為這與大模型編程時(shí)可能出現(xiàn)的"異常模式"有關(guān)。英超聯(lián)賽他舉例說(shuō)明,在枚舉質(zhì)數(shù)的任務(wù)中,正常模型應(yīng)該持續(xù)列舉,如"質(zhì)數(shù)序列 2, 3, 5, 7 …"。
但他觀察到代號(hào)R1-0528的模型會(huì)出現(xiàn)特殊行為:列舉一段時(shí)間后自動(dòng)停止,變成有限序列,例如"質(zhì)數(shù)序列 2, 3, 5, 7 … 997, 極長(zhǎng)"。足球直播
這種"極長(zhǎng)"的使用方式與當(dāng)前討論的"極"字問(wèn)題十分相似,通常出現(xiàn)在大量異常重復(fù)后,作為推理過(guò)程的校正。有時(shí)模型甚至?xí)敵?quot;90000000…0000極大數(shù)值"這類內(nèi)容。
他進(jìn)一步描述了異常觸發(fā)的場(chǎng)景。當(dāng)模型陷入"思考"循環(huán)無(wú)法跳出時(shí),有小概率會(huì)突然輸出"極"字并終止思考,這似乎成為一種特殊的終止標(biāo)記。
通過(guò)分析R1模型的大量輸出,黃哲威發(fā)現(xiàn)了多個(gè)問(wèn)題,免費(fèi)電影包括超長(zhǎng)響應(yīng)、大段空白字符、持續(xù)短句重復(fù)等,連思考末尾的英文字符都變得殘缺不全。
基于這些觀察,他提出核心推測(cè):?jiǎn)栴}根源可能在于數(shù)據(jù)凈化不徹底。在進(jìn)行監(jiān)督微調(diào)數(shù)據(jù)合成乃至預(yù)訓(xùn)練數(shù)據(jù)構(gòu)建時(shí),可能未完全清理名為"'極長(zhǎng)'數(shù)組"的異常數(shù)據(jù)。
他推斷,R1模型在處理復(fù)雜問(wèn)題時(shí),似乎大量采用了檢索增強(qiáng)生成技術(shù),而在后續(xù)強(qiáng)化學(xué)習(xí)階段,模型直接將"極"字作為終止符或語(yǔ)言切換標(biāo)記來(lái)學(xué)習(xí)使用。
最后黃哲威總結(jié)道,五大聯(lián)賽如果R1迭代時(shí)的數(shù)據(jù)未徹底凈化,模型自行蒸餾并"污染"正常輸出過(guò)程是完全可能的。這為理解DeepSeek V3.1模型的"極"字問(wèn)題提供了重要參考。
![]()
這個(gè)被用戶戲稱為"極你太美"、"'極'速版"的技術(shù)問(wèn)題何時(shí)能徹底解決,還需等待DeepSeek官方的版本更新。
標(biāo)簽:
無(wú)相關(guān)信息













