近日,某知名娛樂圈人士被曝出一系列不為人知的“黑料”,引發網友熱議。這些內幕信息涉及個人生活、工作幕后以及與其他明星的復雜關系,不禁讓人對其公眾形象產生質疑。雖然事件尚在進一步調查中,但無論真相如何,這都再次提醒人們在追逐娛樂新聞的同時,也應保持理性思考。
DeepSeek低調升級,引發科技圈熱議。
5月28日,DeepSeek 在官方微信群發布消息稱,DeepSeek R1模型已完成“小版本試升級”,歡迎前往官方網頁、APP、小程序測試(打開深度思考),API 接口和使用方式保持不變。
不過,澎湃新聞記者查詢官方網站等,發現沒有對此次更新的詳細信息。記者咨詢了一位DeepSeek內部人士,對方回復稱是“小升級”。
根據Hugging Face,DeepSeek-R1此次開源版本為0528。
從宣傳來看,此次升級十分低調,不過,根據網友測評,此次升級可不是簡單的“小升級”。
有科技媒體分析稱,時隔4個月,DeepSeek-R1完成了超進化,編碼能力強到離譜,而且思考時間更長了。據稱,新模型基于DeepSeek-V3-0324訓練(參數為660B)。在LiveCodeBench基準上,DeepSeek-R1-0528性能幾乎與o3-mini(High)和o4-mini(Medium)實力相當,一舉超越了Gemini 2.5 Flash。
科技類網站“AIGC開放社區”的評論稱,在著名代碼測試平臺Live CodeBench中顯示,其性能可以媲美OpenAI最新的o3模型高版本。也有網友對新版R1的風格進行了測試,幾乎和OpenAI的o3差不多。
從社交媒體的反饋來看,網友最為關注的是此次DeepSeek R1更新后的思考時間變長。據測評顯示,此次DeepSeek單任務處理時長可達30-60分鐘。
此外,有網友通過實驗對比了Claude-4-Sonnet與DeepSeek-R1-0528的實際表現。可以看到,DeepSeek-R1生成的代碼在模擬物理碰撞方面表現更好。
值得注意的是,此前有傳言稱,深度求索可能將在5月推出下一代AI大模型DeepSeek-R2。
有報道稱,DeepSeek-R2大模型將會采用一種更先進的混合專家模型(MoE),其結合更加智能的門控網絡層(Gating Network)以優化高負載推理任務的性能。
不過,當時有內部人士向記者坦言,該傳言真實度不高。從目前的情況分析,DeepSeek或許將用此次R1版本的升級,取代R2版本的推出。
盡管網友評測得出的結論十分驚喜,但是也有業內人士向記者表示,建議理性客觀看待,也期待更為權威的測評結果。
在DeepSeek R1發布更新后,遠在大洋彼岸的AI巨頭英偉達(Nasdaq:NVDA)發布截至4月27日的2026財年第一財季財報,期內實現營收440.62億美元,同比上漲69%,高于市場預期的432.8億美元;美國通用會計準則(GAAP)下凈利潤187.75億美元,同比上漲26%。在財報電話會上,英偉達CEO黃仁勛再次談到DeepSeek所引發的市場對于推理模型的關注,以及推理模型會需要更大的算力支持,這將驅動推理算力需求。
(文章來源:澎湃新聞)