近日,DeepSeek 官宣其 R1 模型進(jìn)行「小幅」版本升級(jí),發(fā)布 DeepSeek-R1-0528 。在此次更新中,DeepSeek R1 通過提升計(jì)算資源配置并在后訓(xùn)練階段引入算法優(yōu)化機(jī)制,顯著提升了其推理能力。該模型在數(shù)學(xué)、編程與通用邏輯等多項(xiàng)基準(zhǔn)評(píng)測(cè)中表現(xiàn)出色,全面超越了 Qwen3-235B 和 DeepSeek-R1,堪稱是「跨越一小步」便登頂開源王座。
DeepSeek-R1-0528 在多個(gè)基準(zhǔn)測(cè)試中與主流模型的表現(xiàn)對(duì)比
更加值得一提的是,團(tuán)隊(duì)還蒸餾了 DeepSeek-R1-0528 的思維鏈(Chain-of-Thought),用于對(duì) Qwen3-8B-Base 進(jìn)行后訓(xùn)練,得到了 DeepSeek-R1-0528-Qwen3-8B 。該模型在 AIME 2024 測(cè)試中達(dá)到了開源模型中的最新 SOTA(最先進(jìn))性能,較 Qwen3-8B 提升了 10.0%,并與 Qwen3-235B-thinking 的表現(xiàn)相當(dāng)。
DeepSeek-R1-0528-Qwen3-8B 在各基準(zhǔn)測(cè)試中與主流模型的表現(xiàn)對(duì)比
目前,「一鍵部署 DeepSeek-R1-0528-Qwen3-8B」已上線至 HyperAI 超神經(jīng)官網(wǎng)的「教程」板塊,快來體驗(yàn)吧!
Demo 運(yùn)行
1. 進(jìn)入 hyper.ai 首頁后,選擇「教程」頁面,并選擇「一鍵部署 DeepSeek-R1-0528-Qwen3-8B」,點(diǎn)擊「在線運(yùn)行此教程」。
2. 頁面跳轉(zhuǎn)后,點(diǎn)擊右上角「克隆」,將該教程克隆至自己的容器中。
3. 選擇「NVIDIA RTX 4090」以及「vllm」鏡像,OpenBayes 平臺(tái)上線了新的計(jì)費(fèi)方式,大家可以按照需求選擇「按量付費(fèi)」或「包日/周/月」,點(diǎn)擊「繼續(xù)執(zhí)行」。新用戶使用下方邀請(qǐng)鏈接注冊(cè),可獲得 4 小時(shí) RTX 4090 + 5 小時(shí) CPU 的免費(fèi)時(shí)長(zhǎng)!
4. 等待分配資源,首次克隆需等待 2 分鐘左右的時(shí)間。當(dāng)狀態(tài)變?yōu)椤高\(yùn)行中」后,點(diǎn)擊「API 地址」旁邊的跳轉(zhuǎn)箭頭,即可跳轉(zhuǎn)至 WebUI 頁面。請(qǐng)注意,用戶需在實(shí)名認(rèn)證后才能使用 API 地址訪問功能。
效果演示
端午節(jié)即將來臨之際,又到了一年一度「甜咸大戰(zhàn)」的時(shí)刻了,不如讓我們來問問 DeepSeek-R1-0528-Qwen3-8B,看看它怎么回答 ??
可以看到 DeepSeek-R1-0528-Qwen3-8B 會(huì)展示完整的思考過程,并且會(huì)從多個(gè)角度客觀給出分析。
以上就是 HyperAI 超神經(jīng)本次推薦的教程啦,感興趣的小伙伴快來體驗(yàn)吧!教程地址:https://go.hyper.ai/uRzwv