一鍵部署丨DeepSeek-R1 新版本小幅升級(jí)便登頂開源王座，多項(xiàng)評(píng)測(cè)超越 Qwen3

上傳時(shí)間：2025-05-30

HyperAI超神經(jīng)

原創(chuàng)

深度學(xué)習(xí) 人工智能機(jī)器學(xué)習(xí) 推理能力

人工智能說明書，了解 AI 的功效和副作用。

近日，DeepSeek 官宣其 R1 模型進(jìn)行「小幅」版本升級(jí)，發(fā)布 DeepSeek-R1-0528 。在此次更新中，DeepSeek R1 通過提升計(jì)算資源配置并在后訓(xùn)練階段引入算法優(yōu)化機(jī)制，顯著提升了其推理能力。該模型在數(shù)學(xué)、編程與通用邏輯等多項(xiàng)基準(zhǔn)評(píng)測(cè)中表現(xiàn)出色，全面超越了 Qwen3-235B 和 DeepSeek-R1，堪稱是「跨越一小步」便登頂開源王座。

DeepSeek-R1-0528 在多個(gè)基準(zhǔn)測(cè)試中與主流模型的表現(xiàn)對(duì)比

更加值得一提的是，團(tuán)隊(duì)還蒸餾了 DeepSeek-R1-0528 的思維鏈（Chain-of-Thought），用于對(duì) Qwen3-8B-Base 進(jìn)行后訓(xùn)練，得到了 DeepSeek-R1-0528-Qwen3-8B 。該模型在 AIME 2024 測(cè)試中達(dá)到了開源模型中的最新 SOTA（最先進(jìn)）性能，較 Qwen3-8B 提升了 10.0%，并與 Qwen3-235B-thinking 的表現(xiàn)相當(dāng)。

DeepSeek-R1-0528-Qwen3-8B 在各基準(zhǔn)測(cè)試中與主流模型的表現(xiàn)對(duì)比

目前，「一鍵部署 DeepSeek-R1-0528-Qwen3-8B」已上線至 HyperAI 超神經(jīng)官網(wǎng)的「教程」板塊，快來體驗(yàn)吧！

Demo 運(yùn)行

1. 進(jìn)入 hyper.ai 首頁后，選擇「教程」頁面，并選擇「一鍵部署 DeepSeek-R1-0528-Qwen3-8B」，點(diǎn)擊「在線運(yùn)行此教程」。

2. 頁面跳轉(zhuǎn)后，點(diǎn)擊右上角「克隆」，將該教程克隆至自己的容器中。

3. 選擇「NVIDIA RTX 4090」以及「vllm」鏡像，OpenBayes 平臺(tái)上線了新的計(jì)費(fèi)方式，大家可以按照需求選擇「按量付費(fèi)」或「包日/周/月」，點(diǎn)擊「繼續(xù)執(zhí)行」。新用戶使用下方邀請(qǐng)鏈接注冊(cè)，可獲得 4 小時(shí) RTX 4090 + 5 小時(shí) CPU 的免費(fèi)時(shí)長(zhǎng)！

4. 等待分配資源，首次克隆需等待 2 分鐘左右的時(shí)間。當(dāng)狀態(tài)變?yōu)椤高\(yùn)行中」后，點(diǎn)擊「API 地址」旁邊的跳轉(zhuǎn)箭頭，即可跳轉(zhuǎn)至 WebUI 頁面。請(qǐng)注意，用戶需在實(shí)名認(rèn)證后才能使用 API 地址訪問功能。

效果演示

端午節(jié)即將來臨之際，又到了一年一度「甜咸大戰(zhàn)」的時(shí)刻了，不如讓我們來問問 DeepSeek-R1-0528-Qwen3-8B，看看它怎么回答 ??

可以看到 DeepSeek-R1-0528-Qwen3-8B 會(huì)展示完整的思考過程，并且會(huì)從多個(gè)角度客觀給出分析。

以上就是 HyperAI 超神經(jīng)本次推薦的教程啦，感興趣的小伙伴快來體驗(yàn)吧！教程地址：https://go.hyper.ai/uRzwv

評(píng)論

、？！

太師級(jí)

閱

2025-05-31

請(qǐng) 科普中國(guó)APP發(fā)表評(píng)論或查看更多評(píng)論