2月6日晚間,華為中國(guó)官方微博發(fā)文稱,華為DCS AI全棧解決方案中的重要產(chǎn)品—ModelEngine AI平臺(tái),全面支持DeepSeek大模型R1&V3和蒸餾系列模型的本地部署與優(yōu)化,加速客戶AI應(yīng)用快速落地。
![](https://image.nbd.com.cn/uploads/articles/images/1683574/777.jpg)
華為稱,ModelEngine作為大模型訓(xùn)練、推理和應(yīng)用開發(fā)的AI平臺(tái),提供從數(shù)據(jù)預(yù)處理到模型訓(xùn)練、優(yōu)化及部署的一站式服務(wù)。此次ModelEngine基于昇騰AI芯片,通過(guò)推理框架優(yōu)化和MoE存算協(xié)同,提供動(dòng)態(tài)換入換出和全局統(tǒng)一緩存,實(shí)現(xiàn)推理高并發(fā)和低時(shí)延,用戶通過(guò)ModelEngine體驗(yàn)DeepSeek更加快速高效的推理能力。
ModelEngine全面支持DeepSeek系列模型R1&V3 671B以及蒸餾系列模型,開發(fā)者可通過(guò)ModelEngine實(shí)現(xiàn)“一鍵部署”,省去硬件選型、兼容性驗(yàn)證和環(huán)境配置等繁瑣步驟,大幅降低企業(yè)AI應(yīng)用門檻。此外,ModelEngine通過(guò)其高度的開放性和模塊化設(shè)計(jì),極大地縮短了DeepSeek的本地部署時(shí)間。
ModelEngine提供負(fù)載均衡、模型安全接入、多用戶配額管理等高階特性,支持大規(guī)模生產(chǎn)環(huán)境下的穩(wěn)定運(yùn)行。某證券公司引入DCS AI全棧解決方案后,運(yùn)維成本降低42%。
![](https://image.nbd.com.cn/uploads/articles/images/1683575/11.jpg)
圖片來(lái)源:每日經(jīng)濟(jì)新聞 劉國(guó)梅 攝
值得注意的是,2月4日晚間,華為計(jì)算微信公眾號(hào)發(fā)文表示,DeepSeek-R1系列模型的開源,因其出色的性能和低廉的開發(fā)成本,已引發(fā)全球的熱切討論和關(guān)注。潞晨科技攜手昇騰,聯(lián)合發(fā)布基于昇騰算力的DeepSeek-R1系列推理API,及云鏡像服務(wù)。
![](https://image.nbd.com.cn/uploads/articles/images/1682655/QQ20250205-100702.jpg)
華為計(jì)算稱,在本次發(fā)布中,潞晨以自研國(guó)產(chǎn)推理引擎為技術(shù)底座,成功實(shí)現(xiàn)了昇騰算力與DeepSeek-R1系列模型的推理適配優(yōu)化,性能表現(xiàn)與使用高端GPU持平,為開發(fā)者提供高效、靈活、穩(wěn)定的AI推理服務(wù),助力企業(yè)實(shí)現(xiàn)降本增效,加速智能業(yè)務(wù)基于中國(guó)軟硬件體系快速部署落地。
據(jù)華為云官方微信公眾號(hào)2月1日消息,DeepSeek-R1開源后引發(fā)全球用戶和開發(fā)者關(guān)注。經(jīng)過(guò)硅基流動(dòng)和華為云團(tuán)隊(duì)連日攻堅(jiān),現(xiàn)在,雙方聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeekR1/V3推理服務(wù)。
![](https://image.nbd.com.cn/uploads/articles/images/1682189/999.jpg)
該服務(wù)具備以下特點(diǎn):
1、得益于自研推理加速引擎加持,硅基流動(dòng)和華為云昇騰云服務(wù)支持部署的DeepSeek模型可獲得持平全球高端GPU部署模型的效果。
2、提供穩(wěn)定的、生產(chǎn)級(jí)服務(wù)能力,讓模型能夠在⼤規(guī)模生產(chǎn)環(huán)境中穩(wěn)定運(yùn)行,并滿足業(yè)務(wù)商⽤部署需求。華為云昇騰云服務(wù)可以提供澎湃、彈性、充足的算力。
另?yè)?jù)國(guó)家超算互聯(lián)網(wǎng)平臺(tái)消息,目前DeepSeek-R1、V3、Coder等系列模型已上線該平臺(tái)。用戶無(wú)需下載到本地部署,即可在線完成DeepSeek系列模型的推理、部署及定制化訓(xùn)練與開發(fā)。
![](https://image.nbd.com.cn/uploads/articles/images/1683576/333.jpg)
據(jù)深圳商報(bào),為促進(jìn)超算算力一體化運(yùn)營(yíng),打造國(guó)家算力底座,科技部于2023年啟動(dòng)了國(guó)家超算互聯(lián)網(wǎng)部署工作,2024年4月平臺(tái)正式上線。截至目前,已有數(shù)百家應(yīng)用、數(shù)據(jù)、模型等服務(wù)商入駐。
此次上線的模型涵蓋了1.5B到14B的蒸餾模型,以及7B到32B的DeepSeek Chatbot可視化界面,近期還會(huì)陸續(xù)上線32B、70B等更多版本。
超算互聯(lián)網(wǎng)官微2月4日晚間發(fā)布文章稱,DeepSeek-R1因其游刃有余的用戶需求響應(yīng)能力,尤其是其獨(dú)特的“深度思考(DeepThink)”模式及卓越的推理能力,在這個(gè)春天絕響全球。為了讓更多領(lǐng)域的用戶切實(shí)便捷地進(jìn)行體驗(yàn),超算互聯(lián)網(wǎng)平臺(tái)第一時(shí)間上線了DeepSeek Chatbot可視化界面功能。
![](https://image.nbd.com.cn/uploads/articles/images/1682190/1.jpg)
圖片來(lái)源:視覺(jué)中國(guó)
據(jù)證券時(shí)報(bào),DeepSeek的熱度居高不下。此前,英偉達(dá)、微軟、亞馬遜等AI巨頭紛紛宣布,已接入DeepSeek。
國(guó)內(nèi)幾大云服務(wù)平臺(tái)——華為云、騰訊云、阿里云、百度智能云、京東云、字節(jié)跳動(dòng)旗下火山引擎等,也相繼宣布接入DeepSeek系列模型,部分平臺(tái)推出了超低價(jià)格方案及限時(shí)免費(fèi)服務(wù)。
國(guó)內(nèi)三大運(yùn)營(yíng)商旗下的聯(lián)通云、天翼云、移動(dòng)云等平臺(tái)也宣布接入DeepSeek模型。
1月24日,著名投資公司A16z的創(chuàng)始人馬克·安德森發(fā)文稱,Deepseek-R1是他見(jiàn)過(guò)的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。最具煽動(dòng)性的評(píng)價(jià)來(lái)自ScaleAI創(chuàng)始人亞歷山大·王。他說(shuō):過(guò)去十年來(lái),美國(guó)可能一直在AI競(jìng)賽中領(lǐng)先于中國(guó),但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。
DeepSeek日前發(fā)布其最新開源模型DeepSeek-R1,用較低的成本達(dá)到了接近于OpenAI開發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長(zhǎng)期以來(lái)“堆算力”的路徑依賴,其影響還波及了資本市場(chǎng)。
國(guó)際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過(guò)顯著提高數(shù)據(jù)質(zhì)量和改進(jìn)模型架構(gòu),展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說(shuō),DeepSeek的模型現(xiàn)在低成本優(yōu)勢(shì)突出,與國(guó)際知名大模型相比,其成本大約低了一個(gè)數(shù)量級(jí)。
國(guó)泰君安指出,DeepSeek-R1以MIT License完全開源模型權(quán)重,并允許商用模型蒸餾,為開發(fā)者提供了二次創(chuàng)新的自由空間。這一策略推動(dòng)中國(guó)首次在通用大模型開源領(lǐng)域占據(jù)技術(shù)制高點(diǎn),增強(qiáng)全球AI 話語(yǔ)權(quán)。同時(shí),開源生態(tài)可能加速行業(yè)技術(shù)路線趨同,通用大模型因同質(zhì)化加劇競(jìng)爭(zhēng),只有擁有真正領(lǐng)先技術(shù)的企業(yè)才能在這種趨勢(shì)中留存。因此,此次國(guó)產(chǎn)開源模型的突破有望重塑全球AIGC技術(shù)路線及產(chǎn)業(yè)格局。