新聞詳情

銓興科技助力671B DeepSeek R1訓(xùn)練成本再降95%！

發(fā)表時間：2025-02-07 18:29

近日，DeepSeek憑借其低成本、高性能的大模型研發(fā)成果，迅速引發(fā)了全球科技界的關(guān)注。在AI大模型訓(xùn)練領(lǐng)域，顯存墻和通信墻一直是制約技術(shù)普及的核心瓶頸。

銓興科技基于自研技術(shù)創(chuàng)新，通過超顯存融合技術(shù)，打破顯存墻，可將單機(jī)顯存最高擴(kuò)展至8TB，成功實(shí)現(xiàn)了DeepSeek R1 671B大模型極低成本的全參訓(xùn)練，成本相比行業(yè)平均水平降低95%，實(shí)現(xiàn)巨大突破。銓興科技聯(lián)合浪潮云，率先發(fā)表DeepSeek 671B一體機(jī)，向政企客戶實(shí)現(xiàn)高質(zhì)量交付。

銓興攜手浪潮云，賦能智能應(yīng)用落地

銓興科技聯(lián)合浪潮云，發(fā)表預(yù)置DeepSeek R1和DeepSeek V3模型的海若一體機(jī)，率先實(shí)現(xiàn)671B滿血版DeepSeek大模型單機(jī)服務(wù)，為政企客戶提供大模型智能應(yīng)用落地的一體化解決方案。

極低成本實(shí)現(xiàn)DeepSeek R1 671B模型訓(xùn)練

DeepSeek R1 671B大模型的訓(xùn)練最低需要百張高端GPU，最低成本高達(dá)數(shù)千萬元人民幣。而銓興科技的訓(xùn)推一體機(jī)僅使用16張顯卡，便完成了DeepSeek R1 671B模型的全參數(shù)訓(xùn)練，訓(xùn)練硬件成本不到150萬元人民幣，較行業(yè)平均水平降低95%以上。這一突破性成果得益于銓興科技的兩項(xiàng)核心自研技術(shù)：

——自研添翼AI擴(kuò)容卡

添翼AI擴(kuò)容卡通過顯存擴(kuò)展技術(shù)，可將單機(jī)顯存容量提升至8TB，大幅超越傳統(tǒng)GPU架構(gòu)的顯存數(shù)量，顯著提升了硬件資源利用率，滿足超大規(guī)模模型的訓(xùn)練需求。

——自研AI Link訓(xùn)練框架

銓興科技優(yōu)化了分布式訓(xùn)練中的通信效率和資源調(diào)度，實(shí)現(xiàn)顯卡與擴(kuò)容卡的高效協(xié)同，大幅降低硬件門檻。

銓興科技訓(xùn)推一體機(jī)的推出，為AI模型訓(xùn)練帶來了以下顯著優(yōu)勢：

成本效益：以極低的硬件投入實(shí)現(xiàn)千億級模型訓(xùn)練，顯著降低AI企業(yè)模型研發(fā)成本。

性能保障：在降低成本的同時，確保模型訓(xùn)練的完整性和性能，訓(xùn)練效果媲美傳統(tǒng)高端集群。

部署便捷：支持單機(jī)完成訓(xùn)練和推理任務(wù)，簡化了分布式系統(tǒng)的復(fù)雜性和運(yùn)維難度。

靈活擴(kuò)展：支持模塊化擴(kuò)容，可從小規(guī)模模型訓(xùn)練平滑過渡到萬億級參數(shù)模型的訓(xùn)練需求。

銓興科技核心自研技術(shù)已在多個領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用，應(yīng)用場景包括：

智慧政務(wù)：實(shí)現(xiàn)個性化的政務(wù)AI應(yīng)用，深入理解業(yè)務(wù)需求，結(jié)合各局辦自己的數(shù)據(jù)，在本地端訓(xùn)練出大模型，實(shí)現(xiàn)智慧公文寫作、智慧項(xiàng)目評審、高效數(shù)據(jù)治理與可視化等功能，大幅提升效率。

智慧法務(wù)：基于百萬級法律條文與過往案例，實(shí)現(xiàn)專屬法務(wù)大模型，協(xié)助法院實(shí)現(xiàn)高效閱卷，將閱卷效率提升99%。

高校科研：與知名高校合作，以極低的成本實(shí)現(xiàn)半導(dǎo)體、金融、化學(xué)等領(lǐng)域的科研探索，助力中國科研騰飛。

金融風(fēng)控：幫助金融機(jī)構(gòu)構(gòu)建私有化風(fēng)控大模型，提升數(shù)據(jù)安全性和模型迭代效率，降低資金風(fēng)險。

高校教育：基于極低成本訓(xùn)推一體機(jī)，配合精英教師體系與AI大模型算法課程體系，幫助高校實(shí)現(xiàn)大模型算法教育普惠，讓每一個學(xué)生都有機(jī)會訓(xùn)練出自己專屬的大模型，幫助高校打造高層次行業(yè)認(rèn)知、深度模型理解、極豐富AI應(yīng)用經(jīng)驗(yàn)三位一體的頂級人才。

算力中心：基于銓興高效顯存融合方案，階段性解決集群通信墻，實(shí)現(xiàn)高效的算力利舊，以及低成本新算力基建，打造出新時代算力標(biāo)桿，使算力中心的網(wǎng)絡(luò)成本下降90%，整體成本下降15%以上。

銓興科技的超顯存融合技術(shù)，大幅降低模型訓(xùn)練成本，不僅是一項(xiàng)技術(shù)突破，更是AI行業(yè)的一次重大革新。它使得中小企業(yè)也能以極低的成本參與大模型研發(fā)，推動AI技術(shù)的普惠化進(jìn)程，引領(lǐng)”銓”民AI時代。無論是初創(chuàng)企業(yè)還是行業(yè)巨頭，都可以通過這一解決方案快速構(gòu)建和優(yōu)化AI模型，搶占技術(shù)制高點(diǎn)。

分享到：

半導(dǎo)體存儲器研發(fā)、測試、制造、銷售
?2016-2021 深圳市銓興科技有限公司版權(quán)所有

粵ICP備2022067211號

銓興科技助力671B DeepSeek R1訓(xùn)練成本再降95%！

銓興科技助力671B DeepSeek R1訓(xùn)練成本再降95%！