|
新聞詳情
銓興科技助力671B DeepSeek R1訓(xùn)練成本再降95%!發(fā)表時間:2025-02-07 18:29 近日,DeepSeek憑借其低成本、高性能的大模型研發(fā)成果,迅速引發(fā)了全球科技界的關(guān)注。在AI大模型訓(xùn)練領(lǐng)域,顯存墻和通信墻一直是制約技術(shù)普及的核心瓶頸。 銓興科技基于自研技術(shù)創(chuàng)新,通過超顯存融合技術(shù),打破顯存墻,可將單機(jī)顯存最高擴(kuò)展至8TB,成功實(shí)現(xiàn)了DeepSeek R1 671B大模型極低成本的全參訓(xùn)練,成本相比行業(yè)平均水平降低95%,實(shí)現(xiàn)巨大突破。銓興科技聯(lián)合浪潮云,率先發(fā)表DeepSeek 671B一體機(jī),向政企客戶實(shí)現(xiàn)高質(zhì)量交付。 銓興攜手浪潮云,賦能智能應(yīng)用落地 銓興科技聯(lián)合浪潮云,發(fā)表預(yù)置DeepSeek R1和DeepSeek V3模型的海若一體機(jī),率先實(shí)現(xiàn)671B滿血版DeepSeek大模型單機(jī)服務(wù),為政企客戶提供大模型智能應(yīng)用落地的一體化解決方案。 極低成本實(shí)現(xiàn)DeepSeek R1 671B模型訓(xùn)練 DeepSeek R1 671B大模型的訓(xùn)練最低需要百張高端GPU,最低成本高達(dá)數(shù)千萬元人民幣。而銓興科技的訓(xùn)推一體機(jī)僅使用16張顯卡,便完成了DeepSeek R1 671B模型的全參數(shù)訓(xùn)練,訓(xùn)練硬件成本不到150萬元人民幣,較行業(yè)平均水平降低95%以上。這一突破性成果得益于銓興科技的兩項(xiàng)核心自研技術(shù): ——自研添翼AI擴(kuò)容卡 添翼AI擴(kuò)容卡通過顯存擴(kuò)展技術(shù),可將單機(jī)顯存容量提升至8TB,大幅超越傳統(tǒng)GPU架構(gòu)的顯存數(shù)量,顯著提升了硬件資源利用率,滿足超大規(guī)模模型的訓(xùn)練需求。 ——自研AI Link訓(xùn)練框架 銓興科技優(yōu)化了分布式訓(xùn)練中的通信效率和資源調(diào)度,實(shí)現(xiàn)顯卡與擴(kuò)容卡的高效協(xié)同,大幅降低硬件門檻。 銓興科技訓(xùn)推一體機(jī)的推出,為AI模型訓(xùn)練帶來了以下顯著優(yōu)勢: 成本效益:以極低的硬件投入實(shí)現(xiàn)千億級模型訓(xùn)練,顯著降低AI企業(yè)模型研發(fā)成本。 性能保障:在降低成本的同時,確保模型訓(xùn)練的完整性和性能,訓(xùn)練效果媲美傳統(tǒng)高端集群。 部署便捷:支持單機(jī)完成訓(xùn)練和推理任務(wù),簡化了分布式系統(tǒng)的復(fù)雜性和運(yùn)維難度。 靈活擴(kuò)展:支持模塊化擴(kuò)容,可從小規(guī)模模型訓(xùn)練平滑過渡到萬億級參數(shù)模型的訓(xùn)練需求。 銓興科技核心自研技術(shù)已在多個領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用,應(yīng)用場景包括: 智慧政務(wù):實(shí)現(xiàn)個性化的政務(wù)AI應(yīng)用,深入理解業(yè)務(wù)需求,結(jié)合各局辦自己的數(shù)據(jù),在本地端訓(xùn)練出大模型,實(shí)現(xiàn)智慧公文寫作、智慧項(xiàng)目評審、高效數(shù)據(jù)治理與可視化等功能,大幅提升效率。 智慧法務(wù):基于百萬級法律條文與過往案例,實(shí)現(xiàn)專屬法務(wù)大模型,協(xié)助法院實(shí)現(xiàn)高效閱卷,將閱卷效率提升99%。 高校科研:與知名高校合作,以極低的成本實(shí)現(xiàn)半導(dǎo)體、金融、化學(xué)等領(lǐng)域的科研探索,助力中國科研騰飛。 金融風(fēng)控:幫助金融機(jī)構(gòu)構(gòu)建私有化風(fēng)控大模型,提升數(shù)據(jù)安全性和模型迭代效率,降低資金風(fēng)險。 高校教育:基于極低成本訓(xùn)推一體機(jī),配合精英教師體系與AI大模型算法課程體系,幫助高校實(shí)現(xiàn)大模型算法教育普惠,讓每一個學(xué)生都有機(jī)會訓(xùn)練出自己專屬的大模型,幫助高校打造高層次行業(yè)認(rèn)知、深度模型理解、極豐富AI應(yīng)用經(jīng)驗(yàn)三位一體的頂級人才。 算力中心:基于銓興高效顯存融合方案,階段性解決集群通信墻,實(shí)現(xiàn)高效的算力利舊,以及低成本新算力基建,打造出新時代算力標(biāo)桿,使算力中心的網(wǎng)絡(luò)成本下降90%,整體成本下降15%以上。 銓興科技的超顯存融合技術(shù),大幅降低模型訓(xùn)練成本,不僅是一項(xiàng)技術(shù)突破,更是AI行業(yè)的一次重大革新。它使得中小企業(yè)也能以極低的成本參與大模型研發(fā),推動AI技術(shù)的普惠化進(jìn)程,引領(lǐng)”銓”民AI時代。無論是初創(chuàng)企業(yè)還是行業(yè)巨頭,都可以通過這一解決方案快速構(gòu)建和優(yōu)化AI模型,搶占技術(shù)制高點(diǎn)。 |