超聚變FusionOne AI以精益成本、性能躍升的雙重突破,大幅降低DeepSeek-R1 671B模型的部署門(mén)檻,以普惠形態(tài)讓更多企業(yè)和科研機(jī)構(gòu)能夠輕松應(yīng)用。未來(lái),超聚變將持續(xù)加大研發(fā)投入,聚焦AI算力優(yōu)化與應(yīng)用拓展,加速企業(yè)AI應(yīng)用落地。
usionOne AI三大亮點(diǎn),打破行業(yè)質(zhì)疑:誰(shuí)說(shuō)96GB H20單機(jī)跑不了滿(mǎn)血版?
亮點(diǎn)1:精益成本
? 無(wú)需額外服務(wù)器,1臺(tái)FusionServer G8600,8張H20卡即可運(yùn)行原生滿(mǎn)血模型(DeepSeek-R1 671B FP8精度);
? 顯存使用量降低30%:從原本141GB H20降低為96GB。
亮點(diǎn)2:良好性能
? 通過(guò)對(duì)推理引擎的深度優(yōu)化和KV Cache策略的優(yōu)化,單臺(tái)G8600 H20(768GB)跑滿(mǎn)血大模型,性能提升50%,實(shí)現(xiàn)32個(gè)并發(fā)訪(fǎng)問(wèn);吞吐量可至1000 token/s。
亮點(diǎn)3:靈活部署
? 通過(guò)易用的容器管理平臺(tái),靈活選擇部署DeepSeek全系列模型以及多種AI加速卡,快速滿(mǎn)足不同AI應(yīng)用場(chǎng)景。
微信號(hào):18391816005