英偉達(dá) GB300 服務(wù)器生產(chǎn)已啟動,9 月大規(guī)模發(fā)貨
消息稱英偉達(dá) GB300 服務(wù)器生產(chǎn)已啟動,9 月大規(guī)模發(fā)貨
據(jù)外媒消息,Nvidia GB300服務(wù)器預(yù)計將于 2025 年 9 月大規(guī)模出貨預(yù)計,包括Dell等其他合作伙伴已經(jīng)開始了服務(wù)器系統(tǒng)的早期生產(chǎn)。相比此前幾代產(chǎn)品,GB300上市會更加順利,這主要得益于Nvidia戰(zhàn)略性的設(shè)計復(fù)用以及整個供應(yīng)鏈協(xié)調(diào)更加順暢。但對原始設(shè)計制造商(ODM)來說,液冷散熱方案仍然是一個需要面對的挑戰(zhàn)。
GB300之所以能按預(yù)期交付,最重要原因在于Nvidia沿用了 GB200平臺的服務(wù)器主板設(shè)計。此外,Nvidia也給了合作伙伴更大的自由度。針對 GB300,Nvidia轉(zhuǎn)向了更為模塊化的供貨模式。據(jù)消息人士透露,Nvidia將不再直接提供組裝好的主板,而是單獨(dú)供應(yīng)核心組件:安裝有B300 GPU的 SXM Puck 模塊,Grace CPU 將采用獨(dú)立的 BGA 封裝提供,硬件管理控制器(HMC)則由 Axiado 供應(yīng)。(OEM或互聯(lián)網(wǎng))用戶需要自行采購主板上的其余部件,CPU 內(nèi)存則選用標(biāo)準(zhǔn)的 SOCAMM 內(nèi)存模塊,這類模塊可從多家供應(yīng)商處采購獲得。Nvidia依然提供交換機(jī)托盤和銅質(zhì)背板。這種設(shè)計復(fù)用免去了重新設(shè)計的必要,從而簡化了生產(chǎn)流程并降低了潛在風(fēng)險。
在此前的 GB200 系統(tǒng)中,Nvidia提供了完整的 Bianca 主板解決方案。該主板集成了 B200 GPU、Grace CPU、512GB LPDDR5X 內(nèi)存以及供電組件,所有這些組件都整合在一塊印刷電路板(PCB)上。同時,Nvidia還提供交換機(jī)托盤和銅質(zhì)背板。
目前 GB300 正處于驗證和小規(guī)模生產(chǎn)的階段。據(jù)報道,原始設(shè)計制造商(ODM)反饋在推進(jìn)過程中沒有遇到明顯障礙。來自合作伙伴的消息則顯示,零部件認(rèn)證工作正按計劃進(jìn)行,Nvidia有望在Q3穩(wěn)步提升產(chǎn)量。預(yù)計到 2025 年第四季度,GB300 的發(fā)貨量將實現(xiàn)顯著增長。
作為關(guān)鍵的主板供應(yīng)商,緯創(chuàng)科技(Wistron)表示,由于 GB200 與 GB300 兩代產(chǎn)品正處于交替期,緯創(chuàng)科技本季度的營收預(yù)計將維持平穩(wěn)。并且,緯創(chuàng)還表示,相比前代平臺的過渡,此次切換過程顯然要順暢得多。此前的GB200等平臺曾多次遭遇延期,除了因為供應(yīng)鏈緊張之外,最大的技術(shù)問題就是GB200服務(wù)器內(nèi)部布局過于密集,導(dǎo)致散熱要求不達(dá)標(biāo)。顯然OEM有了GB200的經(jīng)驗后,在GB300的散熱問題上已經(jīng)有了應(yīng)對方案。
盡管GB200 服務(wù)器在大量出貨,但其液冷系統(tǒng)仍然持續(xù)面臨問題。故障主要集中在快接頭上,這些接頭即便在工廠完成了壓力測試,也存在泄漏可能。對此,數(shù)據(jù)中心運(yùn)營商不得不采取一些應(yīng)對措施,例如局部停機(jī)以及進(jìn)行大范圍的泄漏檢測。這也從側(cè)面反映出,在實際部署中,互聯(lián)網(wǎng)們往往將部署速度和系統(tǒng)性能放在,即使不得不犧牲部分硬件的可靠性。
在 GB300 之后,Nvidia下一代計劃是研發(fā)代號為“Vera Rubin”的全新 AI 服務(wù)器平臺。這款平臺將分兩個階段推出市場。第一階段的核心變化是將 Grace CPU 更換為 Vera CPU,并用 Rubin GPU 替代 Blackwell GPU,但整個系統(tǒng)的骨架——代號 Oberon 的機(jī)架結(jié)構(gòu)——則會得到保留,該機(jī)架屆時將采用 NVL144 的命名(盡管其內(nèi)部使用的是 72 個GPU 模塊組合(每個中有兩顆計算芯片))。第二階段將推出更新、代號為 Kyber 的新機(jī)架系統(tǒng),搭配 Vera CPU 和集成四顆計算小芯片的 Rubin Ultra GPU。
考慮到 Rubin GPU 的能耗預(yù)計將超過 Blackwell GPU,新一代平臺對液冷技術(shù)的依賴性必然會進(jìn)一步加深。雖然液冷是實現(xiàn)高性能的必要手段,但要穩(wěn)定可靠地散熱依然充滿挑戰(zhàn)。在當(dāng)前的 GB200 系統(tǒng)中,由于數(shù)據(jù)中心的設(shè)計差異,要消除泄漏隱患變得異常困難,這也導(dǎo)致們需要投入相當(dāng)多的維護(hù)服務(wù)工作和相應(yīng)的人力成本。
關(guān)于我們
北京漢深流體技術(shù)有限公司 是丹佛斯中國數(shù)據(jù)中心簽約代理商。產(chǎn)品包括FD83全流量雙聯(lián)鎖液冷快換接頭(互鎖球閥);液冷通用快速接頭UQD & UQDB;OCP ORV3盲插快換接頭BMQC;EHW194 EPDM液冷軟管、電磁閥、壓力和溫度傳感器。在人工智能AI、國家數(shù)字經(jīng)濟(jì)、東數(shù)西算、雙碳、新基建戰(zhàn)略的交匯點(diǎn),公司聚焦組建高素質(zhì)、經(jīng)驗豐富的液冷工程師團(tuán)隊,為客戶提供工程設(shè)計和強(qiáng)大的客戶服務(wù),支持全球范圍內(nèi)的大批量交付。
公司產(chǎn)品涵蓋:丹佛斯液冷流體連接器、EPDM軟管、電磁閥、壓力和溫度傳感器及Manifold。
未來公司發(fā)展規(guī)劃:數(shù)據(jù)中心液冷基礎(chǔ)設(shè)施解決方案廠家,具備冷量分配單元(CDU)、二次側(cè)管路(SFN)和Manifold的專業(yè)研發(fā)設(shè)計制造能力。
- 針對機(jī)架式服務(wù)器中Manifold/節(jié)點(diǎn)、CDU/主回路等應(yīng)用場景,提供不同口徑及鎖緊方式的手動和全自動快速連接器。
- 針對高可用和高密度要求的刀片式機(jī)架,可提供帶浮動、自動校正不對中誤差的盲插連接器。以實現(xiàn)狹小空間的精準(zhǔn)對接。
- 基于OCP標(biāo)準(zhǔn)全新打造的液冷通用快速接頭UQD & UQDB ;OCP ORV3盲插快換接頭BMQC , 支持全球范圍內(nèi)的大批量交付。
- 新型體積更小的NVQD液冷快換接頭。NVQD02 (H20); NVQD03 (Blackwell B300 GB300); NVQD04 。
相關(guān)產(chǎn)品
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。