人工智能的飛速發(fā)展正催生一場真正的“工業(yè)革命”,其核心驅(qū)動力不僅在于算法的突破,更在于支撐這些算法運行的龐大基礎(chǔ)設(shè)施—“鋼鐵、服務(wù)器與電力”。
Crusoe公司聯(lián)合創(chuàng)始人Chase Locke Miller在接受紅杉資本AI峰會主持人David Conn的訪談中深刻揭示了AI基礎(chǔ)設(shè)施建設(shè)的空前規(guī)模與復(fù)雜性。未來的AI數(shù)據(jù)中心,其能源消耗和功率密度將遠(yuǎn)超傳統(tǒng)數(shù)據(jù)中心,液冷技術(shù)將成為標(biāo)配,整個數(shù)據(jù)中心將被視為一個統(tǒng)一的計算單元。

從零開始:構(gòu)建AI工廠的挑戰(zhàn)
David Conn:從一塊空地開始,建設(shè)一座AI工廠,究竟需要經(jīng)歷怎樣的過程?
Chase Locke Miller:我認(rèn)為,首先我們必須退后一步,審視AI工廠和未來的AI數(shù)據(jù)中心究竟是什么,以及它們與現(xiàn)有數(shù)據(jù)中心有何不同。要知道,“數(shù)據(jù)中心”這個詞在某種程度上已經(jīng)被過度使用了。將20年前僅用于支撐網(wǎng)頁瀏覽的數(shù)據(jù)中心,與如今管理著10萬以上GPU集群的高性能AI數(shù)據(jù)中心相提并論,就好比將卡丁車和路虎攬勝都稱為“交通工具”一樣。它們確實都是交通工具,但顯然不會將它們用于相同的目的。
審視當(dāng)今的AI數(shù)據(jù)中心基礎(chǔ)設(shè)施及其規(guī)模化所需的條件,我們會發(fā)現(xiàn)這是一個高度工業(yè)化的過程,其能源消耗巨大。
通過一個例子來幫助大家理解:北弗吉尼亞州被許多人視為全球數(shù)據(jù)中心的樞紐,是互聯(lián)網(wǎng)大部分流量的發(fā)生地,已經(jīng)建設(shè)了幾十年。據(jù)仲量聯(lián)行2024年底的報告,北弗吉尼亞州數(shù)據(jù)中心的總?cè)萘考s為4.5吉瓦。而Crusoe,一家成立僅7年的初創(chuàng)公司,專注于大型AI基礎(chǔ)設(shè)施建設(shè),目前在建容量就已達約2吉瓦,另有20吉瓦的項目正在規(guī)劃中。這意味著,為了實現(xiàn)AI的宏偉藍圖,我們正在徹底改變能源和數(shù)據(jù)中心行業(yè)的格局,因為其所需的基礎(chǔ)設(shè)施規(guī)模是空前的。
當(dāng)然,建設(shè)過程中的瓶頸也在不斷變化。
曾經(jīng)有一段時間,芯片供應(yīng)是主要障礙,但隨著臺積電和英偉達等公司產(chǎn)能的提升,這一問題已大為緩解。然而,電力供應(yīng)、鋼鐵和數(shù)據(jù)中心空間已成為新的主要瓶頸,這些都涉及復(fù)雜的供應(yīng)鏈,難以在短時間內(nèi)提速。
攜手科技巨頭:初創(chuàng)企業(yè)的突圍之道
David Conn:你們是如何說服大型科技公司合作的?亞馬遜、谷歌、微軟這些公司本身就是數(shù)據(jù)中心領(lǐng)域的巨頭。
Chase Locke Miller:盡管大型科技公司在很多方面都表現(xiàn)出色,但它們天生并非為快速行動而設(shè)計。事實上,從組織結(jié)構(gòu)上看,它們的設(shè)計往往不利于快速決策,尤其是在涉及巨額采購時。
比如,當(dāng)我們需要做出購買決策時,我可以直接決定并在當(dāng)天執(zhí)行。但在微軟這樣的公司,一個決策可能需要經(jīng)過19層審批。因此,從起跑線上看,它們在快速行動方面就存在巨大劣勢。
當(dāng)然,這些巨頭也制定了出色的計劃,它們通常將大型數(shù)據(jù)中心項目(如100兆瓦以上)視為一個3~5年的規(guī)劃。而我們極大地縮短了此類基礎(chǔ)設(shè)施的上市時間,這對于那些追求大規(guī)模、專用AI基礎(chǔ)設(shè)施的大型科技公司和AI實驗室而言,具有核心價值。
AI的能源大考:挑戰(zhàn)與機遇并存
David Conn:能否請您更深入地談?wù)勀茉磫栴}?我想大家對AI將面臨能源約束僅有一個抽象的概念。
Chase Locke Miller:這是一個有趣的問題。
在美國,公用事業(yè)在很長一段時間內(nèi)都是一個相對沉寂的行業(yè)。我們總發(fā)電能力并沒有顯著增長,基本處于持平狀態(tài),因為能源效率的提升和電氣化趨勢在一定程度上抵消了需求增長。然而,AI帶來了需求的階梯式增長,這仿佛喚醒了沉睡的巨人,突然間就需要吉瓦級別的電力,這些電力從何而來?
我們不得不再次采取“第一性原理”的思考方式:如果無法從公用事業(yè)公司獲得電力,我們能否自己建造發(fā)電廠 ?事實上,我們也確實這樣做了。我們將AI視為一個巨大的機遇,它能夠加速下一代能源技術(shù)的發(fā)展。我們目前與3家小型模塊化反應(yīng)堆(SMR)公司達成了合作,希望能夠推動核能成為未來數(shù)據(jù)中心電力的關(guān)鍵組成部分。我將此視為整個行業(yè)加速諸多先進能源技術(shù)發(fā)展的巨大契機,將引領(lǐng)我們邁向一個智能和能源都極度充裕的未來。
未來數(shù)據(jù)中心的設(shè)計藍圖
David Conn:您能談?wù)剶?shù)據(jù)中心的設(shè)計嗎?
未來的數(shù)據(jù)中心會是什么樣?液冷技術(shù)又將如何融入其中?我們應(yīng)如何理解未來數(shù)據(jù)中心的概念?
Chase Locke Miller:坦白說,這正是我最初投身這個領(lǐng)域的原因。當(dāng)時Crusoe正在構(gòu)建一個AI云平臺,我研究了未來的技術(shù)路線圖和不斷變化的計算架構(gòu),然后意識到隨著這些計算架構(gòu)的演進,支撐它們的數(shù)據(jù)中心也必須發(fā)生根本性的轉(zhuǎn)變。因此,為了打造全球最頂尖的AI云平臺,我必須成為AI數(shù)據(jù)中心建設(shè)領(lǐng)域的佼佼者。
我認(rèn)為,最重要的變化在于整體功率密度的急劇提升。20年前,一個傳統(tǒng)數(shù)據(jù)中心的機柜功率可能只有2千瓦,最多4千瓦。而現(xiàn)在,英偉達的NVL72和GB200機柜的功率大約在120~130千瓦。黃仁勛在GTC大會上發(fā)布的Vera Rubin Ultra,其機柜功率更是高達600千瓦。這意味著功率密度實現(xiàn)了數(shù)量級的增長。這從根本上改變了數(shù)據(jù)中心內(nèi)部的熱力學(xué)環(huán)境,因此我們必須對冷卻架構(gòu)進行重大調(diào)整。
走進我們的數(shù)據(jù)中心,你會看到非常有趣的景象,它看起來像一個自來水廠。巨大的管道在整個數(shù)據(jù)中心內(nèi)輸送冷卻水。每棟建筑大約儲存100萬加侖的水,這些冷水通過“直接到芯片”(direct-to-chip)的液冷架構(gòu)注入機架為芯片降溫,然后熱水流出到冷卻塔,將熱量排到室外,每棟建筑配備了84個冷卻塔。
此外,我們還高度關(guān)注數(shù)據(jù)中心周邊的網(wǎng)絡(luò)設(shè)計。因為我們思考的層面不是芯片或服務(wù)器,而是集群。數(shù)據(jù)中心本身就是新的計算單元,這正是AI工廠的本質(zhì)—數(shù)據(jù)中心規(guī)模的計算機。
評論
- 財中金控攜手高凈值舉辦第三期“好項目”路演活動
- 權(quán)威榜單重磅啟幕,創(chuàng)業(yè)生態(tài)全新啟航
- 聚勢收官啟新程 共赴永續(xù)經(jīng)營路——第六屆1218全球招商節(jié)圓滿落幕
- 悟空出行朱旭:汽車金融老兵的“重”生意與“輕”愿景
- 川儀股份正式入列國機集團 儀器儀表“國家隊”重組落地
- 手握“豬中茅臺”的西南隱形巨頭,正在改寫土豬市場規(guī)則
- 樹立行業(yè)標(biāo)桿助推產(chǎn)業(yè)發(fā)展“2025商界·中國銀發(fā)經(jīng)濟100強評選”啟動
- “新朝陽工程?2026中國中老年春節(jié)特別節(jié)目”重慶選區(qū)啟動報名
-
最新最熱
行業(yè)資訊 -
訂閱欄目
效率閱讀 -
音頻新聞
通勤最愛




