首頁/ 遊戲/ 正文

晶片設計上雲:從削峰開始

晶片設計上雲:從削峰開始

“存算分離”的混合雲計算架構,或許會給更多晶片設計公司指明方向。

21tech(News-21)

作者:

白楊

編輯:

陶力  盧陶然

圖源

:視覺中國

“上雲正成為晶片設計產業的一個趨勢”,燧原科技IT負責人Vincent近日在接受21世紀經濟報道採訪時表示。

燧原科技是一家於2018年成立的AI晶片設計創業公司,是國內第一家完成人工智慧訓練和推理晶片迭代的科技公司。近年來,內外環境的變化,讓燧原科技面臨諸多新挑戰。

一方面,是全球供應鏈的變化帶來產業轉移需求,導致晶片設計行業在市場繁榮的同時,催化了更大的競爭壓力;另一方面,是隨著產品迭代,工藝製程越來越先進,對算力需求也變得越來越大。

過去,晶片設計公司大都以部署本地算力為主,

但是在新環境下,公司既要權衡投入產出比,又要加速產品研發進度搶佔市場,因此,具有高彈性的雲計算也成為晶片設計公司破局的首選。

然而,具體選擇什麼樣的上雲方案,行業內並沒有太多可借鑑的案例。而燧原科技與騰訊雲、速石科技聯合打造的晶片模擬混合雲平臺,在業內首次實現了“存算分離”的混合雲計算架構,這或許會給更多晶片設計公司指明方向。

晶片設計上雲:從削峰開始

從彈性算力切入

創業公司上雲,要解決的核心問題有兩個:

一是成本;二是業務彈性。

燧原科技專案負責人Eli告訴記者,從成本上來講,IC(積體電路)的設計有不同階段,每個階段對算力的需求又不一樣,所以企業沒有辦法採購相同配置的機器去適應所有業務環節。這種情況下,企業往往面臨重複建設,而且這個重複建設只是為了滿足很短的算力高峰。所以從使用效率和經濟成本上來講,上雲肯定是最優解。

從業務彈性的角度,儘管晶片設計公司在專案前期都會進行充分的論證和討論,並給出算力、儲存等需求的大概預期,但在實際操作過程中,往往會出現很多意外情況。

“比如突然發現一個問題需要緊急修復,修復完以後就要進行大量業務測試,這時首先考慮的就不是經濟問題了,而是能以多快的速度得到相應的資源把突發的業務需求消化掉”,Eli說。

在傳統IDC的模式下,遇到這種突發情況企業很難快速應對,通常要透過採買伺服器或是租借伺服器的方式來部署,等上線測試完成已經過去兩週甚至幾周的時間。

而藉助雲計算的彈性,晶片設計公司在遇到意外增量時,便能夠迅速地將資源部署起來。

“我們現在最快只需要幾個小時就能把所需資源全部部署完成,讓業務直接上去測試,整個產品迭代週期和迭代效率都得到大大提升”,

Eli說道。

儘管從各專案效能以及綜合成本上來看,雲計算都優於傳統IDC,但對絕大多數晶片設計公司而言,讓業務全部上雲,仍不現實。這主要是因為出於資料安全、保密以及合規等因素,晶片設計公司需要把一些核心資料儲存在本地。

Vincent向記者表示,這也是為什麼燧原科技在知道本地IDC資源有限的情況下,對上雲依然是“大膽假設、小心求證”。而燧原科技最終選擇騰訊雲和速石科技的解決方案,也是因為他們實現了“存算分離”的架構,能夠確保核心智慧財產權IP、PDK庫、gitlab程式碼庫等資料儲存在本地,僅把算力放到雲端。

現階段,雲計算對燧原科技的核心作用是削峰,解決彈性算力的問題。

據悉,燧原科技目前已經把前端IP驗證環節的彈性算力全部上雲。資料顯示,透過上雲,燧原科技的任務併發量可以透過雲端彈性同步提升,縮短部分模擬任務週期30%~50%,節省IT投入相當可觀的綜合效益。

接下來,燧原科技還會把更多業務環節的彈性算力上雲。Eli表示,“我們這次只選擇一個點,是要把整個專案的風險控制在一個合理範圍內。這次把一個業務搬上雲三方團隊花了五六個月時間去驗證,保障核心資料、程式碼儲存在本地的前提下,並透過速石平臺與本地計算叢集打通,使得計算任務能夠靈活選取本地或雲端算力佇列。晶片設計上雲需要逐步磨合,慢慢擴大使用規模”。

晶片設計上雲:從削峰開始

高性

能計算落地

從騰訊雲的視角,可以看到雲計算是如何一步步接近晶片設計產業的。

騰訊雲高效能計算行業高階經理Kevin向21世紀經濟報道表示,從2021年起,騰訊雲內部就開始探索高效能計算場景,當時也梳理了一些機會點,比如晶片設計、基因測序、科研計算等等。

經過一番摸索,騰訊雲發現晶片設計的模擬環節對高效能計算存在剛

性需求,並且這塊業務的市場規模也很大,於是開始聚焦於此。

晶片設計週期一般超過12個月,包括產品定義、前端設計、IP驗證、SOC驗證、綜合、佈局佈線等多個階段,且不同階段對算力的需求也不相同。

“在整個晶片的誕生過程中,模擬和驗證環節,對彈性算力的需求比較大,其他環節則相對平穩”,Kevin表示。明確方向後,騰訊雲開始與晶片設計行業接觸,這個過程中,騰訊雲的合作伙伴速石科技則扮演了非常重要的角色。

速石科技成立於2017年,主要業務是為使用者提供一站式研發雲平臺。速石科技大客戶經理鄧雄偉告訴記者,在燧原專案中,騰訊雲主要是提供IaaS層服務,包括基礎資源和基礎硬體的運維,而速石是基於IaaS資源做PaaS層平臺的搭建,比如這次的晶片設計模擬雲平臺。

實際上,此次採用的存算分離混合雲解決方案並不是一個新概念,此前也早已在多個領域應用。但這次燧原科技專案,卻是該方案第一次應用於晶片設計產業。所以在專案實施過程中,也遇到一些挑戰。

“比如燧原科技在整個混合雲建設架構的要求上非常高,對網路時延、寬頻的吞吐率和效率的要求也非常高,因此整個專案的實施過程,需要多方一起尋求架構最優的佈置方式”,速石科技技術總監陳琳濤表示。

從結果來看,騰訊雲、速石科技和燧原科技聯合打造的“存算分離”雲平臺,是一種更精細化的混合雲場景,這對於一些先進製程的晶片設計公司而言,具有很強的適用性。

陳琳濤說,這種存算分離的方案減少了半導體企業的資料流轉步驟,也統一了資料安全訪問策略,並簡化了上雲場景選擇和資料準備過程,對整個行業的發展都起到積極推動作用。據闞明建透露,在燧原專案落地後,該方案已經在其他晶片行業客戶上開始複製。

當然,對晶片行業而言,雲計算的想象空間還很大。但實現更多落地應用的前提是,雲計算不僅要保證效率足夠高,更要獲得晶片設計公司足夠的信任。Kevin告訴記者,目前騰訊雲已經在對可信計算做相應的鋪墊和研究,2023年便能提供相應能力。屆時,如果能對整個計算環境都有加密的過程,那或許能夠打消很多客戶對資料上雲的顧慮。

釋出於:廣東

相關文章

頂部