
芯片采購(gòu)網(wǎng)專注于整合國(guó)內(nèi)外授權(quán)IC代理商現(xiàn)貨資源,芯片庫(kù)存實(shí)時(shí)查詢,行業(yè)價(jià)格合理,采購(gòu)方便IC芯片,國(guó)內(nèi)專業(yè)芯片采購(gòu)平臺(tái)。
摘要
隨著越來(lái)越多的設(shè)備旨在解決現(xiàn)代算法加速工作負(fù)荷,高帶寬數(shù)據(jù)流必須能夠有效地移動(dòng)到高速界面和整個(gè)設(shè)備之間。Achronix的Speedster7t獨(dú)立FPGA芯片可以集成新的、高度創(chuàng)新的二維芯片上網(wǎng)(2D NoC)處理這些高帶寬數(shù)據(jù)流。Achronix的FPGA中特有的2D NoC實(shí)現(xiàn)編程邏輯資源實(shí)現(xiàn)2是一種創(chuàng)新D NoC與傳統(tǒng)方法相比,有哪些創(chuàng)新和價(jià)值?本白皮書討論了這兩種實(shí)現(xiàn)D NoC該方法為展示和軟2提供了示例設(shè)計(jì)D NoC實(shí)現(xiàn)相比,Achronix 2D NoC如何提高性能,減少面積,縮短設(shè)計(jì)時(shí)間。
介紹
Achronix為其Speedster7t系列FPGA通過(guò)集成創(chuàng)新,完全重新設(shè)計(jì)了片上通信架構(gòu)D NoC適應(yīng)高帶寬數(shù)據(jù)流的需要。在該FPGA設(shè)備外圍,這2D NoC連接到所有高速接口,包括多個(gè)400G以太網(wǎng)、PCIe Gen5、GDDR6和DDR4/5端口。在該FPGA在可編程邏輯陣列上部署了一系列高速行和列通道,分別向FPGA網(wǎng)絡(luò)流量分布在可編程邏輯陣列的水平和垂直方向上。除了這些行和列,在NoC每一行和每一列交叉的位置以及發(fā)送點(diǎn)和目標(biāo)NoC訪問(wèn)節(jié)點(diǎn)(NAP)。這些NAP充當(dāng)NoC資源或目的地位于可編程邏輯陣列中。
為了將Achronix FPGA中內(nèi)置的2D NoC,可編程邏輯陣列中使用傳統(tǒng)方法創(chuàng)建的NoC為此,我們?cè)u(píng)估了幾種軟件NoC設(shè)計(jì);最后,基于同行評(píng)審和FPGA可移植結(jié)構(gòu),我們選擇了米蘭理工學(xué)院的軟2D NoC(https://github.com/agalimberti/NoCRouter,2017)設(shè)計(jì)。這種軟NoC單向網(wǎng)絡(luò)(mesh)蟲洞前瞻性預(yù)測(cè)切換已經(jīng)實(shí)現(xiàn)。這種軟NoC單向網(wǎng)絡(luò)(mesh)蟲洞預(yù)測(cè)切換已經(jīng)實(shí)現(xiàn)。在實(shí)施過(guò)程中,它需要每一個(gè)mesh存儲(chǔ)和轉(zhuǎn)發(fā)流控制單元節(jié)點(diǎn)上的多個(gè)存儲(chǔ)器(flit)。
量化片上2D NoC實(shí)現(xiàn)模式與使用邏輯陣列資源的軟實(shí)現(xiàn)模式之間的差異首先創(chuàng)建了一個(gè)實(shí)例AlexNet 2D卷積的19個(gè)實(shí)例設(shè)計(jì),然后在完整的2個(gè)D NoC設(shè)計(jì)比較了三個(gè)主要指標(biāo):所需資源和設(shè)計(jì)性能Jorjin代理以及設(shè)計(jì)時(shí)間建設(shè)計(jì)時(shí)間和在工具中編譯設(shè)計(jì)時(shí)間)。結(jié)果是在所有三種情況下集成Achronix 2D NoC性能明顯優(yōu)于軟實(shí)現(xiàn)。
2D NoC減少資源的使用
為了比較兩種不同的2種D NoC設(shè)計(jì),兩種2D NoC都與現(xiàn)有的2D卷積(conv2d)結(jié)合設(shè)計(jì)。conv2d設(shè)計(jì)執(zhí)行輸入圖像AlexNet 2D卷積。此conv2d設(shè)計(jì)需要一兩個(gè)AXI-4連接:一個(gè)用于讀取內(nèi)存,一個(gè)用于寫入內(nèi)存或共享AXI-四執(zhí)行讀寫。實(shí)現(xiàn)和軟NoC選擇單個(gè)共享的最佳集成AXI-4接口,conv2d每個(gè)模塊的例子mesh節(jié)點(diǎn)。然后,軟NoC啟用了GDDR存儲(chǔ)接口的數(shù)據(jù)入口和出口-軟NoC中間,內(nèi)存接口連接到第20個(gè)mesh節(jié)點(diǎn);內(nèi)置式NoC這種連接已經(jīng)存在于中間。從GDDR6到每個(gè)conv2d從節(jié)點(diǎn)到節(jié)點(diǎn)都有節(jié)點(diǎn)通信,但是conv2d節(jié)點(diǎn)之間沒(méi)有通信。
Achronix 2D NoC的設(shè)計(jì)細(xì)節(jié)
該設(shè)計(jì)有19個(gè)conv2d訪問(wèn)模塊實(shí)例,訪問(wèn)每個(gè)實(shí)例GDDR6存儲(chǔ)器。第20個(gè)例子是空閑的,因?yàn)镚DDR6接口直接連接到集成2D NoC。80個(gè)可用的NoC接入點(diǎn)(NAP)其中38個(gè)用于連接conv2d實(shí)例。每個(gè)conv2d實(shí)例使用64臺(tái)機(jī)器學(xué)習(xí)處理器(MLP),它在垂直方向上覆蓋兩個(gè)NAP。因?yàn)檫@個(gè)部署是針對(duì)內(nèi)置2的D NoC,所以采用雙AXI-4方法連接conv2d模塊。下表列出了本設(shè)計(jì)中使用的資源。
表1 Achronix 2D NoC使用的資源
圖5 Achronix的2D NoC和NAP
軟2D NoC使用五路交叉開關(guān)(crossbar switch),一個(gè)端口和本地conv2d實(shí)例通信,其他端口與網(wǎng)格中的下一個(gè)節(jié)點(diǎn)通信。節(jié)點(diǎn)到節(jié)點(diǎn)連接的頻率為82 MHz,從而在一個(gè)節(jié)點(diǎn)上形成最高的21 Gbps的GDDR6接口帶寬。下面的框圖顯示了軟2D NoC mesh中間的交叉開關(guān)。
- IAR Systems支持全新Arm Cortex-M85處理器
- 瘋狂的Computex顯示器:500赫茲,48英寸OLED等
- 什么是hpaPaaS平臺(tái)?
- 現(xiàn)實(shí)中區(qū)塊鏈的應(yīng)用是什么?
- 800 億個(gè)晶體管!英偉達(dá)發(fā)布首款基于 Hopper 架構(gòu)的 GPU — NVIDIA H100
- 特斯拉進(jìn)一步開放充電網(wǎng)絡(luò) 包括許多歐洲國(guó)家
- SiC MOSFET驅(qū)動(dòng)電壓試驗(yàn)結(jié)果離譜的六個(gè)原因
- 也可以戴口罩Face ID蘋果iOS/iPadOS 15.4正式版本更新發(fā)布
- 傳因多任務(wù)處理功能開發(fā)遇到障礙 iPadOS16推遲發(fā)布一個(gè)月
- 中國(guó)企業(yè)培養(yǎng)和留住云技能人才的四個(gè)步驟
- 國(guó)產(chǎn)x86處理器獲得GCC支持編譯器優(yōu)化 下代直奔7nm工藝
- 羅戈津喊馬斯克負(fù)責(zé):SpaceX為亞速營(yíng)提供星鏈地面終端設(shè)備
