

# 片上網路 (NoC) 技術的發展 給高端 FPGA 帶來的優勢

■作者：黃侖 /Achronix 資深現場應用工程師

## 概述

在摩爾定律的推動下，積體電路製程取得了高速發展，單位面積上的電晶體數量不斷增加。系統單晶片 (System-on-Chip, SoC) 具有集成度高、功耗低、成本低等優勢，已經成為大型積體電路系統設計的主流方向，解決了通信、圖像、計算、消費電子等領域的衆多挑戰性的難題。隨著片上系統 SoC 的應用需求越來越豐富，SoC 需要集成越來越多的不同應用的 IP (Intellectual Property)。另外，

圖 1: Speedster 7t FPGA 結構圖



圖 2: 典型的 AMBA 汇流排系統



片上多核系統 MPSoC(MultiProcessor-System-on-Chip) 也已經成為必然的發展趨勢。

隨著 SoC 的高度集成以及 MPSoC 的高速發展，對片上通信提出了更高的要求。片上網路技術 (Network-on-Chip, NoC) 在這個時候也得到了極大的應用，它本質上就是提供一種解決晶片內不同 IP 或者不同核心之間資料傳輸的片上通信方案。

片上網路技術從發明至今已有 20 多年的歷史，在 SoC 中已經有了廣泛的應用。針對片上網路高頻寬、低延遲的特性，主流 FPGA 公司也開始考慮將 NoC 用於高端 FPGA 中來解決資料傳輸的高頻寬需求。Achronix 的新一代 7nm 製程的 Speedster 7t 便是最早集成了 NoC 的高端 FPGA 之一。如圖 1 所示。

## 片上互連架構的發展

片上互聯架構的發展主要經歷了三個階段：共用匯流排 (Bus)、Crossbar 以及片上網路 (NoC)。

(1) 傳統的 SoC 片上通信結構一般採用共用匯流排的方式。在共用匯流排結構中，所有的處理器和 IP 模組共用一條或多條匯流排。當有多個處理器同時訪問一條匯流排時候需要有仲裁機制來決定匯流排的所有權。共用匯流排片上通信系統結構一般比較簡單，且硬體代價也小。

但是頻寬有限，而且頻寬也沒法隨著 IP 的增多而進行擴展。1996 年，ARM 公司提出的 AMBA 匯流排廣泛應用於嵌入式微處理器的片上匯流排，現在已經成為事實上的工業標準。

(2) 對於傳統的共用匯流排，當多個處理器同時去訪問不同的 IP 的時候，因為需要仲裁機制去決定匯流排的所有權，所以傳統的匯流排方式在這種情況下就會造成一定的瓶頸，最大的問題就是訪問的延時。在這種情況下，為了滿足多處理同時訪問的需求同時提高整個系統的頻寬，一種新的

圖 3: 典型的單向 8x8 Crossbar



圖 4: 典型的混合拓撲網路



解決方案 Crossbar 孕育而生，如圖 3 所示一個典型的 Crossbar 結構。

Crossbar 保證了多路通信同時進行的即時性，只要不是訪問同一個目標設備，就不需要用到仲裁，大大減少了因為仲裁帶來的瓶頸問題。但是隨著設備數的增加，Crossbar 的規模會以幾何級數增長。所以通常我們通過橋接設備去級聯多個 Crossbar 來支援設備的擴展。但是橋接設備可能會成為系統的瓶頸，增加傳輸的延遲。

實際應用中，我們通常也會採用 Crossbar 和共用匯流排相結合的方式，用橋接器將 Crossbar 網路和共用匯流排網路連接起來，如圖 4 所示一個典型的混合型拓撲結構。

(3) 片上網路 NoC 帶來了一種全新的片上通信方法，顯著優於傳統的匯流排式和 Crossbar 的性能。

NoC 是一種可擴展性更好的設計。在 NoC 架構中，每一個模組都連接到片上路由器，模組傳輸的資料則是形成了一個個資料包，通過路由器去送達資料包的目的模組。如圖 5 所示是一個典型的 NoC 結構，圖中的 R 表示 Router，所有的 Router 可以是同步，但每個 Router 所連接的 PE(Processing Element) 與 Router 非同步，自成一個時鐘域 (Clock Domain)。所以基

於 NoC 的系統能更好地適應在複雜多核 SoC 設計中使用的全域非同步局部同步時鐘機制。另外，NoC 可以支援各種擴展功能，比如流量控制 (flow control)、服務品質 (QoS) 等等。因此，NoC 是多核系統的最佳互連線制。

## NoC 在高 端 FPGA 的應用

FPGA 在日益增長的資料加速需求上正在發

圖 5: 典型的片上網路 NoC 結構



揮越來越重要的作用。為了滿足雲計算和邊緣計算中各種高性能應用的需求，FPGA 作為一種可程式設計可定制化的高性能的元件逐步成為一條部署高輸送量資料加速的快捷途徑。但同時這些高性能的加速應用也對高端 FPGA 提出了更高的要求，高算力、高頻寬的資料傳輸以及高頻寬的記憶體。

片上網路技術已經比較廣泛的用於 SoC 中，並取得了比較好的效果。近年來才慢慢用於 FPGA 中，

Achronix 創建了一種可最大限度地提高系統輸送量的 Speedster 7t FPGA 晶片，創新地將二維片上網路 (2D NoC) 運用到了 FPGA 中，可以在邏輯陣列內的處理單元與各種片上高速介面和記憶體介面之間高速地傳輸資料，真正實現了資料密集型應用輸送量的最大化。有了片上網路的 FPGA 如虎添翼，帶來了傳統 FPGA 所不及的很多優勢，勢必在各種資料加速應用中發揮巨大的作用。

## NoC 給 Speedster 7t FPGA 帶來的優勢

Achronix Speedster 7t FPGA 擁有支援單通道速率 112Gbps 的 SerDes、400G 乙太網 MAC、PCIe GEN5 控制器以及頻寬高達 4Tbps 頻寬的 GDDR6 控制器，為各種資料加速應用提供了高頻寬的 I/O 介面和高頻寬的記憶體。在這類應用中，會有大量的資料進入 FPGA 進行處理，處理後的資料會通過 FPGA 輸出，所以除了 FPGA 算力以外，資料移動速度直接決定了器件的性能以及使用者的體驗。為了提高資料傳輸速率，Achronix

圖 6: Speedster 7t 片上網路 (NoC) 結構



在 Speedster 7t FPGA 中專門設計了不同於傳統 FPGA 資料移動通道的片上網路。如圖 6 所示。這是一個可橫跨和垂直跨越 FPGA 邏輯陣列的創新的、高頻寬的二維片上網路 (2D NoC)，它不僅可以連接到所有 FPGA 高速介面、高頻寬記憶體介面，還可以作為內部邏輯之間的互連。

Speedster 7t FPGA 上的二維片上網路 (2D NoC) 不是由可程式設計邏輯搭建，而是固化的 ASIC 邏輯實現，固定運行頻率為 2GHz，每一行或者每一列的 NoC 都可以作為兩個單向 256 位元實現雙向的通路，所以每個方向可提供 512Gbps 的頻寬，整個網路總頻寬則能達到 27Tbps。

下面的表格列出了 Speedster 7t FPGA 中 NoC 的特性。

表 1: Speedster 7t FPGA 中 NoC 特性

| NoC 特性      | 描述                                                                     |
|-------------|------------------------------------------------------------------------|
| NoC 運行頻率    | 2GHz                                                                   |
| NoC 支援的協定   | 1.AXI 協議 (256bit)<br>2.Ethernet 乙太網包格式 (256bit)<br>3.原始資料格式傳輸 (288bit) |
| NoC 接入點 NAP | 80 個 master，80 個 slave                                                 |
| NoC 延時      | 每經過一個 NAP 增加 1ns 或 1.5ns                                               |

### NoC 為 FPGA 提供了以下幾項重要優勢：

■大幅提高設計性能，解決一些高性能應用如 400G 乙太網的性能瓶頸：通常在資料流經過 400G 乙太網 MAC 解包以後會是一個超高位寬且需要運行在很高頻率的處理，這在傳統 FPGA 邏輯單元裡面是無法實現的，而 NoC 就能解決性能瓶頸。

■NoC 是在傳統可程式設計邏輯之外額外增加的走

線資源，所以在高資源佔用設計中可以降低佈局佈線擁塞的風險。

- NoC 包含了非同步時鐘轉換，仲裁控制等邏輯，可以去替代傳統的邏輯去做高速介面和匯流排管理等，所以利用 NoC 可以簡化用戶設計節省一部分傳統資源 (LE、FIFO 和佈線等) 的使用。
- NoC 部分是 ASIC 固化邏輯，功耗比傳統的 FPGA 可程式設計邏輯實現要低很多。
- 利用 NoC 可以實現真正的模組化設計。傳統高端 FPGA 設計通常是需要一個 FPGA 工程師團隊來完成，每個工程師設計自己模組，在 FPGA 整個晶片裡調試驗證自己模組，然後再把各個模組連接成更大的完整設計，這時候會由於資源佔用上升，通常需要花很多時間去優化佈局甚至去修改設計以達到目標性能。而在 Achronix Speedster7t 中可以讓模組之間通過 NOC 互聯，再借助對於單個模組功能性能調試完成後固定佈局技術，甚至可以達到 NoC 互聯後整體設計不需要額外聯調的可能。這樣可以大幅減少研發工作量和時間。

### 參考文獻：

- The SoC Interconnect Fabric: A Brief History by Kurt Shuler 2013
- AMBA specification 2.0
- A comparison of Network-on-Chip and Busses by Arteris
- 片上通信結構 – 共用匯流排和 NoC 的分析與比較 周文彪，張岩，毛志剛 2007
- Achronix website [www.achronix.com](http://www.achronix.com) 

**COMPOTECHAsia 檢書**

**每週一、三、五與您分享精彩內容**

**<https://www.facebook.com/lookcompotech>**