2016年月9日14日--NVIDIA今日起開放免費下載用於 Jetson TX1 的最新開發者工具及函式庫套裝軟體 NVIDIA JetPack 2.3,就能將這具世界上深度學習效能最優異的平台用在嵌入式系統上,將其運算速度和效率提增兩倍。
圖表詳見文末註解
執行複雜深經網路的能力被視為是智慧裝置能否解決現實生活中實質的問題,包含公共安全、智慧城市、製造生產、災害救濟、農業與交通及基礎建設檢查等的重要關鍵。
多合一的設計
JetPack 2.3採多合一設計,將各項系統軟體、工具、優化後的函式庫與API整合並安裝在一起,同時還提供多項範例,讓開發人員可以快速地將此套件應用於其創新設計上。
此版本的重要功能有:
·TensorRT:過去稱為 GIE 的 TensorRT 是一項深度學習推論引擎,將圖片分類、分割和物件偵測等應用項目的執行時間效能發揮到最大,讓開發人員能部署採用 Jetson 技術的即時神經網路,在進行深度學習的表現是過去執行 cuDNN 的兩倍。
·cuDNN 5.1:用於深度學習的 CUDA 加速函式庫提供高度調整後的卷積、激活函數和張量轉換等標準程序執行項目;此版本亦支援 LSTM 和 RNN 等先進網路模型。
·多媒體 API:一組適用於彈性開發應用項目的低階 API,包含:
o攝影機 API:對攝影機參數的各幀控制及 EGL 串流輸出,能有效與 GStreamer 及 V4L2 管線相互運作。這個攝影機 API 讓開發人員以更低階的存取方式通過 MIPI CSI 連接攝影機的感應器。
oV4L2 API:視訊解碼、編碼、格式轉換和擴充功能。用以編碼的V4L2以低階存取的方式開啟位元率控制、品質預設值、低延遲編碼、時間權衡及動態向量圖等功能;亦支援舊版本裡的 GStreamer 執行項目。
·CUDA 8:在最新版本裡加入更新後的主編譯程序,支援 GCC 5.x 和 NVCC CUDA 編譯器,經過最佳化後將編譯速度提升兩倍。CUDA 8 也納入了圖形分析加速函式庫 nvGRAPH,還能見到 CUDA 核心及 cuBLAS 和 cuFFT 函式庫裡新的半精度浮點運算 API。
新的合作關係
NVIDIA 另與Jetson 首選合作夥伴 Leopard Imaging Inc. 合作。Leopard Imaging Inc. 專精於開發包含嵌入式機器視覺應用程式立體深度繪圖、用於智慧機器的攝影機以及消費性產品等攝影機解決方案。
開發者可與 Leopard Imagining 合作以輕鬆整合多具 RAW 影像感應器,同時藉由 CSI 或 USB 介面使用 NVIDIA 的內部晶片上 ISP或外部 ISP,並推出用於 YUV 感應器的 ISP 繞道成像模式。這個納入 Jetpack 2.3 的全新攝影機 API提供強大的功能,讓開發者輕鬆進行整合。
立即下載 JetPack 2.3。更多關於JetPack與TensorRT的技術資訊,請瀏覽開發人員專區部落格。
關於NVIDIA(輝達)
(2)GPU 頻率為 691 MHz 時測量 Jetson TX1 的效率。
(3)CPU 時脈為 4 GHz 時測量 Intel Core i7-6700k 的效率。
(4)GoogLeNet 批次大小限為64,這是能使用 Jetpack 2.0 來執行的最大值。使用 Jetpack 2.3 及 TensorRT 時也支援 GoogLeNet 批次為128的大小,以提高執行表現。
(5)Jetson TX1 的 FP16 結果可與 Intel Core i7-6700k 的 FP32 結果相互比較;在 FP32、FP16 並未出現分類精度耗損的情況。
(6)使用最新公布的 IntelCaffe 與 MKL2017 beta 版本。
(7)Jetpack 2.0 與 Intel Core i7 的重量和輸入影像不使用非零資料;Jetpack 2.3 (TensorRT)使用真實影像和重量。