當前位置: 主頁 > 新聞 >
 

隆重介紹Intel® oneAPI 2022

本文作者:James R Reinders       點擊: 2021-12-23 12:42
前言:
我很高興在此介紹屢獲殊榮的Intel® oneAPI開發工具包2022年版。這些經過強化的工具提供擴展後的跨架構功能,提供開發者加速運算更好的使用率和架構上的選擇性。工具包在Python、C++、OpenMP、MPI、Fortran、SYCL、C均提供高效能程式設計支援,以及一系列廣泛的oneAPI函式庫。

新功能包含為AI負載和光線追蹤視覺化負載所提供的效能加速、更為寬廣的裝置支援範圍、延伸標準支援、新款微架構最佳化、自2021年版推出以來超過900項的新功能、以LLVM為基礎的編譯器透過通用且統一的方式支援C、C++、Fortran、SYCL和OpenMP、為CPU和GPU支援資料平行Python,以及先進加速器效能建模和調整。

這些程式設計開發工具立即可從Intel® Developer Zone下載,亦可利用apt-get、Anaconda、和其它軟體庫,以及Intel® DevCloud和容器等預先安裝方便您使用。透過使用Intel® DevCloud,您可嘗試在CPU、GPU,和FPGA上使用one API!

oneAPI加速:AI催落去

oneAPI透過提供無縫軟體整合,協助您的AI工作流程達到渦輪增壓效果。基礎即提供oneDNN、oneDAL、oneCCL以及 oneMKL等函式庫,以英特爾AI工具產品組合和框架最佳化,驅動效能以及生產力。

Intel® oneAPI AI Analytics Toolkit加速端到端資料科學和機器學習流程,其現正包含 Intel® Neural Compressor 協助簡化橫跨多個深度學習框架的訓練後最佳化(post-training optimization)。透過低精度量化、剪枝(pruning)、知識蒸餾(knowledge distillation),以及其它的壓縮技巧,AI開發者如今能夠在英特爾平台達成提升推論效能和工程生產力。
 
相較先前未加入我們最佳化的版本,使用oneAPI函式庫的Tensorflow 顯示出可達10倍的效能增益幅度。藉由從Anaconda或其它地方能夠下載到的最佳化scikit-learn,Python機器學習演算法在訓練方面平均改善27倍快,推論方面更達36倍快。根據實際結果指出,僅需要一點點的工夫,即可輕易理解為何我們的最佳化已被許多流行的AI框架、軟體發行(包含Anaconda),以及協助為AI和機器學習注入動力的應用程式所整合納入。

oneAPI亦協助為新款工作站注入動力,以 Intel® Optane™記憶體具備的龐大記憶體容量,大幅度地強化AI開發。Dell、HP以及Lenovo提供眾多Intel® Core™和Intel® Xeon®處理器功能選擇的Linux筆記型電腦、桌上型電腦和工作站,並驗證預先搭載Intel oneAPI AI Analytics Toolkit。其結果為無縫且易於使用的解決方案,讓資料科學家以具規模的方式迭代、視覺化、分析複雜資料。

VentureBeat文章「規模化AI和資料科學—從試驗移往實際生產的10個聰明方法」,正是個學習關於如何打造具開放性、互通性,以及延伸性的絕佳場域,而我們也正在建立協助您AI專案邁向規模化生產的AI運算平台。同時也請閱讀有關軟體AI加速器文章,它們能夠協助您在同樣的硬體組態之下,以免費的方式提升您的AI效能。

oneAPI方法十分重要

我們的oneAPI實現方式即為Intel® oneAPI工具包,奠基於英特爾數十年以來,在全球許多應用程式已廣泛使用的軟體產品,並從英特爾大力推廣的多項開放原始碼專案之中建立。這些工具實現支援多款裝置類型和架構的oneAPI願景,我們也會不斷地延伸CPU、GPU、FPGA以及更多裝置支援性。

Embree:路徑追蹤讓渲染栩栩如生
路徑追蹤是在3維環境模擬光線傳遞的演算法,以便產生影像。為了要渲染具有多個真實世界元素的複雜寫實場景(例如樹木、車輛、人們、桌子等),需要大量記憶體和可觀的運算演算法,過去將其限制於電影專業領域、精細產品設計,以及超級電腦科學視覺化,CPU為其最佳處理平台。近期科技發展將路徑追蹤的令人吃驚、栩栩如生意象,藉由額外的GPU光線追蹤加速功能帶向大眾。

 
於GPU增添光線追蹤硬體正在改變圖形產業,但它為軟體開發者創造出一個挑戰:程式設計需兼顧更多平台。鼓勵並支援xPU思維的oneAPI程式設計方式,有助於避免CPU和GPU各自擁有獨立程式碼庫的極端情況。

我們現在就有解決方案,獲得奧斯卡金像獎的Embree,即是一款由oneAPI Rendering Toolkit函式庫所建立的xPU路經追縱器,以及尖端AI降噪器Open Image Denoise。

Intel®   Open Image Denoise:以ML演算法降低雜訊

這個影片展示使用Intel® Embree和Intel® Open Image Denoise進行每像素單一取樣的TAA(Temporal Anti-Aliasing)即時螢幕擷取,全部在即將推出以Intel® Xe架構為基礎的系統上運作。
 
觀賞此影片以便了解Embree。
 
使用英特爾軟體的路徑追蹤,協助清除MGM動畫電影The Addams Family 2「阿達一族2」視覺特效中的雜訊。富比世的深度文章,解釋其詳細運作原理以及為何重要。

oneAPI提供令人難以置信的功能和效能,同時遏止需要維護多個程式碼庫的缺點。

FPGA:不僅止於支援GPU

在DPC++編譯器透過SYCL支援FPGA程式設計,包含任意精度整數、定點、浮點和複雜資料類型、核心至核心和核心至IO溝通的管道、以及多種記憶體類型部署(例如HBM、DRAM,以及∕或是Optane)中,控制多個記憶體位置的緩衝位置存取器屬性等功能變得更為豐富。我們將會繼續加入功能,在來年提供FPGA設計更多的控制。

Intel DevCloud提供Intel® Arria®和Intel® Stratix® FPGA供您存取。明年稍早,我們將會加入Intel® Agilex™ FPGA,最高提升40%的效能(相對於Intel® Stratix® 10的幾何平均),或是將資料中心、網路、邊緣運算再到 Intel DevCloud的應用功耗最多降低40%。透過Intel DevCloud,您可以嘗試在CPU、GPU,或者是FPGA上使用oneAPI—現在就開始使用,並隨著我們加入額外的硬體支援,享受2022年。

產業標準

 
以下是我們積極支援業界語言標準的更新:

所有Intel® C/C++/Fortran編譯器支援OpenMP 4.5和絕大部分的5.0和5.1。
我們以LLVM為基礎的編譯器將會是我們長期發展的項目;我們積極地強化它們的狀態,例如為首款真正地xPU導向的C、C++,和Fortran編譯器:
o Intel C「icx」編譯器使用 Clang,所以它全面支援C99、C11以及一些C17和(部分提議的)C23,未來更新將帶來更多的改善。
o Intel C++ 「icpx」編譯器全面支援C++11、C++14、C++17、C++20(部分改善正在進行中)、 一些(部分提議的)C++23,以及多數SYCL 2020,即將推出的版本將有額外改善。
o Intel Fortran 「ifx」支援除了PDT以外的Fortran 2003、coarrays以外的2008,並支援OpenMP 5.1運算卸載至GPU。以LLVM為基礎的Fortran於即將推出的版本中縮減與經典Fortran的功能差異,同時擴大其作為真正xPU Fortran編譯器的獨特優勢。
我們的經典Intel C/C++編譯器在CPU上幾乎支援全部的C99、C11、C17、C++11、C++14、C++17以及些許的C++20。
我們的經典Intel Fortran「ifort」在CPU上支援全部的Fortran 2003、2008和2018、加上全部的OpenMP 4.5、以及多數的5.0和5.1.

Intel® MPI Library符合MPI 3.1,包含支援使用GPU-to-rank pinning、GPU記憶體分配(GPU memory allocation、USM),以及針對Google Cloud Platform結構的效能最佳化。我們預期來年將可符合MPI 4.0。

我們的Python支援來到Python 3.x最佳化效能。

先進微架構支援
Intel® VTune Profiler的微架構探索和記憶體存取分析,已支援代號Alder Lake的Intel®微架構。
Intel® oneAPI Deep Neural Networks Library支援Intel AMX指令的int8推論和bfloat16訓練AI工作負載。
為最新的微架構,所進行的無數編譯器和函式庫最佳化。

您之所欲,常在我心

Intel oneAPI 2022工具包提供超過900項新功能的範例如下:

Visual Studio Code擴充協助套件內含通用開發者工作,能夠提供更好的生產力。
藉由此次推出oneAPI,我們引薦Microsoft Windows Subsystem for Linux (WSL2)支援性,拓展oneAPI的使用率。透過Windows 10和Windows 11具備的WSL2,您可以在Windows為CPU和GPU工作流程,使用原生Linux發行版的Intel oneAPI編譯器和函式庫。
未來所推出的oneAPI,我們將會擴展分析工具和通訊函式庫的支援性。我肯定會在將來的部落格裡深入探討,因為您可以做得比Microsoft和英特爾部落格所介紹的多更多!
Intel® MPI Library包含為Google Cloud Platform結構的新款效能最佳化。(OFI/tcp)
IoT開發者現在能夠透過OpenEmbedded或是Yocto Project所提供的intel-meta層來使用工具,加速最佳化Yocto Project Linux 核心和應用程式。
Intel® Inspector改善在CPU目標上執行的DPC++和OpenMP卸載程式碼的記憶體和執行緒錯誤分析。其為Wndows上的memcpy()函式參數加入正確性檢查,並改善C++堆疊框架視覺化和提升libc函式庫回報的精確性。
Intel® Embree光線追蹤函式庫現已包含Arm支援性,此外還有彩色透明度、彩色陰影、錐體,以及圓柱幾何,這些已重新加入以便協助科學視覺化和一般渲染。
Intel® Open Volume Kernel Library(VKL)1.0版的推出包含在Arm CPU原生使用Intel Open VKL的支援,以及新增的API功能,例如區間與命中迭代器內容(interval and hit iterator context)、任意體積屬性迭代、可組態背景值、三次三次過濾(tricubic filtering)、VDB多屬性體積支援、更快速的結構化和VDB體積取樣以及更快的結構區間迭代、VDB和非結構化體積、支援結構化FP16、VDB FP16、VDB動態模糊、VDB三次過濾和同一場景處理多種體積的能力。
Intel® Open Image Denoise包含可為最終畫面提供更好表現的新降噪模式,此外還支援平行光照貼圖(directional lightmap)和Apple矽晶片。
Intel® OSPRay現正支援變型動態模糊和MPI模組函式庫支援。
Intel® OSPRay Studio圖形化使用者介面包含輕鬆為場景打光的光編輯器、gITF載入器的改善支援三角形網格動畫和蒙皮、精準光源、素材與材質、更多的攝影機狀態,透過納入模型轉換、素材、打光和攝影機狀態,達成更好的場景檔案載入與儲存。額外的新功能包含Studio Scene Graph中的Python綁定、控制Intel OSPRay轉換和攝影機動態模糊效果的參數,以及UDIM材質工作流程支援。
強化後的Intel® VTune Profiler生產力包含火焰圖形視覺化。
藉由Intel® Advisor達成GPU建模和效能天花板分析突破。
 
現在就取得工具

您可就原本的下載處取得更新—Intel Developer Zone 上的Intel oneAPI工具包,或是透過容器、apt-get、Anaconda,以及其它發行管道。
這些工具也可以在Intel DevCloud上取用,亦包含相當有用的oneAPI訓練資源。這個身處雲端的環境是個開發、測試與最佳化程式碼的絕佳場所,而且還是免費的,不用自行設定您的系統即可使用一系列英特爾CPU和加速器。

今天就下載絕佳的oneAPI

oneAPI使得程式開發真實開啟這個異質運算時代,讓通用工具:包含函式庫、編譯器、除錯器、分析器以及框架,無視供應商或者架構為何,均可支援系統。
我鼓勵您更新並充分利用Intel oneAPI所提供的功能。當您關心最佳效能時,我們在此提供協助。
若您需要更多的個人化支援,請務必將您的問題提交到社群論壇或選擇付費的優先支援選項。
請造訪我的部落格,獲取更多因oneAPI而成就許多可能的異質程式設計。oneAPI是協助所有軟體開發者的一種態度、一種喜悅,更是一段旅程。

關於oneAPI
oneAPI為一款開放、統一,且跨架構的異質運算程式設計模型。oneAPI針對程式設計工具(函式庫、編譯器、除錯器、分析器、框架……等等)採用開放、多供應商、多架構的方式。植基於標準,此程式設計模型簡化軟體開發,並為加速運算提供絕不妥協的效能,不會受到私有專用制約,並能夠整合過往傳統程式碼。Sanjiv Shah近期的一篇文章,討論1.1版規範以及即將推出的1.2版規範。更多詳情請見oneapi.io。
 

電子郵件:look@compotechasia.com

聯繫電話:886-2-27201789       分機請撥:11