當前位置: 主頁 > 新聞 >
 

COMPUTEX 2026恩智浦半導體CEO主題演講

本文作者:恩智浦半導體       點擊: 2026-06-04 10:30
前言:
將AI帶入現實世界:實體人工智慧的未來(Bringing AI into the Real World: The Future of Physical Intelligence) 重點摘要
恩智浦半導體總裁暨執行長Rafael Sotomayor
 
重點摘要

主講者:Rafael Sotomayor,恩智浦半導體總裁暨執行長
好!我們開始吧!
八天後,地表最優秀的足球員將齊聚一堂,參加這個世界矚目的賽事。每當他們出戰,全世界都屏息,數十億人為之關注。這是多年精心準備的成果,場上的球員都是菁英。
那麼,與其他球員相比,是什麼讓他們成為菁英呢?不是體能,因為他們的體能都非常出色;也不是對比賽的理解,因為大家都精通比賽。
關鍵在於對任務的掌握,在於在最高水準的比賽中、最大的壓力下,依然能發揮出最佳水準。這就是精英。
在COMPUTEX我走在展場中,到處都是實體AI(Physical AI)的例子。它們無所不在。
於是我不禁思考:如果我們要把這些智慧系統和設備帶入生活,那麼對系統和設備來說,「精英」的定義是什麼?相當於世界級運動員的機器又是什麼?
請各位跟著我,因為我們今天要解答一個問題。
如果你是足球迷,你一定看過梅西(Lionel Messi)踢球。如果你不是球迷,看過梅西踢球一定也會成為球迷。他控球的姿勢非常流暢,毫不費力。準備踢球時,他似乎會在最後一刻才決定是往左還是往右,這取決於對方門將的動作。在那極短的、從啟動到反應的瞬間,或許是地球上最精妙的智慧,但他卻不需要思考。他的本能反應接管了一切。
我們都知道卓越不在於有更多的思考,而是對任務的掌握達到爐火純青,以至於無需思考。
我舉個例子。各位現在感覺如何?我看到現場有很多人。你們的身體怎麼了?有些人已經調整了姿勢,手腳動來動去,這些都是下意識的。
事實上,我們每天做的絕大多數事情,九成五都是在沒有意識思考、不費力、幾乎不消耗能量的情況下完成。這真是太厲害了。我們一天中大部分時間所做的事情,實際上花的時間和精力都非常少。
如果反射主導我們的日常生活,那麼我認為反射也應該是機器人技術的基礎,也是實體AI的基礎。
但關鍵就在於,反射很難。這就引出「莫拉維克悖論(Moravec's paradox)」。
莫拉維克是第一個提出這個概念的人,當時這個概念看起來非常反直覺。對人類來說非常困難的事情,例如推理、解決複雜問題、下棋,對機器來說非常容易;而對人類來說很容易的事情,比如走路、疊衣服,對機器來說卻非常困難。
反射不是語言,也不是推理,反射是機器人領域中最困難的部分。因此,我希望各位暫時記住「反射很難」的這個概念,因為我們稍後會再討論它,這是釋放實體AI全部潛能的關鍵。
現在正是令人興奮的時刻。大家來到COMPUTEX,我們正經歷前所未有的技術變革。我知道你感覺到了。每天,應該說幾乎每小時,都有令人驚嘆的技術發表,非常精彩。
無論是代理型AI(agentic AI)新成果,還是軟體定義汽車(SDV)或能夠說任何語言並解決各種複雜問題的機器的最新進展,這些都令人驚嘆。
這其中許多都源自於雲端人工智慧的創新,但現在人工智慧已經觸及並融入現實世界,正在影響並改變一切。在恩智浦,我們稱現實世界為“邊緣”,而邊緣正是恩智浦大放異彩的地方。
恩智浦專注於邊緣產品。這些產品都是針對特定用途而設計,可滿足實時效能、低延遲、低功耗、高安全性和高可靠性等要求。應用於軟體定義汽車、智慧工廠和智慧基礎設施等領域。這些就是我們的產品。
隨著我們將智慧從雲端移到邊緣,最令人興奮的是,現在所有這些設備都擁有智慧,您可以創造全新的應用場景。可以創建能夠自主決策、獨立運作甚至完全自動駕駛的設備。
但為了發揮全部潛力,我們仍然需要解開莫拉維克悖論這道謎題。所以現在我要和大家談談恩智浦如何憑藉其優勢來解決這個悖論。為了找到莫拉維克悖論的解方,我們需要從一個已經解決反射問題的地方著手,那就是我們自己。
如果我今天問大家一個問題:「智慧存放在於人體的哪裡」?我猜95% 以上的人會說是在人腦。這個回答部分正確,也部分不正確。
讓我們從迄今為止最偉大的實體AI「人腦」開始說起。大腦是腦中最大的部分,佔腦部總質量的80%,推理、意識思考、學習和決策都在這裡進行。所有這些功能都在這裡運作。但這並非反應最快的地方。
跟各位分享一下我今天早上發生的事情,這是真實事件。恩智浦辦公室離這裡只有幾條街,我有時差所以有點晃神,過馬路的時候差點被摩托車撞到,就差那麼一點點,這讓我一下清醒過來。大腦300毫秒的反應時間簡直像一個世紀。當下我像貓一樣跳開,大腦完全沒幫上忙。
還好大腦並非單獨運作,大腦有夥伴,就是位於大腦下方的小腦。
你可以把小腦想像成運動、動作控制、位置、平衡的協同處理器(co-processor)。速度比大腦快,但還不夠快,至少不夠讓我在今天早上避開摩托車。所以我們要再深入一些,來討論脊髓。
在這種情況下,救命的反射不是來自意識,甚至不是來自頭骨裡面,而是源自於脊髓。
各位看這些數據,40毫秒,快如閃電,這是大自然精心設計的安排,在這種情況下,延遲比智力更重要。今天早上,就是這個反射救了我。
脊髓能夠獨立處理訊息、做出決定並採取行動。
我舉個例子來更具體說明,除今天早上為了躲開摩托車而跳起來之外,我相信大家肯定能理解。
碰到很燙的東西時,刺激會讓你抬起手,並將訊號傳遞給脊髓。脊髓接收到訊號後發出肌肉指令,讓你把手拿開。現在手安全了。
同時,大腦還在處理訊息,最後才反應過來,意識到「哦,好燙,好痛」。現在各位可以知道,脊髓讓我們能夠在思考前就採取行動。脊髓保護我們的安全。
在我繼續講解之前,我想強調另一個設計原則。大自然憑藉著無窮的智慧,決定將反射機制放在行動發生的地方。
本質上,脊髓就像一個沿著背部延伸的堆疊式處理中心,負責將訊息定位、感知並傳遞到最近的地點,非常絕妙。
距離越近代表速度越快,速度越快代表越安全,同時也代表能耗最低。進化向我們展示的是幾十億年的最佳化。
我們討論到哪裡了呢?我們從生物學開始,試圖找出解開莫拉維克之謎的線索。我們得出什麼結論呢?結論是,智慧的擴充不是去增加大腦的體積,而是把智慧放在合適的位置,藉此來擴充智慧。
現實生活中,智慧有三個基本要求:
首先,要極低的延遲才能在現實世界中生存
其次,需要分散式控制,這樣就不會出現單點失效
最後,需要極高的能源效率,嚴格管理能源預算,進而延長壽命
這就是行動指南,這就是藍圖。因此,我們認為這正是實體AI所需要的
現在,我們把這個原則應用於機器人領域。這就是恩智浦所稱的神經軸架構(neural axis architecture)。
智慧有三層:推理層、協調層、反思層。三層獨立運作,但又高度協調。
現在來看看實際應用。這裡有三種不同的外形尺寸,恩智浦都有參與。三種不同實施方式。
首先來看無人機。無人機的神經軸映射非常清晰。
推理層負責飛行規劃和路徑最佳化,大腦負責管理飛行平衡和效能。兩者需要獨立且並行地運行,這不是「有也很好」的事情。必須要有這種獨立性,才能讓裝置值得信賴且安全。
再來是反射層,也就是位於邊緣的節點,它們連接到馬達控制和制動器,反應迅速,反射靈敏。它們幾乎不等待,反應時間以微秒計。
恩智浦提供完整的系統,包括所有的 KPI 以及打造世界級無人機所需的一切。
舉個例子,我們追蹤glass to glass latency(端到端影像延遲)的指標。
各位可以想像一下,攝影機捕捉影像、處理、傳輸,控制器回應,然後無人機做出反應。整個過程只需 20 毫秒。
錯過這個時間無人機就會漂移、不穩,甚至墜機。
如果達標,就能掌控一切,無人機動作順暢,安全無虞。
這就是恩智浦在無人機中實現的神經軸。
或許大家對軟體定義汽車(SDV)比較熟悉,因為我們在汽車產業有很多客戶,SDV也是神經軸的絕佳例證。
首先是推理,例如ADAS和導航,決定車輛下一步要做什麼。
其次是協調,這是獨立的運算單元,負責管理車輛動力學,確保車輛始終保持穩定的運動。
恩智浦憑藉其中央運算單元,5 奈米 S32N 系列處理器,在這個領域佔據領先地位。這些處理器和產品在市面上非常獨特。
在反射層上,我們有Sono 系統,負責管理車輛的任務關鍵功能,例如煞車和懸吊。恩智浦憑藉S32K系列產品,在Sono架構領域佔據領先地位。
這三層在邏輯和物理上的分離,正是車輛可靠性的關鍵所在。因為在關乎生命的車輛中,容不得半點差錯。 
恩智浦之所以能在SDV 居於領先地位,正是因為我們在 SDV 的神經軸領域建立領先地位。
人形機器人是所有實施方式中最複雜的。
我認為這是一個新興市場,大家對於人形機器人有許多討論,但我們的信念仍然非常堅定:如果這種神經軸架構足以應用於生命,那麼它足以應用於人形機器人。我不認為這有討論的空間,讓我舉個例子。
想像有個機器人在倉庫裡走動,手裡拿著貴重又易碎的包裹。走到一半的時候,有人掉了一個托盤,托盤碰到了機器人,導致機器人有點失控。
想想接下來會發生什麼事。機器人需要恢復平衡。機器人要保持平衡、確認包裹還在、調整握法、判斷自身位置、恢復平衡並繼續行走,所有這些都必須在40毫秒內完成,不呼叫雲端,不等模型回應。
身體、關節、雙手、雙腳的智慧必須掌控當下。
你看,神經軸構並非可有可無,而是關乎生存。
因此,我們今天看到的人形機器人通常會將推理部分和協調部分分離,因為機器人需要不斷學習,不斷學習新的應用場景,但你不想干擾機器人的動作,動作必須穩定。
沒有脊柱,取而代之的是節點末端的分散式控制系統,這些處理器在本地擁有各自的功能,完全自主。
手知道如何抓取,腳踝知道如何保持平衡,無需等待,無需請求許可。它們主動行動,確保人形機器人的生存。
剛剛列舉了三個例子,三種不同的外形尺寸,三種不同的複雜程度,一個系統,一種架構,一個藍圖,三個智慧層次。我們能從中得到什麼啟示呢?
智慧不是取決於大腦容量,別再執著於大腦容量。想想神經軸,想想智慧的三個層次。
我們常常討論到運動,現在我要討論一個新的問題。
運動不等於理解。機器人能完美執行某個動作,不代表它理解當中的原因。
在我們所處的複雜世界裡,不理解其中的原因是不行的。
所以,問題在於我們要如何教導機器人不僅知道怎麼動,還要知道怎麼理解。
接下來就來談談這個主題。我們不是生來就會走路,也許有些人認為我們生來就會,但不是這樣的;我們也不是生來就會踢球,或拿起一杯牛奶而不灑出。我們是在錯誤中慢慢學習的,但這種反覆試錯的過程讓我們掌握技能,還在我們的大腦中建立關於世界的物理模型。
我們之所以學會重力的概念,是因為我們摔倒再來感到疼痛,然後我們不想再摔。我們之所以學會熱的概念,是因為我們摸了滾燙的東西,然後被燙傷。
但顯然,人類的學習方式不適用於機器人。我們不能直接野放機器人,然後說:「好,去學習,學好再回來。」這樣做不安全,而且是很魯莽的。所以我們必須採取不同的方法。
機器人有一項能力非常出色,它們的視覺能力非常驚人。我舉個例子,這個機器人看著咳嗽糖漿,它可能可以辨識出瓶子,知道裡面裝的是液體,可能還會讀標籤。但它真的理解自己手上拿的是什麼東西嗎?
它知道瓶子是滿的嗎?它知道如果傾斜角度過大,液體就會灑出來嗎?
如果不了解慣性,就很難估算力量的大小。如果不了解摩擦力,就無法判斷糖漿會如何流動,缺乏這種理解,機器人就無法安全地運作。
所以,我們需要連結感知和理解的橋樑。
感知告訴你眼前有什麼,而對世界的理解則會告訴你,當你與眼前的物體互動時會發生什麼事。因此,我們需要橋樑。
這裡的問題在於:如何教機器人物理?大家都是自己來,我是說真的。每個人都是自己教。
我們教機器人如何抓取物體,如何移動。它們模仿、適應,學習。
這種方法有效,但也有其限制:速度慢,成本高。
這就是世界模型(world model)發揮作用的地方。
現在,我們能夠教導機器人來預測結果,無需經歷實際體驗的過程,就像是把知識直接注入機器人,想想《駭客任務》裡的場景,對吧?把知識注入機器人。
注入知識,注入經驗,無需經歷獲取這些經驗的實際過程。這是一個令人著迷的領域。
世界模型在餵養 VLA(Vision-Language-Action,視覺-語言-動作)。
VLA是很技術的概念,代表視覺、語言、動作模型。
它是機器人視覺感知、指令輸入和動作之間的橋樑,連結這三個不同的層面。它建構機器人感知和理解所需的橋樑。
VLA 是目前學術界和工業界最引人入勝的研究領域之一。
VLA 快速發展且越來越完善。現在的問題是,如何將我們在雲端利用無限資源創建的VLA部署到邊緣?
邊緣環境資源有限,功耗、延遲、記憶體和處理能力都有限制。研究裡的VLA模型對倉庫裡的機器人來說用處不大。
所以,我們需要將這些模型部署到邊緣的實際處理器上。我們針對這項挑戰的解決方案就在這裡:我們的工具包,eIQ工具包。
這是一款軟體,可以取得這些模型,導入模型,量子化、剪枝和編譯。
簡而言之,你可以取得模型,針對目標硬體和目標用例進行調整。
我們的目標是消除客戶的疑慮。所有這些都很複雜,因此在應對挑戰時,我們希望確保消除所有疑慮。我們會消除任何阻礙實體AI部署的障礙。
剛才討論了神經軸作為架構,也討論了利用VLA來理解能力,這兩者結合起來使機器人變得有用。
但這足夠嗎?它確實夠有用。有用和值得信賴並不相同,而實體AI要想真正被市場接受,信任問題必須解決。
對人類來說,信任需要時間累積,需要投入數月甚至數年來建立聲譽、建立關係和累積過往的成績。
你不能讓機器花一年的時間去與操作員建立關係,我們沒有那麼多時間。
所以信任無法設計,機器無法贏得信任。
信任必須從一開始就設計進去。機器必須從一開始就值得信賴。信任至關重要。沒有人喜歡事情會出錯這個概念,但事情確實會出錯。
看到這些照片時,你看到它們可能會感到很不舒服。我不禁想起兩條定律:墨菲定律(Murphy’s Law)和菲納格定律(Finagle’s Law)。
墨菲定律說,可能出錯的一定會出錯;
菲納格定律則說,凡事都可能出錯,而且一定會在最糟的時候出錯。
信任就是在最糟的時刻來定義的。信任不是在一切順利時來定義,而是在最糟糕的時刻才得以被定義。
我們該如何看待信任呢?
信任可能因外在因素或內在因素而受損。外在因素可能是環境變化,也可能是有人惡意攻擊系統。
內部因素則包括設計缺陷、模型局限性,有時電子元件的磨損也會導致其行為改變。
這些都是至關重要的問題,因為隨著實體AI的部署,越來越多的關鍵任務功能將依賴人工智慧,因此妥善處理這些問題至關重要。
恩智浦的實體人工智慧並非源自雲端,而是源自邊緣,這正是我們目前在研究的領域,是我們日常工作的一部分,也是我們如今所關注的。對我們而言,它的價值現在更加凸顯。
恩智浦用於保障信任的現有資源,在實體AI領域顯得格外重要。
那麼,我想談談如何從宏觀層面討論信任問題,因為我們目前有架構,而且不斷完善,從宏觀層面來說非常簡單。
我們採取「控制」措施,代表我們隔離問題,建立冗餘機制,不允許單點故障。
我們採取「保護」措施,將安全機制間接注入硬體,保護程式碼執行,防止篡改,保護憑證。
我們也為後量子加密時代做好準備,因為今天的威脅與五年後的威脅截然不同。我們的裝置是未來就緒的。
下一個基本要素是驗證。
我們獲得的SIL和ASIL認證不只是一張紙,這是衡量信任度的方式。
我們的SafeAssure計畫讓醫院或汽車OEM廠商能夠獲得對他們來說至關重要的東西:設備在故障時能運作並自動適應的保證。
在這個市場中,一切都在不斷變化。威脅不斷演變,環境也在不斷變化,所以我們需要不斷發展。
我們需要建立一種機制,能夠持續更新這些邊緣設備,因為它們會在邊緣運作十年之久。因此,我們需要確保這些設備在未來數年內始終保持完整性和安全性。
恩智浦非常重視信任。
邊緣運算中的錯誤和故障不是數位的問題。
你無法透過軟體補丁來修復骨折,也無法透過系統更新來處理車禍碰撞。
我知道我們無法設計出絕不出錯的系統,這一點我們很清楚。
但我們可以設計出出錯也能正常運作的系統。
信任是我們DNA的核心,原因在於我們太了解信任,現實世界沒有撤銷鍵。
實體AI的發展現況如何?
我們的工作不是在客戶準備好之前強行推廣實體AI,而是確保實體AI真正發揮作用。實體AI之所以能被廣泛採用,是有原因的。這裡的主題是:贏得被需要的權利。
我最近收到很多客戶關於如何應用人工智慧的問題,其中一個常被問到的問題是:「實體AI究竟能達到什麼智慧水平?」
這個問題我得好好想想,因為我覺得它問的不太對。
我認為正確的問題是:如今實體AI可以在哪些領域安全可靠地部署,並創造價值?我認為答案逐漸揭曉。
我舉個例子。在工廠自動化領域。
即使是現在,在那些已經部署實體AI機器人的工廠裡,生產效率已比傳統自動化提高40%。
意思是,傳統自動化的生產效率已經相當高,實體AI又在這個基礎上提升40%。
顯然,我們無法單打獨鬥,我們必須與客戶攜手合作。我們非常自豪能與客戶合作。跟各位呈現的是Boston Dynamics,我們將我們的硬體或軟體與他們卓越的機器人平台結合,確保機器人和人類能夠在工廠高效協作。
醫療領域尤其如此,安全性和精準性至關重要,它們會決定治療結果。
2025年,診斷和實驗室機器人的銷售成長610%。這並非曇花一現,而是醫療領域發出的訊號:如果用負責任的方式來部署實體AI,它可以拯救生命。
我們非常自豪能與 GE HealthCare合作,他們在麻醉領域部署智慧系統,精準性和安全性在麻醉領域至關重要,而恩智浦的產品正是他們部署的核心。
每次來台灣我都會在這個時候跟大家交流,台灣的生態系真的太棒了。我們深知,單憑一己之力無法實現這一切。沒有客戶和夥伴的支持,恩智浦力量太小無法落實這一切。
恩智浦有如此成就絕對離不開各位。我們無法自己創新,必須透過合作、共創和交付目標來實現。
名單上的各位不僅是客戶和合作夥伴,更是將人工智慧產品推向市場、使其成為真實的命脈。所以,對於在座的各位以及名單上的各位,我衷心感謝。讓我們攜手並進,共創輝煌。
我的演講從梅西開始,最後也想在梅西結束。
讓這位球員如此出色、如此頂尖,他的身體能夠做到這些不可思議的事情,原因不在於可以看到的地方,而是在於看不到的地方。
暫且不提他對這項運動的驚人投入,但各位所看到的,他身體裡我們稱之為神經軸的無形結構,才是真正的關鍵。
實體AI和機器人也是如此,只不過它們是由人類設計。
我最開始提出的問題是什麼呢?對機器而言,什麼是菁英?我認為我們已經找到答案。
對機器而言,精英是指能夠在真實世界的真實環境下可靠地高效運行,並且在出現故障時能夠保障資產和人員的安全。
這些菁英機器和系統必須具備三個不可妥協的要素:低延遲、低功耗和高度信任。
請記住,僅靠智慧無法擴展實體AI的規模。擴展的方法是將智慧部署在適當的位置,並以神經軸為骨幹。
為了推動實體AI走向市場,恩智浦已經做好充分準備。
謝謝大家!
 

電子郵件:look@compotechasia.com

聯繫電話:886-2-27201789       分機請撥:11