2022年4月11日--甲骨文宣布,Oracle MySQL HeatWave 除了支援交易處理和分析之外,現在也支援資料庫機器學習 (ML)。這是目前唯一提供此功能的 MySQL 雲端資料庫服務。HeatWave ML 可完全自動化ML生命週期,並將所有經過訓練的模型儲存在 MySQL 資料庫中,無須將資料或模型移轉至ML工具或服務。消除擷取、變換及載入 (ETL) 流程可降低應用程式的複雜性及成本,並提升資料和模型的安全性。HeatWave ML 包含在所有 37 個 Oracle Cloud Infrastructure (OCI) 區域的 MySQL HeatWave 資料庫雲端服務中。
目前為止,為 MySQL 應用程式添加機器學習功能對於許多開發人員來說非常困難且耗時。首先,需要將資料從資料庫擷取到另一個系統,以建立與部署ML模型。透過此方式,將機器學習應用於應用程式資料時會建立多個孤島,並隨著資料移動而出現延遲。同時也導致資料庫中資料的擴散,使其安全性更容易受到威脅,並增加了開發人員在多個環境中編程的複雜性。其次,現有服務期望開發人員為指導ML模型訓練過程的專家,否則模型是次佳的,並會降低預測的準確性。最後,大多數現有的ML解決方案不包含解釋功能,説明開發人員建置的模型為何能提供特定預測。
MySQL HeatWave ML 透過在 MySQL 資料庫中原生整合機器學習功能來解決這些問題,無須要將資料擷取、變換及載入到另一個服務。HeatWave ML 可完全自動化訓練過程,並為指定資料集和特定作業建立具有最佳演算法、最佳功能以及最佳超參數的模型。同時,HeatWave ML 產生的所有模型都可以提供模型和預測說明。
沒有其他雲端資料庫供應商在其資料庫服務內提供這類進階的機器學習功能。甲骨文發布的 ML 基準是針對眾多公開存取的機器學習分類與迴歸資料集 (例如 Numerai、Nomao 及 Bank Marketing等) 執行。在較大的 HeatWave 叢集上進行訓練時,更能顯現HeatWave ML相較於Redshift ML在性能上的優勢。訓練是一個耗時的過程,由於使用 MySQL HeatWave 可以非常高效和快速地完成,客戶現在可以更頻繁地重新訓練模型,並且隨時掌握資料的變更。這樣一來,模型可保持在最新狀態,並提升預測的準確性。
甲骨文首席企業架構師 Edward Screven 表示:「正如我們在單一資料庫內整合分析和交易處理一樣,我們現在將機器學習併入 MySQL HeatWave。MySQL HeatWave 是甲骨文發展最快的雲端服務之一。越來越多客戶從 Amazon 和其他雲端資料庫服務轉移至MySQL HeatWave,不但顯著提升了效能,也降低了成本。此外,我們還推出許多創新功能來強化 HeatWave 功能、改善可用性及降低成本。我們全新且完全透明的基準結果再次表明,Snowflake、AWS、Microsoft 和 Google 比 MySQL HeatWave 更慢,而且成本更高。」
相較於其他雲端資料庫服務,HeatWave ML 提供以下功能:
全自動化模型訓練:使用 HeatWave ML 建立模型的每一個階段都是完全自動化的,不需要開發人員介入。這使調整後的模型更準確,無須手動工作,且能始終完成訓練過程。另一方面,其他雲端資料庫服務 (例如 Amazon Redshift)雖然可與外部服務的機器學習功能整合,但需要開發人員在 ML 訓練處理期間進行大量手動輸入。
模型和推論解釋:模型可解釋性協助開發人員瞭解ML模型的行為。例如,如果銀行拒絕客戶貸款,銀行會需要認定哪些模型參數有被納入考量,或者模型是否包含任何偏差。預測可解釋性這樣的技術,可協助解釋ML模型進行特定預測的原因。近來,由於企業必須能夠解釋ML模型所做出的決定,因此預測解釋功能越來越重要。HeatWave ML 在模型訓練處理中整合了模型解釋和預測解釋,因此,HeatWave ML 建立的所有模型都可以提供模型與推論的解釋,而無須在推論解釋時訓練資料。甲骨文增強了現有的解釋技術,以改進性能、可解譯性及品質。其他雲端資料庫服務則無法為其所有ML模型提供如此豐富的可解釋性。
超參數調整:HeatWave ML 為超參數調整實行一種新的漸層搜尋式縮減演算法,能夠在不影響模型準確度的情況下,同時執行超參數搜尋。超參數調整是 ML 模型訓練最耗時的階段,而這項獨特功能讓 HeatWave ML提供優於其它雲端服務商的建立ML模型的效能優勢。
演算法選擇:HeatWave ML 使用代理模型的概念,也就是呈現完整複雜模型特性的簡單模型,以判斷訓練的最佳 ML 演算法。此功能使用簡單的代理模型,在不影響準確度的情況下非常有效率地完成演算法選擇。目前,沒有其他用於建置ML模型的資料庫服務具備此類代理建模功能。
智慧資料抽樣:在模型訓練期間,HeatWave ML 會對少量的資料進行抽樣,以提升效能。此抽樣的方式是在資料集中擷取所有具有代表性的資料點,其他雲端服務在建置ML模型時則會採用效率較低的隨機資料抽樣法,在不考慮資料分佈特性的情況下對一小部分資料進行抽樣。
功能選擇:功能選擇可協助判斷訓練資料屬性,這會影響進行預測之ML模型行為。HeatWave ML 中的功能選擇的技術已針對多個領域和應用系統的大量資料集進行了訓練。從這些收集到的統計資料和元資料中,HeatWave ML 能夠有效地識別新資料集中的相關功能。
除了機器學習功能之外,甲骨文 還為 MySQL HeatWave 服務推出了更多創新功能。即時彈性功能可讓客戶將 HeatWave 叢集擴展或縮小至任意數目的節點,無須任何停機時間或唯讀時間,也無須手動重新平衡叢集;資料壓縮功能可讓客戶在每個節點多處理 2 倍的資料量,並降低近 50% 的成本,同時保持相同的性價比;而新增的暫停與恢復功能則可讓客戶暫停 HeatWave,以節省成本。恢復時,MySQL Autopilot 所需的資料和統計資料都會自動重新載入 HeatWave 中。
MySQL Heatwave 客戶與合作夥伴分享
Astute Business Solutions 是領先的 Oracle Cloud MSP 合作夥伴。Astute Business Solutions 共同創辦人暨執行長 Arvind Rajan 表示:「我們最近有機會使用 HeatWave ML 的機器學習功能,認爲這個功能非常創新、快速且易於使用。最重要的是,它十分安全,因為資料或模型沒有離開資料庫。我們相信,提供資料庫內機器學習對我們的客戶來說相當重要,並將進一步加速採用 MySQL HeatWave。」
Estuda.com 是一家 教育SaaS 供應商,為巴西的 K-12 學生提供測試服務。Estuda.com 共同創辦人暨技術長 Vitor Freitas 表示:「與未更改代碼的 Google BigQuery 相比,MySQL HeatWave 將我們的複雜查詢性能提升了 300 倍,響應時間只需幾秒,而且成本降低了 85%。現在,我們可以更好地為 300 萬用戶提供即時分析功能,並持續改善我們的應用程式,以提升學生的績效。」
VRGlass 是一家巴西 SaaS 生產商,為企業客戶提供元宇宙應用程式和設備。VRGlass 執行長 Ohmar Tacla 表示:「Oracle for Startups 計畫所取得的進展,讓我們決定將所有應用程式資料從 AWS EC2 移轉至 MySQL HeatWave。我們只花了三個小時就把一個虛擬活動的資料庫效能提高了 5 倍,同時提升了安全性,而且只需一半的成本。該活動可容納超過 100 萬名參加者和 170 萬個活動環節。」
Genius Sonority 是日本的視訊遊戲設計師、開發者和營運者。Genius Sonority 技術長兼總監 Masayuki Kawamoto 表示:「MySQL HeatWave 將性能提高了 90 倍,這解決了我們在移轉資料時遇到的所有挑戰和顧慮,協助實現即時分析。這對我們來說是一個很大的驚喜。極致的性能改善有助於我們持續改進游戲,為全球玩家帶來愉悅的娛樂體驗。」
Neovera 是值得信賴的託管網路安全解決方案供應商,具備 20 多年的相關經驗。Neovera Inc 的Oracle Database 高級架構師 Arman Rawls 表示:「相較於企業內部部署的 MySQL 資料庫環境,OCI 上的 MySQL HeatWave 讓我們的查詢性能提高了 300 倍,總擁有成本降低了 80%。現在,我們可以在 OLTP 資料庫中獲得即時分析報告,加速增強我們的安全應用程式。」
IDC 資料管理軟體研究副總裁 Carl Olofson 表示:「甲骨文去年 8 月發布搭載 Autopilot 的 MySQL HeatWave。這很可能是過去 20 年來開源雲端資料庫的最大創新。現在,甲骨文憑藉 MySQL HeatWave ML,突破了最初在 HeatWave 中統一 OLTP 和 OLAP 的方式。甲骨文將所有機器學習處理和模型都納入資料庫,因此客戶不僅可以避免在核心資料庫之外管理 ML 資料庫,還能省去資料擷取、變換及載入的麻煩。,進而在速度、準確度和成本方面獲得更多優勢。」
其他資源
• 觀看由 Edward Screven 主講的 Oracle Live 活動
• 在此處自行執行基準
• 觀看 MySQL HeatWave 說明影片
• 閱讀技術部落格,瞭解更多資訊,包括 TPC-DS* 基準
• 閱讀 MySQL HeatWave ML 技術白皮書
• * 基準查詢源自 TPC-DS 基準,但結果無法與已發布的 TPC-DS 基準結果進行比較,因為它們不符合 TPC-DS 規範。
關於甲骨文Oracle
甲骨文在 Oracle Cloud 中提供整合式應用程式套件以及安全、自主的基礎架構。如需有關 甲骨文 (NYSE: ORCL) 的詳細資訊,請造訪 www.oracle.com。
商標
Oracle、Java 和 MySQL 是 Oracle Corporation 的註冊商標。