Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >催生超低功耗邊緣AI應用 tinyML賦予MCU產業新契機

催生超低功耗邊緣AI應用 tinyML賦予MCU產業新契機

作者头像
用户6026865
发布于 2022-09-02 07:28:22
发布于 2022-09-02 07:28:22
7100
举报

物聯網(IoT)相關技術不斷向前演進,加上節能減碳意識抬頭,使得人工智慧(AI)也從雲端走向邊緣端,僅需mW等級的超低功耗就能進行機器學習(Machine Learning,ML)的「微型機器學習」(tinyML)概念應運而生,近年相關技術發展飛快,擠身熱門前瞻技術之列。運用微控制器(MCU)為邊緣裝置(Edge Device)裝上大腦,將有機會讓電子貨架標籤、感測器等邊緣裝置上,也能增添智慧應用。

冠肺炎疫情刺激各產業加速數位轉型;導入AI進行智慧化升級,已然成為各企業的重要發展主軸。一般常見的作法,是透過感測器等裝置進行資料收集,再傳到雲端分析和運算;但隨著資料量愈加龐大,運算力的要求也越來越高,雲端為提供高運算力衍生出高能耗的問題;大量資料不斷在雲端和邊緣端傳輸,亦使資安風險相對提高。tinyML概念的出現,就成了以上問題的解方之一

市場研究機構Gartner於2018年發出關於邊緣運算(Edge Computing)的報告中,即提到2025年將有75%的資料,會在傳統所認知的資料中心或雲端以外的管道被創造與處理,當資料量越來越大,透過傳統方式處理資料也顯得缺乏效率。Gartner甚至斷言,2025年在商務、科技等領域,都將往邊緣運算靠攏,「AI at the edge」將成為主流。

根據tinyML基金會定義的tinyML規格,是用mW等級以下的超低功耗,在常時啟動(Always-on)及電池供電的邊緣裝置執行邊緣運算。NXP大中華區行銷經理李宜儒表示,過去對ML的看法是高耗能跟資源密集,需要非常龐大的雲端處理能力執行;tinyML著眼的就是希望能在邊緣節點上,透過MCU或微處理器執行ML,以少量的電量與記憶體,達到長時間處理並實現應用的成果。

現行ML之所以導致高功耗,大量資料傳輸是一個痛點;而當ML拉到邊緣端,問題也就有機會迎刃而解。MCU業者Silicon Labs比較透過低功耗藍牙(BLE)傳輸感測器資料與使用AI在邊緣裝置進行分析,結果即顯示前者的功耗多了將近10倍。Silicon Labs資深產品經理Tamas Daranyi也認為,在邊緣裝置分析感測器資料,將可有效節省使用雲端基礎設施和流量的費用,進而達到成本的下降。

Daranyi進一步指出,感測器產生大量即時資料,需要耗費大量的頻寬傳輸至雲端運算,導致無線頻譜飽和並增加運作成本。因此,當原始資料不需要傳輸到雲端進行處理,意味著決策可以在邊緣裝置上即時運行,除了節省成本,並能提供更低的延遲,支援即時操作,無需將詳細的原始資料發發送到雲端,也消除了資料隱私洩漏的可能性。

即便tinyML運算力與一般AI晶片是天差地遠,但如此來看,確實可望替AI應用打開另一片天,使應用場域進一步擴大;以無所不在、相對低成本的邊緣裝置做為載體,背後蘊藏著巨大商機;種種因素,讓tinyML的概念,已然成為市場焦點,替MCU產業界注入新的刺激。從上游的CPU IP設計到MCU產品規劃,各廠商無一不絞盡腦汁,以避免在這場甫鳴槍起跑的tinyML競賽中落於人後。

tinyML商機強勁 RISC-V、Arm IP各顯神通

「智慧深入到終端裝置,已經是一個長期必然的大方向!」RISC-V IP設計廠晶心科技董事長林志明著眼tinyML的特性,歸納出tinyML產品幾個重點發展方向:「tinyML要求低功耗,又要執行大量AI運算,更有效率的處理器架構、軟硬整合,以及演算法的優化將變得關鍵;終端應用的多樣性,也讓處理器架構的彈性及可拓展性,對運算效率扮演舉足輕重的角色。」

林志明認為,低功耗、高效率、彈性及擴充性也就是RISC-V先天的優勢,「Simple與Clean-slate,為RISC-V處理器帶來簡潔的設計,設計模組化讓晶片的面積更小,這些設計皆可優化功耗表現;RISC-V指令標準允許使用者自訂架構,加上處理器核心架構廠提供的擴充化工具,則可補足通用架構對多樣需求上不足。融合所有優勢,即可產出具備差異化又貼近終端應用的處理器架構。」

以晶心RISC-V解決方案為例,林志明指出,tinyML常見應用包括震動偵測、手勢感測、語音指令、異常偵測、物件偵測等,為支應其多樣化應用的需求,晶心在D25和D45等RISC-V核心中提供高效的SIMD/DSP處理效能;商用RISC-V向量處理器NX27V中,也提供多功能向量處理能力。晶心並提供ACE (Andes Custom Extension)擴充框架,使客戶能添加指令以進一步加快應用程序。

晶心為因應邊緣運算至雲端運算的高效能應用需求,也於今年初推出NX27V的RISC-V向量(RVV)擴展指令規格v1.0版。針對向量資料類型,可以處理從FP16到FP64的浮點運算,和Int8到Int64的整數運算,並擴充可減少AI資料傳輸量的BF16和Int4指令;其含有專用串流通訊埠(Streaming Port)介面的向量處理單元,亦可使暫存器和外部元件能高效率交換大量資料。

CPU IP設計廠Arm近年也將AI視為重要方向,並因應tinyML趨勢相繼發表Cortex-M55及M85產品,認定這將是MCU重要的發展趨勢。Arm AIoT方案資深經理黃晏祥指出,隨著tinyML在MCU上的應用越來越普遍,「主要幾個專注32bit的廠商原本用M4或M33,現在逐步轉移到M55甚至近期剛發表的M85,以賦予MCU ML的能力」,實體IC預計今年底、明年初有機會上市。

為支援tinyML的低功耗要求,Arm也在M55或M85等針對AI市場推出的產品上,增加進階的Power Domain,讓電源管理更精細。Arm首席應用工程師張維良解釋,進階的Power Domain能針對不同的硬體區塊更精確管理哪些要工作、哪些要關電,這是傳統M3、M4等產品所沒有的;Helium向量處理技術做向量化運算,據內部統計,每一個單位面積也可增加兩到三倍的效能。

此外,32bit處理器的M55和M85搭配Helium,可支援最小8bit的資料運算單元,使效率和功耗優於M4等處理器,這也是M55跟M4關鍵的差異點。張維良解釋,同樣運算8bit資料,M4只能用32bit運算單元進行運算,M55則只需使用一個8bit乘法器運算,因此M55功耗可以是M4的1/4甚至更少,最佳情況下功耗效率有機會是M4的五倍以上,再加上Helium技術,可進一步優化效能。

綜上所述,黃晏祥認為,要執行ML同時兼顧功耗,必須在軟體和硬體兩方面同時著力,「如M55與M85,都具備了為執行tinyML的Helium功能,能針對AI工作負載進行硬體的最佳化。軟體部分,我們有相對應的應用程式介面(API),例如CMSIS-NN或者CMSIS-DSP的指令集,都是專門用來支援tinyML的應用。因此軟硬體都要相互配合,才能為MCU進行最佳化。」

低功耗、高性能 MCU應用場域更多元

如NXP、意法半導體(ST)、Silicon Labs等MCU業者,也都紛紛針對ML推出產品,搶攻tinyML的潛在市場。像是NXP,打著「將ML和深度學習帶向邊緣端」的標語,規劃以Cortex-M7為基礎的i.MX RT10x0、Cortex-M33為基礎RT600等系列產品;ST也瞄準AI應用打造AI生態系統,除了相應的MCU產品,並提供「STM32Cube.AI」擴充包等工具,以協助企業縮短設計時程。

李宜儒舉語音UI系統為例,他說,過去這樣的系統受到低功耗和高性能要求的限制,NXP協助客戶規劃的解決方案,內建了去雜訊音訊前端晶片、喚醒詞引擎和語音命令引擎,並強調不需要任何雲端運算,就能提高現實生活嘈雜場景中的喚醒詞和語音命令觸發率;據統計,完整的語音強化解決方案以Cortex-M7為核心,設備平均以160MHz運作,準確率可提高40%。

Silicon Labs則將ML應用整合於系統單晶片(SoC),搭配無線AIoT系統平台,提供完整解決方案。EFR32系列1和系列2的SoC,支援適用tinyML的TensorFlow Lite Micro ML框架;EFR32xG24並具有內建ML硬體加速器子系統,可將執行AI推論(inference)的性能提高四倍,功耗降低六倍。ML解決方案讓設計人員在需要超低功耗的無線物聯網設備中,可增加AI/ML應用。

Daranyi表示,當物聯網終端產品要加入AI/ML功能,客戶除了要選擇MCU/處理器執行AI/ML工作負載,也要在功能需求與安全性、可負擔性、複雜性和運算間取得平衡。從調查結果顯示到2027年tinyML設備出貨量將成長到30億台、年複合成長率達30%的結果,tinyML的市場確實已在逐漸興起。對MCU來說,如果要因應AI/ML功能需求,接下來會需要更高的執行效率。

目前包括視覺辨識、智慧攝影機、監控、語音指令,或是工廠中物件偵測、良率判斷、異常偵測、震動偵測等,諸如此類邊緣端的應用,皆被認為可能是tinyML的機會。其中又以視覺辨識跟語音辨識,發展最為快速,且或許已悄悄進入我們的生活。比如,像我們喊出「OK Google」詞彙喚醒Android裝置,就是仰賴語音喚醒偵測的ML模型,搭配數位訊號處理器實現類似tinyML概念的應用。

黃晏祥指出,像工業領域震動偵測的應用,是類似偵測機器震動的頻率、型態、模式等參數,輔以相關的演算法,即可預先診斷機器是否故障或者需要維修,也可應用在偵測產線的溫度等。若在前端即可有一些tinyML的能力,可以放入一些演算法,將資料即時的送到後端、或伺服器上,即時發出警訊,與物聯網做更緊密的結合應用。

此外,意法半導體(ST)亞太區資深產品行銷經理楊正廉指出,現在慢慢也有看到手勢偵測及語音辨識等應用,隨著判斷的內容越來越複雜,且大家追求更智慧化,傾向獨立在設備端就做完運算,減少後端負擔,並可即時做出反應,會需要更好的MCU。以ST來說M4到M7都有相關產品支應需求,也在針對運算效能持續優化。

tinyML發展飛快強化生態圈為業界共識

tinyML無疑為AI的應用帶來更多想像空間,一旦不一定需仰賴後端進行判讀,設備「AI化」的成本就有機會降下來,進而提升市場接受度,現在也確實看到越來越多的應用出現。但Gartner曾點出,即便2025年創新應用和產品服務都會朝邊緣運算靠攏,但現在的發展目前確實遇到挑戰,包括難以估計的投資報酬率、相關技術尚未完全成熟等。

黃晏祥也點出三大挑戰,其一是ML的運算模型較大,需要記憶體、flash、cache等依序展開進行處理,用在功耗及記憶體有限制的MCU上會是挑戰;再者,MCU大多以電池供電時,電力有限的情況下多少將影響效能;最後在軟體方面,各個MCU工具鏈不相容,現階段不容易在不同MCU間移植,也會對tinyML裝置未來的大佈建帶來考驗。

針對痛點,相關廠商已有陸續推出解決之道,比如軟體的移植問題,Arm就發表了Project Centauri,讓基於Cortex-M的MCU直接連到雲端,橫跨不同的雲、不同的Cortex-M產品,有標準的API進行跨平台移植,以求將軟體的問題以最快速度解決。

不過物聯網市場應用碎片化的特性,使得單一廠商想憑藉一己之力全面解決痛點、加速擴大市場,難度很高;因此「深化生態系」,以更緊密的合作共創商機和找尋技術突破口,也就成了業界相當重視的重要方向。

業界普遍認為,tinyML是相當接近邊緣端的應用,應用更加多元且發散,很多應用甚至要因地制宜,不再是以前大量或單一規格的產品就能通吃的市場,這就需要平台、生態圈的力量,才得以推著產業鏈和相關技術繼續前行。為此,tinyML基金會於2019年誕生,贊助商不乏高通(Qualcomm)、Arm、英特爾(Intel)、NXP、Silicon Labs、ST、奇景光電(Himax)等半導體大廠,即是希望用打群架的方式搶攻市場。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 SmellLikeAISpirit 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
淺談晶片實體設計-競爭力(Competitiveness)
题记:本文是 funBroad 系列文章的第一篇,中心思想还是,在头部企业可以吃更多『设计余量』红利时,老二老三老四老五跟老小们怎么跟随,怎么提高自身竞争力——最后一段标红部分可细读。
老秃胖驴
2020/05/22
7610
解密特斯拉自動駕駛晶片背後的一號人物
源自:虎嗅網 作者:國仁 在自動駕駛領域,AI晶片其實並非新奇玩意。Mobileye的EyeQ系列晶片,就是較早應用於自動駕駛的AI晶片之一。 而在這個月早些時候,矽谷鋼鐵俠馬斯克,還宣佈了特斯拉正在研發用於自動駕駛的AI晶片,回顧馬斯克對自動駕駛晶片的各種動作,我們發現近來各種跳票“不靠譜”的他,其實對技術發展的趨勢,遠比看上去更理解。 馬斯克對特斯拉自行研發自動駕駛晶片的佈局,從兩年前就開始了。 一、從Mobileye到英偉達 特斯拉的自動駕駛焦慮症 2014年,特斯拉找上Mobileye,用上了它
企鹅号小编
2018/01/25
9580
8 个 WebAssembly 应用案例直击 /转
除了瀏覽器業者、遊戲業者大力支援WebAssembly外,許多需要加速效能表現的大型網頁應用或線上工具,也都能得利於WebAssembly的超快執行速度。目前WebAssembly已經開始應用在哪些場景呢?從這8個WebAssembly應用可以一探究竟,其中,有些專案更在GitHub上釋出了原始程式碼,可供開發者參考,來打造出自己的WebAssembly應用。
Jean
2019/02/11
2.7K0
8 个 WebAssembly 应用案例直击 /转
計算機程序設計:7大編程原則
編程的工作同石匠的工作相類似,即是技術活,也是體力活,而編寫優秀的軟件,算是一件比較難的事。編程大牛們並不是直接上手編寫,而是根據需求進行設計,不但將代碼中 Bug 出現的機率降到最低,還要讓代碼具有高可讀性,高安全性等等。
一个会写诗的程序员
2020/09/01
6010
ios苹果app上架流程
什麼都是假的,只有 App 上架 Store 才是真的。千辛萬苦完成 App 後,下一步、也是最重要的一步,就是把 App 送審上架!為了讓新手都能一次就送審成
iOS程序应用
2023/02/10
1.4K0
ios苹果app上架流程
NVIDIA 下一代 Pascal GPU 預計於明年推出
NVIDIA 於美國矽谷舉辦的 GTC 2015 大會上,率先揭露明年推出的 Pascal 架構,相較於當前的 Maxwell 處理器, Pascal 架構 GPU 將可能可讓應用程式的運算速度加快十倍。 GTC 2015 大會由 NVIDIA 執行長暨共同創辦人黃仁勳先生進行開幕主題演講,並對四千名與會嘉賓揭露 Pascal 架構的細節與處理器的最新發展藍圖。 Pascal 架構 GPU 的三大設計特色將大幅加快訓練速度,加上 32GB 的記憶體 ( 是剛發表 NVIDIA 旗艦級繪圖卡 GeForce
GPUS Lady
2018/03/30
6370
【ES三周年】基于ELK的日志分析服务
本專題作品開發一套基於ELK的日誌分析服務,提供多種日誌類型解析及對應的可視化功能。目前提供的日誌類型分別為系統日誌(syslog)、網功能變數名稱稱系統日誌(dnslog)及網頁伺服器日誌(nginxlog),可視化功能包含圖表呈現和文字說明等。
sh1mwww
2023/02/15
1.3K0
【Rust日报】 2020-01-31 Rust編譯模型災難
文章作者Brian Anderson是Rust編程語言 及其姊妹項目Servo Web瀏覽器的共同創始人之一。
MikeLoveRust
2020/02/20
4610
从数据到AI
信息是一個客觀存在物體的自然表現,比如說“I am a local villain.”,無論你用什麼語言、什麼方式表示他都是客觀存在的,而信息即是承載這些客觀實體的概念載體。雖然香濃知道20世紀中才提出了信息輪,但是信息自古就有,與算機系統的出現無關,比如遠古結繩記事、早期文明的甲骨文、中世紀文明的簡牘等等,但是直道現代才理論化。
随风溜达的向日葵
2019/11/21
5440
从数据到AI
[ISUX譯]Touch bar 設計指南
導語:日前蘋果發布會上,最大的亮點之一當屬替代一欄功能鍵的Touch bar。本文包括有5個小節,詳細介紹了Touch bar設計原則、新特性和基本元素 ,一起來學習。 Touch bar概述 Touch Bar是位於新一代MacBook Pro鍵盤上方的一條 Retina 顯示屏,同時也是與主屏幕內容交互提供動態操作界面的輸入設備。基於當前語境,Touch Bar的這些控件能對系統或應用的功能進行快速訪問。 例如,當用戶在編輯文檔時,Touch Bar可提供調整字體類型和大小的控件。 當用戶查看地圖時,T
腾讯ISUX
2018/06/29
8750
2017年最突出研究發現之一:人工智能會否取代人類
2017年最突出的研究调查发现,超过70%的美国人认为,机器人和人工智能在未来可能会取代人类的工作。然而,大多数受访者并不认为自己的工作会被取代。这项调查还发现,人们对于不同行业的工作被取代的担忧程度不同,如快餐业和软件工程行业的工作更容易被取代,而教师和护士等职业则相对较难被取代。此外,调查还发现,人们对于政府应该限制机器人和人工智能取代人类工作的政策持不同态度。
企鹅号小编
2018/01/08
5670
2017年最突出研究發現之一:人工智能會否取代人類
NVIDIA GPU 助信息安全厂商免除惡意程式攻擊
電腦和行動裝置上的惡意軟體程式日漸增加,對於信息安全業界造成嚴重問題,由於資料量過於龐大,現時有部份公司陸續開始利用 NVIDIA GPU 解決惡意軟體的問題,避免受惡意程式攻擊。 NVIDIA 指出與 CPU 相比,進行規則比對時 GPU 查詢的速度比 CPU 快上 22 倍、產生規則的速度快上 20 倍,而進行近鄰查詢的速度比快上 13 倍。 來自捷克的信息安全廠商 Avast Software 開始利用 GPU 來解決惡意軟體, Avast 增設了一個 GPU 加速資料庫,處理和分析數百萬個樣本,速度
GPUS Lady
2018/03/30
7370
生存VS算力
英國「金融時報」報導,鑒於美國近期祭出制裁來壓制中國電腦運算能力,中國科技企業阿里巴巴和壁仞科技為了避免受制裁,正將各自最先進晶片的設計微調,以降低運算處理速度。
用户9732312
2022/12/20
9170
生存VS算力
2015 年財務分析師大會上 AMD 闡述未來發展重點及策略
AMD 剛於上星期美國紐約納斯達克交易中心舉辦的 2015 年財務分析師大會上,闡述 AMD 未來數年發展策略,透露包括新一代 64 位元 x86 與 ARM 處理器核心的細節、運算與圖像業務的更新、企業端、嵌入式與半客製化業務的最新消息等,持續架建各類型的高效能產品為公司帶來更高的利潤。 AMD 於 2015 年財務分析師大會中闡述未來發展重點,開發代號為「 Zen 」的全新 x86 處理器核心,相較目前 x86 處理器核心,每時脈周期執行的指令集可提高達 40% ,「 Zen 」具備同步多線程 SMT
GPUS Lady
2018/03/30
5370
AMD FirePro W7100 已經推出咗啦! 大家快嚟睇睇有咩新功能
最強單插槽8GB 記憶體專業顯示卡 AMD FirePro W7100 已經推出咗啦! 大家快嚟睇睇有咩新功能 1.> 8GB 記憶體? 咁高點會用得着啊? 原來對於高需求的專業軟體,更大的記憶體有
GPUS Lady
2018/03/30
7130
譯文: Adaptive Layout Tutorial in iOS 11: Getting Started
翻譯自raywenderlich上的一篇教程:Adaptive Layout Tutorial in iOS 11: Getting Started。水平有限,如有謬誤,還請斧正。以下為譯文:
iOS Development
2019/02/14
7180
Tegra X1 家用遊戲多元化裝置 NVIDIA SHIELD Android TV
NVIDIA 5 日針對智能家居推出 NVIDIA SHIELD 系列 Android TV 裝置,內建 Tegra X1 處理器提供優質性能,而且採用 Android 系統平台並搭載為遊戲而設計的 SHIELD 控制器,用家只需一部 NVIDIA SHIELD 即可得到影音娛樂、音樂、 apps 應用和出色的遊戲帶進每個家庭的客廳 。 NVIDIA SHIELD 內建 NVIDIA Tegra X1 八核心處理器, 64 bit 架構,並搭載 256 核心 Maxwell GPU 及 3GB RAM ,
GPUS Lady
2018/03/30
6990
專為手提電腦及AIO PC 設計 AMD 「Carrizo」 APU 系統單晶片
AMD 日前於國際固態電路研討會中( International Solid-State Circuits Conference ; ISSCC )發表新款 A 系列 APU - 「 Carrizo 」,其主要針對手提電腦及低功耗桌面電腦而設計,採用「 Excavator 」 x86 CPU 核心及 AMD 新一代 Radeon GPU 核心,核心效能提升,功耗進一步降低。 AMD 新一代 「 Carrizo 」 APU 主要集成與上代 Kaveri APU 晶片尺吋相若,受惠於其高密度設
GPUS Lady
2018/03/30
6690
AMD 于 2015 CES 上展示多款未來運算技術
AMD 在 2015 CES 國際消費電子展上,展出多款令人眼前一亮的新產品和技術,包括一系列 APU 、 Radeon GPU 與嵌入式設計的創新,突破現代運算發展界限,並展示對未來運算的精闢見解,鞏固 AMD 在環繞運算的領導地位。 AMD 2015 CES 大會重點展出多個新產品和技術,其中於新一代行動運算, AMD 於會上展出首款高效能系統單晶片( SoC )和新一代代號為 Carrizo 的行動 APU 。並預計於 2015 年中上市的 Carrizo ,專為現代消費者運算習慣及 IT 部
GPUS Lady
2018/03/30
7500
Express.js 4.0 有加入一個新的 Router 功能
Express.js 4.0 有加入一個新的 Router 功能,它就像一個迷你的應用程式,可以讓應用程式內部的路由撰寫更方便、更有彈性。 Express.js 在 4.0 版中有許多新的功能,其中一項主要的功能就是 Router,以下我們介紹如何使用 Router 功能來撰寫應用程式。 基本應用程式 首先建立一個 package.json 檔案,定義套件的相依資訊: { "name": "express-router-experiments", "main": "server.js",
前朝楚水
2018/04/03
1.1K0
Express.js 4.0 有加入一個新的 Router 功能
推荐阅读
相关推荐
淺談晶片實體設計-競爭力(Competitiveness)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档