告別“云端依賴”!邊緣計(jì)算讓AI在設(shè)備端“獨(dú)立思考”
2024年11月,普華永道美國全球半導(dǎo)體主管、合伙人Glenn Burm在一份報(bào)告中指出:人工智能專用芯片市場(包括GPU、加速器和HBM芯片)預(yù)計(jì)將在2028年飆升至1,500億美元規(guī)模。這些專用半導(dǎo)體芯片為從生成式AI模型到物聯(lián)網(wǎng)解決方案的尖端AI應(yīng)用提供核心算力。
當(dāng)前,產(chǎn)業(yè)焦點(diǎn)集中于開發(fā)兼具頂級性能、可擴(kuò)展性與能效的芯片設(shè)計(jì),然而AI芯片的性能發(fā)揮同樣取決于數(shù)據(jù)處理的位置——邊緣AI有望成為撬動全行業(yè)升級的支點(diǎn),實(shí)現(xiàn)“水漲船高”的協(xié)同效應(yīng)。
人工智能與邊緣計(jì)算的崛起
邊緣計(jì)算與AI技術(shù)的迅猛普及已徹底變革各行業(yè),從汽車制造到工業(yè)制造、醫(yī)療健康、電子設(shè)備、零售及金融服務(wù)等領(lǐng)域,為企業(yè)和消費(fèi)者帶來更智能、更快速、更安全可靠的解決方案。
這些快速增長的技術(shù)方案依賴于云計(jì)算來處理海量AI工作負(fù)載。盡管云端生成式AI面臨高昂成本,但其近乎無限的內(nèi)存容量與算力資源,意味著在可預(yù)見的未來,基于云平臺的應(yīng)用程序仍將主導(dǎo)AI應(yīng)用的發(fā)展方向。
當(dāng)人工智能應(yīng)用的計(jì)算處理主要在云端進(jìn)行時(shí),會帶來安全、隱私、響應(yīng)時(shí)間和可擴(kuò)展性等方面的挑戰(zhàn)。以自動駕駛汽車為例,為確保安全高效運(yùn)行,車輛需要近乎實(shí)時(shí)的響應(yīng)能力,而集中部署于云端的計(jì)算資源易引發(fā)延遲并影響性能。
邊緣AI正帶來變革性突破
邊緣AI通過將人工智能直接嵌入終端設(shè)備,在數(shù)據(jù)源頭進(jìn)行近域處理,而非依賴異地云計(jì)算數(shù)據(jù)中心,從而能帶來更卓越的性能表現(xiàn)、可擴(kuò)展性、安全防護(hù)與創(chuàng)新能力。
邊緣AI的分布式架構(gòu)天然具備卓越的可擴(kuò)展性,使得在龐大設(shè)備集群中部署專為邊緣場景優(yōu)化的AI應(yīng)用變得更簡便、更經(jīng)濟(jì)高效。更重要的是,通過在邊緣端直接處理潛在敏感數(shù)據(jù),該技術(shù)能強(qiáng)化隱私保護(hù)與安全防線,顯著降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。邊緣計(jì)算還大幅提升了系統(tǒng)可靠性,即使面臨間歇性網(wǎng)絡(luò)波動甚至脫機(jī)運(yùn)行,設(shè)備仍可維持核心功能運(yùn)轉(zhuǎn)。
這場技術(shù)變革的核心驅(qū)動力在于邊緣AI芯片設(shè)計(jì)——通過融合科學(xué)突破、工程實(shí)踐及AI優(yōu)化技術(shù),打造出能在本地完成即時(shí)數(shù)據(jù)處理的專用芯片。
為邊緣AI提供支持的芯片設(shè)計(jì)
在邊緣端執(zhí)行復(fù)雜生成型AI處理的迫切需求,正催生多重技術(shù)挑戰(zhàn),需滿足包括實(shí)時(shí)處理需求、嚴(yán)格的成本要求、有限的內(nèi)存資源、緊湊的空間要求以及強(qiáng)制性的功耗預(yù)算。
傳統(tǒng)芯片架構(gòu)在邊緣場景面臨嚴(yán)峻挑戰(zhàn),其根源在于存儲器與處理器間持續(xù)數(shù)據(jù)搬移帶來的高昂能耗代價(jià)。特別是運(yùn)行大型語言模型(LLM)等AI工作負(fù)載時(shí),頻繁的內(nèi)存訪問將引發(fā)性能瓶頸。為突破此限制,新一代芯片架構(gòu)將AI加速器與優(yōu)化的內(nèi)存層次結(jié)構(gòu)深度集成,顯著降低對外部存儲的依賴,從而實(shí)現(xiàn)更快、更高效的處理能力。核心原則是最大限度地重復(fù)利用已加載到芯片上的數(shù)據(jù)。
實(shí)現(xiàn)智能設(shè)備感知與理解環(huán)境的能力,必須依托強(qiáng)大的系統(tǒng)芯片(SoC)解決方案。三維異構(gòu)集成技術(shù)將成為必然演進(jìn)方向——通過在芯片上使數(shù)據(jù)處理單元、存儲單元與專用AI加速器更緊密集成,大幅提升協(xié)同效率。垂直結(jié)構(gòu)對邊緣AI尤為重要:不同于平面結(jié)構(gòu)的微縮化路徑,3D架構(gòu)在相同基底面積上垂直構(gòu)建計(jì)算單元,如同高層建筑向空中拓展空間。該技術(shù)在閃存領(lǐng)域已得到很好的應(yīng)用。這些技術(shù)突破帶來三重效益:在保持同等運(yùn)算性能的前提下,芯片制造成本顯著降低、能耗大幅削減,同時(shí)實(shí)現(xiàn)算力進(jìn)一步躍升。正是此類高性能專用芯片的誕生,才使人工智能技術(shù)的規(guī)模化落地成為可能。
這些技術(shù)進(jìn)步有一個(gè)共同點(diǎn)。它們都需要使用此前從未在芯片生產(chǎn)中應(yīng)用過的全新“智能”材料。新型3D結(jié)構(gòu)需要完全不同的材料層疊方式,從水平層疊轉(zhuǎn)變?yōu)榇怪苯Y(jié)構(gòu)。此外,許多常用材料在進(jìn)一步縮小尺寸時(shí),其性能會發(fā)生劇烈變化(例如,銅在尺寸僅為幾納米時(shí)導(dǎo)電性能會顯著下降)。
與此同時(shí),機(jī)械和熱學(xué)性能正變得愈發(fā)重要。如今,芯片表面的發(fā)熱量已超過電磁爐灶面。在分層結(jié)構(gòu)中散熱正變得越來越具挑戰(zhàn)性。開發(fā)能更好地滿足這些要求的全新材料,正成為芯片行業(yè)日益重要的任務(wù)。
新材料的發(fā)現(xiàn)任務(wù)異常艱巨,將數(shù)十種潛在元素組合成多種不同的三維結(jié)構(gòu),這一挑戰(zhàn)似乎令人望而生畏。但基于當(dāng)前芯片運(yùn)行的全新工具,有望推動未來芯片技術(shù)的革命性突破。
例如,人工智能有助于開發(fā)新型高度專業(yè)化的材料,使半導(dǎo)體更快、更高效且耐高溫。它還可以用于進(jìn)行虛擬實(shí)驗(yàn)——可以在不同溫度下測試材料的行為,是否與其他物質(zhì)發(fā)生反應(yīng),或其純度可以達(dá)到何種程度——而這一切都在實(shí)驗(yàn)室混合之前就已完成。
當(dāng)前,用于訓(xùn)練AI的模型必須適應(yīng)邊緣計(jì)算環(huán)境,傳統(tǒng)模型所需的算力過于龐大,邊緣設(shè)備難以滿足如此大的算力需求。由于存在這些限制,開發(fā)者正在突破傳統(tǒng)深度學(xué)習(xí)的范疇,其中的一個(gè)方向是——AI不再基于數(shù)據(jù)庫中的數(shù)百萬個(gè)示例進(jìn)行訓(xùn)練,而是通過觀察人類訓(xùn)練師來學(xué)習(xí)。這樣,邊緣AI設(shè)備既能提升計(jì)算效率,又能實(shí)現(xiàn)高推理性能。
改進(jìn)尚需時(shí)日,但前景可期
如今,成本和效率仍是邊緣人工智能成為主流的障礙。所幸的是,已有跡象表明這一進(jìn)程已然推進(jìn)。
最近,Epoch AI的一項(xiàng)全面分析顯示,自2012年以來,用于預(yù)訓(xùn)練語言模型的算法改進(jìn)速度已經(jīng)顯著提升。研究發(fā)現(xiàn),實(shí)現(xiàn)特定語言模型性能所需的計(jì)算資源大約每八個(gè)月就會減少一半;SemiAnalysis的預(yù)測更樂觀。該機(jī)構(gòu)認(rèn)為,大型語言模型(LLM)的算法改進(jìn)速度可達(dá)每年4倍至10倍。
無論是那種預(yù)測,這些速度都遠(yuǎn)超摩爾定律。同樣,推理定價(jià)成本也呈現(xiàn)出指數(shù)級下降趨勢,例如,GPT-3級別的成本在不到三年內(nèi)已下降約1,200倍。
得益于取得的重大進(jìn)展,邊緣人工智能已然成為現(xiàn)實(shí)。相信在未來幾年內(nèi),該技術(shù)還將帶來顯著的增長潛力和創(chuàng)新成果。隨著人工智能應(yīng)用在越來越多的領(lǐng)域得到普及,對嵌入邊緣設(shè)備的高性能、高效率專用芯片的需求將持續(xù)增長。
本文翻譯自國際電子商情姊妹平臺EETimes Europe,原文標(biāo)題: