在 AI 變革千行百業(yè)的時(shí)代,一場(chǎng)關(guān)于效率、可部署性與算力可持續(xù)性的技術(shù)革命正悄然發(fā)生。作為承上啟下的關(guān)鍵中間件,AI 編譯器串聯(lián)起了底層硬件與上層應(yīng)用。無(wú)論是已在業(yè)界廣泛應(yīng)用的 TVM,還是近年來(lái)快速崛起的 Triton,亦或是今年年初才嶄露頭角的算子編程語(yǔ)言 TileLang,編譯技術(shù)已不僅僅是讓模型「跑得起來(lái)」的基本保障,同時(shí)也正在升級(jí)為支撐「高效執(zhí)行與資源利用優(yōu)化」的關(guān)鍵技術(shù)。
圍繞 AI 編譯器上下游的創(chuàng)新與實(shí)踐持續(xù)涌現(xiàn),大家對(duì)該領(lǐng)域的關(guān)注度也在 up up up! 為了更好地連接前沿研究與應(yīng)用場(chǎng)景,7 月 5 日,HyperAI超神經(jīng)將在北京舉辦第 7 期 Meet AI Compiler 技術(shù)沙龍。我們有幸邀請(qǐng)到了來(lái)自 AMD、北京大學(xué)、沐曦集成電路等多位資深專(zhuān)家,與各位分享其面向 AI 編譯器的最佳實(shí)踐及趨勢(shì)研判。此外,上海創(chuàng)智學(xué)院助理教授、Apache TVM PMC 馮思遠(yuǎn)將擔(dān)任圓桌環(huán)節(jié)的主持人,和眾多講師一起圍繞「跨硬件的統(tǒng)一編譯生態(tài)」這一主題展開(kāi)深入的討論。
席位有限,記得提前報(bào)名哦~我們現(xiàn)場(chǎng)見(jiàn)!
活動(dòng)詳情
? 時(shí)間:7 月 5 日(周六)13:30-17:45
地點(diǎn):北京市海淀區(qū)中關(guān)村創(chuàng)業(yè)大街 6 號(hào)樓 2 層車(chē)庫(kù)咖啡
人數(shù):200(現(xiàn)場(chǎng)座位有限,請(qǐng)盡早報(bào)名)
嘉賓及議程
環(huán)節(jié) 1 技術(shù)分享
13:40-16:35
張寧 AMD AI 架構(gòu)師
分享主題:助力開(kāi)源社區(qū),剖析 AMD Triton 編譯器
內(nèi)容簡(jiǎn)介:Triton 是 OpenAI 提出的一種專(zhuān)為簡(jiǎn)化高性能 GPU Kernel 開(kāi)發(fā)而設(shè)計(jì)的編程語(yǔ)言,在主流的 LLM 推理訓(xùn)練框架中得到了廣泛應(yīng)用。用戶(hù)可以通過(guò)開(kāi)發(fā) Python Triton 代碼來(lái)實(shí)現(xiàn) GPU Kernel,無(wú)需關(guān)心底層的 GPU 架構(gòu)細(xì)節(jié),大大降低了 GPU 代碼的開(kāi)發(fā)難度。
AMD 在相關(guān)的 GPU 平臺(tái)上實(shí)現(xiàn)了 Triton 編譯器,并且貢獻(xiàn)給了 Triton 開(kāi)源社區(qū)。為了優(yōu)化 GPU 代碼性能,需要了解 Triton 編譯器及其在 Kernel 性能優(yōu)化中的作用。本次分享將詳細(xì)探討 AMD Triton 編譯器,介紹 編譯器如何提升 Triton 在 AMD GPU 平臺(tái)上的性能。
觀看本場(chǎng)分享,你將了解:
-
AMD GPU 架構(gòu)的介紹。
-
AMD GPU 在 Triton 開(kāi)源社區(qū)上的最新工作。
楊智 北京大學(xué) 計(jì)算機(jī)學(xué)院副研究員
分享主題:TileLang:算子開(kāi)發(fā)不再「燒腦」,性能依然在線
內(nèi)容簡(jiǎn)介:本次分享我們帶來(lái)新的算子編程語(yǔ)言——TileLang。它通過(guò)顯式的 tile 級(jí)原語(yǔ)與自動(dòng)推理機(jī)制,賦能開(kāi)發(fā)者高效實(shí)現(xiàn)硬件感知的神經(jīng)算子,兼顧控制力與開(kāi)發(fā)效率。與傳統(tǒng)編譯器(如 Triton)相比,TileLang 在主流 GPU 上可實(shí)現(xiàn)高達(dá) 6 倍的性能提升,顯著簡(jiǎn)化開(kāi)發(fā)流程,讓性能優(yōu)化不再是「專(zhuān)家專(zhuān)屬」。
觀看本場(chǎng)分享,你將了解:
-
掌握一種更簡(jiǎn)單、更高效的高性能算子開(kāi)發(fā)語(yǔ)言。
-
了解 TileLang 的核心設(shè)計(jì)理念與技術(shù)優(yōu)勢(shì)。
董兆華 沐曦集成電路 高級(jí)總監(jiān)
分享主題:沐曦 GPU 上的 TVM 應(yīng)用實(shí)踐
內(nèi)容簡(jiǎn)介:這次討論主要圍繞如何在沐曦 GPU 上應(yīng)用 TVM。針對(duì)沐曦 GPU,圍繞 TVM 進(jìn)行高性能算子生成,使能基于 TVM 的主流 AI 框架。
觀看本場(chǎng)分享,你將了解:
-
國(guó)產(chǎn) GPGPU 上適配 TVM 可能會(huì)碰到的問(wèn)題。
-
TVM 在國(guó)產(chǎn) GPGPU 上的收益如何,以及哪些方面需要繼續(xù)突破。
-
關(guān)于 TVM 等 AI 編譯器在國(guó)產(chǎn) GPGPU 上的支持現(xiàn)狀,并討論如何拓展相關(guān)生態(tài)圈。
敬請(qǐng)期待~
更多嘉賓敬請(qǐng)期待~
環(huán)節(jié) 2 圓桌討論
圓桌主題:跨硬件的統(tǒng)一編譯生態(tài)
主辦方及合作伙伴
HyperAI超神經(jīng)(hyper.ai)作為國(guó)際領(lǐng)先的人工智能及高性能計(jì)算社區(qū),旨在通過(guò)提供行業(yè)資訊報(bào)道、數(shù)據(jù)集加速下載、在線教程演示、熱門(mén)模型性能評(píng)測(cè)、前沿論文推薦、高價(jià)值成果解讀、頂會(huì)日歷集成等一系列服務(wù),助力全球數(shù)據(jù)科學(xué)及??智能?業(yè)的開(kāi)發(fā)者及愛(ài)好者學(xué)習(xí)、理解、實(shí)踐,與社區(qū)?起構(gòu)建??智能的未來(lái)。
OpenBayes貝式計(jì)算是國(guó)內(nèi)領(lǐng)先的高性能計(jì)算服務(wù)提供商,通過(guò)為新一代異構(gòu)芯片嫁接經(jīng)典軟件生態(tài)及機(jī)器學(xué)習(xí)模型,進(jìn)而為工業(yè)企業(yè)及高??蒲刑峁└涌焖佟⒁子玫臄?shù)據(jù)科學(xué)計(jì)算產(chǎn)品,其產(chǎn)品已被數(shù)十家大型工業(yè)場(chǎng)景或頭部科研院所所采用。
MLC.AI 社區(qū)成立于 2022 年 6 月,并由 Apache TVM 主要發(fā)明者、機(jī)器學(xué)習(xí)領(lǐng)域著名的青年學(xué)者陳天奇,帶領(lǐng)團(tuán)隊(duì)上線了 MLC 線上課程,系統(tǒng)介紹了機(jī)器學(xué)習(xí)編譯的關(guān)鍵元素以及核心概念。
2022 年 11 月,在 MLC.AI 社區(qū)志愿者的共同努力下,首個(gè)完整的 TVM 中文文檔上線,并成功托管至 HyperAI超神經(jīng)官網(wǎng),進(jìn)一步為對(duì)機(jī)器學(xué)習(xí)編譯感興趣的國(guó)內(nèi)開(kāi)發(fā)者,提供了接觸并學(xué)習(xí)一門(mén)新技術(shù)的基礎(chǔ)設(shè)置——文檔。
車(chē)庫(kù)咖啡成立于 2011 年 4 月,是中國(guó)最早關(guān)注早期互聯(lián)網(wǎng)創(chuàng)業(yè),面向早期創(chuàng)業(yè)者圍繞「大眾創(chuàng)業(yè)」打造低成本、便利化、全要素、開(kāi)放式創(chuàng)新創(chuàng)業(yè)服務(wù)平臺(tái)。
作為北京中關(guān)村創(chuàng)業(yè)大街首家眾創(chuàng)空間,車(chē)庫(kù)咖啡以咖啡廳為交互載體,為創(chuàng)業(yè)團(tuán)隊(duì)提供共享、共促、共融、共生交互式辦公空間與創(chuàng)孵配套服務(wù)。車(chē)庫(kù)咖啡是全球第一家創(chuàng)業(yè)主題咖啡廳,是中國(guó)最具影響力的國(guó)家級(jí)眾創(chuàng)空間和國(guó)際化創(chuàng)新創(chuàng)業(yè)平臺(tái)。
活動(dòng)支持
考慮到本場(chǎng)活動(dòng)的場(chǎng)地空間情況,我們僅開(kāi)放了 200 個(gè)到場(chǎng)名額,建議大家盡早報(bào)名鎖定席位。
7 月 5 日 13:30-17:45,我們不見(jiàn)不散!