近日,鵬城實驗室網絡智能研究部視覺智能研究所與中國科學院大學電子電氣與通信工程學院共同合作,分別在GitHub和OpenI啟智社區開源了物理傳熱啟發的高效視覺表征模型vHeat。
vHeat與ViT核心算子計算復雜度對比。研究團隊供圖
研究團隊認為,CNN和ViT的卷積算子與自注意力算子都是特征內部的像素傳播過程,分別是一種信息傳遞的形式,從而聯想到物理領域的熱傳導,因此提出了基于熱傳導的視覺表征模型vHeat。vHeat將圖片特征塊視為熱源,通過預測熱擴散率,以物理學熱傳導原理來提取圖像特征。
相比基于Attention機制的視覺模型,vHeat同時兼顧了低計算復雜度、全局感受野、物理可解釋性等特性,計算復雜度降低為1.5次方。
HCO與HCO Layer示意圖。研究團隊供圖
研究團隊根據熱傳導方程,將視覺語義的空間傳播和物理熱傳導建立聯系,根據傅里葉變換求得通解,并依據通解進行離散化和通道維度擴展,提出了一種1.5次方計算復雜度的視覺熱傳導算子(Heat Conduction Operator,HCO)。
此外,團隊認為不同圖像內容對應不同的熱擴散率,提出了頻率值編碼(Frequency Value Embeddings,FVEs)來表示頻率信息,并采用FVEs來預測熱擴散率,使得HCO可進行非均勻、自適應的傳導。
用FVEs預測熱擴散率,形成非均勻、自適應的傳導。研究團隊供圖
實驗證明,vHeat在各種視覺任務中表現優秀。例如vHeat-T在ImageNet-1K上分類準確率達到82.2%,比Swin-T高0.9%,比Vim-S高1.7%。除性能優勢之外,vHeat還擁有高推理速度、低GPU顯存占用和低FLOPs等優點。在輸入圖像分辨率較高時,相比于Swin,base規模的vHeat模型達到3倍吞吐量,同時GPU顯存占用為其1/4倍,FLOPs為其3/4倍。
vHeat這一創新性研究成果為視覺模型的發展提供了新的方向和思路。未來,研究團隊將繼續推進新型視覺模型研究,為模型在各行業、多領域的人工智能發展和應用貢獻力量。
原文地址:http://news.sciencenet.cn/htmlnews/2024/10/531421.shtm10月11日,科幻電影《749局》科影融合特別場在京舉行。電影主創團隊與科技領域相......
10月11日,甘肅省迎來了職業教育領域的一個重要里程碑——甘肅林業職業技術大學正式揭牌成立。這一歷史性時刻標志著歷經六十八載發展的甘肅省唯一一所林業類高等院校,正式邁入了本科教育的新階段,開啟了新的征......
”標志性科考活動獲系列重大突破 “第二次青藏科考標志性科考活動守護水塔‘一原兩湖三江’科考主體任務已經基本完成,這次科考從天到地、從冰到水取得了全方位的進展。”第二次青藏科考隊隊長、中國科學......
關于確定2024年國家環境健康管理試點名單的通知北京市、河北省、內蒙古自治區、遼寧省、黑龍江省、江蘇省、浙江省、江西省、山東省、湖北省、湖南省、廣東省、重慶市、四川省、貴州省、陜西省、青海省生態環境廳......
10月8日,華中農業大學果蔬園藝作物種質創新與利用全國重點實驗室、藥用植物資源可持續利用團隊梅之南教授和楊慶勇教授課題組,發布了首個專門面向菊科植物的多組學數據庫平臺——AsteraceaeMulti......
實驗桌上堆放著精密儀器和焊接工具,電腦上是正在運行的電路圖,一頁頁寫滿了數據、畫滿了圖樣的紙張在桌面鋪開,各式或大或小的電子元件前,南京郵電大學工程實驗教學部創新中心副主任郝學元正在埋首研制電工電子實......
近日,記者從中國計量大學獲悉,該校生命科學學院蜜蜂與蜂產品學研究團隊主持的兩項推薦性國家標準《GB/T44349-2024 蜂花粉總多酚的檢測福林酚試劑比色法》和《GB/T44350-202......
10月10日,由廣東省機械行業協會組織并主持召開的“面向軟性物料的多級賦碼追溯柔性包裝生產線研制與應用”項目科技成果鑒定會議在廣東佛山舉行。經專家鑒定,該項目成果總體技術水平達到國際先進水平。記者獲悉......
近日,中國熱帶農業科學院橡膠研究所組培與轉基因團隊在全球率先獲得了橡膠樹CRISPR/Cas9純合基因編輯橡膠苗。相關研究成果在線發表于《經濟作物和產品》(IndustrialCropsandProd......
近日,中國熱帶農業科學院熱帶生物技術研究所香(大)蕉栽培生理生態研究組從森林鏈霉菌2-6中分離獲得抗枯萎病菌(FocTR4)的活性物質FluvirucinB6,解析了該抗真菌物質的抑菌作用位點及抑菌機......