成年男女免费视频网站_国产福利精品在线观看_耽美肉文片段_中文字幕一区二区在线播放 - 欧美一级欧美三级在线观看

快速發(fā)布求購 登錄 注冊
行業(yè)資訊行業(yè)財報市場標準研發(fā)新品會議盤點政策本站速遞

沈陽自動化所提出場景識別新方法

研發(fā)快訊 2025年06月10日 09:29:27來源:中國科學院沈陽自動化研究所 8921
摘要近日,中國科學院沈陽自動化研究所光電信息技術研究室機器視覺研究部科研團隊提出了一種結合CLIP多模態(tài)模型的場景識別新方法——OSFA(Object-Level and Scene-Level Feature Aggregation)。

  【儀表網(wǎng) 研發(fā)快訊】在機器人領域,場景識別可以幫助機器人理解周圍環(huán)境,完成精準的作業(yè)任務。隨著人工智能技術在各行業(yè)的深入應用,對場景識別的準確性和魯棒性要求不斷提高。
 
  在實際場景中,光照變化、物體遮擋、視角差異及同類場景的多樣性,容易導致識別方法難以提取穩(wěn)定且具代表性的特征。此外,復雜場景中多語義信息的高效融合、避免信息冗余或丟失,以及提升模型泛化能力,是亟待解決的技術難點。
 
  近日,中國科學院沈陽自動化研究所光電信息技術研究室機器視覺研究部科研團隊提出了一種結合CLIP多模態(tài)模型的場景識別新方法——OSFA(Object-Level and Scene-Level Feature Aggregation)。該方法通過動態(tài)聚合對象級與場景級特征,可以顯著提升復雜場景的分類精度與魯棒性。
 
OSFA方法框架
 
  首先,科研人員將CLIP的視覺特征作為先驗信息,采用對象級交叉注意力機制,提取與場景高度相關的局部細節(jié)特征。隨后,利用CLIP的文本編碼器生成類別文本語義信息,引導從圖像中提取全局語義特征,再通過場景級交叉注意力機制形成最終的場景表示。為了增強模型魯棒性,還引入了多損失策略,包括線性分類損失、場景對比損失和類別對比損失。
 
  研究結果顯示,該場景識別方法可有效聚合特征,顯著提升復雜場景分類精度與魯棒性,能為視覺導航、機器人應用等領域的場景理解與智能決策提供技術支撐,助力提升感知與任務執(zhí)行效率。
 
  該研究以Object-Level and Scene-Level Feature Aggregation with CLIP for Scene Recognition為題發(fā)表于國際期刊Information Fusion。沈陽自動化所博士生王群為第一作者,沈陽自動化所朱楓研究員為通訊作者。
 
  光電信息技術研究室機器視覺研究部長期從事智能感知與場景理解關鍵技術的研究,致力于推動人工智能在智能制造、服務機器人、智慧城市等領域的深入應用。(光電信息技術研究室)

我要評論
文明上網(wǎng),理性發(fā)言。(您還可以輸入200個字符)

所有評論僅代表網(wǎng)友意見,與本站立場無關。

版權與免責聲明
  • 凡本網(wǎng)注明"來源:儀表網(wǎng)"的所有作品,版權均屬于儀表網(wǎng),未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍內使用,并注明"來源:儀表網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關法律責任。
  • 本網(wǎng)轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉載時,必須保留本網(wǎng)注明的作品來源,并自負版權等法律責任。
  • 如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
  • 合作、投稿、轉載授權等相關事宜,請聯(lián)系本網(wǎng)。聯(lián)系電話:0571-87759945,QQ:1103027433。
廣告招商
今日換一換
新發(fā)產(chǎn)品更多+

客服熱線:0571-87759942

采購熱線:0571-87759942

媒體合作:0571-87759945

  • 儀表站APP
  • 微信公眾號
  • 儀表網(wǎng)小程序
  • 儀表網(wǎng)抖音號
Copyright ybzhan.cn    All Rights Reserved   法律顧問:浙江天冊律師事務所 賈熙明律師   儀表網(wǎng)-儀器儀表行業(yè)“互聯(lián)網(wǎng)+”服務平臺
意見反饋
我知道了