夜夜夜操操操_亚洲综合无码AV一区二区三区_56pao在线_成x99人av在线www_av水蜜桃_国产成人拍精品视频午夜网站

成果速遞丨ACM MM 2024:中科視語提出FiLo,實現(xiàn)工業(yè)場景零樣本異常檢測新突破

2024-07-30 16:42   來源: 互聯(lián)網(wǎng)

在工業(yè)生產(chǎn)和質(zhì)量控制領(lǐng)域,異常檢測始終是一個關(guān)鍵問題。傳統(tǒng)的異常檢測方法通常依賴大量的正常樣本進(jìn)行訓(xùn)練,但在保護(hù)用戶數(shù)據(jù)隱私或應(yīng)用于新生產(chǎn)線時,這些方法往往不適用。零樣本異常檢測在這種情況下應(yīng)運(yùn)而生,其目的是在沒有目標(biāo)類別物體訓(xùn)練數(shù)據(jù)的情況下,直接進(jìn)行異常檢測。

近日,中科視語和中國科學(xué)院自動化研究所的研究團(tuán)隊提出了一種新的零樣本異常檢測方法——FiLo。 FiLo方法通過細(xì)粒度描述和高質(zhì)量定位模塊,在異常檢測和異常定位兩個方面取得了顯著的性能提升,在零樣本異常檢測工業(yè)場景中取得了業(yè)內(nèi)最好性能。

現(xiàn)有的零樣本異常檢測方法通常依賴于多模態(tài)預(yù)訓(xùn)練模型的強(qiáng)大泛化能力,通過計算圖像特征與手工編寫的表示“正常”或“異常”語義的文本特征之間的相似度來檢測異常,并根據(jù)文本特征和每個圖像塊特征的相似度來定位異常區(qū)域。然而,通用的“異常”描述往往無法精確匹配不同對象類別中的各種異常類型。此外,文本特征與單個圖像塊的特征的相似性計算難以準(zhǔn)確定位具有不同大小和尺度的異常。

中科視語研究團(tuán)隊提出的FiLo方法為了解決現(xiàn)有零樣本異常檢測方法在異常檢測和異常定位兩個方面存在的問題,提出了兩個有機(jī)結(jié)合的模塊:自適應(yīng)學(xué)習(xí)的細(xì)粒度描述模塊(FG-Des)和位置增強(qiáng)的高質(zhì)量定位模塊(HQ-Loc):

自適應(yīng)學(xué)習(xí)的細(xì)粒度描述模塊(FG-Des)主要利用大語言模型(LLMs)的強(qiáng)大知識來生成每個物體類別可能出現(xiàn)的細(xì)粒度異常類型,并采用自適應(yīng)學(xué)習(xí)的文本模板替代手工編寫的文本內(nèi)容,提高了異常檢測的準(zhǔn)確性和可解釋性。

位置增強(qiáng)的高質(zhì)量定位模塊(HQ-Loc)利用Grounding DINO進(jìn)行初步定位,并通過位置增強(qiáng)的文本提示和多尺度、多形狀的跨模態(tài)交互模塊(MMCI)來準(zhǔn)確定位不同大小和形狀的異常。

結(jié)合了 FG-Des 和 HQ-Loc 兩個模塊的 FiLo 方法的整體結(jié)構(gòu)如下圖所示:

FiLo首先通過大語言模型(LLMs)生成每個類別可能存在的細(xì)粒度異常類型列表,然后將細(xì)粒度異常描述填入可學(xué)習(xí)的文本模板中,通過 CLIP 文本編碼器后得到表示“正常”和“異常”語義的文本特征。與此同時,F(xiàn)iLo還將待檢測圖像和大語言模型生成的細(xì)粒度異常描述內(nèi)容輸入到Grounding DINO中,以獲得初步的異常定位框,并將初步定位框的位置信息也添加到文本特征中。

接下來,F(xiàn)iLo將待檢測圖像輸入到CLIP圖像編碼器以提取中間層特征,這些特征通過多尺度、多形狀的跨模態(tài)交互模塊(MMCI)與含有位置信息的文本特征交互,生成異常分?jǐn)?shù)圖。最后綜合各中間層的異常分?jǐn)?shù)圖,即可得到最終的異常圖和全局異常得分。

通過這種方法,F(xiàn)iLo能夠充分利用LLMs的強(qiáng)大先驗知識和Grounding DINO的初步定位能力,再結(jié)合MMCI模塊的多尺度、多形狀特征交互,有效提升了異常檢測的準(zhǔn)確性和精確定位的能力。

基于上述方法結(jié)構(gòu),F(xiàn)iLo研究團(tuán)隊在目前流行的 MVTec-AD和VisA兩個工業(yè)異常檢測數(shù)據(jù)集上進(jìn)行了實驗,與現(xiàn)有零樣本異常檢測方法相比,F(xiàn)iLo取得了最先進(jìn)的性能,實驗結(jié)果如下表所示:

下圖還展示了FiLo在一些實例上的異常檢測和定位結(jié)果,可以發(fā)現(xiàn)相比于 CLIP 的原始輸出,經(jīng)過 Grounding DINO 的定位框篩選和MMCI的多尺度交互后,F(xiàn)iLo 能夠更加準(zhǔn)確地定位出異常位置。


除此之外,通過查看與圖像特征最相似的細(xì)粒度異常描述中的內(nèi)容,我們還可以知道圖像中存在的具體異常種類,為模型的判斷提供了依據(jù),提高了模型決策的可信度和可解釋性。

FiLo論文已經(jīng)被人工智能和多媒體領(lǐng)域頂級會議 ACM MM 2024 接收,論文預(yù)印版已發(fā)布于 Arxiv 上,并開源了相關(guān)代碼。

研究團(tuán)隊認(rèn)為,現(xiàn)有異常檢測方法往往只注重判斷圖像中是否含有異常,而不重視異常的具體內(nèi)容,通過借助大語言模型的豐富知識,后續(xù)研究可以增強(qiáng)異常檢測方法對具體異常類型的判斷,增加方法的實用性和可信度。

論文地址:[2404.13671] FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization

https://arxiv.org/abs/2404.13671

代碼地址:

https://github.com/CASIA-IVA-Lab/FiLo



責(zé)任編輯:Linda
分享到:
0
【慎重聲明】凡本站未注明來源為"大眾時報網(wǎng)"的所有作品,均轉(zhuǎn)載、編譯或摘編自其它媒體,轉(zhuǎn)載、編譯或摘編的目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn)和對其真實性負(fù)責(zé)。如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進(jìn)行!
網(wǎng)站地圖 關(guān)于我們 免責(zé)聲明 投訴建議 sitemap

未經(jīng)許可任何人不得復(fù)制和鏡像,如有發(fā)現(xiàn)追究法律責(zé)任 粵ICP備2020138440號

主站蜘蛛池模板: 天堂中文在线最新 | 这里只有精品视频在线观看 | 免费看欧美黄色片 | 热色av| 91久久偷偷做嫩草影院 | 噜噜噜av在线观看 | 91精品国产高清一区二区性色 | 日本视频中文字幕一区二区三区 | 伊人网络 | 日本老熟妇maturebbw | 欧美亚洲日本在线 | 国产成人无码aⅴ片在线观看 | 国产乳摇福利视频在线观看 | 久久久久久久久久久久久国产精品 | 亚洲精品动漫成人3d无尽在线 | 人人看人人鲁狠狠 | 亚洲欧美成人网 | 亚洲av色香蕉一区二区三区蜜桃 | 日韩欧美区 | 欧美视频精品在线观看 | 欧美性日韩 | 国产精品久久久久尤物蜜月 | 四虎影视免费观看高清视频 | 精灵公主妮娜1至3集免费观看 | 欧美激情A片久久久久久 | 精品av中文字幕在线毛片 | 国产六月婷婷爱在线观看 | 年轻丰满迷人的邻居少妇 | 欧美狠狠色| 韩国午夜理伦三级在线观看仙踪林 | 妇女bbbb插插插视频 | 欧美一区二区在线视频 | 小婕子伦流澡到高潮视频 | 亚洲国产精品av久久久 | 日本成人免费在线视频 | 久久久久亚洲波多野结衣 | 午夜影院在线免费观看视频 | 成年美女黄网色视频免费4399 | 日本少妇又色又爽又高潮看你 | av黄色免费网站 | 18av在线免费观看 |