東北大学 大学院情報科学研究科 情報基礎科学専攻 計算機構論分野
(東北大学 工学部 電気情報物理工学科 情報工学コース)
青木・伊藤(康)研究室

MIRU インタラクティブ発表賞

画像セグメンテーションのための CLIP を用いたゼロショットアノテーション

斎藤 凪都 (東北大学) , 伊藤 慎太郎 (東北大学) , 伊藤 康一 (東北大学) , 青木 孝文 (東北大学)
画像の認識・理解シンポジウム, pp. 1--5, July 2025.
Abstract

視覚と言語の基盤モデルであるCLIPは,テキストと画像との間の類似度を計算することができる.画像セグメンテーションのためのアノテーションにCLIPが用いられているが,物体の細部を捉えることができない問題がある.本論文では,CLIPを用いたゼロショットアノテーションを提案する.複数の解像度の画像とクラスラベルのそれぞれからCLIP特徴量を抽出し,擬似ラベルを求め,条件付き確率場の最適化を通して擬似ラベルを洗練する.公開データセットを用いた性能評価実験により,提案手法の有効性を示す.

戻る