顔認証は,生体認証の中でも低コストで導入することができ,利便性が高いため,実用化が進んでいる.一方で,顔認証システムは,顔の姿勢や照明の変化,撮影時のブレなどに対してロバストに設計されているため,悪意のある人物が登録者の顔写真などを提示することでユーザになりすまして不正に認証されてしまう可能性がある.そのため,顔認証を行う前に,このようななりすましを検知する必要がある.本物の顔画像となりすましの顔画像との間に存在する微小な差を検知するためにVision Transformer (ViT) を用いたなりすまし攻撃検知手法が数多く提案されている.本稿では,なりすまし攻撃を高精度に検知するためにViT の中間特徴量を用いた学習時の損失関数および推論時のスコア算出法を提案する.公開データセットを用いた性能評価実験により提案手法の有効性を示す.