顔認証は,生体認証の中でも低コストで導入が可能で,利便性が高いため,実用化が進んでいる.一方で,顔認証システムは,顔の姿勢や照明の変化,撮影時のブレなどに対してロバストに設計されているため,悪意のある人物が登録者の顔写真などを提示することで不正に認証を通過してしまう可能性がある.そのため,顔認証を行う前に,このようななりすまし攻撃を検知する必要がある.なりすまし攻撃に含まれる微細な差を検知するためには,テクスチャ特徴とデプス(奥行き)特徴が有効である.本稿では,Vision Transformer (ViT) を用いてテクスチャ特徴とデプス特徴を抽出し,なりすまし攻撃を検知する手法を提案する.大規模ななりすまし攻撃データセットを用いた性能評価実験により提案手法の有効性を示す.