顔認証は,生体認証の中でも利便性が高く,低コストで導入が可能であるため,実用化が進んでいる.顔認証システムは,顔の姿勢や照明の変化,撮影時のブレなどに対してロバストに設計されているため,登録者の顔写真などを提示することで第三者を不正に認証してしまう可能性がある.このようななりすまし攻撃として,印刷した顔画像を提示する Print Attack や,顔動画像を表示したデバイスを提示する Display Attack がある.そのため,顔認証を行う前に,入力画像に対してなりすまし攻撃検知を行う必要がある.なりすまし攻撃に含まれる微小な差を検知するためには,テクスチャ特徴とデプス(奥行き)特徴が有効である.本稿では,Vision Transformer (ViT) を用いてテクスチャ特徴とデプス特徴を抽出し,なりすまし攻撃を検知する手法を提案する.公開データセットを用いた実験により提案手法の有効性を示す.