複数視点で撮影された画像からカメラの位置姿勢や焦点距離などのカメラパラメータを推定する手法として,Structure from Motion (SfM) が広く用いられている. SfM の精度は画像対応付けの精度に大きく依存するため,画像間に十分な共通領域がなくても局所的な 3 次元再構成に基づき高精度な対応付けを行う MASt3R の利用が有効であると考えられる. これまでに,MASt3R を SfM に応用した MASt3R-SfM が提案されている. MASt3R-SfM は,全視点のカメラパラメータを同時に最適化するため,入力視点数が増加するにつれて整合性の維持が困難となり,結果として推定精度が低下する問題がある. これに対して,本稿では,異なる視点数で段階的にカメラパラメータを最適化することで,MASt3R-SfM の高精度化を図る. 公開データセットを用いた精度評価実験により,提案手法の有効性を実証する.