1. フレーム間の視覚的差異を分析する
2. 重大なレイアウトまたはコンテンツの変更を検出する
3. トランジションをスライド境界として分類する
4. 各スライドのタイムスタンプ付きセグメントを生成する