• TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT
taziku
  • TOP
  • NEWS
  • ABOUT
  • SERVICE
  • WORKS
  • PROJECT
  • BLOG
  • CONTACT

3D Gaussian Splatting 動画から3Dのシーン生成を解説

2023年9月25日
AI BLOG Technology
3D Gaussian Splatting 生成AI

「3D Gaussian SplattingのWindows環境構築手順を解説」という記事で、3D Gaussian Splattingのwindowsのローカル環境で構築する方法を紹介し、Anaconda上で独立した生成環境の構築を行いましたが、今回は実際に3D Gaussian Splatting を利用して2Dの動画から、3Dシーンを構築するまでを解説したいと思います。

生成に必要なソフトウェアをインストール

FFmpeg

動画を静止画に書き出したり、動画の形式を変換したりと動画ファイルを様々な形で変換してくれるFFmpeg。3D Gaussian Splattingの構築には200枚から1000枚の画像が必要とされています、そのため写真を一枚ずつ撮影するより、動画を撮影して静止画に切り出したほうが手間が少ないため、FFmpegを利用します。

ffmpeg orgよりダウンロードし、パスを通します。詳しいインストール方法やパスの通し方については「WindowsにFFmpegをインストールして利用できるようにパスを通す」をご覧ください。

COLMAP

3D Gaussian Splattingでのトレーニングは画像だけではなく、カメラ位置の推定も必要となります。COLMAPは複数の写真からカメラ位置や向きを推定してくれるツールです。CUDA対応verが必要なためgithubから「COLMAP-3.8-windows-cuda.zip」をダウンロードしましょう。

FFmpegと同じ原理で、pathの環境変数の編集追加から展開した先へパスを通しておきましょう。

ImageMagick

画像処理のため必要なツール「imagemagickの公式」から最新版の「ImageMagick-7.1.1-15-Q16-HDRI-x64-dll.exe」をダウンロード、インストーラーのためインストールすれば自動的にパスが通ります。

トレーニング準備

今回は撮影した動画を静止画に書き出してトレーニングする方法を解説します。

FFmpegで動画から静止画書き出し

動画を設置したディレクトリでコマンドプロンプトを開き以下のコマンドを実行します。Anaconda promptではないのでご注意ください。

mkdir input
ffmpeg -i GH010065.MP4 -r 2 input/image_%05d.jpg

コマンドを実行すると動画の格納フォルダにinputフォルダが生成され、2fpsで書き出されます。

COLMAPで歪み補正とデータセットを作成

gaussian-splattingをインストールしたフォルダから、Anaconda promptにて、以下のコマンドで構築した環境を呼び出し

conda activate gaussian_splatting

convert.pyを利用して、COLMAPのデータセットを受け取りトレーニングを行います。先ほどの書き出した画像をconvert.pyに渡しデータセットを作成します。

python convert.py --colmap_executable "COLMAPを設置した場所\COLMAP.bat" -s データフォルダ場所

COLMAP.bat、データフォルダの場所、いずれもフルパスで記載します。inputフォルダ事態ではなくて、inputフォルダが格納されている場所となりますのでご注意ください。

上記コマンドを実行すると、imagesフォルダに歪み補正を行ったら画像ファイルが格納され、distroted、sparse、stereoなどのフォルダが生成されカメラのデータ(位置、向き、ゆがみなど)のファイルが格納されます。

これでトレーニング準備は完了です。

トレーニングの実施

conda activate gaussian_splattingをインストールフォルダでAnaconda promptで、構築した環境を呼び出した後、以下のコマンドで構築を実行します。

python train.py -s データ格納フォルダまでのパス

データ格納フォルダは先ほどconvert.pyで指定した場所と同じとなります。

トレーニングが完了すると gaussian-splattingのoutputフォルダ内に「123456ab-1」の様なランダムな文字列のフォルダが作成されていれば、トレーニングは完了となります。

トレーニングデータの準備がすぐにできない方へ

トレーニングデータとなるデータが準備できない方は3D Gaussian SplattingのプロジェクトページのScenesからサンプルのトレーニング前データがダウンロードできるため、そちらで試してみましょう。

ビューワー編へ

今回生成したトレーニングデータを読みこんで、3Dシーンを読み込んで自由視点で閲覧していきます。

※当サイトに掲載されている商標、一部画像、スクリ-ンショット、文章に置いては著作権侵害を目的に利用しておらず、第三十二条で定められる引用の範囲で使用しています。万が一問題があれば、お問い合わせからご連絡ください。即刻削除いたします。また、本ブログは業務の研究開発のためのものとなり、一部、弊社に関連性が無いものも掲載しております。

AIの最新情報を随時発信中

Xやnoteでは、AI・生成AI・LLMなどの最新情報や、ChatGPTやMidjourneyのプロンプトテクニックを連載中!フォローよろしくお願いします。

生成AI・AIの導入・研修・DXの支援はtazikuへ

生成AI・LLMなど、AIを活用したAIの導入・DXコンサルティング、AI領域の研修・講演などのご相談はお気軽にお問い合わせフォーム、もしくは生成AIソリューションAI CREATIVE BASEから、ご相談・お問い合せください。

PREV ChatGPTのGPT-4の知識範囲が2022年1月までにアップデートされたので検証してみた
NEXT 3D Gaussian Splattingでトレーニングしたデータをビューワーで表示する
Related Post
Claude 3 公式プロンプト「ツイートトーン検出器」を試す
メタバースの始め方-Spatialのアカウント作成から基本操作まで
Stable Diffusion のモデルデータをインストール
AIを活用した「ジェネーティブ塗りつぶし」インペイントを試す
New Bing/AI Chat にジェネレーティブAIについて色々質問してきた
taziku BLOG振り返り 2023アクセスランキング TOP10
Related Post
進化するMidjourney v7が描く次世代のAI画像生成
Claude 3.5の新機能 新モデル登場とPC操作機能
Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
Claude 3 で画像をピクセル化するプログラムを生成
Claude 3で登場人物の会話を生成する
Claude 3 でXMLタグを利用する

« PREV

Back to list

NEXT »

  • 投稿検索

  • ABOUT US?

    tazikuは東京・名古屋を拠点に活動するクリエイティブスタジオです。
    AI・生成AI・LLMとクリエイティブを掛け合わせ、新しいクリエイティブを提供します。
    Works
    Service
    Contact
  • AI CREATIVE BASE

    デザイン、ビジュアル、音声、空間演出。生成AIでクリエイティブワークフローに革新を与え、ビジネスの成果を最大化します。

    詳細を見る

  • MENU

    • BLOG
      • Think
      • Creative
      • Technology
        • AI
        • メタバース
    • Project
      • AIアニメプロジェクト
      • どうくつたんけん
  • NEW POST

    • 進化するMidjourney v7が描く次世代のAI画像生成
    • Claude 3.5の新機能 新モデル登場とPC操作機能
    • Claude 3 の連鎖プロンプト「プロンプトチェーン」を試す
    • Claude 3 で画像をピクセル化するプログラムを生成
    • Claude 3で登場人物の会話を生成する
© 2021 taziku / 株式会社タジク Based in Tokyo and Nagoya | プライバシーポリシー