すべてのAIモデルを見る
画像生成と動画生成に対応した 24 種類の強力なAIモデルを比較。あなたの制作プロジェクトに最適なツールを見つけましょう。
動画生成モデル
テキスト、画像、既存の動画から魅力的な動画を作成できます。
Grok
Grok Imagine は xAI のマルチモーダル動画モデルで、テキストや画像から画像や短い動画を生成します。高速な出力、同期された音声、表現豊かなビジュアルスタイルのためのオプションのクリエイティブモードを備えています。
Seedance
Seedance 1.5 Pro は ByteDance の高度な動画生成モデルで、同期された音声、効果音、音楽を備えたシネマティックな動画を作成します。テキストプロンプトから完全なシネマティック動画を直接生成したり、画像を変換して一貫したキャラクターとネイティブオーディオを備えた動的な動画にしたりできます。
Kling 2.6
Kling 2.6 は Kuaishou(快手)の高度な動画生成モデルで、テキストや画像から同期された音声、環境音、正確なモーションタイミングを備えた完全なオーディオビジュアル動画を作成します。
Kling 3.0
Kling 3.0 は、3秒から15秒のより長いシネマティックなクリップ生成、より高いプロンプト追従性、そしてテキスト動画生成と画像動画生成の両方に対応する柔軟なモーション制御を備えた Kuaishou の次世代動画モデルです。
Wan
Wan 2.6 は、リアルなサウンドを備えた高忠実度で最長15秒の長編動画を生成できる最先端のマルチモーダルモデルです。
Veo
Veo 3.1 は Google の高度な AI 動画モデルで、テキストや画像から、シネマティックな動き、ネイティブオーディオ、正確なフレーム制御を備えた高品質な動画を作成します。
Google Veo 3.1 Fast
Google Veo 3.1 Fast は、画像を同期オーディオ付きのシネマティックな 8 秒動画へ約 1 分で変換する Google の高速動画生成モデルです。素早い反復や SNS 向けコンテンツ制作に最適です。
Kling 2.5 Turbo
Kling 2.5 Turbo は、5 秒または 10 秒のエンタメ寄りモーション動画を生成する Kuaishou の高速動画モデルです。ダイナミックな動きと表情豊かなキャラクターで、SNS 向け短尺コンテンツ制作に最適化されています。
Wan 2.5
Wan 2.5 は、テキストから動画と画像から動画の両方に対応した汎用性の高い動画生成モデルです。5 種類のアスペクト比と柔軟な長さ設定を備え、幅広いクリエイティブ制作に使えます。
Wan 2.7
Wan 2.7 は、プロンプト主導の最新動画生成モデルで、720p/1080p 出力、5 種類のアスペクト比、最初と最後のフレーム制御に対応しており、より精密な動画制作が可能です。
Seedance 2 Fast
Seedance 2 Fast は、約 1 分 30 秒で同期オーディオ付きの動画を生成できる ByteDance の高速動画モデルです。素早い反復や SNS 向け制作に向いており、6 種類のアスペクト比に対応しています。
Seedance 1.5 Pro
Seedance 1.5 Pro は、同期された音声、効果音、音楽を備えたシネマティック動画を生成する ByteDance のプロ向け動画モデルです。テキストからでも画像からでも、一貫したキャラクターとネイティブ音声付きの映像を作れます。
画像生成モデル
テキストの説明から高品質な画像を生成したり、既存画像を変換したりできます。
Nano Banana Pro
Gemini 3.0 Pro Image アーキテクチャを基盤とする Nano Banana Pro は、よりシャープな構造精度、向上したキャラクターの一貫性、正確なテキストレンダリング、そしてクリアな素材のディテールを備えた4K高忠実度画像生成を提供します。
FLUX 2
Black Forest Labs 発の FLUX 2 は、最大8枚の画像による強力なマルチリファレンス制御を提供し、キャラクター、製品、スタイルを出力全体で一貫させ、信頼性の高い精度を維持します。
GPT Image 1.5 AI ジェネレーター
OpenAI の GPT Image 1.5 は、強力なプロンプト準拠性、よりリアルなビジュアル、そして向上したテキストレンダリング(特に画像内の密集したテキストや小さなテキスト)を備えた高品質な画像生成を提供します。
Z Image Turbo (超高速版) AI ジェネレーター
Tongyi-MAI を搭載した Z-Image-Turbo は、極めて低遅延で高品質なフォトリアリスティック画像を提供します。わずか数回のサンプリングステップで生成を完了し、ディテール、クリーンなライティング、強力な構図を保持します。
Google Nano Banana AI ジェネレーター
リアルタイムアプリケーション向けに設計された Nano Banana は、軽量な Gemini 2.5 Flash Image アーキテクチャを活用しています。最低コストで高速な生成速度を実現し、大量のバッチ処理やインスタントプレビューツールに最適です。
Google Nano Banana 2
Google Nano Banana 2 は、最大 14 枚の参照画像、超横長を含む 15 種類のアスペクト比、4K 出力に対応した Google の最新画像生成モデルです。複雑な構図や複数参照を使ったスタイル転写に適しています。
Wan 2.7 Image AI ジェネレーター
Wan 2.7 Image は、最大 9 枚の参照画像、4K 出力、8 種類のアスペクト比に対応した高度な画像生成・編集モデルです。ビジュアルの一貫性維持とスタイル転写に優れています。
Qwen 2.0
Qwen 2.0 は、テキストプロンプトから高精細な画像を生成したり、既存画像をリミックスしたりできるフォトリアル系モデルです。自然なライティング、リアルな質感、生きた構図表現に強みがあります。
Seedream 5.0 Lite
Seedream 5.0 Lite は、最大 14 枚の参照画像、8 種類のアスペクト比、標準/高品質の 2 つの出力モードに対応した柔軟な画像生成モデルです。創造的な構図づくりやスタイルのブレンドに向いています。
Seedream 4.5
Seedream 4.5 は、最大 14 枚の参照画像、8 種類のアスペクト比、2 つの品質モードに対応したフォトリアル重視の画像生成モデルです。自然な質感とリアルな構図表現に優れています。
GPT Image 2
GPT Image 2 は、最大 16 枚の参照画像を使ったテキスト生成と画像リミックスに対応する OpenAI の最新画像生成モデルです。高いプロンプト追従性と創造的な解釈力が特長です。
Grok Imagine
Grok Imagine は、表現力のあるビジュアルスタイルと複数のクリエイティブモードを備えた xAI の画像生成モデルです。アーティスティックな制作や独自性のあるビジュアルづくりに適しています。