探索全部 AI 模型
24 款强大的图像与视频生成 AI 模型,帮你找到最适合创作项目的工具。
视频生成模型
从文本、图片或现有视频生成令人惊艳的视频内容。
Grok
Grok Imagine 是 xAI 的多模态视频模型,可从文本或图像生成图像和短视频,具有快速输出、同步音频以及用于表达性视觉风格的可选创意模式。
Seedance
Seedance 1.5 Pro 是字节跳动的高级视频生成模型,可创建带有同步语音、音效和音乐的电影级视频。直接从文本提示词生成完整的电影视频,或将图像转换为具有一致角色和原生音频的动态视频。
Kling 2.6
Kling 2.6 是快手的高级视频生成模型,可从文本或图像生成完整的视听视频,具有同步语音、环境音和精确的动作时机。
Kling 3.0
Kling 3.0 是快手的新一代视频模型,支持 3 秒到 15 秒的更长镜头生成、更强的 prompt 遵循能力,以及覆盖文生视频和图生视频的灵活动作控制。
Wan
Wan 2.6 是一款尖端的多模态模型,能够生成高保真、长达 15 秒且具有逼真声音的长视频。
Veo
Veo 3.1 是 Google 的高级 AI 视频模型,可从文本或图像创建高质量视频,具有电影级动作、原生音频和精确的帧控制。
Google Veo 3.1 Fast
Google Veo 3.1 Fast 是 Google 的快速视频生成模型,可在约 1 分钟内将图片转换为带同步音频的 8 秒电影级视频。非常适合快速迭代和社交媒体内容创作。
Kling 2.5 Turbo
Kling 2.5 Turbo 是快手的快速视频生成模型,可创建 5 秒或 10 秒时长的娱乐动作视频。针对快速社交媒体内容创作进行了优化,具有动态运动和富有表现力的角色。
Wan 2.5
Wan 2.5 是一个多功能视频生成模型,支持文生视频和图生视频,具有 5 种宽高比和灵活的时长选项,适用于创意内容。
Wan 2.7
Wan 2.7 是最新的视频生成模型,采用提示优先方法,支持 720p/1080p 输出、5 种宽高比和首尾帧控制,实现精确的视频创作。
Seedance 2 Fast
Seedance 2 Fast 是字节跳动的快速视频生成模型,可在约 1.5 分钟内创建带同步音频的视频。非常适合快速迭代和社交媒体内容,支持 6 种宽高比选项。
Seedance 1.5 Pro
Seedance 1.5 Pro 是字节跳动的专业视频生成模型,可创建带同步语音、音效和音乐的电影级视频。直接从文本提示生成完整的电影级视频,或将图片转换为具有一致角色和原生音频的动作视频。
图像生成模型
根据文本描述生成高质量图像,或对现有图片进行智能变换。
Nano Banana Pro
基于 Gemini 3.0 Pro Image 架构,Nano Banana Pro 提供 4K 高保真图像生成,具有更锐利的结构精度、改进的角色一致性、精确的文本渲染和更清晰的材质细节。
FLUX 2
来自 Black Forest Labs,FLUX 2 提供强大的多参考图控制(最多 8 张),保持角色、产品和风格在输出中的一致性,具有可靠的准确性。
GPT Image 1.5
OpenAI 的 GPT Image 1.5 提供高质量图像生成,具有强大的提示词遵循能力、更逼真的视觉效果和改进的文本渲染——特别适合图片内的密集或小文本。
Z Image Turbo (超速版)
由 Tongyi-MAI 驱动,Z-Image-Turbo 提供极低延迟的高质量逼真图像。只需几个采样步骤即可完成生成,同时保留细节、干净的光照和强构图。
Google Nano Banana
专为实时应用设计,Nano Banana 利用轻量级 Gemini 2.5 Flash Image 架构。它以最低成本提供快速生成速度,是大批量处理和即时预览工具的理想选择。
Google Nano Banana 2
Google Nano Banana 2 是 Google 最新的图像生成模型,支持最多 14 张参考图、15 种宽高比(含超宽格式)以及 4K 输出。非常适合复杂构图和多参考风格融合。
Wan 2.7 Image
Wan 2.7 Image 是一款先进的图像生成与编辑模型,支持最多 9 张参考图、4K 输出和 8 种宽高比,擅长保持视觉一致性和风格迁移效果。
Qwen 2.0
Qwen 2.0 是一款偏写实风格的图像生成模型,既可以通过文本生成新图,也可以基于已有图片进行 remix,擅长自然光影、真实材质和逼真构图。
Seedream 5.0 Lite
Seedream 5.0 Lite 是一款多用途图像生成模型,支持最多 14 张参考图、8 种宽高比,以及基础和高质量两种输出模式,适合创意合成与风格混搭。
Seedream 4.5
Seedream 4.5 是一款偏写实风格的图像生成模型,支持最多 14 张参考图、8 种宽高比以及双质量模式,擅长真实纹理和自然构图。
GPT Image 2
GPT Image 2 是 OpenAI 最新的图像生成模型,支持文生图与图片 remix,最多可使用 16 张参考图,擅长复杂提示词理解和富有创意的结果表达。
Grok Imagine
Grok Imagine 是 xAI 的图像生成模型,能够产出更具表现力的视觉风格和多种创意模式,非常适合艺术类内容与更有个性的视觉表达。