AI 影视全链路创作平台
2026-02-04 15:25
1. 项目背景与目标- 一句话描述:通过 AI 驱动的一站式工作流,将纯文本剧本自动化转化为高质量视频内容,包含分镜设计、一致性角色生成及动态视频合成。主要用于婚纱摄影,变成婚前微电影,视频效果- 对标产品:StoryVideo、Runway Gen-3 工作流集成版。2. 核心功能需求 (Functional Requirements)暂时无法在飞书文档外展示此内容3. AI 工作流详细定义 (The Workflow)建议基于 ComfyUI 后端 API 构建,确保节点的灵活替换。- Step 1 (文本层):LLM 节点。输入原始剧本 -> 输出包含 Scene_ID, Character, Action, Visual_Prompt 的 JSON。- Step 2 (图像层):Stable Diffusion 节点。输入 Visual_Prompt + IP-Adapter (角色参考) -> 输出关键帧图像。- Step 3 (视频层):Video Diffusion 节点 (建议接入 Kling API 或私有化部署 SVD)。输入图像 + 运动强度参数 -> 生成动态视频。- Step 4 (音频层 - 扩展):TTS 节点。提取剧本对白 -> 匹配角色音色生成音频流。4. 非功能性需求 (验收标准)- 性能要求:- 剧本解析响应时间 < 5s。- 单张分镜图生成时间 < 8s (GPU: 4090 级别)。- 视频渲染任务需支持异步处理,并有进度条实时反馈。- 并发要求:支持多任务并行渲染(需建立 Redis 任务队列)。- 交付物:- 完整的 Web 端源代码(React/Vue)。- 后端 API 服务文档(Python/FastAPI)。- 核心 ComfyUI 工作流 JSON 配置文件。- GPU 服务器部署脚本(Docker 镜像)。
*************
*************
评论
全部评论
