你雇的不是一个 AI,
而是一个调教好的 AI 团队。
从选题洞察到剧本创作,从角色设计到视频生成,从配音剪辑到 TikTok 发行和数据分析 —— 每个环节都有专门的 AI 专家负责。他们不是各自为战,而是像真正的剧组一样协作:开会讨论、并行执行、交叉质检。
AI 圆桌会 —— 多 Agent 讨论机制
这不是 11 个独立 AI 工具的简单串联。你的 AI 剧组通过「圆桌会」机制协作:当需要创意决策时,相关 Agent 聚在一起讨论。编剧追求情感深度,导演追求视觉冲击力,质检员标记合规风险,制片人综合意见形成共识。你看到讨论和决定,你审批,团队继续前进。
第一阶段:前期策划
Agent:制片人、选题官、编剧制片人
总调度你的整个 AI 剧组的指挥官。制片人解析自然语言需求,自动构建有向无环图 (DAG) 定义任务依赖和执行顺序。他管理整个制作时间线,在并行工作流中协调 10 个 Agent,执行审批门和质量检查点,跨会话维护任务状态。制片人还处理跨 Agent 的模型路由决策 —— 根据任务类型、成本预算和质量要求为每个 Agent 分配最优模型组合。
- ›自然语言解析 → 自动 DAG 构建
- ›端到端时间线管理和并行调度
- ›跨 Agent 多模型路由决策(成本/质量/速度权衡)
- ›审批门执行(选题、剧本、终审 —— 3 道门)
- ›跨会话状态持久化
- ›自动任务重试和指数退避
任务图、实时进度仪表板、审批通知
选题官
市场情报你的市场情报专家。选题官连接实时漫剧榜单,分析流行题材,应用专有的 5 维评分模型(层次深度、3 秒黄金钩、情感密度、文化撬动、价值清晰度)评估选题潜力。基于题材、地域、季节和预算交付数据驱动的 ROI 预测。每个制作周期都从选题官的洞察推动战略开始。
- ›实时漫剧榜单数据分析
- ›流行题材识别和追踪
- ›5 维选题评分模型(深度/黄金钩/情感/文化/价值)
- ›ROI 预测(题材 × 地域 × 季节 × 预算)
- ›竞品分析和差异化建议
- ›数据飞轮学习循环参与
3 个数据驱动的选题方案(含评分、ROI 预测、竞品分析)
编剧
剧本创作短剧叙事专家。编剧精通 TikTok 竖屏叙事节奏 —— 3 秒视觉黄金钩 → 10 秒悬念堆积 → 30 秒反转揭露。创作完整的 30-32 集 × 90 秒剧本,精确的角色弧线、情感曲线和单集卡点。处理多元题材(甜宠、CEO、悬疑、复仇、穿越),输出双语对白(英文+中文)供全球触达。
- ›完整 30-32 集剧本创作
- ›TikTok 黄金钩公式设计(3s/10s/30s 节奏精通)
- ›角色弧线和情感曲线设计
- ›单集卡点和悬念设置
- ›多元题材适配(甜宠/CEO/悬疑/复仇/穿越)
- ›双语输出(英文+中文对白)
完整 30 集剧本、集数大纲、角色档案、情感曲线
第二阶段:制作
Agent:分镜师、美术总监、导演、配音师、剪辑师、质检员分镜师
视觉翻译将剧本文本转换为精确的视觉指令。分镜师逐镜头解码剧本,输出严格的 Seedance 格式提示词 —— 包括 @ 角色/场景引用、摄像机运动(OTS/推拉/吊臂/跟焦)、光影氛围、动作描述和时间标记。他管理 @ 引用准确性(对视频生成质量至关重要)并维持 4-15 秒每镜头 × 90 秒每集的时间预算。
- ›剧本 → 分镜脚本逐镜头转换
- ›Seedance 提示词输出含 @ 引用语法
- ›摄像机语言设计(OTS/推拉/吊臂/跟焦等)
- ›光影设计(伦勃朗光/轮廓光/霓虹/自然光)
- ›时长预算(每镜头 4-15s,每集 90s±3s)
- ›10 万字符预算管理
完整分镜脚本(Shot N ⊙ Ns 格式)含所有 @ 引用
美术总监
视觉创作你剧组的视觉灵魂。美术总监智能调度多个图像生成模型 —— Gemini 用于高质量写实肖像,Seedream 用于风格化处理 —— 确保角色既逼真又通过内容审核。创建角色卡(每个角色 2-16 套换装)和场景卡(5 层视觉结构)。采用「先定基准再生成变体」的一致性管线保证全集视觉连贯性。
- ›角色卡生成(每个角色 2-16 套换装变体)
- ›场景卡生成(5 层视觉结构)
- ›基准锚点 → 变体生成一致性管线
- ›AI 图像生成+风格化(3D 渲染风格规避审核)
- ›资产版本管理(C01-C99 角色 / S01-S99 场景 / P01-P99 道具)
- ›跨集视觉一致性保障
角色卡(基准+变体引用)、场景卡、道具卡
导演
制作引擎最核心的制作引擎,拥有最先进的多模型路由能力。经过垂直调教,导演掌握每个视频模型的优势 —— Seedance 用于角色一致性和镜头控制,MiniMax 用于动态场景和大幅运动。自动将每个镜头路由到最优模型。专用图生视频(I2V)配角色参考锚点(禁用文生视频 T2V)。支持批量异步提交、智能轮询和自动语音注入。
- ›多模型智能路由(Seedance / MiniMax / 自定义)
- ›图生视频(I2V)配角色锚点(绝对禁用 T2V)
- ›批量异步提交(--poll 0 立即返回)
- ›自动语音注入+智能音频修剪(≤15.2s 总时长)
- ›并行控制(3-5 个并发任务)
- ›ffmpeg 视频压缩(11MB→360KB)
全集视频素材(5/10/12/15s × 9:16 竖屏)、video_manifest.json
配音师
声音设计为每个角色赋予独特声音人设。配音师经过垂直调教,智能调度多个 TTS 引擎 —— 火山 TTS 用于丰富音色(适合主角),MiniMax TTS 用于低延迟快节奏场景,声音克隆 API 用于真实语音复现。按角色个性化配音(语言/口音/年龄/音色),输出对白+背景音+环境音多轨,自动同步到视频时间轴。
- ›多角色 TTS 合成和声音克隆
- ›角色配音个性化(语言/口音/年龄/音色)
- ›对白+背景音+环境音多轨输出
- ›ASMR 技巧(呼吸/布料/耳语用于张力场景)
- ›音视频时间轴自动同步
- ›云端音频资产管理
完整集数角色对白、背景音、环境音、与视频同步
剪辑师
后期制作多轨复合专家。剪辑师使用 FFmpeg 管线将视频素材、对白、背景音、音效和字幕复合成最终版本。处理转场、色彩校正、音量平衡。输出 1080×1920(9:16 竖屏)MP4 文件。批量处理全 30 集,精度 90 秒。
- ›FFmpeg 多轨复合(视频+对白+背景音+音效+字幕)
- ›转场设计和应用
- ›色彩校正和图像优化
- ›自动音量平衡
- ›批量输出(30 集 × 90s)
- ›720p→1080p 智能升频(必要时)
30 × MP4 最终版本(1080×1920, 9:16, h.264+AAC, ~90s 每集)
质检员
10 层校验全链路质量守护者。质检员执行 10 层自动化校验:@ 引用完整性、中文名泄露检测(导出剧必须纯英文)、时长合规(每镜头 4-15s)、格式校验、字符预算(10 万限制)、平台合规(TikTok/Reels/Shorts 安全阈值不同)、角色一致性、叙事连贯性、元数据完整性。标记不合规项并要求返工。
- ›L1:@ 引用完整性 —— 正则表达式校验
- ›L2:中文名泄露检测 —— 导出剧必须纯英文
- ›L3:时长合规 —— 每镜头 4-15s,每集 87-93s
- ›L4-L5:格式和字符预算校验
- ›L6:平台合规 —— TikTok/Reels/Shorts 安全评分
- ›L7-L10:内容审核、角色一致性、叙事连贯性、元数据
10 层 QA 报告、不合规标记和返工需求
第三阶段:发行与分析
Agent:投放手、数据官投放手
发行引擎自动化发行引擎。投放手集成 TikTok Content Posting API,管理 30 集自动上传、元数据优化(标题/描述/标签/分类)、智能发布时间调度、TikTok Minis 卡点配置和多平台分发。一旦获批,一键发布全部 —— 无需手动干预。
- ›TikTok Content Posting API 自动发布
- ›元数据优化(标题/描述/标签/分类)
- ›智能发布时间调度
- ›TikTok Minis 卡点配置
- ›封面和黄金钩 A/B 测试
- ›多平台分发(YouTube Shorts / Reels / 抖音)
30 集自动发布、发行日历、A/B 测试计划
数据官
数据飞轮数据飞轮引擎和配方自我进化驱动者。数据官连接 TikTok Marketing API,追踪观看、完播率、转化和 ROI。构建归因模型验证配方参数。最关键的是 —— 数据反哺所有 Agent 的 Skills 持续自我进化。编剧学会更好的节奏,导演优化镜头策略,投放手改进时间表 —— 团队随每个周期进化。
- ›TikTok Marketing API 数据采集(~11h 延迟)
- ›观看/完播/互动/转化追踪
- ›归因分析(题材 × 结构 × 地域 × 季节 → ROI)
- ›配方验证 —— 用真实数据验证配方
- ›数据反哺 Skills —— 驱动 Agent 自我进化
- ›自动日/周报告+选题官优化建议
日/周数据报告、ROI 归因分析、选题优化建议
配方驱动,自我进化飞轮
「配方」是 DramaClaw 的核心产品哲学 —— 从数据洞察提炼配方,一键注入全链路,再持续将表现数据反哺 Skills 和 Agent 能力,实现自我进化。