ArcReel

Name: ArcReel
Author: ArcReel

开源 AI 视频生成工作台 — 从小说到短视频，全程 AI Agent 驱动

Open-source AI Video Generation Workspace — Novel to Short Video, Powered by AI Agents

ArcReel 工作台

核心能力

🤖 AI Agent 工作流

基于 Claude Agent SDK，编排 Skill + 聚焦 Subagent 多智能体协作，自动完成从剧本创作到视频合成的完整流水线

🎨 多供应商图像生成

支持 Gemini、火山方舟、Grok 三大图像供应商，角色设计图确保角色一致性，线索追踪保证道具/场景跨镜连贯

🎬 多供应商视频生成

支持 Veo 3.1、Seedance、Grok 三大视频供应商，全局/项目级可切换

⚡ 异步任务队列

RPM 速率限制 + Image/Video 独立并发通道，lease-based 调度，支持断点续传

🖥️ 可视化工作台

Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪，内置 AI 助手

工作流程

graph TD
    A["📖 上传小说"] --> B["📝 AI Agent 生成分镜剧本"]
    B --> C["👤 生成角色设计图"]
    B --> D["🔑 生成线索设计图"]
    C --> E["🖼️ 生成分镜图片"]
    D --> E
    E --> F["🎬 生成视频片段"]
    F --> G["🎞️ FFmpeg 合成最终视频"]
    F --> H["📦 导出剪映草稿"]

功能特性

完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片，一键编排
多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent，每个 Subagent 独立完成一项任务后返回摘要
多图片供应商 — 支持 Gemini (Nano Banana 2)、火山方舟 (Seedream 5)、Grok 三大图片生成后端，全局/项目级可切换
多视频供应商 — 支持 Gemini (Veo 3.1)、火山方舟 (Seedance 1.5 Pro)、Grok (xAI) 三大视频生成后端，全局/项目级可切换
多文本供应商 — 支持 Gemini、火山方舟、Grok 文本生成后端，剧本生成/概述/风格分析等文本任务统一调度
两种内容模式 — 说书模式（narration）按朗读节奏拆分片段，剧集动画模式（drama）按场景/对话结构组织
渐进式分集规划 — 人机协作切分长篇小说：peek 脚本探测切分点上下文 → Agent 建议自然断点 → 用户确认 → 物理切分为单集文件，按需制作、无需一次规划全部集数
风格参考图 — 上传一张风格图，AI 自动分析生成风格描述，后续所有内容生成（角色/线索/分镜）统一使用该风格，确保全项目视觉一致
角色一致性 — AI 先生成角色设计图，后续所有分镜和视频均参考该设计
场景连贯 — 分镜图自动参考上一张生成，确保相邻场景画面衔接自然
线索追踪 — 关键道具、场景元素标记为"线索"，跨镜头保持视觉连贯
版本历史 — 每次重新生成自动保存历史版本，支持一键回滚
多供应商费用追踪 — 图片/视频/文本生成全部纳入费用计算与使用记录，按供应商分策略计费（Gemini 按分辨率×时长 USD、火山方舟按 token 用量 CNY、Grok 按秒 USD），不同币种分别统计
用户认证 — JWT 登录 + API Key 认证双模式，支持外部平台集成
OpenClaw 集成 — 提供 AgentSkill 定义文件与同步对话端点，可通过 OpenClaw 等外部 AI Agent 平台调用 ArcReel 能力
剪映草稿导出 — 按集导出为剪映（JianYing）草稿 ZIP，解压即可在剪映桌面版中二次编辑（调节奏、加字幕、转场、配音），说书模式自动附带字幕轨，支持剪映 5.x / 6+（操作指南）
项目导入/导出 — 整个项目打包归档，方便备份和迁移
竖屏优化 — 默认 9:16 比例，适合短视频平台发布

快速开始

默认部署（SQLite）

# 1. 克隆项目
git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy

# 2. 配置环境变量
cp .env.example .env

# 3. 启动服务
docker compose up -d

# 访问 http://localhost:1241

生产部署（PostgreSQL）

cd ArcReel/deploy/production

# 配置环境变量（需设置 POSTGRES_PASSWORD）
cp .env.example .env

docker compose up -d

首次启动后，前往 设置页（/settings）完成以下配置即可开始使用：

ArcReel 智能体 — 配置 Anthropic API Key（驱动 AI 助手）
AI 生图/生视频 — 配置至少一个供应商的 API Key（Gemini / 火山方舟 / Grok）

交流群

扫码加入飞书交流群，获取帮助和最新动态：

飞书交流群二维码

供应商支持

ArcReel 通过统一的 ImageBackend / VideoBackend 协议，支持多个图片和视频生成供应商，可在全局或项目级别切换：

图片供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	Nano Banana 2 (gemini-3.1-flash-image-preview), Nano Banana Pro (gemini-3-pro-image-preview)	文生图、图生图（多参考图）	按分辨率查表 (USD)
火山方舟	Seedream 5、Seedream 5 Lite、Seedream 4.5、Seedream 4	文生图、图生图	按张计费 (CNY)
Grok (xAI)	grok-imagine-image, grok-imagine-image-pro	文生图、图生图	按张计费 (USD)

视频供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	veo-3.1-generate, veo-3.1-fast-generate	文生视频、图生视频、视频延展、负面提示词	按分辨率 × 时长查表 (USD)
火山方舟	Seedance 1.5 Pro	文生视频、图生视频、音频生成、种子控制、离线推理	按 token 用量 (CNY)
Grok (xAI)	grok-imagine-video	文生视频、图生视频	按秒计费 (USD)

文本供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	gemini-3-flash-preview（默认）	文本生成、结构化输出、视觉理解	按 token 用量 (USD)
火山方舟	doubao-seed-2-0-lite-260215（默认）	文本生成、结构化输出、视觉理解	按 token 用量 (CNY)
Grok (xAI)	grok-4-1-fast-reasoning（默认）	文本生成、结构化输出、视觉理解	按 token 用量 (USD)

供应商选择优先级：项目级设置 > 全局默认。切换供应商时通用设置（分辨率、宽高比、音频等）直接沿用，供应商特有参数保留。

AI 助手架构

ArcReel 的 AI 助手基于 Claude Agent SDK 构建，采用编排 Skill + 聚焦 Subagent 的多智能体架构：

flowchart TD
    User["用户对话"] --> Main["主 Agent"]
    Main --> MW["manga-workflow<br/>编排 Skill"]
    MW -->|"状态检测"| PJ["读取 project.json<br/>+ 文件系统"]
    MW -->|"dispatch"| SA1["analyze-characters-clues<br/>全局角色/线索提取"]
    MW -->|"dispatch"| SA2["split-narration-segments<br/>说书模式片段拆分"]
    MW -->|"dispatch"| SA3["normalize-drama-script<br/>剧集动画规范化"]
    MW -->|"dispatch"| SA4["create-episode-script<br/>JSON 剧本生成"]
    MW -->|"dispatch"| SA5["资产生成 Subagent<br/>角色/线索/分镜/视频"]
    SA1 -->|"摘要"| Main
    SA4 -->|"摘要"| Main
    Main -->|"展示结果<br/>等待确认"| User

核心设计原则：

编排 Skill（manga-workflow） — 具备状态检测能力，自动判断项目当前阶段（角色设计 / 分集规划 / 预处理 / 剧本生成 / 资产生成），dispatch 对应的 Subagent，支持从任意阶段进入和中断恢复
聚焦 Subagent — 每个 Subagent 只完成一项任务后返回，小说原文等大量上下文留在 Subagent 内部，主 Agent 只收到精炼摘要，保护上下文空间
Skill vs Subagent 边界 — Skill 负责确定性脚本执行（API 调用、文件生成），Subagent 负责需要推理分析的任务（角色提取、剧本规范化）
阶段间确认 — 每个 Subagent 返回后，主 Agent 向用户展示结果摘要并等待确认，确认后才进入下一阶段

OpenClaw 集成

ArcReel 支持通过 OpenClaw 等外部 AI Agent 平台调用，实现自然语言驱动的视频创作：

在 ArcReel 设置页生成 API Key（arc- 前缀）
在 OpenClaw 中加载 ArcReel 的 Skill 定义（访问 http://your-domain/skill.md 自动获取）
通过 OpenClaw 对话即可创建项目、生成剧本、制作视频

技术实现：API Key 认证（Bearer Token）+ 同步 Agent 对话端点（POST /api/v1/agent/chat），内部对接 SSE 流式助手并收集完整响应返回。

使用方式

通过 Web UI 工作台完成所有操作：

项目管理 — 创建项目、上传小说、管理多剧集
AI 助手 — 内置 AI 助手，对话式引导完成剧本创作、角色设计、分集规划等
分集规划 — 长篇小说渐进式切分：peek 探测 → Agent 建议断点 → 用户确认 → 物理切分
风格参考图 — 上传风格图 → AI 自动分析生成风格描述 → 统一应用到所有图片生成
素材预览 — 角色图、分镜图、视频片段全屏预览
任务监控 — 实时查看生成任务进度（SSE 推送）
版本管理 — 每次重新生成自动保存历史，支持一键回滚
费用统计 — 按供应商、按任务类型精确统计 API 调用费用
参数配置 — 供应商管理、API Key、模型选择、速率限制等均可在页面配置

技术架构

flowchart TB
    subgraph UI["Web UI — React 19"]
        U1["项目管理"] ~~~ U2["素材预览"] ~~~ U3["AI 助手"] ~~~ U4["任务监控"]
    end

    subgraph Server["FastAPI Server"]
        S1["REST API<br/>路由分发"] ~~~ S2["Agent Runtime<br/>Claude Agent SDK"]
        S3["SSE Stream<br/>实时状态推送"] ~~~ S4["Auth<br/>JWT + API Key"]
    end

    subgraph Core["Core Library"]
        C1["VideoBackend 抽象层<br/>Gemini · 火山方舟 · Grok"] ~~~ C2["ImageBackend 抽象层<br/>Gemini · 火山方舟 · Grok"]
        C5["TextBackend 抽象层<br/>Gemini · 火山方舟 · Grok"] ~~~ C3["GenerationQueue<br/>RPM 限速 · Image/Video 通道"]
        C4["ProjectManager<br/>文件系统 + 版本管理"]
    end

    subgraph Data["数据层"]
        D1["SQLAlchemy 2.0 Async ORM"] ~~~ D2["SQLite / PostgreSQL"]
        D3["Alembic 迁移"] ~~~ D4["UsageTracker<br/>多供应商费用追踪"]
    end

    UI --> Server --> Core --> Data

技术栈

层级	技术
前端	React 19, TypeScript, Tailwind CSS 4, wouter, zustand, Framer Motion, Vite
后端	FastAPI, Python 3.12+, uvicorn, Pydantic 2
AI 智能体	Claude Agent SDK (Skill + Subagent 多智能体架构)
图像生成	Gemini Nano Banana 2 (`google-genai`), 火山方舟 Seedream 5 (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`)
视频生成	Gemini Veo 3.1 (`google-genai`), 火山方舟 Seedance 1.5 (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`)
文本生成	Gemini (`google-genai`), 火山方舟 (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`)
媒体处理	FFmpeg, Pillow
ORM & 数据库	SQLAlchemy 2.0 (async), Alembic, aiosqlite, asyncpg — SQLite (默认) / PostgreSQL (生产)
认证	JWT (`pyjwt`), API Key (SHA-256 哈希), Argon2 密码哈希 (`pwdlib`)
部署	Docker, Docker Compose（`deploy/` 默认, `deploy/production/` 含 PostgreSQL）

文档

📖 完整入门教程 — 从零开始的手把手指南
📦 剪映草稿导出指南 — 将视频片段导入剪映桌面版进行二次编辑
💰 Google GenAI 费用说明 — Gemini 图像 / Veo 视频生成费用参考
💰 火山方舟费用说明 — 火山方舟图片 / 视频生成费用参考

贡献

欢迎贡献代码、报告 Bug 或提出功能建议！

本地开发环境

# 前置要求：Python 3.12+, Node.js 20+, uv, pnpm, ffmpeg

# 安装依赖
uv sync
cd frontend && pnpm install && cd ..

# 初始化数据库
uv run alembic upgrade head

# 启动后端 (终端 1)
uv run uvicorn server.app:app --reload --port 1241

# 启动前端 (终端 2)
cd frontend && pnpm dev

# 访问 http://localhost:5173

运行测试

# 后端测试
python -m pytest

# 前端类型检查 + 测试
cd frontend && pnpm check

许可证

AGPL-3.0

如果觉得项目有用，请给个 ⭐ Star 支持一下！