carocut

agent
Security Audit
Pass
Health Pass
  • License — License: NOASSERTION
  • Description — Repository has a description
  • Active repo — Last push 0 days ago
  • Community trust — 28 GitHub stars
Code Pass
  • Code scan — Scanned 12 files during light audit, no dangerous patterns found
Permissions Pass
  • Permissions — No dangerous permissions requested

No AI report is available for this listing yet.

SUMMARY

Multi-Agent 的视频制作助手,基于 OpenCode AI SDK 和 Remotion 构建。

README.md

CaroCut

AI 驱动的视频制作工作流系统,基于 OpenCode AI SDK 和 Remotion 构建。

简介

CaroCut 是端到端的自动化视频生产平台。通过多 Agent 协作(orchestrator + planner/media/builder/reviewer),将原始素材(PDF、图片、文本)转化为专业视频。

demo

核心特性:

  • 多 Agent 协作:5 个专业 Agent,12 个 Skill,职责隔离
  • 8 步标准工作流:素材分析 → 策划 → 脚本润色 → 视觉素材 → 音频素材 → 资产管道 → 组件实现 → 预览渲染
  • 自动化环境初始化:Bootstrap 一次,多项目共享 Remotion 模板和浏览器(session 创建时自动兜底)
  • Remotion 驱动:React 组件编程式生成视频,逐帧精确控制
  • 断点续做progress.yaml 状态持久化,支持中断恢复和增量修改

案例:

调度架构

                         ┌─────────┐
                         │  User   │
                         └────┬────┘
                              │ request / confirm
                              ▼
                    ┌───────────────────┐
                    │   Orchestrator    │
                    │                   │
                    │  · 读取进度状态    │
                    │  · 调度 subagent  │
                    │  · 验证产出物     │
                    │  · 更新 progress  │
                    └──┬────┬────┬───┬──┘
                       │    │    │   │
          dispatch     │    │    │   │    callback
       ┌───────────────┘    │    │   └───────────────┐
       │         ┌──────────┘    └──────────┐        │
       ▼         ▼                          ▼        ▼
  ┌─────────┐ ┌─────────┐            ┌─────────┐ ┌──────────┐
  │ Planner │ │  Media  │            │ Builder │ │ Reviewer │
  │         │ │         │            │         │ │          │
  │ step 1  │ │ step 3  │            │ step 6  │ │ step 8   │
  │ step 2  │ │ step 4  │            │ step 7  │ │          │
  │         │ │ step 5  │            │         │ │          │
  └─────────┘ └─────────┘            └─────────┘ └──────────┘
  ╔═══════════╗ ╔═══════════╗ ╔════════════════╗ ╔══════════╗
  ║ Planning  ║ ║Enhancement║ ║Implementation  ║ ║ Delivery ║
  ╚═══════════╝ ╚═══════════╝ ╚════════════════╝ ╚══════════╝

  ──────────────────── 数据流向 ────────────────────

  Planner ──manifests/──▶ Media ──raws/──▶ Builder ──project/──▶ Reviewer
              ↑                                          │
              │              revision_request            │
              └──────────── Orchestrator ◀───────────────┘

快速开始

环境要求

  • macOS / Linux(不支持 Windows,需用 WSL2)
  • Node.js >= 18, Python >= 3.9, uv(Python 包管理), ffmpeg
  • API 密钥:
    • 必需:PEXELS_API_KEY
    • 可选:PIXABAY_API_KEY, CARO_LLM_API_KEY, FREESOUND_API_KEY

安装与启动

git clone <repository-url>
cd carocut/
cp .env_example .env # 配置 API 密钥

# Python 环境(使用 uv 管理)
uv venv
source .venv/bin/activate  # macOS/Linux
uv pip install -r requirements.txt

# Node.js 依赖
pnpm install

# OpenCode 配置
cp opencode-template.json opencode.json  # 编辑配置 API 密钥和模型

# Bootstrap:全局环境初始化(首次运行)
python .opencode/scripts/bootstrap.py

Bootstrap 会执行:

  • 环境检查(Node.js、Python、ffmpeg、API keys)
  • Remotion 模板缓存准备(~700MB,所有项目共享)
  • Chrome headless shell 下载

启动需要两个终端(重要:在 venv 下执行):

# 激活虚拟环境(如未激活)
source .venv/bin/activate  # macOS/Linux

# 终端 1:启动 OpenCode 后端(启用 Web 搜索)
OPENCODE_ENABLE_EXA=1 opencode serve --port 4096 --cors http://localhost:3000 --print-logs

# 终端 2:启动前端
pnpm dev  # 访问 http://localhost:3000

启动工作流

在 OpenCode 界面输入 /carocut,系统自动执行完整视频制作流水线。

架构概览

用户输入素材 → Orchestrator → Planner / Media / Builder / Reviewer → 最终视频
阶段 步骤 Agent 描述
Planning step-1, 2 planner 素材分析、制作策划
Enhancement step-3, 4, 5 media 脚本润色、视觉素材、音频素材
Implementation step-6, 7 builder 资产管道、组件实现
Delivery step-8 reviewer 预览审查、最终渲染

项目结构

carocut/
├── app/                    # Next.js 应用(页面 + API 路由)
├── components/             # React 组件
├── lib/                    # 工具函数(studio-manager 等)
├── .opencode/
│   ├── agents/             # 5 个 Agent 定义
│   ├── commands/           # /carocut 命令
│   └── skills/             # 12 个 Skill 定义
├── raws/                   # 原始素材(images/ + audio/)
├── workspaces/             # 运行时工作空间
├── server.ts               # Next.js + Remotion Studio 代理服务器
├── opencode-template.json  # OpenCode 配置模板
└── requirements.txt        # Python 依赖

文档

  • 完整指南 — 环境配置、开发规范、使用方法、素材规范
  • 架构详解 — 系统架构、Agent 设计、数据流、设计决策
  • 贡献指南 — 代码规范、PR 流程

许可证

MIT License。详见 LICENSE

Remotion 许可证:Remotion 为源码可见项目,个人/非营利/≤3 人公司免费,超 3 人公司商用需购买 Remotion License。详见 THIRD-PARTY-NOTICES

致谢

Remotion · OpenCode SDK · Pexels · Pixabay · Freesound

Reviews (0)

No results found