awesome-chinese-ai-agents

agent
Security Audit
Warn
Health Pass
  • License — License: MIT
  • Description — Repository has a description
  • Active repo — Last push 0 days ago
  • Community trust — 20 GitHub stars
Code Warn
  • network request — Outbound network request in scripts/post_xhs.py
Permissions Pass
  • Permissions — No dangerous permissions requested

No AI report is available for this listing yet.

SUMMARY

🤖🇨🇳 最全面的中文 AI Agent 资源库 | The Most Comprehensive Chinese AI Agent Resources - Tools, Skills, Documentation & Best Practices for WeChat, Douyin, Xiaohongshu and more

README.md

Awesome Chinese AI Agents 🦞🤖

为什么是小龙虾 🦞? 因为 OpenClaw = Open + Claw(钳子),所以大家都叫它"小龙虾",开发 AI Agent 就是"养小龙虾"!

Awesome
GitHub stars
GitHub forks
PRs Welcome
License: MIT
GitHub issues
GitHub contributors
Last commit

最全面的中文 AI Agent 资源库 - 为中文开发者打造的 AI Agent 工具、技能、文档和最佳实践合集

English | 简体中文

⭐ Star · 🐛 Report Bug · 💡 Request Feature

✨ 项目亮点

  • 🎯 专注中文生态 - 收录专门适配中文场景的 AI Agent 资源
  • 🔥 真实可用 - 所有项目均为真实存在、可直接使用的开源项目
  • 📈 持续更新 - 紧跟中文 AI Agent 领域最新动态
  • 🌟 精选推荐 - 按 GitHub Star 数和社区活跃度筛选优质资源
  • 💡 实战导向 - 包含完整的实战案例和最佳实践
  • 🤝 社区驱动 - 欢迎所有开发者贡献和完善

📊 资源统计

  • 🔥 Agent Harness: 8+ (Claude Code、Codex、Gemini CLI、Deer-Flow 等) 🆕
  • 🔧 AI Agent 框架: 18+
  • 🤖 中文 LLM: 10+
  • 🛠️ 开发工具: 30+
  • 💬 平台集成: 8+ (微信、抖音、小红书等)
  • 📚 学习资源: 20+
  • 🎨 提示词模板: 15+
  • 📊 实战案例: 5+
  • 🔌 中国服务 API: 30+

🗓️ 最近更新:2026-04-22 — 新增字节跳动 Deer-Flow、Gemini CLI、LobeHub Agent 协作平台等最新资源


📖 目录


🔥 Agent Harness —— 让 AI 直接写代码

什么是 Agent Harness?
Harness(执行框架)是让 AI Agent 直接操控编码工具的调度层 —— 不只是生成代码建议,而是真正打开编辑器、读写文件、跑测试、提 PR,全流程自动完成。

🎯 核心概念

概念 说明
Harness Agent 的"身体"——与代码工具(Claude Code、Codex、Gemini CLI 等)交互的执行层
ACP 协议 Agent Control Protocol,OpenClaw 用于调度 Harness 的标准接口
Coding Agent 在 Harness 中运行的代码智能体,可自主规划、编写、调试代码
Session 每次 Harness 调用的独立上下文,支持一次性(run)和持久(session)两种模式

🚀 主流 Agent Harness 对比

Harness 背后模型 适用场景 中文支持 开源
Claude Code Claude 3.5/3.7 全流程代码任务、复杂重构 ✅ 中文指令友好 部分开源
Codex CLI GPT-4o / o3 终端命令、脚本生成 ✅ 开源
Gemini CLI Gemini 2.5 Pro 大上下文代码理解 ✅ 开源
Aider 多模型 对话式代码修改、Git 集成 ✅ 开源
Cursor 多模型 IDE 级别 AI 辅助 ❌ 商业
OpenCode 多模型 终端原生、轻量 ✅ 开源

⚡ OpenClaw ACP Harness

OpenClaw 通过 ACP(Agent Control Protocol) 原生支持 Harness 调度,可在对话中直接唤起 Claude Code、Codex 等 Coding Agent:

# 在 OpenClaw 中直接对话触发 Harness
"帮我用 Codex 重构这个函数"
"让 Claude Code 审查一下 PR #42"
"在 Gemini CLI 里分析整个代码库"

核心特性:

  • 🔄 多 Harness 并行调度 — 同时启动多个 Coding Agent 处理不同子任务
  • 📌 Thread 绑定 — Discord/Slack 频道中每个对话线程独立维护一个 Agent Session
  • 🔁 Push 完成通知 — 任务完成后主动推送结果,无需轮询
  • 🔒 权限隔离bypassPermissions 模式下 Agent 可全自动操作,无需人工确认
  • 🌐 中文指令透传 — 直接用中文描述任务,OpenClaw 自动适配各 Harness 协议

快速配置示例:

// openclaw.config.json
{
  "acp": {
    "defaultAgent": "claude-code",  // 默认 Harness
    "allowedAgents": ["claude-code", "codex", "gemini-cli", "aider"],
    "sessionTarget": "isolated"     // 隔离执行,不污染主会话
  }
}

对话触发示例(Discord/Telegram/微信):

用户: 帮我在 Codex 里实现一个微信消息去重模块
AI:  好的,正在启动 Codex... [spawn isolated session]
     任务完成后会通知你 🚀

# 几分钟后
AI:  ✅ Codex 完成了!已在 feat/dedup-wechat 分支提交代码:
     - 新增 MessageDeduplicator 类
     - 单元测试覆盖率 92%
     - PR 链接:https://github.com/...

🛠️ 主流 Harness 安装与配置

Claude Code(推荐)

# 安装
npm install -g @anthropic-ai/claude-code

# 配置国内可访问的 API 端点(支持 BRConnector 等中转)
export ANTHROPIC_BASE_URL="https://your-proxy.example.com"
export ANTHROPIC_API_KEY="sk-..."

# 验证
claude --version

# 以非交互模式运行(适合 Harness 调度)
claude --print --permission-mode bypassPermissions "重构 utils.py 中的缓存逻辑"

Codex CLI

# 安装
npm install -g @openai/codex

# 配置
export OPENAI_API_KEY="sk-..."
# 国内用户可配置 baseURL
export OPENAI_BASE_URL="https://your-proxy.example.com/v1"

# 运行(需要 PTY 终端)
codex "用 Python 写一个飞书消息推送脚本"

Aider(多模型,中文友好)

# 安装
pip install aider-chat

# 配置通义千问(国内直连)
export OPENAI_API_KEY="your-qwen-api-key"
export OPENAI_API_BASE="https://dashscope.aliyuncs.com/compatible-mode/v1"

# 启动,绑定到 Git 仓库
cd your-project
aider --model qwen-max --chinese  # 全程中文交互

📋 Harness 使用场景速查

场景 推荐 Harness 说明
新功能开发 Claude Code 理解需求 → 规划 → 实现 → 测试,全自动
PR 代码审查 Claude Code / Gemini CLI 分析 diff,给出中文审查意见
大型重构 Gemini CLI 200K 上下文,适合大代码库
脚本生成 Codex 快速生成 shell/Python 工具脚本
对话式修改 Aider 持续对话,每步提交 Git
IDE 辅助 Cursor 图形化,适合不习惯终端的开发者
企业私有化 Aider + 本地 LLM Ollama + Qwen,数据不出内网

🔗 相关资源


🚀 快速开始

给贡献者

欢迎参与建设这个资源库!你可以:

  1. ⭐ Star 本项目 - 支持我们持续更新
  2. 📝 提交资源 - 分享你发现的优质工具和教程
  3. 💬 参与讨论 - 在 Discussions 分享经验
  4. 🐛 报告问题 - 发现错误或过时信息请提 Issue

详细贡献指南: CONTRIBUTING.md

给使用者

新手入门建议:

  1. 浏览 精选项目 选择一个框架(推荐 LangChain 或 Dify)
  2. 查看 对话平台集成 了解如何接入微信/抖音等平台
  3. 参考 实战案例 学习完整的实现方案
  4. 阅读 FAQ 解决常见问题

5分钟快速上手:

# 方案1: 使用 Dify (可视化,零代码)
git clone https://github.com/langgenius/dify.git
cd dify/docker
docker-compose up -d
# 访问 http://localhost/install 完成安装

# 方案2: 使用 LangChain (代码开发)
pip install langchain openai
# 创建你的第一个 Agent
python -c "
from langchain.agents import initialize_agent, Tool
from langchain.llms import OpenAI

llm = OpenAI(temperature=0)
tools = []
agent = initialize_agent(tools, llm, agent='zero-shot-react-description')
print(agent.run('你好,请介绍一下自己'))
"

# 方案3: 使用 Ollama (本地运行)
curl https://ollama.ai/install.sh | sh
ollama run qwen  # 运行通义千问模型

给项目发起者

如果你正在发起一个 AI Agent 项目,参考我们的经验:


🌟 精选项目

AI Agent 框架

  • LangChain - 最流行的 LLM 应用开发框架

    • 官方中文文档
    • 庞大的中文社区
    • 海量的中文教程
    • 中文入门指南 (8.8K+ ⭐)
  • MetaGPT - 多 Agent 元编程框架 (中国团队)

    • 完全中文支持
    • 软件公司级别的协作
    • 自动生成PRD、设计文档、代码
  • AutoGen - 微软开源的多 Agent 对话框架

    • 中文文档完善
    • 支持多 Agent 协作
    • 丰富的示例代码
  • 万物 Wanwu - 中国联通元景万物 Agent 平台 (3.9K+ ⭐)

    • 企业级多租户 AI Agent 开发平台
    • 支持智能体、工作流、RAG 应用构建
    • 模型管理功能
    • 开发者友好的许可证
  • Deer-Flow 🆕 - 字节跳动开源 SuperAgent 框架 (63K+ ⭐)

    • 长程任务:可执行需要数分钟至数小时的复杂任务
    • 集成沙箱隔离环境、长期记忆、多种工具调用
    • 支持子 Agent 并行协作与消息网关
    • 适合研究、编码、内容创作等复杂场景
  • LobeHub 🆕 - 新一代多 Agent 协作平台 (75K+ ⭐)

    • 支持多 Agent 团队设计和协作
    • 以 Agent 为工作交互单元
    • 集成 AI 市场,可发现和复用 Agent 团队
    • 支持中英文界面
  • Langchain-Chatchat - 基于 LangChain 的知识库问答应用

    • 完整的中文支持
    • 本地知识库问答
    • 支持多种中文 LLM

中文原生 LLM 与工具

  • LLamaFactory - 易用的 LLM 微调框架

    • 支持多种中文模型
    • 一键训练和部署
    • Web UI 界面
  • ChatGLM-6B - 清华开源的中文对话模型

    • 针对中文优化
    • 可本地部署
    • 适合私有化场景
  • Qwen-Agent - 阿里巴巴通义千问 Agent 框架

    • 完整的中文文档
    • 官方技术支持
    • 与通义千问深度集成
  • Chinese-LangChain - 中文 LangChain 项目集合 (2.8K+ ⭐)

    • 中文 LLM 应用案例
    • 实战项目代码

框架对比

框架 上手难度 中文支持 社区活跃度 适用场景 Star数
LangChain ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 通用开发 135K+
MetaGPT ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ 多Agent协作 45K+
AutoGen ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ 对话系统 35K+
万物 Wanwu ⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐ 企业应用 3.9K
Dify ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 可视化开发 138K+
Deer-Flow 🆕 ⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 长程复杂任务 63K+
LobeHub 🆕 ⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 多Agent协作平台 75K+

🛠️ 开发工具

开发框架

  • LangGraph - 构建有状态的 Agent 工作流

    • 可视化工作流编辑
    • 中文示例丰富
    • 与 LangChain 无缝集成
  • CrewAI - 角色扮演型多 Agent 协作框架

    • 简单易用的 API
    • 适合团队协作场景
    • 支持中文场景
  • DD-OS - 基于事件驱动与 Nexus 记忆机制的 AI Agent 操作系统

    • 可视化的节点,开箱即用
    • V3 状态机架构配合 Nexus 分层记忆,执行更稳定
    • 独创“模拟城市”等轴测 UI,全景监控 Agent 任务流

RAG 与知识库

  • Langchain-Chatchat - 本地知识库问答系统

    • 支持多种文档格式
    • 向量数据库集成
    • 完整的中文支持
  • QAnything - 网易有道的本地知识库问答

    • 支持任意格式文件
    • 离线运行
    • 中文优化
  • RAGFlow - 基于深度文档理解的 RAG 引擎

    • 可视化管理界面
    • 支持复杂文档解析
    • 中文文档完善

可视化开发平台

  • Dify - 开源的 LLM 应用开发平台

    • 可视化 Prompt 编排
    • 支持多种 LLM
    • 完整的中文界面
    • Agent 和工作流设计
  • FastGPT - 知识库问答系统

    • 拖拽式工作流
    • 可视化调试
    • 支持 API 调用
    • 数据集管理

提示词工程

监控与调试

  • Langfuse - 开源 LLM 工程平台

    • LLM 可观测性
    • Prompt 管理和版本控制
    • 成本追踪和分析
    • 支持多种 LLM 框架集成
  • LangSmith - LangChain 官方监控平台

    • 实时追踪 Agent 执行
    • 调试和优化 Prompt
    • 性能分析
    • 中文界面支持
  • OpenLLMetry - LLM 可观测性工具

    • OpenTelemetry 集成
    • 追踪 LLM 调用
    • 性能监控
    • 开源免费

向量数据库

  • Qdrant - 高性能向量搜索引擎

    • Rust 编写,性能优秀
    • 支持过滤和分组
    • 完善的中文文档
    • Docker 一键部署
  • Milvus - 云原生向量数据库

    • 支持海量数据
    • 多种索引算法
    • 中国团队开发
    • 企业级特性
  • Chroma - AI 原生向量数据库

    • 轻量级,易于使用
    • Python/JS SDK
    • 适合快速原型开发
    • 开源免费

部署与运维

  • Ollama - 本地运行大语言模型

    • 一键安装部署
    • 支持多种模型
    • API 兼容 OpenAI
    • 资源占用可控
  • LocalAI - 本地 AI API 服务

    • OpenAI 兼容 API
    • 支持 CPU 运行
    • Docker 部署
    • 隐私保护
  • vLLM - 高性能 LLM 推理引擎

    • 吞吐量提升 10-20倍
    • 支持主流 LLM
    • 生产环境可用
    • PagedAttention 优化

🎯 Agent 技能

通用技能

文本处理

  • 文档解析与摘要

    • PDF/Word/Excel 文档解析
    • 智能摘要生成
    • 多语言翻译(中英互译)
    • 文档格式转换
  • 内容创作

    • 文章写作助手
    • 营销文案生成
    • 小红书文案生成器
    • 公众号排版助手

数据分析

  • 数据可视化

    • 自动生成图表
    • 数据报告生成
    • Pandas/NumPy 代码生成
    • Excel 自动化
  • 网页抓取

    • 中文网站爬虫
    • 反爬虫策略处理
    • 数据清洗与结构化
    • 定时监控与告警

中文特色技能

社交媒体自动化

  • 微信生态

    • 微信公众号自动发文
    • 企业微信机器人
    • 微信群聊机器人
    • 朋友圈自动发布
  • 抖音/快手

    • 视频文案生成
    • 评论自动回复
    • 数据分析与报告
    • 热点追踪
  • 小红书

    • 笔记自动生成
    • 标签推荐
    • 爆款文案分析
    • 达人数据监控
  • 微博

    • 热搜追踪
    • 自动转发评论
    • 舆情监控
    • 粉丝互动

电商平台

  • 淘宝/天猫

    • 商品标题优化
    • 详情页文案生成
    • 客服自动回复
    • 订单数据分析
  • 拼多多

    • 价格监控
    • 竞品分析
    • 自动改价策略
    • 评价管理
  • 京东

    • 库存监控
    • 促销活动分析
    • 物流追踪
    • 售后处理

办公协作

  • 钉钉

    • 钉钉机器人
    • 审批流程自动化
    • 考勤统计
    • 日报周报生成
  • 飞书

    • 飞书机器人
    • 文档协作
    • 日程管理
    • 会议纪要生成
  • 企业微信

    • 客户管理
    • 群发消息
    • 数据统计
    • CRM集成

营销与运营

增长黑客

  • SEO优化

    • 中文关键词研究
    • 百度SEO优化
    • 内容优化建议
    • 竞品分析
  • SEM投放

    • 百度广告优化
    • 关键词出价建议
    • A/B测试分析
    • ROI计算
  • 内容营销

    • 爆款内容分析
    • 选题推荐
    • 发布时间优化
    • 数据追踪

用户运营

  • 用户增长

    • 裂变活动策划
    • 拉新文案生成
    • 增长漏斗分析
    • 用户分层
  • 用户留存

    • 流失预警
    • 召回策略
    • 个性化推荐
    • 社群运营

开发与DevOps

代码辅助

  • 中文代码生成

    • 根据中文描述生成代码
    • 代码注释中文化
    • API文档生成
    • 单元测试生成
  • 代码审查

    • 中文代码审查报告
    • 安全漏洞检测
    • 性能优化建议
    • 最佳实践检查

运维自动化

  • 监控告警

    • 服务器监控
    • 日志分析
    • 异常检测
    • 告警处理(中文通知)
  • CI/CD

    • 自动化部署
    • 构建优化
    • 测试报告生成
    • 发布笔记生成

💬 对话平台集成

微信生态

  • WeChaty - 对话机器人 SDK

    • 支持多种微信协议
    • TypeScript/JavaScript
    • 活跃的社区支持
  • chatgpt-on-wechat - 基于 ChatGPT 的微信机器人

    • 开箱即用
    • 支持多种 LLM
    • 插件系统
  • wechat-chatgpt - 微信 + ChatGPT 集成

    • 简单易用
    • Docker 部署
    • 支持群聊
  • wechat-bot - 功能丰富的微信机器人

    • 支持多种功能
    • 定时任务
    • 群管理
  • wechatbot-webhook - 微信机器人 Webhook 方案

    • RESTful API
    • 易于集成
    • 支持企业微信

即时通讯

平台 集成难度 文档质量 推荐方案
企业微信 ⭐⭐⭐ ⭐⭐⭐⭐ 企业微信SDK
钉钉 ⭐⭐ ⭐⭐⭐⭐⭐ 钉钉开放平台
飞书 ⭐⭐ ⭐⭐⭐⭐⭐ 飞书开放平台
Telegram ⭐⭐⭐⭐⭐ Telegraf
WhatsApp ⭐⭐⭐ ⭐⭐⭐⭐ whatsapp-web.js

社交媒体


📚 中文文档与教程

优质学习资源

视频教程

  • B站搜索关键词: "AI Agent 教程", "LangChain 实战", "大模型应用开发"
  • 推荐UP主:
    • @李沐 - 深度学习论文精读
    • 搜索 "LangChain 中文教程"
    • 搜索 "ChatGPT API 开发"

博客与社区


🎨 提示词库

通用提示词

#### 角色扮演

你是一位资深的{角色},拥有{经验年限}年的{领域}经验。
你的任务是帮助用户{目标},需要注意以下要点:
1. {要点1}
2. {要点2}
3. {要点3}

请使用专业但易懂的中文进行回答。

中文写作

#### 小红书笔记生成

请根据以下信息生成一篇小红书笔记:
- 主题: {主题}
- 关键词: {关键词1}, {关键词2}, {关键词3}
- 风格: {风格}(如: 种草/测评/教程)
- 字数: {字数}

要求:
1. 标题吸引眼球,包含emoji
2. 开头引起共鸣
3. 内容有价值,有干货
4. 结尾有互动引导
5. 合理使用emoji和排版
6. 添加5-10个相关标签

营销文案

#### 广告文案生成

产品/服务: {产品名称}
目标用户: {用户画像}
核心卖点: {卖点1}, {卖点2}, {卖点3}
文案类型: {类型}(如: 朋友圈/海报/短视频)

请生成3个版本的文案,每个版本风格不同:
1. 理性说服型
2. 情感共鸣型
3. 幽默娱乐型

每个文案包含:
- 标题(20字以内)
- 正文(根据类型调整长度)
- Call-to-Action

技术文档

#### API文档生成

请根据以下代码生成完整的中文API文档:

{粘贴代码}

文档应包含:
1. 功能描述
2. 参数说明(类型、必填、默认值、示例)
3. 返回值说明
4. 使用示例
5. 注意事项
6. 常见错误及解决方案

Agent 系统提示词

#### 多步骤任务执行 Agent

你是一个任务执行助手,能够将复杂任务分解为多个步骤并逐步完成。

对于用户的请求,请:
1. 分析任务需求,列出需要完成的子任务
2. 为每个子任务制定执行计划
3. 按顺序执行各个子任务
4. 每完成一个子任务后,总结结果并继续下一步
5. 如遇到问题,说明原因并调整计划
6. 所有子任务完成后,提供完整总结

工具使用规则:
- 需要搜索信息时使用 search 工具
- 需要计算时使用 calculator 工具
- 需要生成代码时使用 code_generator 工具
- 每次只调用一个工具,等待结果后再继续

请用中文清晰地说明你的思考过程和执行步骤。
#### RAG 知识库问答 Agent

你是一个专业的知识库助手,基于提供的上下文回答用户问题。

回答规则:
1. 仔细阅读检索到的上下文信息
2. 只基于上下文中的内容回答,不要编造
3. 如果上下文中没有相关信息,诚实地说"根据现有资料无法回答"
4. 引用时请注明来源段落
5. 回答要准确、简洁、专业
6. 使用中文回答

上下文信息:
{context}

用户问题:
{question}

请基于以上上下文回答用户问题。
#### 微信客服机器人

你是 {公司名称} 的智能客服助手,负责解答用户咨询。

服务准则:
- 态度友好,回复及时
- 用简单易懂的语言
- 提供准确的信息
- 无法解决时及时转人工

常见问题处理:
1. 订单查询 → 引导提供订单号,调用订单查询接口
2. 物流查询 → 引导提供运单号,调用物流接口
3. 退换货 → 说明政策,引导填写申请表单
4. 产品咨询 → 基于产品知识库回答
5. 投诉建议 → 记录并转人工处理

触发转人工关键词:
"人工客服"、"转人工"、"投诉"、"经理"

请用温暖、专业的语气与用户交流,使用中文回复。

数据分析提示词

#### 数据分析与可视化

作为数据分析师,请分析以下数据并生成报告:

数据: {数据内容或数据描述}

分析要求:
1. 数据清洗: 识别并处理异常值、缺失值
2. 描述性统计: 计算均值、中位数、标准差等
3. 趋势分析: 识别数据中的规律和趋势
4. 相关性分析: 分析变量之间的关系
5. 可视化建议: 推荐合适的图表类型
6. 结论总结: 提炼关键发现和建议

输出格式:
- 使用 Markdown 表格展示统计结果
- 用中文描述发现和洞察
- 提供 Python/Pandas 代码示例

🔌 中国服务API集成

支付

地图导航

短信/邮件

身份验证

  • 手机号验证 - 阿里云/腾讯云号码认证服务
  • 身份证OCR - 百度AI/腾讯云/阿里云
  • 人脸识别 - Face++ / 腾讯云 / 阿里云

存储


📊 实战案例

案例1: 微信客服机器人

场景: 电商公司需要24小时自动回复客户咨询

技术栈:

  • WeChaty (微信接入)
  • LangChain (对话管理)
  • 通义千问 (LLM)
  • Redis (会话存储)

功能:

  • 自动回复常见问题
  • 订单查询
  • 物流跟踪
  • 人工客服转接

代码: 查看完整实现


案例2: 小红书内容运营助手

场景: 品牌方需要批量生成小红书内容并监控数据

技术栈:

  • LangChain (Agent框架)
  • ChatGPT/Claude (内容生成)
  • 小红书开放平台 (内容发布)
  • MongoDB (数据存储)

功能:

  • 根据关键词生成笔记
  • 自动添加标签和emoji
  • 定时发布
  • 数据监控与分析

代码: 查看完整实现


案例3: 自动化SEO优化工具

场景: SEO团队需要批量优化网站内容

技术栈:

  • Python
  • LangChain
  • 百度搜索API
  • 站长工具API

功能:

  • 关键词研究
  • 内容优化建议
  • 竞品分析
  • 排名监控

代码: 查看完整实现


快速上手代码示例

示例1: 最简单的 LangChain Agent

from langchain.agents import initialize_agent, Tool, AgentType
from langchain_openai import ChatOpenAI
from langchain.tools import DuckDuckGoSearchRun

# 初始化 LLM
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0,
    openai_api_key="your-api-key"
)

# 定义工具
search = DuckDuckGoSearchRun()
tools = [
    Tool(
        name="搜索",
        func=search.run,
        description="用于搜索最新信息。输入应该是搜索查询。"
    )
]

# 创建 Agent
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True,
    max_iterations=3
)

# 运行 Agent
result = agent.run("2024年中国AI发展现状")
print(result)

示例2: 简单的 RAG 知识库问答

from langchain_community.document_loaders import TextLoader
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA

# 1. 加载文档
loader = TextLoader("knowledge_base.txt", encoding="utf-8")
documents = loader.load()

# 2. 文档分块
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50
)
texts = text_splitter.split_documents(documents)

# 3. 创建向量数据库
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(
    documents=texts,
    embedding=embeddings
)

# 4. 创建问答链
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3})
)

# 5. 提问
question = "这个产品的主要功能是什么?"
answer = qa_chain.run(question)
print(answer)

示例3: 微信机器人集成 (基于 WeChaty)

const { WechatyBuilder } = require('wechaty')
const { OpenAI } = require('openai')

const openai = new OpenAI({
  apiKey: process.env.OPENAI_API_KEY
})

// 创建机器人
const bot = WechatyBuilder.build({
  name: 'ai-assistant'
})

// 监听消息
bot.on('message', async (message) => {
  // 忽略自己的消息
  if (message.self()) return

  // 获取消息内容
  const text = message.text()
  const contact = message.talker()

  // 只响应包含 @机器人 的消息
  if (!text.includes('@AI助手')) return

  try {
    // 调用 OpenAI
    const response = await openai.chat.completions.create({
      model: 'gpt-3.5-turbo',
      messages: [
        { role: 'system', content: '你是一个友好的助手,用简洁的中文回答问题。' },
        { role: 'user', content: text.replace('@AI助手', '').trim() }
      ],
      max_tokens: 500
    })

    const reply = response.choices[0].message.content
    await message.say(reply)

  } catch (error) {
    console.error('Error:', error)
    await message.say('抱歉,我遇到了一些问题,请稍后再试。')
  }
})

// 启动机器人
bot.start()
  .then(() => console.log('机器人启动成功'))
  .catch(e => console.error('启动失败:', e))

示例4: 使用 Dify API 调用 Agent

import requests

# Dify API 配置
DIFY_API_KEY = "your-dify-api-key"
DIFY_API_URL = "https://api.dify.ai/v1/chat-messages"

def chat_with_dify(query, conversation_id=None):
    """调用 Dify Agent"""

    headers = {
        "Authorization": f"Bearer {DIFY_API_KEY}",
        "Content-Type": "application/json"
    }

    data = {
        "inputs": {},
        "query": query,
        "response_mode": "blocking",
        "user": "user-123"
    }

    if conversation_id:
        data["conversation_id"] = conversation_id

    response = requests.post(DIFY_API_URL, headers=headers, json=data)
    result = response.json()

    return {
        "answer": result["answer"],
        "conversation_id": result["conversation_id"]
    }

# 使用示例
response1 = chat_with_dify("你好,介绍一下自己")
print(response1["answer"])

# 继续对话
response2 = chat_with_dify(
    "你能做什么?",
    conversation_id=response1["conversation_id"]
)
print(response2["answer"])

示例5: 成本监控和缓存优化

from functools import lru_cache
import hashlib
import json
from langchain_openai import ChatOpenAI
from langchain.cache import InMemoryCache
import langchain

# 启用 LangChain 缓存
langchain.llm_cache = InMemoryCache()

class CostTracker:
    """成本追踪器"""
    def __init__(self):
        self.total_tokens = 0
        self.total_cost = 0
        # GPT-3.5-turbo 价格 (每1K tokens)
        self.input_cost_per_1k = 0.0015
        self.output_cost_per_1k = 0.002

    def track(self, input_tokens, output_tokens):
        self.total_tokens += (input_tokens + output_tokens)
        cost = (input_tokens * self.input_cost_per_1k / 1000 +
                output_tokens * self.output_cost_per_1k / 1000)
        self.total_cost += cost
        return cost

    def get_stats(self):
        return {
            "total_tokens": self.total_tokens,
            "total_cost_usd": round(self.total_cost, 4)
        }

# 初始化
tracker = CostTracker()
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 使用缓存的装饰器
@lru_cache(maxsize=100)
def get_cached_response(query_hash):
    """缓存相似查询的响应"""
    return None

def chat(query):
    # 计算查询哈希
    query_hash = hashlib.md5(query.encode()).hexdigest()

    # 检查缓存
    cached = get_cached_response(query_hash)
    if cached:
        print("✓ 使用缓存响应,节省成本")
        return cached

    # 调用 LLM
    response = llm.predict(query)

    # 追踪成本 (估算)
    input_tokens = len(query) // 4
    output_tokens = len(response) // 4
    cost = tracker.track(input_tokens, output_tokens)

    print(f"✓ 本次调用成本: ${cost:.4f}")

    # 缓存响应
    get_cached_response.cache_info()

    return response

# 测试
print(chat("什么是人工智能?"))
print(chat("什么是人工智能?"))  # 第二次调用会使用缓存

# 查看统计
print("\n成本统计:", tracker.get_stats())

🔧 常见错误与故障排除

安装和环境问题

错误: ImportError: No module named 'langchain'

原因: LangChain 未安装或安装版本不正确

解决方案:

# 安装最新版本
pip install langchain langchain-openai langchain-community

# 或指定版本
pip install langchain==0.1.0

# 检查安装
python -c "import langchain; print(langchain.__version__)"
错误: SSL Certificate Verification Failed

原因: SSL 证书验证失败,常见于国内网络环境

解决方案:

# 临时禁用 SSL 验证 (不推荐生产环境)
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

# 或设置代理
import os
os.environ['HTTP_PROXY'] = 'http://your-proxy:port'
os.environ['HTTPS_PROXY'] = 'http://your-proxy:port'

API 调用问题

错误: RateLimitError: Rate limit exceeded

原因: API 调用频率超限

解决方案:

from time import sleep
from tenacity import retry, wait_exponential, stop_after_attempt

@retry(
    wait=wait_exponential(multiplier=1, min=4, max=60),
    stop=stop_after_attempt(5)
)
def call_llm_with_retry(prompt):
    try:
        return llm.predict(prompt)
    except Exception as e:
        print(f"错误: {e}, 重试中...")
        raise

# 或添加延迟
sleep(1)  # 每次调用间隔 1 秒
错误: AuthenticationError: Invalid API key

原因: API 密钥无效或未设置

解决方案:

# 设置环境变量
export OPENAI_API_KEY="sk-..."

# 或在代码中设置
import os
os.environ['OPENAI_API_KEY'] = 'sk-...'

# 验证密钥
from openai import OpenAI
client = OpenAI()
print(client.models.list())  # 测试连接

向量数据库问题

错误: ChromaDB dimension mismatch

原因: Embedding 维度与数据库中存储的不一致

解决方案:

# 删除旧数据库重新创建
import shutil
shutil.rmtree("./chroma_db")

# 确保使用相同的 Embedding 模型
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

# 重新创建向量库
vectorstore = Chroma.from_documents(
    documents=docs,
    embedding=embeddings,
    persist_directory="./chroma_db"
)

性能问题

问题: 响应速度太慢

优化方案:

  1. 使用流式输出
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

llm = ChatOpenAI(
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()]
)
  1. 减少 Top-K
retriever = vectorstore.as_retriever(
    search_kwargs={"k": 3}  # 从 10 减少到 3
)
  1. 使用更快的模型
llm = ChatOpenAI(model="gpt-3.5-turbo")  # 而不是 gpt-4
  1. 并行处理
from concurrent.futures import ThreadPoolExecutor

with ThreadPoolExecutor(max_workers=5) as executor:
    results = executor.map(process_query, queries)

中文处理问题

问题: 中文分词效果差

解决方案:

# 使用专门的中文分词器
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    separators=["\n\n", "\n", "。", "!", "?", ";", ",", " ", ""],
    keep_separator=True
)

# 或使用 jieba
import jieba
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    length_function=lambda x: len(jieba.lcut(x))
)

🌐 社区资源

中文技术社区

  • 知乎 - 人工智能话题 - 高质量技术讨论

    • AI Agent 相关话题活跃
    • 行业专家分享经验
    • 最新技术动态
  • 掘金 - AI 标签 - 开发者社区

    • 技术文章分享
    • 实战经验交流
    • 开源项目推荐
  • CSDN - AI 专区 - 中文技术博客

    • 入门教程丰富
    • 代码示例完整
    • 问题解答及时
  • GitHub 中文社区 - 开源项目聚集地

    • 中文开源项目
    • 协作开发
    • Issue 讨论

学习资源

  • B站 UP主推荐:

    • 搜索"AI Agent 教程"
    • 搜索"LangChain 实战"
    • 搜索"大模型应用开发"
  • 公众号推荐:

    • "AI科技大本营"
    • "机器之心"
    • "量子位"
    • "新智元"

开源贡献

欢迎为本项目贡献资源!

  • 提交 Issue 报告问题
  • 提交 PR 添加资源
  • Star 本项目支持我们
  • 分享给更多开发者

❓ 常见问题速查

Q: 我是新手,应该从哪个框架开始?

A: 推荐顺序:

  • 零代码: Dify (可视化界面,拖拽式开发)
  • Python 开发者: LangChain (生态完善,中文资源多)
  • 企业应用: 万物 Wanwu (多租户,开箱即用)
Q: 如何选择中文 LLM?

A: 根据需求选择:

  • 预算充足: GPT-4 或 Claude (能力最强)
  • 性价比: 通义千问、文心一言 (中文优化好)
  • 私有部署: ChatGLM、Qwen (可本地运行)
  • 免费测试: Ollama + Qwen (完全本地)
Q: 微信机器人会被封号吗?

A: 风险评估:

  • 个人微信 + WeChaty: 有封号风险,建议用小号测试
  • 企业微信: 官方支持,稳定可靠
  • 微信公众号: 官方 API,完全合规
  • 建议: 生产环境优先使用企业微信或公众号
Q: RAG 系统的准确率低怎么办?

A: 优化方案:

  1. 文档质量: 清洗格式,去除无效信息
  2. 分块策略: 调整 chunk_size (建议 500-1000 字符)
  3. 检索优化: 使用混合检索 (向量 + 关键词)
  4. Rerank: 添加重排序模型提升准确率
  5. Prompt 优化: 明确告诉模型如何使用检索内容
Q: 如何降低 API 调用成本?

A: 成本优化技巧:

  • 缓存: 相似问题直接返回缓存结果
  • 模型选择: 简单任务用小模型 (GPT-3.5/通义千问)
  • Prompt 压缩: 减少不必要的上下文
  • 本地模型: 高频场景考虑 Ollama 本地部署
  • 流式输出: 避免重复生成

💡 最佳实践

选择合适的框架

  • 入门推荐: LangChain - 文档完善,社区活跃,中文资源丰富
  • 企业应用: 万物 Wanwu - 企业级平台,多租户支持
  • 多 Agent 协作: MetaGPT - 软件开发场景,自动化协作
  • 本地部署: ChatGLM + LangChain - 数据安全,私有化部署

中文 LLM 选择

模型 适用场景 优势 成本
通义千问 通用对话、内容生成 中文理解好,API稳定 中等
ChatGLM 私有化部署 可本地运行,数据安全 硬件成本
文心一言 企业应用 百度生态集成 中等
GPT-4 复杂推理 能力最强 较高

微信集成最佳实践

  1. 选择合适的接入方案:

    • 个人微信: WeChaty (注意封号风险)
    • 企业微信: 官方 SDK (稳定可靠)
    • 公众号: 微信公众平台 API (官方支持)
  2. 避免常见问题:

    • 消息去重处理
    • 频率限制控制
    • 异常重连机制
    • 日志监控告警
  3. 性能优化:

    • 使用消息队列异步处理
    • Redis 缓存会话状态
    • 限流防止滥用
    • 定期清理历史数据

RAG 系统优化

  1. 文档预处理:

    • 清洗格式和无效字符
    • 合理分块 (chunk size 建议 500-1000 字符)
    • 添加元数据信息
  2. 向量库选择:

    • 小规模 (<10万): Chroma, FAISS
    • 中规模 (10万-100万): Qdrant, Milvus
    • 大规模 (>100万): Elasticsearch, Weaviate
  3. 检索优化:

    • 混合检索 (向量 + 关键词)
    • Rerank 重排序
    • 动态调整 Top-K
    • 结果去重和过滤

成本优化策略

API 调用成本对比 (每百万 tokens)

模型 输入成本 输出成本 性价比 推荐场景
GPT-4 Turbo $10 $30 ⭐⭐⭐ 复杂推理
GPT-3.5 Turbo $0.5 $1.5 ⭐⭐⭐⭐⭐ 日常对话
通义千问 Plus ¥8 ¥20 ⭐⭐⭐⭐ 中文场景
通义千问 ¥2 ¥6 ⭐⭐⭐⭐⭐ 高频调用
文心一言 ¥12 ¥12 ⭐⭐⭐⭐ 企业应用
Claude 3.5 Sonnet $3 $15 ⭐⭐⭐⭐ 代码生成

降低成本的 10 个技巧

  1. 智能路由: 简单任务用便宜模型,复杂任务用贵模型
  2. Prompt 压缩: 移除冗余信息,使用缩写和简洁表达
  3. 缓存策略: 相同/相似问题直接返回缓存 (可节省 60-80%)
  4. 流式输出: 使用 streaming 避免重复生成
  5. 批处理: 合并多个请求,减少 API 调用次数
  6. 本地模型: 高频简单任务用 Ollama 本地模型
  7. Token 限制: 设置 max_tokens 避免超长输出
  8. 异步处理: 非实时场景使用异步,降低并发成本
  9. 模型微调: 专有场景微调小模型替代大模型
  10. 监控告警: 使用 Langfuse 实时监控成本,设置预算告警

安全与隐私保护

数据安全checklist

  • API 密钥管理

    • 使用环境变量,不要硬编码
    • 定期轮换密钥
    • 不同环境使用不同密钥
    • 启用 IP 白名单
  • 敏感信息过滤

    • 过滤身份证号、手机号
    • 脱敏处理用户数据
    • 避免将敏感数据发送到 LLM
    • 加密存储历史对话
  • 访问控制

    • 实施用户认证和授权
    • 限制 API 调用频率
    • 记录操作审计日志
    • 实施最小权限原则
  • 本地化部署

    • 敏感场景使用本地模型 (Ollama + ChatGLM)
    • 私有向量数据库 (Qdrant/Milvus 私有部署)
    • 内网隔离,不连接公网
    • 定期安全审计

常见安全风险

  1. Prompt 注入攻击

    • 风险: 用户输入包含恶意 Prompt 覆盖原始指令
    • 防范: 输入验证,使用系统角色分离,添加安全边界
  2. 数据泄露

    • 风险: 将用户敏感数据发送到第三方 LLM
    • 防范: 数据脱敏,本地模型,加密传输
  3. DDoS 和滥用

    • 风险: 恶意用户大量调用 API 消耗资源
    • 防范: 限流限频,CAPTCHA,成本预算告警
  4. 模型输出有害内容

    • 风险: LLM 生成违规、有害或错误信息
    • 防范: 内容审核,输出过滤,人工审核机制

🤝 贡献指南

我们欢迎所有形式的贡献!

如何贡献

  1. Fork 本项目
  2. 创建特性分支 (git checkout -b feature/AmazingFeature)
  3. 提交更改 (git commit -m 'Add some AmazingFeature')
  4. 推送到分支 (git push origin feature/AmazingFeature)
  5. 打开Pull Request

贡献内容

你可以贡献:

  • 📝 新的资源链接
  • 🔧 新的工具推荐
  • 📚 教程和文档
  • 💡 实战案例
  • 🐛 修复错误
  • 🌐 翻译内容

格式规范

添加新资源时,请遵循以下格式:

- **[项目名称](项目链接)** - 简短描述 (可选: stars数量)
  - 特点1
  - 特点2

📊 项目统计

  • 📚 收录资源: 160+
  • 🔥 Agent Harness: 6+ 🆕
  • 🛠️ 开发工具: 30+
  • 🎯 Agent技能: 80+
  • 💬 平台集成: 15+
  • 📖 教程文档: 50+
  • 🔌 API集成: 25+

⭐ Star History

Star History Chart


📄 License

本项目采用 MIT License


💖 致谢

感谢所有贡献者的付出! 🎉

特别感谢以下项目和组织:


🔗 相关项目


如果这个项目对你有帮助,请给我们一个 ⭐️!

Made with ❤️ by Chinese AI Community

Reviews (0)

No results found