deepseek-eyes

mcp
Guvenlik Denetimi
Uyari
Health Uyari
  • License — License: MIT
  • Description — Repository has a description
  • Active repo — Last push 0 days ago
  • Low visibility — Only 7 GitHub stars
Code Gecti
  • Code scan — Scanned 8 files during light audit, no dangerous patterns found
Permissions Gecti
  • Permissions — No dangerous permissions requested

Bu listing icin henuz AI raporu yok.

SUMMARY

给 DeepSeek 装上眼睛 — MCP Server + 通义千问VL, 剪贴板图片→视觉模型→文字描述 / Give DeepSeek the ability to see images via clipboard + Qwen-VL

README.md

deepseek-eyes 👁️

给 DeepSeek 装上眼睛(无需外网!)。
截图 → 剪贴板 → MCP → 通义千问VL → 文字描述 → DeepSeek 也能"看见"

Give DeepSeek the ability to see.
Screenshot → clipboard → Qwen-VL → text → your text-only model can "see"

🤖 一键安装 · 快速开始 · 为什么需要 · 客户端配置 · English


🇨🇳 中文

🤖 一键安装

把下面的提示词直接粘贴给 Claude Code / DeepSeek / ChatGPT,AI 会自动帮你完成克隆、安装、配置全流程:

请帮我安装 deepseek-eyes,仓库地址 https://github.com/290298661-pixel/deepseek-eyes 。按 README 中的步骤:克隆 → 创建 venv → pip install -e . → 引导我获取 ModelScope API Key → 配置 MCP 客户端。

📋 完整安装提示词(中英文)


⚡ 手动安装 / 快速开始

# 1. 克隆
git clone [https://github.com/290298661-pixel/deepseek-eyes](https://github.com/Shaohan-He/deepseek-eyes).git
cd deepseek-eyes

# 2. 安装
python -m venv .venv
.venv\Scripts\activate    # Windows
# source .venv/bin/activate  # macOS/Linux
pip install -e .

# 3. 获取免费 API Key(每天2000次,单模型500次)
# ① 打开 https://modelscope.cn 注册/登录
# ② 点右上角头像 → 个人中心 → 访问令牌
#    或直接访问: https://modelscope.cn/my/myaccesstoken
# ③ 首次使用会提示绑定阿里云账号(必须,按页面引导完成)
# ④ 点击"新建访问令牌" → 命名 → 生成 → 复制
# ⑤ 令牌格式为 ms-xxxxxxxxxxxx,使用时去掉 ms- 前缀!

# 4. 测试剪贴板(复制一张图片后运行)
python examples/smoke_test.py
# 预期: ✅ 成功: 剪贴板图片已保存到 ...\clip_xxx.png

# 5. 配置 MCP 客户端(见下方)

🎯 为什么需要?

DeepSeek V4 / GLM 等文本模型的 API 没有视觉能力 ——你粘贴一张截图,它只能告诉你"我看见了文件路径"。

deepseek-eyes 填补了这个缺口:

你截了一张图
        │
        ▼
  ┌─────────────────┐
  │ deepseek-eyes    │
  │ 读取剪贴板图片    │
  │ → 发给通义千问VL  │
  │ → 返回文字描述   │
  └────────┬────────┘
           ▼
  DeepSeek: "这是一个登录页面,有用户名和密码两个输入框..."

和同类工具的对比:

deepseek-eyes 原版 clipboard-vision-mcp ErlichLiu/deepseek-vision
视觉后端 通义千问VL Groq(需翻墙) 自选
免费额度 500次/天 Groq 免费层 取决于后端
语言 🇨🇳 中文优先 英文 🇨🇳 中文
方式 MCP stdio MCP stdio HTTP 代理

🔧 工作原理

┌──────────────────┐   MCP    ┌──────────────────┐   HTTPS   ┌───────────────────┐
│  Claude Code /    │ ──────▶ │  deepseek-eyes   │ ────────▶│  ModelScope API    │
│  Opencode         │         │  (Python)        │          │  Qwen3-VL-8B       │
│  (DeepSeek API)   │         │                  │          │  (国内直连, 免费)   │
└──────────────────┘         └──────────────────┘          └───────────────────┘
                                    │
                                    ▼
                          读取系统剪贴板 (PIL)
                          → base64 → 发送 → 返回中文描述 → 删除临时文件

📋 MCP 工具列表

工具 功能
analyze_clipboard 分析剪贴板中的图片
extract_text_from_clipboard 剪贴板图片 OCR 提取文字
describe_ui_from_clipboard 分析剪贴板 UI 截图
diagnose_error_from_clipboard 诊断剪贴板错误截图
code_from_clipboard 从剪贴板代码截图提取代码
analyze_image 分析磁盘图片文件
extract_text 磁盘图片 OCR
describe_ui 分析磁盘 UI 截图
diagnose_error 诊断磁盘错误截图
understand_diagram 解读流程图/架构图
analyze_chart 分析数据图表
code_from_screenshot 磁盘代码截图提取代码

🔌 客户端配置

Claude Code.claude/settings.json):

{
  "mcpServers": {
    "deepseek-eyes": {
      "command": "D:\\GitHub\\deepseek-eyes\\.venv\\Scripts\\python.exe",
      "args": ["-m", "deepseek_eyes"],
      "env": {
        "MODELSCOPE_API_KEY": "你的_API_Key"
      }
    }
  }
}

⚠️ command 必须使用 venv 中 Python 的绝对路径

Opencode%APPDATA%\opencode\opencode.json):

{
  "mcp": {
    "deepseek-eyes": {
      "type": "local",
      "command": ["D:\\GitHub\\deepseek-eyes\\.venv\\Scripts\\python.exe", "-m", "deepseek_eyes"],
      "enabled": true,
      "environment": {
        "MODELSCOPE_API_KEY": "你的_API_Key"
      }
    }
  }
}

❓ 常见问题

故障排查指南

🛡️ 安全

  • 本地 stdio 进程运行,不开放任何网络端口
  • 临时剪贴板文件分析完成后自动删除
  • 仅接受图片格式(.png .jpg .jpeg .gif .webp .bmp),防止 LLM 注入后读取任意文件
  • 文件大小限制 20MB,魔数校验
  • 图片经 base64 编码发送至 ModelScope API,参阅其隐私政策

🗺️ 路线图

  • 支持 DashScope(阿里云官方)作为备用后端
  • 多 API Key 轮询
  • 视频关键帧提取 + 分析

🇬🇧 English

See README_EN.md for the full English version.


🙏 致谢

📄 License

MIT © Shaohan He

Yorumlar (0)

Sonuc bulunamadi