Skip to content

Latest commit

 

History

History
292 lines (214 loc) · 10.6 KB

File metadata and controls

292 lines (214 loc) · 10.6 KB

English中文العربية

ARK

ARK — 智能体研究工具包

自动化苦活,不自动化方向。

Python 3.9+ Apache 2.0 CI 8 Agents 11+ Venues 115 Tests

网站快速开始PipelineAgents命令行


ARK 协调 8 个专业 AI 智能体,将研究想法转化为论文——文献调研、Slurm 实验、LaTeX 撰写、图表生成与迭代审稿——你随时通过 CLIWeb 门户Telegram 掌控全局。

给它一个想法和目标会议,ARK 处理其余一切。

ARK 撰写的论文

MMA 论文
CPU 矩阵乘法:从朴素到高效
NeurIPS 格式 • 6 页 • 14 次迭代


ARK Pipeline

ARK 按三个阶段依次执行。Review 阶段循环迭代直到论文达到目标分数。

ARK Pipeline

阶段 执行内容
Research 4 步流水线:Deep Research → 初始化器(环境引导 & 引用准备)→ 规划器 → 实验者
Dev 迭代实验循环:规划 → Slurm 运行 → 分析 → 撰写初稿
Review 编译 → 审稿 → 规划 → 执行 → 验证,循环直到分数 ≥ 阈值

Review 循环

每次 Review 迭代经过 5 个步骤

Review 循环

步骤 说明
Compile LaTeX → PDF,统计页数,提取页面图像
Review AI 审稿人评分 1–10,列出主要和次要问题
Plan 规划器生成优先级行动计划
Execute 研究员 + 实验者并行运行;写作者修改 LaTeX
Validate 验证变更可编译,重新生成 PDF

循环持续直到分数达到阈值——或你通过 Telegram 干预。


ARK Agents

ARK 架构

智能体 职责
Reviewer 按会议标准评分,生成改进任务
Planner 将审稿意见转化为优先级行动计划
Writer 撰写和打磨 LaTeX 章节,引用经 DBLP 验证
Experimenter 设计实验、提交 Slurm 任务、分析结果
Researcher 通过学术 API(DBLP、CrossRef、Semantic Scholar)深度文献调研
Visualizer 基于 Nano Banana 和会议画布尺寸生成出版级图表
Meta-Debugger 识别流程停滞、诊断故障、触发自修复
Coder 编写和调试实验代码与分析脚本

ARK 有何不同

其他工具 ARK
控制 全自动运行,偏离意图,无法中途纠偏 人机协同:关键决策暂停,Telegram 或网页随时介入
排版 布局混乱、LaTeX 报错、大量人工修复 硬编码 LaTeX + 会议模板(NeurIPS、ACL、IEEE……)
引用 LLM 编造看似合理但不存在的引用 每条引用经 DBLP API 验证,杜绝虚假文献
图表 默认样式、尺寸失控、无视页面约束 Nano Banana + 会议画布尺寸、栏宽、字号精确匹配
隔离 共享环境,项目之间互相干扰 每项目独立 conda 环境、沙盒 HOME、完全多租户隔离
完整性 LLM 模拟结果而非运行真实实验 反模拟提示 + 内置 Skills 强制真实执行

环境隔离

每个项目运行在独立的 项目级 conda 环境 中,在创建时从基础环境克隆。这确保了完全的多租户隔离:

  • 沙盒 Python — 每项目 .env/ 目录,拥有独立的包
  • 隔离 HOME — 每个 orchestrator 以项目目录作为 HOME 运行
  • 无交叉污染PYTHONNOUSERSITE=1 防止用户级包泄露
  • 自动配置ark run 和 Web 门户自动检测并使用项目 conda 环境;流水线在缺失时自动引导创建
# conda 环境在首次运行时自动创建
# ark run 会检测并使用它:
ark run myproject
#   Conda env: /path/to/projects/myproject/.env

Skills 系统

ARK 内置 builtin skills — 模块化指令集,智能体在运行时加载以强制执行最佳实践:

Skill 用途
research-integrity 反模拟提示:智能体必须运行真实实验,不得伪造输出
human-intervention 升级协议:智能体在执行不可逆操作前通过 Telegram 暂停并请求确认
env-isolation 强制项目级环境边界
figure-integrity 验证图表内容与数据一致;防止占位或虚构的图表
page-adjustment 通过调整内容密度维持页数限制,而非删除章节

Skills 位于 skills/builtin/,在流水线引导阶段自动安装。


快速开始

# 安装
pip install -e .

# 创建项目(交互式向导)
ark new mma

# 运行——ARK 接管一切
ark run mma

# 实时监控
ark monitor mma

# 查看进度
ark status mma

向导将引导你完成:代码目录、目标会议、研究想法、作者、计算后端、图表生成和 Telegram 设置。

从现有 PDF 开始

ark new mma --from-pdf proposal.pdf

ARK 使用 PyMuPDF + Claude Haiku 解析 PDF,预填向导,从提取的规格启动项目。


命令行参考

命令 功能
ark new <name> 通过交互式向导创建项目
ark run <name> 启动 pipeline(自动检测项目级 conda 环境)
ark status [name] 分数、迭代、阶段、成本
ark monitor <name> 实时仪表板:智能体活动、分数趋势
ark update <name> 注入运行中指令
ark stop <name> 优雅停止
ark restart <name> 停止并重启
ark research <name> 单独运行 Gemini Deep Research
ark config <name> [key] [val] 查看或编辑配置
ark clear <name> 重置状态,重新开始
ark delete <name> 完全删除项目
ark setup-bot 配置 Telegram 机器人
ark list 列出所有项目及状态
ark webapp install 安装 Web 门户服务

Web 门户

ARK 提供基于 Web 的门户,用于管理项目、查看评分和控制智能体。门户展示 实时阶段徽章(Research / Dev / Review)、项目级 conda 环境状态和实时成本追踪。

配置

Web 应用通过 webapp.env 配置,位于 ARK 配置目录(默认:项目根目录下的 .ark/webapp.env)。首次运行 ark webapp 时自动创建。

认证与访问

  • SMTP:魔法链接登录所需。设置 SMTP_HOSTSMTP_USERSMTP_PASSWORD
  • 访问限制:使用 ALLOWED_EMAILS(指定用户)或 EMAIL_DOMAINS(整个组织)限制访问。
  • Google OAuth:可选。设置 GOOGLE_CLIENT_IDGOOGLE_CLIENT_SECRET

管理命令

命令 描述
ark webapp 前台启动应用(适用于调试)。
ark webapp release 打 tag 并部署到生产环境工作树。
ark webapp install [--dev] 安装并启动为 systemd 用户服务。
ark webapp status 查看 systemd 服务状态。
ark webapp restart 重启 Web 应用服务。
ark webapp logs [-f] 查看或追踪服务日志。
服务详情(生产 vs. 开发)
生产环境 开发环境
端口 9527 1027
服务名 ark-webapp ark-webapp-dev
Conda 环境 ark-prod ark-dev
代码来源 ~/.ark/prod/(锁定版本) 当前 repo(实时生效)
直接调用 orchestrator
python -m ark.orchestrator --project mma --mode paper --max-iterations 20
python -m ark.orchestrator --project mma --mode dev

Telegram 集成

ark setup-bot    # 一次性配置:粘贴 BotFather token,自动检测 chat ID

功能:

  • 富��本通知 — 格式化的分数变化、阶段转换、智能体活动和��误报告
  • 发送指令 — 实时引导当前迭代方向
  • 请求 PDF — 获取最新编译论文
  • 人工干预 — 智能体在执行不可逆操作前向你请求确认
  • HPC 友好 — 支持企业/HPC 网络的自签名 SSL ��书

环境要求

  • Python 3.9+pyyamlPyMuPDF
  • Claude Code CLI 已安装并登录
  • 建议 Claude Max 订阅 — 极度消耗 token
  • 可选:LaTeX(pdflatex + bibtex)、Slurm、google-genai(AI 图表)
# 创建 conda 基础环境
conda env create -f environment.yml         # Linux (创建 "ark-base")
# 或者对于 macOS:
conda env create -f environment-macos.yml   # macOS (创建 "ark-base")

pip install -e .                    # 核心
pip install -e ".[research]"       # + Gemini Deep Research 和 Nano Banana

支持的会议模板

NeurIPS • ICML • ICLR • AAAI • ACL • IEEE • ACM SIGPLAN • ACM SIGCONF • LNCS • MLSys • USENIX — 另有 PLDI、ASPLOS、SOSP、EuroSys、OSDI、NSDI、INFOCOM 等别名。

许可证

Apache 2.0

KAUST SANDS 实验室 构建