Skip to content
View eastonsuo's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report eastonsuo

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
eastonsuo/README.md

Hi, 我是索毅 (eastonsuo) 👋

AI Infra Engineer · 8 年 AI 平台与云原生基础设施研发经验

专注 LLM Infra:RAG 检索基础设施 · Agent 运行时 · 异构算力调度


🔧 开源项目

  • nanoagent — harness-first 的单 agent 框架:核心循环约 30 行、易读、真能用。核心原则 Stable Core + Pluggable Strategy——核心稳定,上下文 / 权限 / 熔断等 harness 能力经 Hook 注入、可插拔。
  • Claude Code 工具集 — 围绕 Claude Code 的一组开源工具与 skill:

💼 核心工作 · 企业级 RAG / GraphRAG 知识检索引擎

面向企业知识库的端到端检索系统(百度千帆),支撑下游 Agent 与对话产品。

  • 离线:多模态异构文档(pdf / md / 网页 / 表格 / 图片)加工,建「段落 + 知识点」两层粒度索引——召回用细、返回用粗。
  • 在线:BM25 + 向量(HNSW)+ 知识图谱三路并发召回 → 两段加权粗排剪枝 → Rerank 精排。
  • GraphRAG(参考 LightRAG):Elasticsearch + 图数据库双存储;自研 多文档共建实体的删除一致性 —— 图谱作为可重建派生视图,删单篇文档时反查其余文档做幂等重建,不引入分布式事务。
  • 成本工程:向量降维换检索提速 + 高置信结果跳过精排省 GPU;OpenTelemetry 全链路可观测。

🧩 过往经历

项目 一句话
KubeSaaS 资源池平台 统一 Serverless 与标准 K8s 的异构算力底座,Saga 补偿保证跨系统回滚
PaddleX AI 全流程平台 prepare / run / sync 三段式训练工作流引擎,插件化接入多套件
星河社区 Codelab 云 IDE JupyterLab 二次开发,存储 / 计算 / 应用三层解耦 + GPU 按需起停

🛠 技术栈

  • LLM Infra:RAG · GraphRAG · 向量检索(HNSW)· Rerank · 知识图谱 · OpenTelemetry · Agent 运行时
  • 云原生:Kubernetes · Volcano · 多集群异构算力调度
  • 后端:Python(精通)· Go · asyncio · Celery · Redis · PostgreSQL · Elasticsearch

📫 联系

📧 pumpkinday2012@gmail.com · 📦 pypi.org/user/eastonsuo

Pinned Loading

  1. nanoagent nanoagent Public

    A harness-first ReAct Agent framework — easy to understand, genuinely usable (~30-line core loop). 以 Harness 为核心、易上手又真正可用的 ReAct 单 agent 框架(核心循环 ~30 行)。

    Python 1

  2. claude-code-statusline-usage claude-code-statusline-usage Public

    Non-invasive realtime usage statusline for Claude Code: live context %, cost, diff, api time — via the official statusLine extension point (no app-bundle patching, survives upgrades).

    Python 1

  3. claude-desktop-usage claude-desktop-usage Public

    macOS floating widget for Claude.ai Pro/Max usage — glance at your 5h + 7d budget without opening the browser

    Swift 1

  4. claude-skill-repo-deep-dive claude-skill-repo-deep-dive Public

    A Claude Code skill for end-to-end deep-dive analysis of GitHub repos. Produces structured Chinese reports + claim-level machine-readable summary (schema v2).

    Shell

  5. claude-tech-writing claude-tech-writing Public

    A Claude Code skill that pushes diagrams to the front of technical writing — with a Python linter enforcing every rule.

    Python

  6. yinxiang-mac-patches yinxiang-mac-patches Public

    印象笔记 (Evernote 中国版) Mac 客户端 markdown 渲染补丁集:mermaid v11 升级 + [toc] 链接 bug 修复

    JavaScript 1