Graphify — граф знаний для AI-агентов

Graphify — open-source скилл (by Safi Shamsi), который превращает кодовую базу в queryable knowledge graph. Вместо того чтобы агент каждый раз читал десятки файлов, он один раз задаёт точный вопрос графу — и получает ответ за долю токенов. Инструмент поддерживает 20+ AI-платформ: Claude Code, Codex, Cursor, Gemini CLI и другие.


1. Проблема: агент как full table scan

Классический сценарий: дать задачу «найди, где обрабатывается авторизация». Claude Code идёт искать — спавнит эксплорацию, грепает по ключевым словам, читает 15–20 файлов целиком. Каждый read — это весь файл в контекст. На среднем репозитории — сотни тысяч токенов только чтобы понять, где вообще лежит ответ. Половину времени агент промахивается: прочитал не те файлы, сделал вывод, пошёл чинить не там.

Проблема не в модели. Проблема в способе поиска: агент делает full table scan по кодовой базе там, где должен делать запрос по индексу.

Это ровно та же история, что с индексами в базе данных. Можно гонять SELECT по миллиону строк, а можно построить индекс и доставать нужное за миллисекунды. С кодом для агента — та же логика.


2. Что такое Graphify

Graphify — инструмент, который строит граф знаний из кодовой базы. Три ключевых момента:

  • Код парсится локально через tree-sitter — 0 токенов, ничего не уходит наружу
  • Документы, PDF, изображения, видео — опционально, через LLM (вашего IDE-провайдера)
  • Результат — три файла: graph.html, GRAPH_REPORT.md, graph.json
graphify-out/
├── graph.html       # интерактивная визуализация — открыть в браузере
├── GRAPH_REPORT.md  # god-ноды, неожиданные связи, suggested questions
└── graph.json       # полный граф — queryable в любой момент

После установки агент получает команды /graphify query, /graphify path, /graphify explain — и вместо веера чтений делает один точный запрос.

Автор и лицензия: Safi Shamsi, MIT, Python 3.10+, 3.7k+ звёзд на GitHub (на момент написания). PyPI-пакет называется graphifyy (два «y»), CLI-команда — graphify.


3. Архитектура: как это работает

Семистадийный pipeline:

detect → extract → build → cluster → analyze → report → export
СтадияЧто происходит
detectСканирует файлы по типам
extracttree-sitter (AST) для кода; LLM для документов/медиа
buildСтроит NetworkX-граф из узлов и рёбер
clusterLeiden-алгоритм — community detection без векторов
analyzeНаходит god-ноды и неожиданные связи
reportГенерирует GRAPH_REPORT.md
exportgraph.html, graph.json, опционально Obsidian vault, Wiki, Neo4j

Ключевые компоненты

tree-sitter — парсит 28+ языков программирования (.py, .ts, .js, .go, .rs, .java, .c, .cpp, .rb, .cs, .kt, .scala, .php, .swift, .lua, .zig, .ps1 и др.) в AST. Структурные рёбра (call, import, inheritance) извлекаются без LLM — ноль токенов на код.

NetworkX — in-memory граф на Python. Все узлы и рёбра живут в памяти, graph.json — текстовый артефакт, его можно (и нужно) коммитить в git.

Leiden algorithm (через graspologic) — community detection на топологии графа, без векторных эмбеддингов. Находит группы связанных файлов, которые «принадлежат одной фиче».

PreToolUse hook — ключевая интеграция с Claude Code. После graphify install в ~/.claude/settings.json прописывается hook, который срабатывает перед каждым вызовом Glob или Grep. Если в проекте есть граф, агент получает напоминание: «Knowledge graph exists. Read GRAPH_REPORT.md for god nodes and community structure before searching raw files». Claude Code сначала смотрит на одностраничный обзор архитектуры — и только потом, если нужно, лезет в файлы.

Что попадает в GRAPH_REPORT.md

  • God nodes — наиболее связанные концепции проекта. Всё проходит через них
  • Surprising connections — связи между разными файлами или модулями, отсортированные по «неожиданности»
  • The “why” — inline-комментарии (# NOTE:, # WHY:, # HACK:), docstrings и проектная документация
  • Suggested questions — 4–5 вопросов, на которые граф лучше всего отвечает
  • Confidence tags — каждая инференция помечена: EXTRACTED, INFERRED или AMBIGUOUS

4. Установка и основные команды

Быстрый старт

# Установка (рекомендуется через uv)
uv tool install graphifyy
 
# Регистрация скилла в Claude Code
graphify install
 
# Сборка графа для текущей папки
/graphify .
 
# Или в Codex/PowerShell (без слеша):
graphify .

На Windows: winget install astral-sh.uv, затем graphify install (автоопределяет платформу).

Основные команды

# Запросы к графу
/graphify query "что связывает auth с базой данных?"
/graphify path "UserService" "DatabasePool"
/graphify explain "RateLimiter"
 
# Обновление (только изменённые файлы)
/graphify . --update
 
# Режимы сборки
/graphify . --mode deep        # агрессивное семантическое извлечение
/graphify . --no-viz           # только отчёт + JSON, без HTML
 
# Экспорт
/graphify . --obsidian         # генерировать Obsidian vault
/graphify . --wiki             # markdown-wiki
graphify export callflow-html  # Mermaid call-flow HTML
 
# Git hook — авторебилд после каждого коммита
graphify hook install

Платформы

Graphify работает с 20+ инструментами: Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat, Aider, Hermes, Kimi Code, Google Antigravity и другими. Для каждой — отдельная команда install с правильным механизмом интеграции.


5. Экономия токенов: факты и маркетинг

Вокруг Graphify ходит много цифр — стоит разобраться честно.

ИсточникЗаявленная экономияКонтекст
Official (graphify.net)71.5×Corpus Карпати: 3 репо + 5 статей + 4 диаграммы; 1.7k токенов vs 123k naive
Eric Tech (YouTube)27×Production SaaS bookzero.ai — реальный проект
lucasrosati (GitHub)499×React+Supabase, 126 файлов TypeScript; per query, не per session
Шубин Данила (Habr)2–5× реалистичноСредний сценарий, честная оценка; до 10× на задачах где граф хорошо ложится

Вывод: цифра 71.5× — это лучший случай на синтетическом корпусе, не средняя экономия в проде. Реалистичная оценка — 2–5× в среднем, до 10–27× на крупных проектах с чётко выраженной структурой. Это всё равно значимо.

Важнее токенов — точность и скорость. Агент с графом находит нужное с первого запроса, а не читает двадцать файлов и строит гипотезу. Он реже промахивается, реже чинит не то.


6. Плюсы и минусы

Плюсы

  • Ноль токенов для кода — tree-sitter работает чисто локально, никаких API-вызовов на исходники
  • Персистентность через gitgraph.json коммитится в репозиторий; вся команда стартует с готовой картой
  • Мульти-модальность — код + документы + PDF + изображения + видео в одном графе
  • PreToolUse hook — агент автоматически консультируется с графом перед поиском
  • Широкая поддержка платформ — 20+ AI-инструментов
  • Интерактивная визуализацияgraph.html открыть в браузере и клацать ноды
  • MCP server mode — команда может поднять один HTTP-сервер с графом для всех разработчиков
  • Obsidian export — интеграция с LLM-Wiki паттерном (см. LLM Wiki вместо RAG - Полный Obsidian-сетап для новичка по методу Андрея Карпати)
  • MIT-лицензия, бесплатно для коммерческого использования
  • PR-triagegraphify prs --triage ранжирует PR по приоритету через тот же граф

Минусы

  • Документы и медиа стоят токенов — если идёте глубже кода, платите LLM-вызовами
  • Нет авто-синхронизации — в отличие от CodeGraph с файловыми watcher’ами, надо вручную запускать --update (или настроить git hook)
  • Требует rebuild после рефакторинга — при значительных изменениях структуры старый граф устаревает
  • Коммерческий интерес автора — Penpax строится поверх Graphify; Open Source, но с оглядкой на это
  • Маркетинговые цифры — 71.5× продаётся везде, реальность скромнее
  • Python-зависимость — если в проекте уже нет Python, нужно поставить отдельно
  • Сложность с крупными проектами — граф >5000 нод плохо открывается как HTML; нужен --no-viz

7. Graphify vs другие инструменты

Инструменты памяти для кода

GraphifyCodeGraphGortexSourcegraph MCP
Что индексируеткод + доки + медиатолько символы кодатолько кодтолько код
Хранилищеgraph.json (коммитить)SQLite (локально)in-memoryоблако/enterprise
Токены на сборку0 для кода0 всегда0нет
Авто-синхронизациянет (git hook)да (file watcher)дада
Мультирепозиторийнетнетдада
Языков28+19+256много
СтоимостьMIT freeMIT freefreeплатный Enterprise
Для чегопонять проект целикомускорить агентаускорить агента, мультирепокорпоративный масштаб

CodeGraph (@colbymchenry/codegraph) — ближайший аналог, но с другим фокусом. 100% локально, SQLite + FTS5, автообновление через FSEvents/inotify. Работает как MCP-сервер в runtime агента. Заявленная экономия: −57% токенов, −71% tool calls, −46% времени (benchmark на 7 open-source репозиториях). Правило хранения — противоположное: граф CodeGraph это кэш, регенерируемый из кода, в git не коммитится.

Gortex — то же самое что CodeGraph, но больше: 256 языков, мультирепо со сквозным разрешением символов, один бинарь без внешних зависимостей. Если вы работаете с десятком связанных репозиториев — смотреть сюда.

Три класса «памяти для агентов»

Часто Graphify сравнивают с Mem0, Zep, Letta — это неверное сравнение. Это принципиально разные задачи:

ЗадачаИнструментЧто делает
Память о пользователеMem0, Zep/Graphiti, LettaФакты о пользователе, персонализация
Память о кодеGraphify, CodeGraph, GortexСтруктура кодовой базы, связи
Память о знанияхObsidian + LLM WikiНакопление и синтез знаний

Mem0 — API для разработчиков собственных агентов: «дай мне ту же memory API, что у ChatGPT, но для моего бота на FastAPI». Двухслойная архитектура extraction → vector store. Не про код вообще.

Zep/Graphiti — temporal knowledge graph: каждый факт помечен valid_from/valid_until, temporal queries «где жил пользователь полгода назад». Мощно, тяжело, много LLM-вызовов. Не про код.

Letta (бывший MemGPT) — агент как «операционная система»: контекстное окно = RAM, агент сам управляет выгрузкой в archival storage. Полный контроль над policy памяти, steep learning curve.

Когда кто-то говорит «наш memory framework улучшит агента в N раз» — стоит спросить: память о чём? Если о коде — Mem0 не поможет вообще.

Подробнее о Mem0, Zep и Letta: Бесконечная память для ИИ — Claude, Codex и Gemini с Pinecone.


8. Интеграция с Obsidian: связка со стратегией

Graphify органично встраивается в LLM-Wiki паттерн по методу Карпати. Связка выглядит так:

СлойИнструментЧто хранит
Структура кодаGraphifyГраф: функции, классы, связи, архитектура
Решения и историяObsidian vaultЧто было решено, почему, что осталось сделать
Чаты и инсайтыImport pipelineЦенные находки из переписок с агентом

Типичная сессия при такой связке:

Открыть Claude Code
  /resume         ← vault context: решения, прогресс
  Claude → graph.json   ← понимает структуру без re-reading
  Работа над кодом
  /save           ← session log в vault
  git commit      ← hook перестраивает граф

Проект lucasrosati/claude-code-memory-setup реализует эту связку «под ключ»: Obsidian + Graphify + pipeline импорта чатов + команды /resume и /save.

Экспорт в Obsidian

Graphify умеет генерировать Obsidian vault из графа:

/graphify . --obsidian --obsidian-dir ~/vault/graphify/my-project

Каждая функция и модуль получает свою страницу с frontmatter и wikilinks. Это уже не «инструмент для агента», а визуальная карта проекта прямо в Obsidian.


9. Penpax: коммерческий слой

Автор Graphify строит поверх него коммерческий продукт Penpax (graphifylabs.ai) — «always-on layer» для всей рабочей жизни: митинги, browser history, письма, файлы, код. Обновляется в фоне, on-device.

Это важно понимать: Graphify — open-source инструмент, за которым стоит чисто коммерческий интерес. Автор заинтересован в том, чтобы пользователи привыкали к Graphify. Это не делает инструмент плохим — MIT-лицензия остаётся MIT-лицензией — но стоит держать в уме при оценке цифр и roadmap.


10. Когда брать

СитуацияРешение
Онбординг в чужой или легаси-проектGraphify — понять архитектуру целиком
Ежедневная работа агента в кодеCodeGraph — быстрый символьный поиск без overhead
Много языков или несколько репозиториевGortex — шире по охвату
Корпоративный масштаб, сотни репозиториевSourcegraph MCP
Память о пользователе, персонализация агентаMem0 / Zep
Накопление знаний из статей, видео, заметокObsidian + LLM Wiki

Тезис Игоря Масленникова (Habr): CodeGraph и Graphify не «или-или», они разные инструменты, которые легко держать оба. CodeGraph работает каждый день в фоне. Graphify достаёшь, когда надо охватить картину — собрать карту, посмотреть god-ноды и неожиданные связи.


11. Обновления (июнь 2026)

A/B тест Никиты Велса (13.06.2026)

Практическая верификация с реальным проектом (Telegram ↔ Claude Code интеграция):

ПараметрС GraphifyБез Graphify
Сообщение40,000 токенов100,000 токенов
Разница×2.5 больше
Задача«Как устроена авторизация?»Та же задача

Граф проекта: 2040 узлов, 4156 рёбер, 151 сообщество. Сборка через 9 субагентов параллельно.

Нюанс от Велса: «Внедрять Graphify во все проекты подряд — плохая идея». Его шкала:

  • < 100 файлов → разница почти нулевая
  • 100–500 файлов → существенная экономия
  • 500+ файлов → до 30× экономии

Это подтверждает данные из раздела 5 (реалистично 2-5× в среднем, до 27-30× на крупных проектах).

Skill Pilot — кастомный скилл Велса, который сам выбирает нужную команду Graphify под задачу. У Graphify > 100 команд, часть из них ломают Claude Code или сжигают токены зря.

Источник: raw · Никита Велс, YouTube, 13.06.2026


InfraNodus — граф для поиска ПРОБЕЛОВ (не только структуры)

InfraNodus (infranodus.com) — knowledge graph инструмент, который решает другую задачу: не «что здесь есть», а «чего здесь нет».

ИнструментЗадачаОтвет
GraphifyСтруктура кода/документовГде какой файл, как связаны
InfraNodusСтруктура знанийКакие кластеры есть, какие связи между ними отсутствуют

Ключевая фича InfraNodus: graph science metrics выявляют gaps — пространства между кластерами, которые не соединены. По этим gaps модель генерирует «мостовые» инсайты — идеи, которые связывают разные области знания.

Интеграция с LLM Wiki: Nodus Labs выпустили InfraNodus MCP server — Claude Code подключается к InfraNodus API и использует его напрямую в разговоре. Команды: generate_graph, identify_clusters, find_gaps, generate_insights.

Расширение для VS Code и Obsidian: визуализация графа прямо внутри IDE / второго мозга.

Для чего брать InfraNodus:

  • Анализ исследовательских материалов (статьи, заметки, PDF)
  • Генерация новых идей через «мостовые» вопросы
  • Поиск blind spots в накопленных знаниях

Не заменяет Graphify: InfraNodus = граф смыслов. Graphify = граф кода. Разные уровни.

Источник: raw · Nodus Labs, YouTube, 11.04.2026 (добавлено в wiki 14.06.2026)


Graphify vs LLM Wiki: 4 вопроса для выбора

Исчерпывающий фреймворк (ai-chain.tw, апрель 2026):

Фундаментальное различие:

  • Graphify = граф-первый (map for agents): структура, traversable, дешёвые токены
  • LLM Wiki (этот vault) = wiki-первый (encyclopedia for humans): нарратив, ссылки, накопление интерпретаций

4 вопроса для выбора:

ВопросGraphifyLLM Wiki
1. Кто primary reader?АгентЧеловек
2. Материал multimodal/смешанный?✅ ДаТекстовые заметки
3. Нужна трейсируемость связей?✅ Да (EXTRACTED / INFERRED / AMBIGUOUS)Человекочитаемый синтез
4. Главная стоимость — повторная выборка?✅ Retrieval costОрганизация и синтез

Источник: raw · ai-chain.tw, апрель 2026


Ссылки

  • GitHub: safishamsi/graphify — исходник, README, документация
  • Сайт: graphify.net — landing page с архитектурным разбором
  • Penpax: graphifylabs.ai — коммерческий продукт поверх Graphify
  • lucasrosati setup: claude-code-memory-setup — Obsidian + Graphify «под ключ»
  • InfraNodus: infranodus.com — knowledge graph для поиска пробелов в знаниях

Источники: raw · raw · raw · raw · raw