Graphify vs Karpathy LLM Wiki: два пути к базе знаний

Есть две вещи, которые стоит знать прежде чем читать очередное сравнение Graphify и Karpathy LLM Wiki.

Первая: они не конкуренты. Вторая: понять это с первого раза почти невозможно, потому что на поверхности оба инструмента действительно решают одну задачу — превратить кучу материалов в базу знаний, с которой можно работать. Но то, что происходит под капотом, принципиально разное.


Что именно сравниваем

Graphify — open-source скилл для AI-агентов (Claude Code, Codex, Cursor, Gemini CLI). Устанавливается как Python-пакет, строит граф связей из кода, документов и медиафайлов, отдаёт агенту карту вместо сырых файлов.

Karpathy LLM Wiki — не продукт и не пакет. Это метод: позволить LLM поддерживать живую вики из markdown-страниц, которая растёт, обновляется и накапливает знания со временем. Опубликован Андреем Карпати 4 апреля 2026 года в виде llm-wiki.md на GitHub.

Оба отличаются от классического RAG — они не бросают файлы в систему и не ищут чанки при каждом вопросе. Но оптимизируют они для разного.

Graphify — граф сначала: структура как основа для навигации агента.
LLM Wiki — вики сначала: смысл как накапливаемый живой артефакт.


Первая путаница: Graphify и его имя

Если начать с установки, первое что собьёт с толку — разрыв в именах. Пакет в PyPI называется graphifyy (с двумя «y»), но CLI-команда и скилл в агенте — graphify. То есть:

pip install graphifyy    # или: uv tool install graphifyy
graphify install         # регистрация в Claude Code
/graphify .              # запуск сборки графа

Это не просто опечатка. Это сигнал о природе инструмента: Graphify — не просто библиотека. Это workflow для агентных сред. Его ценность не в API, а в том, что происходит внутри сессии агента.

Подробнее об архитектуре и командах: Graphify — граф знаний для AI-агентов.


Что на самом деле решает каждый инструмент

Graphify: карта для агента

Суть Graphify — это ответ на конкретную боль: агент при каждом запросе читает десятки файлов с нуля, тратит сотни тысяч токенов только чтобы понять, где вообще лежит нужная функция. Это full table scan там, где нужен индекс.

Graphify строит граф в два прохода:

  1. AST-проход через tree-sitter — парсит 28+ языков программирования без единого токена
  2. Семантический проход — LLM извлекает связи из документов, PDF, изображений

Выход: graph.json, GRAPH_REPORT.md, graph.html. Агент получает карту — и только потом, если нужно, лезет в файлы.

Три причины, почему это работает:

Структура до вопроса. Не бросать файлы в систему и надеяться, что retrieval найдёт правильный чанк. Сначала построить связи, потом запрашивать через ноды, сообщества и пути.

Разграничение факта и вывода. Graphify помечает рёбра графа как EXTRACTED, INFERRED или AMBIGUOUS. Это важно: красивый граф легко воспринимается как истина в последней инстанции, хотя часть рёбер — только разумные гипотезы.

Агент видит карту раньше материала. PreToolUse hook в Claude Code срабатывает перед каждым Glob или Grep и напоминает: «Есть граф знаний. Посмотри сначала GRAPH_REPORT.md». Агент переориентируется с одной страницы вместо двадцати файлов.

Karpathy LLM Wiki: энциклопедия для человека

Karpathy описывает проблему иначе. Большинство людей не страдают от нехватки информации. Они страдают от нехватки среднего слоя, который накапливался бы, оставался актуальным и превращал разрозненное чтение в долгосрочный актив.

Метод простой: не заставляй LLM переоткрывать знания из сырых документов при каждом вопросе. Пусть он поддерживает связанную вики, интегрирует новые источники в существующие страницы, исправляет устаревшие утверждения, добавляет кросс-ссылки.

Ключевая идея: вики — это персистентный артефакт. Знание компилируется один раз и хранится. Не воссоздаётся при каждом запросе.

Сила метода — не в том, как выглядит граф. В том, становится ли база знаний плотнее и полезнее с каждым использованием. Когда изучаешь тему неделями, нужен не способ быстрее найти один абзац. Нужен способ быстрее увидеть текущий тезис, конкурирующие позиции и то, как понятия уже связаны между собой. С этим справляется вики, а не граф.


Настоящее разделение: кто первичный читатель

Если смотреть только на buzzwords, оба инструмента выглядят как «системы организации знаний». Но реальная линия раздела другая.

GraphifyKarpathy LLM Wiki
Первичный читательAI-агентЧеловек
ПродуктГраф с узлами, сообществами, путямиСтраницы, нарратив, индексы, логи
ЦенностьСтруктура, пригодная для навигации и суммаризацииРастущая, интерпретируемая база понимания
АналогияКарта для агентаЭнциклопедия для человека
Где накапливается ценностьВ graph.jsonВ связях между markdown-страницами
Срок жизни знанияПока не изменилась структура кода/корпусаБессрочно, обновляется инкрементально

Graphify работает лучше, когда главный потребитель знания — агент, которому нужно понять структуру за минимальное количество токенов.

LLM Wiki работает лучше, когда главный потребитель знания — человек, которому нужно видеть текущее состояние темы, разрешённые и неразрешённые противоречия, историю того, что было передумано.


Четыре вопроса для выбора

Это не академическая классификация. Это практические развилки, которые реально разводят инструменты по разные стороны.

1. Кто первичный пользователь — агент или человек?

Если пишете инструмент, где агент должен ориентироваться в большом корпусе, разбираться в архитектуре незнакомого репозитория или эффективно находить нужные связи — Graphify.

Если строите личную базу знаний, исследовательский vault, командную вики, куда регулярно заходят люди — LLM Wiki.

2. Мультимодальный и разнородный контент или преимущественно текстовые заметки?

Graphify работает с кодом + документами + PDF + изображениями + видео в одном пайплайне. Если у вас смешанный корпус с чёткой структурой — это его территория.

Karpathy LLM Wiki оптимизирован для текста: статьи, транскрипты, заметки, ссылки. Смысловые связи важнее форматных.

3. Нужны прослеживаемые связи или читаемый синтез?

«Покажи путь от UserService до DatabasePool» — Graphify.

«Покажи текущий консенсус по теме X и где он противоречит источнику Y» — LLM Wiki.

4. Главная боль — повторный retrieval или повторная организация?

Если каждый вопрос заставляет систему заново читать большой корпус сырых материалов — Graphify устраняет это напрямую.

Если знания существуют в разрозненных чатах, заметках, файлах и никогда не превращаются в долгосрочный актив — LLM Wiki приносит больше ценности.


Самое интересное: они уже движутся навстречу друг другу

Здесь начинается то, что не очевидно из поверхностного сравнения.

Karpathy LLM Wiki пытается компилировать знание в поддерживаемую вики. Graphify уже предлагает wiki-style output — то есть превращает граф в нечто похожее на вики-страницы. Два инструмента, которые выглядят как конкуренты, на самом деле сближаются.

/graphify . --obsidian    # экспорт Obsidian vault из графа
/graphify . --wiki        # markdown-вики из графа

Это значит: граф знаний и вики знаний — не конкурирующие форматы. Это соседние слои.

Корпус (код, доки, медиа)
    ↓
Graphify: граф структуры → быстрая навигация для агента
    ↓
LLM Wiki: синтез страниц → накопление понимания для человека

Graphify помогает превратить гетерогенный корпус в навигируемую структуру: быстро выявить сообщества, центральные ноды, ключевые связи, дать агенту практическую карту.

LLM Wiki берёт эти структуры и поддерживает страницы высокой ценности, которые люди могут читать, обсуждать и развивать.

Одна сторона — про извлечение и навигацию. Другая — про синтез и накопление.


Конкретные сценарии

Сценарий А: онбординг в легаси-репозиторий

Вам дали чужой проект. Нужно за день понять архитектуру: где авторизация, как данные движутся от API до базы, что такое god-ноды.

Graphify. Один запуск, GRAPH_REPORT.md, интерактивный граф в браузере. Агент с graphify path "AuthMiddleware" "Database" находит ответ за один запрос вместо двадцати чтений.

Сценарий Б: личная исследовательская база

Вы изучаете тему 3 месяца: читаете статьи, смотрите видео, делаете заметки. Нужно, чтобы это накапливалось, а не терялось в старых чатах.

LLM Wiki. Каждый новый источник интегрируется в существующие страницы. Через месяц есть плотная сеть связанных концепций с историей пересмотров, а не папка с файлами.

Сценарий В: AI-агент для кодовой базы + документация решений

Код эволюционирует, агенты помогают, но контекст теряется между сессиями. Нужна и навигация по коду, и память о решениях.

Оба. Graphify даёт агенту карту структуры. LLM Wiki (или Obsidian vault) хранит log.md — что было решено, почему, что изменилось. Классическая связка Obsidian + Graphify.

Сценарий Г: быстрый поиск по большому исследовательскому корпусу

Несколько сотен PDF, статей, транскриптов — и нужно быстро находить связи между понятиями.

Graphify для первичной навигации (особенно если корпус мультимодальный), LLM Wiki для синтеза в читаемые страницы после первичного прохода.


Что выбрать сегодня

Если нужен один совет:

ЗадачаИнструмент
Агент должен понять большую кодовую базу или корпусGraphify
Личная/командная база знаний, которая растёт месяцамиKarpathy LLM Wiki
Онбординг в незнакомый проектGraphify
Исследование темы с накоплением пониманияLLM Wiki
Мультимодальный корпус (код + PDF + изображения)Graphify
Преимущественно текстовые источники и заметкиLLM Wiki
Максимальная экономия токенов при ответах агентаGraphify
Долгосрочный актив, понятный человекуLLM Wiki

Главный тезис

Сильнейшие системы управления знаниями будут иметь оба слоя.

Только граф — агент навигирует эффективно, но люди не получают читаемого нарратива. Только вики — люди понимают, но агент не может эффективно её обходить.

Graphify — это не замена Karpathy LLM Wiki. Karpathy LLM Wiki — это не упрощённая версия Graphify. Они отвечают на разные подвопросы внутри одной большой задачи: как сделать так, чтобы знание накапливалось и оставалось доступным — и для машины, и для человека.


Связанное


Источник: ai-chain.tw — 2 Knowledge Graph Paths + 4 Selection Questions · опубликовано 08.04.2026
Raw: raw