У любого ИИ-агента есть одна неудобная особенность: каждый раз, когда вы открываете новую вкладку, он не знает о вас ничего. Ни проекты, над которыми вы работали вчера. Ни решения, которые вы принимали две недели назад. Ни книги, которые вы читали и хотели учитывать.

Это не баг конкретной модели. Это архитектурное ограничение всех больших языковых моделей: они работают только в пределах контекстного окна — окна, которое открывается при каждой новой сессии с нуля.

Разработчики давно нашли решение. Называется оно vector database — векторная база данных. И самый популярный инструмент в этом классе — Pinecone.


Почему контекстного окна недостаточно

Claude Opus 4.7 поддерживает до 200 тысяч токенов контекста. Это много — примерно 600 страниц текста. Но у этого подхода есть три системных проблемы.

Во-первых, это дорого. Чем длиннее контекст, тем больше токенов расходует каждый запрос. Если вы постоянно пихаете в промпт всю историю проекта, счёт растёт быстро.

Во-вторых, контекст не сохраняется. Закрыли вкладку — всё пропало. Завтра придётся объяснять снова.

В-третьих, поиск по ключевым словам — плохая идея. Допустим, вы хотите, чтобы Claude нашёл ваши заметки про «способы монетизации YouTube». Но в документах написано «revenue models» и «pricing strategy». Простой текстовый поиск ничего не найдёт. Нужен поиск по смыслу — семантический.

Именно это и даёт Pinecone.


Три подхода к памяти: от простого к сложному

Прежде чем идти в настройку Pinecone, полезно понять, что существует три разных уровня организации памяти для ИИ. Pinecone — это третий уровень. Начинать с него без первых двух — как покупать NAS для 10 фотографий.

Уровень 1: Obsidian (текстовые файлы)

Самый простой и самый быстрый способ дать ИИ контекст — это Markdown-файлы. Метод Андрея Карпатого: держите знания в структурированных .md файлах, а Claude читает нужные по ссылкам в index.md.

Когда работает хорошо:

  • База до 100–200 файлов
  • Информация структурирована по темам
  • Вы сами знаете, что искать

Когда начинает ломаться:

  • index.md разрастается → огромный контекст-налог на каждый запрос
  • Нет поиска по смыслу — только по ключевым словам
  • Тысячи файлов Claude не сможет перебрать эффективно

Уровень 2: CLAUDE.md (инструкции проекта)

Файл CLAUDE.md в корне проекта — это «конституция». Claude читает его при каждой сессии. Там лежит: кто вы, каков стиль работы, какие правила у проекта, что нельзя делать.

Это не хранилище данных — это хранилище правил. 100–200 строк, не больше. Больше — хуже: Claude начинает игнорировать то, что находится в конце.

Уровень 3: Pinecone (векторная база)

Pinecone хранит данные в виде числовых векторов. Каждый документ преобразуется в вектор — математическое представление смысла. При запросе Pinecone ищет не слова, а близость смыслов.

Спрашиваете «монетизация»? Найдёт документы про «revenue models», «pricing strategy» и «способы заработка» — даже если слово «монетизация» там ни разу не встречается.


Что хранить в Pinecone

Здесь важно разделить два типа данных.

Статичные данные — то, что не меняется или меняется редко. Именно их стоит класть в Pinecone:

  • Транскрипты YouTube-видео (сотни и тысячи)
  • Книги и PDF
  • Архивы переписок и писем
  • Ваши старые заметки и решения
  • Документация проектов

Динамичные данные — то, что постоянно обновляется, лучше держать в Obsidian или в проектных инструкциях. Pinecone не рассчитан на частые правки — это архив, а не рабочий стол.

Правило: Obsidian — для того, что постоянно меняется. Pinecone — для того, что уже сказано и зафиксировано.


Настройка: от нуля до работающей системы

Шаг 1. Создать аккаунт Pinecone

Зайдите на pinecone.io. Бесплатный тариф позволяет хранить до 100 000 векторов — это примерно несколько тысяч документов среднего размера. Для начала хватит.

После регистрации:

  1. Создайте новый API Key (сохраните его — понадобится)
  2. Создайте Index — назовите его как угодно (например, personal-vault или knowledge-base)
  3. Выберите модель эмбеддингов: multilingual-e5-large подходит для многоязычных баз; text-embedding-3-small от OpenAI — дешевле и быстрее

Шаг 2. Векторизовать данные

Самый удобный способ для большого объёма — через Claude Code. Откройте папку с документами, добавьте API-ключ в .env файл:

PINECONE_API_KEY=ваш-ключ-здесь

Затем дайте Claude задание:

Создай Pinecone-индекс "knowledge-base".
Используй модель multilingual-e5-large для эмбеддингов.
Векторизуй все PDF и Markdown-файлы в папке /documents.
Добавь namespace: "books" для книг, "transcripts" для транскриптов.

Claude Code установит нужные библиотеки, создаст скрипт и запустит загрузку. На несколько сотен документов уходит 10–30 минут.

Важно: используйте namespaces (пространства имён) для разделения данных. Это как папки внутри Pinecone: books, emails, transcripts, projects. Потом можно будет искать только в нужном разделе.

Шаг 3. Подключить к Claude (через Skill)

В Claude App создайте новый Skill — текстовый файл с инструкциями для Claude. Содержимое:

Ты имеешь доступ к моей базе знаний через Pinecone.
Когда я прошу найти что-то из прошлого опыта, документов или заметок:
1. Сформулируй поисковый запрос по смыслу
2. Обратись к Pinecone-индексу "knowledge-base"
3. Верни найденные фрагменты с указанием источника
4. Синтезируй ответ на основе найденного

Namespace по умолчанию: "general"
Для поиска по книгам: namespace "books"
Для поиска по транскриптам: namespace "transcripts"

После этого в любом чате можно писать:

  • «Найди в памяти мои мысли про монетизацию»
  • «Что я говорил про архитектуру микросервисов?»
  • «Найди в книгах про управление командой»

Шаг 4. Подключить к Claude Code (через MCP)

Claude Code поддерживает Pinecone через MCP-сервер. Добавьте в конфигурацию MCP:

{
  "mcpServers": {
    "pinecone": {
      "command": "npx",
      "args": ["@pinecone-database/mcp"],
      "env": {
        "PINECONE_API_KEY": "ваш-ключ"
      }
    }
  }
}

После этого Claude Code может обращаться к базе прямо в процессе работы над кодом — например, проверить, как вы решали похожую задачу в другом проекте.


Как это работает с разными ИИ

Claude (все три интерфейса)

ИнтерфейсКак подключить Pinecone
Claude Chat (Web)Через Skill с инструкциями + MCP-коннектор
Claude Code (CLI)MCP-сервер в конфиге, работает напрямую
Claude APIСвой код: получить эмбеддинг запроса → найти в Pinecone → добавить результат в промпт

OpenAI Codex

Codex работает с файловой системой. Самый простой способ — при старте сессии автоматически выгружать релевантные документы из Pinecone в папку .context/ в проекте. Codex увидит их как обычные файлы.

Другой вариант — написать кастомный Skill для Codex, который запрашивает Pinecone перед каждой задачей.

Gemini CLI

Gemini CLI поддерживает MCP-серверы с версии 0.39+. Конфигурация аналогична Claude Code:

{
  "mcpServers": {
    "pinecone": {
      "command": "npx",
      "args": ["@pinecone-database/mcp"],
      "env": {
        "PINECONE_API_KEY": "ваш-ключ"
      }
    }
  }
}

После добавления Gemini может делать семантический поиск по вашей базе в ходе диалога.

Единая база для всех агентов

Ключевое преимущество Pinecone: один индекс — несколько агентов. Claude, Codex и Gemini работают с одной базой. То, что вы объяснили Claude вчера, доступно Codex сегодня. Агенты перестают быть изолированными.


Продвинутые сценарии

Поиск по Gmail

Вместо стандартного поиска по ключевым словам можно векторизовать последние 100–200 писем и спрашивать:

  • «Кто предлагал партнёрство по YouTube?»
  • «Найди письма, где клиенты жаловались на скорость»
  • «Что я отвечал на запросы по интеграциям в апреле?»

Скрипт для загрузки писем из Gmail через API пишется Claude Code за 15 минут.

Связка с NotebookLM

NotebookLM (Google) позволяет загружать до 300 источников и работать с ними как с единым документом. Через специальный Skill для Claude можно автоматически выгружать содержимое ноутбуков и добавлять их в Pinecone — таким образом комбинируя аналитику NotebookLM с постоянной памятью Pinecone.

Автоматическое обновление базы

В CLAUDE.md или через хуки Claude Code можно настроить автоматическую индексацию: каждый раз, когда в папку raw/ падает новый файл, он автоматически векторизуется и добавляется в Pinecone. Вручную ничего делать не нужно.


Альтернатива: AgentMemory

Если настраивать Pinecone кажется слишком сложным, есть готовое решение — AgentMemory (open-source, Apache 2.0).

Это MCP-сервер с тройным поиском:

  • BM25 — классический поиск по ключевым словам
  • Вектор — семантический поиск (как Pinecone)
  • Граф знаний — поиск по связям между концепциями

Точность: 95.2% при поиске релевантных документов. База хранится локально в SQLite — никаких внешних сервисов. Работает с Claude Code, Codex, Gemini и другими агентами через единый MCP-протокол.

# Установка
npx @agentmemory/mcp

AgentMemory проще в старте, Pinecone — масштабируемее и гибче. Для тысяч документов Pinecone выигрывает. Для личного использования на сотнях файлов — AgentMemory удобнее.


Итоговая архитектура: три уровня

УровеньИнструментЧто хранитКто читает
Правила и стильCLAUDE.md / AGENTS.mdПостоянные инструкции, принципы работыClaude, Codex
Активная работаObsidian (Markdown)Текущие проекты, черновики, живые заметкиВсе агенты через LLM Wiki
Архив знанийPineconeКниги, транскрипты, письма, старые решенияВсе агенты через MCP/Skill
Глубокий анализNotebookLMДо 300 источников для разового исследованияВручную

Эта система работает как пирамида: правила сверху, активная работа в середине, архив снизу. Каждый уровень решает свою задачу и не заменяет остальные.


С чего начать прямо сейчас

Если вы только начинаете — не пытайтесь сразу выстроить всю пирамиду. Три шага, которые дают 80% ценности за 20% усилий:

  1. Создать CLAUDE.md с вашими базовыми правилами и контекстом о себе. 50–100 строк.
  2. Завести Obsidian и начать сохранять туда то, что хочется не забыть — статьи, решения, заметки.
  3. Открыть аккаунт в Pinecone (бесплатно) и закинуть туда 20–30 документов, которые чаще всего нужны. Написать простой Skill для Claude.

Весь этот процесс занимает 2–3 часа при первом запуске. После этого система работает сама, наполняется постепенно и перестаёт требовать внимания.

Агент, который помнит всё, что вы ему показали — принципиально другой инструмент, чем агент, который начинает с нуля каждый раз.


Связанное: