Внутренний GPT по базе из 4 200 документов — менеджеры находят ответ за 6 секунд

Сделали внутренний AI-поиск по 4 200 документам: регламенты, договоры, инструкции. Ответы со ссылками на источник. Без отправки данных в OpenAI.

корпоративный ai ассистент — кейс MPGuide

У средней компании на 100+ сотрудников — горы внутренних документов: регламенты, инструкции, шаблоны договоров, протоколы. Менеджер ищет ответ на конкретный вопрос — тратит 10–15 минут на «найти нужный документ → пролистать → понять, актуален ли». Знания есть, но они недоступны в моменте.

Развернули внутреннего GPT-ассистента по базе знаний (RAG): сотрудник задаёт вопрос текстом — за 6 секунд получает ответ со ссылками на конкретные документы и пункты. Данные не уходят в OpenAI: вся обработка локальная, базу знаний компания контролирует целиком.

Документов в базе
4 200+
регламенты, инструкции, договоры
Время поиска ответа
15 мин → 6 сек
для сотрудника
Защита данных
On-prem
локальная LLM, без OpenAI

Контекст: знания есть, но «попробуй их найди»

Компания с распределёнными отделами (продажи, юридический, HR, IT, бухгалтерия). У каждого — свой портал, своя файло-помойка, свои Confluence/SharePoint/Notion. У типового сотрудника — 4+ разных места, где «может быть ответ».

Поиск работает по ключевым словам, не по смыслу. Запрос «как оформить командировку для иностранца» ищет точную фразу, не находит — а регламент есть, просто называется «Положение о служебных командировках п. 14.2».

Боль: 4 200 документов, ответ — за 15 минут

Внутренний опрос показал: типовой сотрудник тратит 15 минут на поиск ответа в регламентах. И в 30% случаев находит «не то» или не находит вовсе и идёт спрашивать в чат отдела — отвлекая коллег.

Параллельно появляются «эксперты по регламентам» — сотрудники, которые помнят, где что лежит, и к которым все идут. У них нет рабочего времени на это, и при их отпуске процессы тормозят.

Что сделали: внутренний GPT с RAG-архитектурой

RAG = Retrieval-Augmented Generation. Простыми словами: для каждого ответа AI сначала ищет релевантные фрагменты в базе документов, потом формирует ответ ТОЛЬКО на основе найденного. Не «галлюцинирует», не «думает» от себя.

Загрузили все 4 200 документов в векторную базу: разрезали на смысловые блоки, посчитали эмбеддинги, проиндексировали. На вопрос сотрудника AI достаёт топ-10 релевантных блоков и формирует ответ со ссылками на конкретные документы и пункты.

Главное — данные не уходят к OpenAI. Развернули локальную LLM (на серверах компании или в её Yandex.Cloud), эмбеддинги тоже считаются локально. Чувствительная информация остаётся внутри периметра.

  • База: регламенты, инструкции, шаблоны, протоколы, юридические документы
  • Каждый ответ — со ссылкой на источник (конкретный документ + раздел)
  • On-prem или Yandex.Cloud — без отправки данных в OpenAI / Anthropic
  • Ролевой доступ: HR не видит юридическую базу, бухгалтерия не видит HR
  • Обновление базы: загружаем новый/изменённый документ — индекс обновляется автоматически

Как работает: типовой запрос

Менеджер пишет в Telegram-боту корпоративного GPT: «Как оформить командировку иностранному сотруднику в Турцию?». Через 6 секунд приходит ответ: «Согласно Положению о служебных командировках (п. 14.2), для иностранного сотрудника требуется: 1) виза (страна назначения), 2) полис ВЗР с покрытием …, 3) согласие отдела HR (через форму X)…».

В конце ответа — ссылка на сам регламент с подсвеченным пунктом. Если сотрудник видит, что AI чего-то не учёл — нажимает «эскалировать в HR», тикет уходит уже с готовым контекстом.

Результат: знания работают

Время поиска ответа упало с 15 минут до 6 секунд. NPS сотрудников по «удобству работы с регламентами» вырос с 4 до 8 (по 10-балльной шкале).

Снизилась нагрузка на «экспертов» — те, к кому раньше шли все, освободили часть рабочего времени. Теперь они занимаются обновлением базы и контролем качества AI-ответов, а не «вопросами как сделать X».

«Раньше регламент работал, только если ты помнишь, где он лежит. Сейчас он работает всегда.»

руководитель HR-отдела

Стек

Локальная LLM (Llama 3, Qwen, или GPT-4 в Yandex.Cloud) — без отправки в OpenAIЭмбеддинги: BGE-M3 или E5 (русскоязычные)Векторная база: pgvector (PostgreSQL) или QdrantЧанкинг документов: 500–1000 токенов с overlapTelegram-бот / веб-интерфейс — клиент для сотрудниковРолевой доступ на уровне коллекций документов

Часто задаваемые вопросы

Кому подойдёт это решение?
Подход универсален для бизнеса в схожей нише и с похожими процессами. На странице услуг можно почитать, в каких категориях у нас есть опыт. Чтобы понять, подойдёт ли вам — напишите в Telegram, обсудим за 15 минут.
Сколько времени заняла реализация?
Зависит от объёма данных и количества модулей. В среднем — от 3 недель на MVP до 2–3 месяцев на полноценную систему. Финальный текст этого кейса с конкретными сроками и метриками — в работе.
Какие данные нужны для запуска?
Минимум — API-доступ к источникам (маркетплейсы, CRM, 1С, банк). Дополнительно — справочники товаров, история продаж, текущие отчёты команды. На первом созвоне списком пройдёмся.
Можно ли адаптировать решение под мой бизнес?
Да. Любой наш кейс — это набор подходов и компонентов, который мы собираем под конкретные процессы клиента. Конкретные модули, источники данных, интеграции и метрики настраиваются индивидуально.
Сколько примерно стоит?
Цена зависит от объёма работы и сроков. Типовые диапазоны бюджетов: BI-дашборд от 150 тыс. ₽, кастомная веб-платформа от 500 тыс. ₽, внедрение AI от 100 тыс. ₽. После короткого аудита даём точный ориентир по вашей задаче.

Обсудим похожий проект для вас?

Расскажите про задачу — мы предложим, как её решить с помощью автоматизации или ИИ.

Похожие кейсы

ai ассистент для менеджеров — обложка кейса
Внедрение ИИМаркетплейсыАвтоматизация

AI-ассистент для менеджера маркетплейса: вместо 12 вкладок Excel — один чат

Развернули AI-ассистента поверх аналитики WB, Ozon и Я.Маркета. Менеджер спрашивает «что с рекламой по SKU X» — и получает ответ с графиком за 4 секунды.

Подробнее
ai квалификация лидов — обложка кейса
Внедрение ИИАвтоматизация

AI квалифицирует входящие заявки за 9 секунд — и передаёт менеджеру только горячие

AI-агент читает заявку с сайта и формы, отсеивает мусор, задаёт 3 уточняющих вопроса в Telegram и передаёт менеджеру только готовый к звонку лид.

Подробнее
ai для разбора звонков менеджеров — обложка кейса
Внедрение ИИАвтоматизация

AI-платформа разбора звонков и переписок: не аналитика, а конкретные действия для каждого менеджера

Внедрили платформу разбора звонков и переписок отдела продаж. Реактивная ветка: сигнал через 5 минут с готовым сообщением клиенту. Стратегическая: персональный коучинг-план менеджеру на неделю. Точность 92–96%, запуск за 2 недели.

Подробнее