Внутренний GPT по базе из 4 200 документов — менеджеры находят ответ за 6 секунд

Сделали внутренний AI-поиск по 4 200 документам: регламенты, договоры, инструкции. Ответы со ссылками на источник. Без отправки данных в OpenAI.

У средней компании на 100+ сотрудников — горы внутренних документов: регламенты, инструкции, шаблоны договоров, протоколы. Менеджер ищет ответ на конкретный вопрос — тратит 10–15 минут на «найти нужный документ → пролистать → понять, актуален ли». Знания есть, но они недоступны в моменте.

Развернули внутреннего GPT-ассистента по базе знаний (RAG): сотрудник задаёт вопрос текстом — за 6 секунд получает ответ со ссылками на конкретные документы и пункты. Данные не уходят в OpenAI: вся обработка локальная, базу знаний компания контролирует целиком.

Документов в базе

4 200+

регламенты, инструкции, договоры

Время поиска ответа

15 мин → 6 сек

для сотрудника

Защита данных

On-prem

локальная LLM, без OpenAI

Контекст: знания есть, но «попробуй их найди»

Компания с распределёнными отделами (продажи, юридический, HR, IT, бухгалтерия). У каждого — свой портал, своя файло-помойка, свои Confluence/SharePoint/Notion. У типового сотрудника — 4+ разных места, где «может быть ответ».

Поиск работает по ключевым словам, не по смыслу. Запрос «как оформить командировку для иностранца» ищет точную фразу, не находит — а регламент есть, просто называется «Положение о служебных командировках п. 14.2».

Боль: 4 200 документов, ответ — за 15 минут

Внутренний опрос показал: типовой сотрудник тратит 15 минут на поиск ответа в регламентах. И в 30% случаев находит «не то» или не находит вовсе и идёт спрашивать в чат отдела — отвлекая коллег.

Параллельно появляются «эксперты по регламентам» — сотрудники, которые помнят, где что лежит, и к которым все идут. У них нет рабочего времени на это, и при их отпуске процессы тормозят.

Что сделали: внутренний GPT с RAG-архитектурой

RAG = Retrieval-Augmented Generation. Простыми словами: для каждого ответа AI сначала ищет релевантные фрагменты в базе документов, потом формирует ответ ТОЛЬКО на основе найденного. Не «галлюцинирует», не «думает» от себя.

Загрузили все 4 200 документов в векторную базу: разрезали на смысловые блоки, посчитали эмбеддинги, проиндексировали. На вопрос сотрудника AI достаёт топ-10 релевантных блоков и формирует ответ со ссылками на конкретные документы и пункты.

Главное — данные не уходят к OpenAI. Развернули локальную LLM (на серверах компании или в её Yandex.Cloud), эмбеддинги тоже считаются локально. Чувствительная информация остаётся внутри периметра.

База: регламенты, инструкции, шаблоны, протоколы, юридические документы
Каждый ответ — со ссылкой на источник (конкретный документ + раздел)
On-prem или Yandex.Cloud — без отправки данных в OpenAI / Anthropic
Ролевой доступ: HR не видит юридическую базу, бухгалтерия не видит HR
Обновление базы: загружаем новый/изменённый документ — индекс обновляется автоматически

Как работает: типовой запрос

Менеджер пишет в Telegram-боту корпоративного GPT: «Как оформить командировку иностранному сотруднику в Турцию?». Через 6 секунд приходит ответ: «Согласно Положению о служебных командировках (п. 14.2), для иностранного сотрудника требуется: 1) виза (страна назначения), 2) полис ВЗР с покрытием …, 3) согласие отдела HR (через форму X)…».

В конце ответа — ссылка на сам регламент с подсвеченным пунктом. Если сотрудник видит, что AI чего-то не учёл — нажимает «эскалировать в HR», тикет уходит уже с готовым контекстом.

Результат: знания работают

Время поиска ответа упало с 15 минут до 6 секунд. NPS сотрудников по «удобству работы с регламентами» вырос с 4 до 8 (по 10-балльной шкале).

Снизилась нагрузка на «экспертов» — те, к кому раньше шли все, освободили часть рабочего времени. Теперь они занимаются обновлением базы и контролем качества AI-ответов, а не «вопросами как сделать X».

«Раньше регламент работал, только если ты помнишь, где он лежит. Сейчас он работает всегда.»
— руководитель HR-отдела

Стек

Локальная LLM (Llama 3, Qwen, или GPT-4 в Yandex.Cloud) — без отправки в OpenAIЭмбеддинги: BGE-M3 или E5 (русскоязычные)Векторная база: pgvector (PostgreSQL) или QdrantЧанкинг документов: 500–1000 токенов с overlapTelegram-бот / веб-интерфейс — клиент для сотрудниковРолевой доступ на уровне коллекций документов

Часто задаваемые вопросы

Кому подойдёт это решение?

Подход универсален для бизнеса в схожей нише и с похожими процессами. На странице услуг можно почитать, в каких категориях у нас есть опыт. Чтобы понять, подойдёт ли вам — напишите в Telegram, обсудим за 15 минут.

Сколько времени заняла реализация?

Зависит от объёма данных и количества модулей. В среднем — от 3 недель на MVP до 2–3 месяцев на полноценную систему. Финальный текст этого кейса с конкретными сроками и метриками — в работе.

Какие данные нужны для запуска?

Минимум — API-доступ к источникам (маркетплейсы, CRM, 1С, банк). Дополнительно — справочники товаров, история продаж, текущие отчёты команды. На первом созвоне списком пройдёмся.

Можно ли адаптировать решение под мой бизнес?

Да. Любой наш кейс — это набор подходов и компонентов, который мы собираем под конкретные процессы клиента. Конкретные модули, источники данных, интеграции и метрики настраиваются индивидуально.

Сколько примерно стоит?

Цена зависит от объёма работы и сроков. Типовые диапазоны бюджетов: BI-дашборд от 150 тыс. ₽, кастомная веб-платформа от 500 тыс. ₽, внедрение AI от 100 тыс. ₽. После короткого аудита даём точный ориентир по вашей задаче.

Обсудим похожий проект для вас?

Расскажите про задачу — мы предложим, как её решить с помощью автоматизации или ИИ.

Написать в Telegram Написать в MAX

Внутренний GPT по базе из 4 200 документов — менеджеры находят ответ за 6 секунд

Контекст: знания есть, но «попробуй их найди»

Боль: 4 200 документов, ответ — за 15 минут

Что сделали: внутренний GPT с RAG-архитектурой

Как работает: типовой запрос

Результат: знания работают

Стек

Часто задаваемые вопросы

Обсудим похожий проект для вас?

Похожие кейсы

AI-ассистент для менеджера маркетплейса: вместо 12 вкладок Excel — один чат

AI квалифицирует входящие заявки за 9 секунд — и передаёт менеджеру только горячие

AI-платформа разбора звонков и переписок: не аналитика, а конкретные действия для каждого менеджера