1. About the project
First-line support was drowning in repeat questions, while high-value cases waited. The team needed 24/7 coverage without a proportional headcount increase.
Key results
- −68% median first-response time for common intents.
- 24/7 automated first line with defined escalation rules.
- 41% fewer manually handled tickets for tier-1 topics.
- Handoff to humans includes full thread and confidence metadata.
Project overview
Customers waited too long for simple answers, and specialists lacked capacity for complex issues. Knowledge lived across docs, chats and internal notes.
We deployed an agent grounded in the knowledge base with guardrails for tone, citations and unknowns. Edge cases route to the team with structured context.
Operations received dashboards on volumes, resolution paths and escalation reasons for continuous tuning.
Technical breakdown
PROBLEM
Support team overloaded by repeated questions
Context
- Customers waited too long for simple answers.
- Specialists had little time for high-value cases.
- Knowledge lived across docs, chats and internal notes with no unified access.
What happened
SOLUTION
AI triage with controlled answers
We built a support agent grounded in the knowledge base. It classifies intent, finds the right answer, checks it against guardrails, and escalates edge cases with full context.
How it works
- Customer message arrives via chat, email or ticket.
- Classifier determines intent, priority and language.
- Agent searches the knowledge base using RAG retrieval.
- Answer is checked: tone, source citation, length, unknowns.
- If unresolved → escalate with full thread and confidence score.
PIPELINE
Pipeline
Единый AI-процесс от входящего запроса до ответа клиенту или передачи специалисту.
фикатор
знаний
Guardrails
Эскалация
Входящий запрос
Клиент пишет через чат, email или тикет. Агент подхватывает мгновенно — 24/7 без очереди.
Омниканальность
Чат, email, тикет, мессенджеры
Без очереди
Мгновенный первый ответ в любое время
Контекст сессии
История переписки и метаданные клиента
Время первого ответа
<5сек
было 4–8 часов при ручной обработке
Классификатор интента
AI определяет тип запроса, приоритет и маршрут — до генерации ответа. Сначала понять, потом отвечать.
Тип запроса
Billing, technical, general, complaint
Приоритет
Low / Normal / High / Urgent
Язык
Автоопределение, поддержка мультиязычности
База знаний (RAG)
Агент ищет ответ в верифицированных источниках. Если ответа нет — не придумывает, а эскалирует.
RAG поиск
По документам, FAQ и базе статей
Цитирование источника
Ответ со ссылкой на конкретный раздел
Fallback
Если ответа нет в KB — честный handoff
РАЗРЕШЕНИЕ ТИКЕТОВ
Ответ с guardrails
Каждый ответ проходит проверку тона, точности и ограничений до отправки клиенту.
Tone check
Стиль под бренд — нейтральный, вежливый
Fact check
Только факты из верифицированной KB
Length control
Без лишних слов — ответ по делу
Добрый день! Ваш счёт выставляется 1-го числа каждого месяца. Вы можете скачать его в разделе «Billing → Invoices». Нужна дополнительная помощь?
Отправлено через 4 сек · Источник: FAQ #12Закрытие / Эскалация
Простые тикеты закрываются автоматически. Сложные передаются специалисту с полным контекстом.
Auto-close
При успешном ответе тикет закрывается
Handoff с контекстом
Тред + классификация + confidence score
Аналитика
Причины эскалации для улучшения KB
ЛОГИКА
Guardrails и пороги уверенности агента
ОГРАНИЧЕНИЯ АГЕНТА
tone guardrails
стиль и тон фиксированы брендом
source citation
только из верифицированной базы
unknown handling
не знает → эскалирует, не выдумывает
confidence < 0.70
→ эскалировать специалисту
resolved = true
→ автозакрытие тикета
КОНТРОЛЬ РИСКОВ
агент не отвечает вне базы знаний
все ответы логируются
сложные → специалисту с контекстом
регулярная калибровка и обновление KB
В ЧЁМ СИЛА РЕШЕНИЯ
скорость
−68% времени ответа
покрытие
24/7 без выходных
масштаб
без роста команды