
AI-боты и агенты
Telegram, WhatsApp, Discord и веб-виджеты с памятью и контекстом. RAG поверх вашей базы знаний, multi-step агенты на LangGraph и CrewAI, голос — опционально через ElevenLabs.
- Каналы и платформы
- RAG и память
- Multi-step агенты
Что в работе
Каналы и платформы
Telegram (Telegraf / aiogram), WhatsApp Business API, Discord, Slack, веб-виджет с потоковой выдачей токенов.
RAG и память
pgvector, Pinecone или Weaviate. Чанкинг через unstructured.io, реранк Cohere, hybrid search BM25 + semantic.
Multi-step агенты
LangGraph для state-machine, CrewAI для команд агентов, function-calling через GPT-5/Claude. Tracing в LangSmith.
Интеграции
AmoCRM, Bitrix24, HubSpot, 1C, Google Sheets, Stripe. Webhook-based — обновления в реальном времени.
Гардрейлы
Защита от prompt injection, фильтр PII, rate-limit по пользователю, логирование всех вызовов в Postgres + S3.
Аналитика
Дашборд: воронка, retention, стоимость токенов на пользователя, топ-промпты, fallback-ы. Grafana + Posthog.
Как мы работаем
Без маркетинговой воды — четыре шага к продакшену.
Брифинг
30 минут — выясняем задачу, ограничения, метрику успеха.
Прототип
За 5–10 дней показываем работающий MVP, не дизайн в Figma.
Продакшн
Доводим до боевого состояния: CI, мониторинг, тесты, документация.
Сопровождение
Дежурим, обновляем модели, тюним промпты, считаем стоимость.
Чем делаем
Не подбираем «модно». Подбираем то, что выживает в продакшне.
Частые вопросы
По умолчанию — GPT-5 или Claude 4.7 (router выбирает по задаче и стоимости). По запросу — Gemini 2.5, Llama 3.3 70B или ваш fine-tune. Если нужен on-prem — DeepSeek V3 или Qwen 2.5 на вашем железе.
В стандарте: данные не уходят в обучение, шифрование at-rest и in-transit, PII redaction перед отправкой в LLM. По запросу — полный self-hosted без внешних API.
Зависит от объёма: 10 000 диалогов в месяц на GPT-5 — $50–150. На Claude Haiku — $15–40. На self-hosted Llama — только инфраструктура (~$200/мес за GPU). Кешируем агрессивно.
Гардрейлы: 1) фильтр на токсичность и галлюцинации, 2) откат к человеку при низкой уверенности, 3) канареечный деплой новых промптов на 5% трафика. Полностью убрать ошибки нельзя — но можно держать ниже 1%.
Cron-джоба раз в час пересобирает эмбеддинги для изменённых документов. Источники: Notion, Confluence, Google Drive, S3, любой webhook. Пересборка — инкрементальная, не полная.
Стек, на котором работаем
Цены
Финальная смета — после 30-минутного брифинга. Зависит от объёма данных, числа интеграций и SLA.
- Каналы и платформы
- RAG и память
- Multi-step агенты
- Интеграции
- Гардрейлы
- Аналитика
Обсудим проект?
Напишите в Telegram или оставьте заявку — ответим в течение 4 часов.






