Urartu.
Услуга 03 / 08

AI-боты и агенты

Telegram, WhatsApp, Discord и веб-виджеты с памятью и контекстом. RAG поверх вашей базы знаний, multi-step агенты на LangGraph и CrewAI, голос — опционально через ElevenLabs.

  • Каналы и платформы
  • RAG и память
  • Multi-step агенты
от $1000Telegram, WhatsApp, Discord, веб-виджеты. RAG, voice, multi-step на LangGraph/CrewAI.
Состав поставки

Что в работе

Каналы и платформы

Telegram (Telegraf / aiogram), WhatsApp Business API, Discord, Slack, веб-виджет с потоковой выдачей токенов.

RAG и память

pgvector, Pinecone или Weaviate. Чанкинг через unstructured.io, реранк Cohere, hybrid search BM25 + semantic.

Multi-step агенты

LangGraph для state-machine, CrewAI для команд агентов, function-calling через GPT-5/Claude. Tracing в LangSmith.

Интеграции

AmoCRM, Bitrix24, HubSpot, 1C, Google Sheets, Stripe. Webhook-based — обновления в реальном времени.

Гардрейлы

Защита от prompt injection, фильтр PII, rate-limit по пользователю, логирование всех вызовов в Postgres + S3.

Аналитика

Дашборд: воронка, retention, стоимость токенов на пользователя, топ-промпты, fallback-ы. Grafana + Posthog.

Как мы работаем

Без маркетинговой воды — четыре шага к продакшену.

01

Брифинг

30 минут — выясняем задачу, ограничения, метрику успеха.

02

Прототип

За 5–10 дней показываем работающий MVP, не дизайн в Figma.

03

Продакшн

Доводим до боевого состояния: CI, мониторинг, тесты, документация.

04

Сопровождение

Дежурим, обновляем модели, тюним промпты, считаем стоимость.

Стек и инструменты

Чем делаем

Не подбираем «модно». Подбираем то, что выживает в продакшне.

LangGraph
CrewAI
Telegraf
aiogram
WhatsApp Business API
GPT-5
Claude 4.7
Gemini 2.5
pgvector
Pinecone
Cohere Rerank
LangSmith
n8n
Redis
FastAPI
FAQ

Частые вопросы

По умолчанию — GPT-5 или Claude 4.7 (router выбирает по задаче и стоимости). По запросу — Gemini 2.5, Llama 3.3 70B или ваш fine-tune. Если нужен on-prem — DeepSeek V3 или Qwen 2.5 на вашем железе.

В стандарте: данные не уходят в обучение, шифрование at-rest и in-transit, PII redaction перед отправкой в LLM. По запросу — полный self-hosted без внешних API.

Зависит от объёма: 10 000 диалогов в месяц на GPT-5 — $50–150. На Claude Haiku — $15–40. На self-hosted Llama — только инфраструктура (~$200/мес за GPU). Кешируем агрессивно.

Гардрейлы: 1) фильтр на токсичность и галлюцинации, 2) откат к человеку при низкой уверенности, 3) канареечный деплой новых промптов на 5% трафика. Полностью убрать ошибки нельзя — но можно держать ниже 1%.

Cron-джоба раз в час пересобирает эмбеддинги для изменённых документов. Источники: Notion, Confluence, Google Drive, S3, любой webhook. Пересборка — инкрементальная, не полная.

Стек, на котором работаем

Next.js 15Veo 3.1Gemini 2.5Claude 4.7GPT-5ElevenLabsLangGraphPineconen8nCartesiaHeyGenRunwaySoraWhisperPostgreSQLpgvectorDrizzleVercelCloudflareBitrix24AmoCRM1CTelegram BotWhatsApp
Next.js 15Veo 3.1Gemini 2.5Claude 4.7GPT-5ElevenLabsLangGraphPineconen8nCartesiaHeyGenRunwaySoraWhisperPostgreSQLpgvectorDrizzleVercelCloudflareBitrix24AmoCRM1CTelegram BotWhatsApp
Next.js 15Veo 3.1Gemini 2.5Claude 4.7GPT-5ElevenLabsLangGraphPineconen8nCartesiaHeyGenRunwaySoraWhisperPostgreSQLpgvectorDrizzleVercelCloudflareBitrix24AmoCRM1CTelegram BotWhatsApp
Бюджеты

Цены

от$0

Финальная смета — после 30-минутного брифинга. Зависит от объёма данных, числа интеграций и SLA.

  • Каналы и платформы
  • RAG и память
  • Multi-step агенты
  • Интеграции
  • Гардрейлы
  • Аналитика

Обсудим проект?

Напишите в Telegram или оставьте заявку — ответим в течение 4 часов.