Как я заменил трёх сотрудников одним локальным ИИ-агентом
Автор демонстрирует свою систему AI Ops для поддержки клиентов и продаж. Он развернул мощную языковую модель локально и заставил её выполнять три параллельные задачи для одного входящего тикета: классифицировать срочность, составлять ответ клиенту и готовить внутреннюю служебную записку. Всё работает на его собственном железе без облачных API, экономя время и человеческие ресурсы на рутинных операциях.
Как повторить:
1️⃣ Разверните локальную LLM. Используйте
Ollama или vLLM, как в видео, для запуска больших моделей вроде Qwen на своём сервере. Это позволит обрабатывать запросы без облачных затрат и с полным контролем над данными.
2️⃣ Создайте endpoint для обработки задач. Настройте фреймворк вроде
vLLM как сервер OpenAI-совместимого API. Это даст единую точку, куда можно отправлять запросы на классификацию, генерацию ответов и сводок одновременно.
3️⃣ Автоматизируйте рабочий процесс (оркестрация). С помощью
n8n или подобного инструмента соедините вашу систему тикетов с локальным endpoint ИИ. Настройте автоматический запуск трёх параллельных промптов для каждого нового тикета и распределение результатов в нужные каналы.
Итог: Вы получите собственный, полностью контролируемый AI-слой для автоматизации поддержки, который экономит часы рутинной работы и масштабируется под нагрузку.
🤖
AI MAN | Нейросети и деньги