Меня зовут Константин Шуткин, я DevOps-инженер с 10+ годами опыта. Строил инфраструктуру в Nvidia, Сбербанке и Wildberries. Сейчас применяю этот опыт к ИИ — собираю локальные ИИ-серверы «под ключ», от подбора железа и выбора модели до внедрения ИИ-агентов в рабочие процессы.
От подбора железа и развёртывания модели до автономных агентов и поддержки
Не только ставлю и настраиваю llama.cpp и vLLM, но и подбираю серверы и GPU под конкретные нагрузки и бюджет — от рабочей станции до GPU-кластера. Считаю требуемую видеопамять, пропускную способность и помогаю оценить стоимость владения.
vLLM, TensorRT-LLM, Triton, llama.cpp — ставлю модель на подобранное железо, отдаю продакшен-сервинг. Данные остаются внутри периметра.
OpenClaw, Hermes, Claude, LangGraph, CrewAI — агенты с tool-calling, MCP и памятью, которые действуют, а не просто отвечают.
Дообучение LLM на ваших данных: Unsloth, Axolotl, LLaMA Factory, LoRA — для точного стиля и специфической терминологии.
Векторные базы (Qdrant, Milvus, pgvector), поиск по документам и ответы со ссылками на источники.
MCP-серверы и tool-calling: подключаю агентов к CRM, почте, API и внутренним системам.
Kubernetes с GPU-нодами, автомасштабирование инференса и мониторинг токенов/с, latency и утилизации.
Не просто чат-боты, а автономные агенты, которые выполняют реальную работу 24/7
Автоматизирует цикл разработки: берёт задачи из таск-трекера, пишет код, формирует готовые изменения и передаёт их разработчикам на ревью.
Реагирует на алерты, собирает логи и метрики, выполняет безопасные действия (rollback, restart, масштабирование) и докладывает дежурному.
Работает с вашими данными и сервисами: отвечает на вопросы по внутренней базе знаний, готовит документы, взаимодействует с CRM, почтой и календарём.
Меня зовут Константин Шуткин, я DevOps-инженер с 10+ годами опыта и сертифицированный Kubernetes-администратор (CKA). Строил продакшен-инфраструктуру в Nvidia, Сбербанке и Wildberries.
ИИ-инфраструктура — это те же продакшен-системы: кластеры, мониторинг, масштабирование, CI/CD. Я применяю DevOps-экспертизу, чтобы разворачивать ИИ-серверы и агентов надёжно, как любую другую критическую инфраструктуру.
Работаю как самозанятый: тот же уровень напрямую, без посредников и бюрократии.
От первого созвона до запущенного ИИ — прозрачно и предсказуемо
30 минут: задача, модель, железо, варианты решения.
Считаю нагрузку, подбираю GPU и серверы под бюджет, выбираю стек.
Архитектура, план работ и фиксация бюджета.
Развёртывание сервера, агентов, RAG, запуск в прод.
Документация, обучение команды и сопровождение.
Единая почасовая ставка — вы платите только за фактическое время
за час работы
* Ориентировочные оценки. Точная стоимость — после бесплатной консультации.
Отвечу в течение часа — выберите удобный способ связи