Приватный ИИ на ваших GPU

ИИ-инфраструктура
под ключ

Константин Шуткин — DevOps-инженер

Меня зовут Константин Шуткин, я DevOps-инженер с 10+ годами опыта. Строил инфраструктуру в Nvidia, Сбербанке и Wildberries. Сейчас применяю этот опыт к ИИ — собираю локальные ИИ-серверы «под ключ», от подбора железа и выбора модели до внедрения ИИ-агентов в рабочие процессы.

DevOps 10+ лет CKA сертификация GPU bare-metal / cloud
// Услуги

ИИ-инфраструктура под ключ

От подбора железа и развёртывания модели до автономных агентов и поддержки

🧮

Подбор железа под задачу

Не только ставлю и настраиваю llama.cpp и vLLM, но и подбираю серверы и GPU под конкретные нагрузки и бюджет — от рабочей станции до GPU-кластера. Считаю требуемую видеопамять, пропускную способность и помогаю оценить стоимость владения.

Подобрать железо →
🖥️

ИИ-сервер под ключ

vLLM, TensorRT-LLM, Triton, llama.cpp — ставлю модель на подобранное железо, отдаю продакшен-сервинг. Данные остаются внутри периметра.

🤖

ИИ-агенты

OpenClaw, Hermes, Claude, LangGraph, CrewAI — агенты с tool-calling, MCP и памятью, которые действуют, а не просто отвечают.

🧠

Fine-tuning

Дообучение LLM на ваших данных: Unsloth, Axolotl, LLaMA Factory, LoRA — для точного стиля и специфической терминологии.

📚

RAG и базы знаний

Векторные базы (Qdrant, Milvus, pgvector), поиск по документам и ответы со ссылками на источники.

🔌

MCP и интеграции

MCP-серверы и tool-calling: подключаю агентов к CRM, почте, API и внутренним системам.

⚙️

GPU-инфраструктура

Kubernetes с GPU-нодами, автомасштабирование инференса и мониторинг токенов/с, latency и утилизации.

// ИИ-агенты

Ваши цифровые сотрудники

Не просто чат-боты, а автономные агенты, которые выполняют реальную работу 24/7

🦞

Агент-разработчик

Автоматизирует цикл разработки: берёт задачи из таск-трекера, пишет код, формирует готовые изменения и передаёт их разработчикам на ревью.

🛠️

SRE / DevOps-агент

Реагирует на алерты, собирает логи и метрики, выполняет безопасные действия (rollback, restart, масштабирование) и докладывает дежурному.

💼

Бизнес-ассистент

Работает с вашими данными и сервисами: отвечает на вопросы по внутренней базе знаний, готовит документы, взаимодействует с CRM, почтой и календарём.

// Обо мне

Почему стоит работать со мной

DevOps-экспертиза — для ИИ-инфраструктуры

Меня зовут Константин Шуткин, я DevOps-инженер с 10+ годами опыта и сертифицированный Kubernetes-администратор (CKA). Строил продакшен-инфраструктуру в Nvidia, Сбербанке и Wildberries.

ИИ-инфраструктура — это те же продакшен-системы: кластеры, мониторинг, масштабирование, CI/CD. Я применяю DevOps-экспертизу, чтобы разворачивать ИИ-серверы и агентов надёжно, как любую другую критическую инфраструктуру.

Работаю как самозанятый: тот же уровень напрямую, без посредников и бюрократии.

  • Подбор GPU и серверов под задачу и бюджет
  • ИИ-сервер на vLLM / TensorRT-LLM / Triton
  • Агенты OpenClaw / Hermes / Claude
  • Fine-tuning и RAG на ваших данных
  • GPU Kubernetes и мониторинг

Технологический стек

Inference-серверы
vLLM TensorRT-LLM Triton llama.cpp
ИИ-агенты
OpenClaw Hermes Claude LangGraph CrewAI MCP
Fine-tuning / RAG
Unsloth Axolotl LLaMA Factory Qdrant pgvector
Инфраструктура
Kubernetes Terraform / OpenTofu ArgoCD GitLab CI Ansible NVIDIA / CUDA Docker Helm Grafana
// Процесс

Как я работаю

От первого созвона до запущенного ИИ — прозрачно и предсказуемо

Бесплатно
00

Консультация

30 минут: задача, модель, железо, варианты решения.

01

Аудит и подбор железа

Считаю нагрузку, подбираю GPU и серверы под бюджет, выбираю стек.

02

Стратегия

Архитектура, план работ и фиксация бюджета.

03

Внедрение

Развёртывание сервера, агентов, RAG, запуск в прод.

04

Поддержка

Документация, обучение команды и сопровождение.

// Цены

Прозрачное ценообразование

Единая почасовая ставка — вы платите только за фактическое время

Ставка
5 000

за час работы

Оплата только за реальное время
Оценка трудозатрат до старта
Договор (НПД), чеки, акты
Бесплатная консультация 30 мин
Получить оценку

Примеры стоимости

🧮
Подбор железа и оценкаРасчёт GPU, необходимой памяти и пропускной способности
~1–4 чот 5 000 ₽
🖥️
ИИ-сервер на llama.cppOpenAI-совместимый API
~2–5 чот 10 000 ₽
Прод-кластер vLLM на GPUМасштабирование, балансировка, мониторинг
~5–20 чот 25 000 ₽
🤖
ИИ-агент с инструментамиOpenClaw / LangGraph + MCP и tool-calling
~5–20 чот 25 000 ₽
📚
RAG / база знанийВекторная БД, поиск по документам
~5–15 чот 25 000 ₽
🎓
Дообучение LLMПодготовка данных, обучение, деплой
~5–40 чот 25 000 ₽

* Ориентировочные оценки. Точная стоимость — после бесплатной консультации.

// Контакты

Бесплатная консультация 30 минут

Отвечу в течение часа — выберите удобный способ связи