Кастомная разработка
продуктов с LLM под капотом —
для задач, которые обходятся дорого

Превращаем дорогостоящую экспертную рутину в LLM-продукт. С точными метриками качества, валидацией на реальных данных и нужным контуром безопасности

[ Примеры ]
  • Финансовый аудит компаний на основе внутренних документов
  • On-device ассистенты для авиации
  • Автоматическая сверка договоров
  • B2B-лидогенерация через парсинг тендеров
  • Автоматизация банковской отчётности
[ Что получаете ]
  • PoC за дни-недели — проверяем достижимость до больших вложений
  • 2–4× быстрее обычных команд
  • Код + процесс + эвалы — без чёрного ящика
  • Production-grade в регулируемых доменах

Что мы делаем

Основное — LLM-продукты под ключ. Отдельно — поставка процесса и обучение

01

LLM-продукты под ключ

От проблемы до runnable-системы. Делали в финтехе, авиации, юр-домене, инфраструктуре, медицине. Три типа задач, на которых специализируемся:

Build · A

Автоматизация B2B продаж

Парсинг лидов, мэтчинг с каталогом, скоринг, автогенерация КП, доставка в CRM или Telegram отделу продаж

Build · B

RAG / Agentic Search

Финансовая отчётность, тендеры, авиационные мануалы, юр. договоры, медицинские документы. Traceability — каждый ответ с цитатой, страницей и объяснением

Build · C

On-device и edge

Локальный inference и retrieval прямо на устройстве: мобильное железо, удалённые точки, регулируемые периметры. Работает без интернета. Своя система оптимизации инференса

+ отдельные услуги
02

Engineering process для AI-команд

Переносим в команду заказчика воспроизводимый процесс: eval'ы, мониторинги, decision log, review-гейты. Иногда — помогаем нанять штатных AI-инженеров

03

Обучение

Две B2B-программы (для dev-команд и для не-разработчиков) и b2c курс aiforwork.courses

Кейсы

Основные кейсы — FinTech / LegalTech, B2B sales, HRTech

01
Case · Financial Valuations Tivaco · Сингапур top-5% damages-эксперты в мире · $15B+ в оценённых активах
Финансовая оценка под арбитражи
Метрики из финансовой отчётности — для досудебного аудита бизнеса

~10 документов за ~5 минут вместо нескольких дней на один. У каждой цифры — цитата, страница, объяснение

high-stakes valuations traceability
Подробнее
02
Case · Aviation On-Device Overwatch AI · US Techstars · Startup of the Year — Aviation Festival Asia
Startup of the Year на Aviation Festival Asia
On-device RAG для пилотов + агентная система для наземных служб

Techstars · Startup of the Year на Aviation Festival Asia · пилот с крупнейшей европейской авиакомпанией · два AI-инженера в штат

on-device offline RAG aviation
Подробнее
03
Case · Tenders / Pipes NDA · РФ
Реестр тендеров с прозрачным скорингом
Лидогенерация через парсинг тендеров — с прозрачным скорингом

Узкий поток релевантных лидов вместо «всего реестра». Заходим в проекты даже до оформления тендера

B2B lead-gen tender parsing scoring
Подробнее
04
Case · Tenders / Pumps NDA · РФ
Рабочая характеристика насоса
Парсинг тендера → подбор насоса по графику → готовое КП в Telegram

Мэтчинг по реальным рабочим характеристикам, не по таблице соответствий. Дни → часы на отклик

B2B automation catalog matching Telegram bot
Подробнее
FEATURED · NDA ● ВСЁ ЛОКАЛЬНО ON-PREM PERIMETER contract document approval correspondence systems of record unified contract context comparator LLM rules catalog remark cards → lawyer UI LLM
05
Case · Contract Review NDA · полностью локальный контур
Автоматическая сверка договоров — чтобы юрист видел сразу, на что смотреть

Часы → минуты на стандартных классах договоров. Каталог правил — теперь аудируемый артефакт. Под капотом — наш собственный двухчастный engineering pipeline

on-prem local LLM contract review agentic pipeline
Подробнее

Ещё мы делали

Как мы работаем

Каждая стадия — точка выхода с готовым артефактом на руках. Можно остановиться, перепланировать или продолжить.

  1. Scope
    ~дни

    Бизнес-задача и границы риска

    Цель, стейкхолдеры, ограничения, цена ошибки. Карта домена и flow — на языке заказчика, не инженеров.

  2. PoC
    дни–недели

    Проверка достижимости

    Минимальное ядро на самом рискованном. Если задача в текущей конфигурации не решается — фиксируем это до больших вложений.

  3. Критерии
    ~неделя

    Метрики приёмки + decision log

    После PoC фиксируем критерии приёмки и decision log — на основе того, что реально достижимо.

  4. MVP
    недели

    Рабочая система для пилота

    Минимальный набор интеграций. Eval'ы для бизнес-стейкхолдеров — качество в цифрах, понятных вам, а не только нам.

  5. Прод
    месяцы

    Полная обвязка + handoff

    Интерфейсы, мониторинги, eval'ы как инструмент дальнейшего развития. Передача в команду заказчика.

[ Handoff ]

Что у вас остаётся

Полный пакет — код, процесс, инструменты для развития системы.

Код
В репозитории заказчика
Decision log
Зачем сделано именно так
Eval-suite
Чтобы выпускать новые версии без страха
Мониторинги
Качество системы в проде
Описание процесса
Analysis + engineering pipeline
Onboarding
Сессии для вашей команды
Поддержка
Опционально — ежемесячный ретейнер на итерации, апгрейды и архитектурные вопросы
Найм
Опционально — помощь со штатными AI-инженерами
Вы получаете продукт вместе с процессом, который ваша команда сможет развивать сама.

Кто за это отвечает

RoleFounder · Custom AI Engineering
Pastex-AI Architect · CodeSignal (US HRTech)
Tenure8 лет в индустрии · 4+ AI-native
GeoЕреван · работа во всех юрисдикциях
Коля Шейко
[ Founder · Grably Tech ]
Коля Шейко
Веду всё общение с заказчиком от сбора требований до приёмки. Сам строю AI-архитектуру и контролирую техническое выполнение. Под специфичные задачи подбираю экспертов из нетворка
Что ещё:
  • a.Ко-фаундер entropy.talk — крупнейшие онлайн-конференции по ИИ на русском (до 5K зрителей)
  • b.Автор Telegram-канала «AI и грабли» — про реальную инженерию AI-продуктов без хайпа
  • c.Автор курса aiforwork.courses — для не-разработчиков, которые хотят отдать рутину агентам
  • d.Лектор по Computer Science в университете Еревана
[ Мы в медиа ]
  • a.AI Hard Fork — Обучение, найм и увольнение в эпоху ИИ-агентовYouTube ↗
  • b.Podlodka AI Crew — Субагенты: собираем виртуальную командуYouTube ↗
  • c.VAMI — 3 ошибки при внедрении ИИ в разработкуYouTube ↗
  • d.R77 AI — RAG без ембединговTG ↗YouTube ↗
  • e.NGI — Управление контекстом LLMTG ↗YouTube ↗
  • f.AI Dev Conf 2025 — Сценарии развития рынка разработкиsite ↗YouTube ↗

FAQ

У нас обычно спрашивают на первой встрече

[ 09 Q / A ]
Q01У нас регулируемый домен — вы с этим работаете?+
Да. У нас два контура: SOC2-облако (Vertex AI / Azure) — с data residency, access policies и аудитом — и полностью локальный (on-prem, локальные модели, без внешних API). Кейс 05 — целиком на локальном контуре, ни строки договора не уходит наружу.
Q02У нас уже есть AI-команда. Чем вы отличаетесь?+
Мы строим продукт вместе с процессом его развития: eval'ы под бизнес-метрики, мониторинги, decision log. Держим руку на пульсе индустрии за счёт сообщества вокруг entropy.talk. В наших кейсах систему клиента нередко удаётся упростить в ~10 раз без потери точности. Если ваша команда уже это умеет — мы не нужны. Если хочется, чтобы умела — поможем нанять людей в штат и поставить процесс.
Q03Что значит «не оставляете чёрный ящик»?+
Код в репозитории, decision log (зачем сделано так), eval-suite (чтобы выпускать новые версии без страха), мониторинги, описание процесса (analysis + engineering pipeline), onboarding-сессии. По желанию — помощь с наймом. Цель: через ~3 месяца после релиза мы вам не нужны для ежедневной работы. Только для следующих больших итераций.
Q04Можно on-prem или on-device?+
Да, оба варианта. On-prem делаем сами (кейс 05); по российскому рынку есть проверенный партнёр для случаев, когда нужны их компетенции по железу и compliance. On-device — кейс 02 авиации: RAG-ассистент на iPad без интернета.
Q05Что с данными — PII, NDA, регуляторика?+
NDA — до обсуждения деталей. Дальше три режима: чувствительные данные → локальный контур (on-prem, локальные модели, без внешних API); нужна мощность foundation-моделей → SOC2-cloud (Vertex AI / Azure) без обучения на ваших данных; публичные данные → без ограничений. Какой режим — решаем на PoC под ваш compliance.
Q06Сколько по времени?+

Почти всегда разбиваем проект на стадии — это снижает риски и расходы заказчика на ранних этапах.

PoC — дни и недели. Первая стадия — проверка технической осуществимости задачи на минимальных вложениях. Убираем продакшн-обвязку, строим только AI-core, проверяем достижимость требований по точности. Если задача в текущей конфигурации не решается — фиксируем это до больших инвестиций.

MVP — недели. Когда осуществимость подтверждена — собираем рабочую систему с минимальным набором интеграций для пилотного использования.

Продакшн — месяцы. Полная обвязка: интерфейсы, интеграции, мониторинги, eval'ы для дальнейшего развития.

Дополнительно: мы сами активно используем AI-инструменты для разработки последние ~4 года и получаем сопоставимое качество в 2–4 раза быстрее команд, только начинающих с ними работать.

Q07Где вы и в каких юрисдикциях работаете?+
Юрлица в РФ и Армении. Работаем во всех юрисдикциях. Действующие клиенты — Сингапур, США, ЕС, РФ, Индонезия. Контракт — под удобный вам периметр.
Q08У нас уже есть прототип — сможете доделать?+

Технически да. Но в большинстве случаев доделывать существующий прототип заказчику невыгоднее, чем переписать: дольше по срокам, дороже по деньгам и менее надёжно по результату — обычно в нём уже зашиты неверные архитектурные решения, и чинить их выходит дороже, чем сделать правильно с нуля.

Стандартный сценарий: существующая система используется как референс требований и как генератор тестовых данных для новой — то есть мы не берём данные «непонятно откуда», а гоняем новую систему на реальных входах и выходах старой. Интеграции и сами данные переиспользуем, ядро пишем заново.

Q09Что значит «помогаете нанять»? Вы рекрутёры?+
Мы не рекрутёры в классическом смысле. Помогаем там, где ломается технический найм AI-инженеров: дизайн самой роли (AI-инженер vs AI-native разработчик — это разные люди), дизайн технических собеседований (опыт с CodeSignal), проведение интервью или обучение ваших разработчиков их проводить. Плюс network в русскоязычном AI-сообществе.

Если у вас задача,
которую страшно отдавать AI
нам интересно.

Напишите ваш кейс. Разбираем контекст, оцениваем границы, договариваемся о PoC. PoC обычно занимает дни или недели — так мы снижаем ваши риски на старте.