Кастомная разработка
продуктов с LLM под капотом —
для задач, которые обходятся дорого

Превращаем дорогостоящую экспертную рутину в LLM-продукт. С точными метриками качества, валидацией на реальных данных и нужным контуром безопасности

[ Примеры ]

Финансовый аудит компаний на основе внутренних документов
On-device ассистенты для авиации
Автоматическая сверка договоров
B2B-лидогенерация через парсинг тендеров
Автоматизация банковской отчётности

[ Что получаете ]

PoC за дни-недели — проверяем достижимость до больших вложений
2–4× быстрее обычных команд
Код + процесс + эвалы — без чёрного ящика
Production-grade в регулируемых доменах

Обсудить вашу задачу →

Что мы делаем

Основное — LLM-продукты под ключ. Отдельно — поставка процесса и обучение

LLM-продукты под ключ

От проблемы до runnable-системы. Делали в финтехе, авиации, юр-домене, инфраструктуре, медицине. Три типа задач, на которых специализируемся:

Build · A

Автоматизация B2B продаж

Парсинг лидов, мэтчинг с каталогом, скоринг, автогенерация КП, доставка в CRM или Telegram отделу продаж

Build · B

RAG / Agentic Search

Финансовая отчётность, тендеры, авиационные мануалы, юр. договоры, медицинские документы. Traceability — каждый ответ с цитатой, страницей и объяснением

Build · C

On-device и edge

Локальный inference и retrieval прямо на устройстве: мобильное железо, удалённые точки, регулируемые периметры. Работает без интернета. Своя система оптимизации инференса

+ отдельные услуги

Engineering process для AI-команд

Переносим в команду заказчика воспроизводимый процесс: eval'ы, мониторинги, decision log, review-гейты. Иногда — помогаем нанять штатных AI-инженеров

Обучение

Две B2B-программы (для dev-команд и для не-разработчиков) и b2c курс aiforwork.courses

Кейсы

Основные кейсы — FinTech / LegalTech, B2B sales, HRTech

Case · Financial Valuations Tivaco · Сингапур top-5% damages-эксперты в мире · $15B+ в оценённых активах

Метрики из финансовой отчётности — для досудебного аудита бизнеса

~10 документов за ~5 минут вместо нескольких дней на один. У каждой цифры — цитата, страница, объяснение

high-stakes valuations traceability

Подробнее→

Case · Aviation On-Device Overwatch AI · US Techstars · Startup of the Year — Aviation Festival Asia

On-device RAG для пилотов + агентная система для наземных служб

Techstars · Startup of the Year на Aviation Festival Asia · пилот с крупнейшей европейской авиакомпанией · два AI-инженера в штат

on-device offline RAG aviation

Подробнее→

Case · Tenders / Pipes NDA · РФ

Лидогенерация через парсинг тендеров — с прозрачным скорингом

Узкий поток релевантных лидов вместо «всего реестра». Заходим в проекты даже до оформления тендера

B2B lead-gen tender parsing scoring

Подробнее→

Case · Tenders / Pumps NDA · РФ

Парсинг тендера → подбор насоса по графику → готовое КП в Telegram

Мэтчинг по реальным рабочим характеристикам, не по таблице соответствий. Дни → часы на отклик

B2B automation catalog matching Telegram bot

Подробнее→

Case · Contract Review NDA · полностью локальный контур

Автоматическая сверка договоров — чтобы юрист видел сразу, на что смотреть

Часы → минуты на стандартных классах договоров. Каталог правил — теперь аудируемый артефакт. Под капотом — наш собственный двухчастный engineering pipeline

on-prem local LLM contract review agentic pipeline

Подробнее→

Ещё мы делали

01Аудит агентной системы для известного companion-ботааудит · US
02Автоматизация работы кураторов в онлайн-школе на GetCourseавтоматизация · РФ
03Медицинский Q&A-бот: контролируемые источники, безопасные отказыQ&A
04AI-парсинг HH под критерии HR-агентстваdata extraction · РФ
05Нейроперевод онлайн курса с lipsync: транскрибация → перевод → синтез → губы синхронноmedia pipeline · ID

Как мы работаем

Каждая стадия — точка выхода с готовым артефактом на руках. Можно остановиться, перепланировать или продолжить.

Scope

~дни

Бизнес-задача и границы риска

Цель, стейкхолдеры, ограничения, цена ошибки. Карта домена и flow — на языке заказчика, не инженеров.
PoC

дни–недели

Проверка достижимости

Минимальное ядро на самом рискованном. Если задача в текущей конфигурации не решается — фиксируем это до больших вложений.
Критерии

~неделя

Метрики приёмки + decision log

После PoC фиксируем критерии приёмки и decision log — на основе того, что реально достижимо.
MVP

недели

Рабочая система для пилота

Минимальный набор интеграций. Eval'ы для бизнес-стейкхолдеров — качество в цифрах, понятных вам, а не только нам.
Прод

месяцы

Полная обвязка + handoff

Интерфейсы, мониторинги, eval'ы как инструмент дальнейшего развития. Передача в команду заказчика.

[ Handoff ]

Что у вас остаётся

Полный пакет — код, процесс, инструменты для развития системы.

Код

В репозитории заказчика

Decision log

Зачем сделано именно так

Eval-suite

Чтобы выпускать новые версии без страха

Мониторинги

Качество системы в проде

Описание процесса

Analysis + engineering pipeline

Onboarding

Сессии для вашей команды

Поддержка

Опционально — ежемесячный ретейнер на итерации, апгрейды и архитектурные вопросы

Найм

Опционально — помощь со штатными AI-инженерами

Вы получаете продукт вместе с процессом, который ваша команда сможет развивать сама.

Кто за это отвечает

RoleFounder · Custom AI Engineering

Pastex-AI Architect · CodeSignal (US HRTech)

Tenure8 лет в индустрии · 4+ AI-native

GeoЕреван · работа во всех юрисдикциях

[ Founder · Grably Tech ]

Коля Шейко

Веду всё общение с заказчиком от сбора требований до приёмки. Сам строю AI-архитектуру и контролирую техническое выполнение. Под специфичные задачи подбираю экспертов из нетворка

Что ещё:

a.Ко-фаундер entropy.talk — крупнейшие онлайн-конференции по ИИ на русском (до 5K зрителей)
b.Автор Telegram-канала «AI и грабли» — про реальную инженерию AI-продуктов без хайпа
c.Автор курса aiforwork.courses — для не-разработчиков, которые хотят отдать рутину агентам
d.Лектор по Computer Science в университете Еревана

[ Мы в медиа ]

a.AI Hard Fork — Обучение, найм и увольнение в эпоху ИИ-агентовYouTube ↗
b.Podlodka AI Crew — Субагенты: собираем виртуальную командуYouTube ↗
c.VAMI — 3 ошибки при внедрении ИИ в разработкуYouTube ↗
d.R77 AI — RAG без ембединговTG ↗YouTube ↗
e.NGI — Управление контекстом LLMTG ↗YouTube ↗
f.AI Dev Conf 2025 — Сценарии развития рынка разработкиsite ↗YouTube ↗

FAQ

У нас обычно спрашивают на первой встрече

[ 09 Q / A ]

Q01У нас регулируемый домен — вы с этим работаете?+

Да. У нас два контура: SOC2-облако (Vertex AI / Azure) — с data residency, access policies и аудитом — и полностью локальный (on-prem, локальные модели, без внешних API). Кейс 05 — целиком на локальном контуре, ни строки договора не уходит наружу.

Q02У нас уже есть AI-команда. Чем вы отличаетесь?+

Мы строим продукт вместе с процессом его развития: eval'ы под бизнес-метрики, мониторинги, decision log. Держим руку на пульсе индустрии за счёт сообщества вокруг entropy.talk. В наших кейсах систему клиента нередко удаётся упростить в ~10 раз без потери точности. Если ваша команда уже это умеет — мы не нужны. Если хочется, чтобы умела — поможем нанять людей в штат и поставить процесс.

Q03Что значит «не оставляете чёрный ящик»?+

Код в репозитории, decision log (зачем сделано так), eval-suite (чтобы выпускать новые версии без страха), мониторинги, описание процесса (analysis + engineering pipeline), onboarding-сессии. По желанию — помощь с наймом. Цель: через ~3 месяца после релиза мы вам не нужны для ежедневной работы. Только для следующих больших итераций.

Q04Можно on-prem или on-device?+

Да, оба варианта. On-prem делаем сами (кейс 05); по российскому рынку есть проверенный партнёр для случаев, когда нужны их компетенции по железу и compliance. On-device — кейс 02 авиации: RAG-ассистент на iPad без интернета.

Q05Что с данными — PII, NDA, регуляторика?+

NDA — до обсуждения деталей. Дальше три режима: чувствительные данные → локальный контур (on-prem, локальные модели, без внешних API); нужна мощность foundation-моделей → SOC2-cloud (Vertex AI / Azure) без обучения на ваших данных; публичные данные → без ограничений. Какой режим — решаем на PoC под ваш compliance.

Q06Сколько по времени?+

Почти всегда разбиваем проект на стадии — это снижает риски и расходы заказчика на ранних этапах.

PoC — дни и недели. Первая стадия — проверка технической осуществимости задачи на минимальных вложениях. Убираем продакшн-обвязку, строим только AI-core, проверяем достижимость требований по точности. Если задача в текущей конфигурации не решается — фиксируем это до больших инвестиций.

MVP — недели. Когда осуществимость подтверждена — собираем рабочую систему с минимальным набором интеграций для пилотного использования.

Продакшн — месяцы. Полная обвязка: интерфейсы, интеграции, мониторинги, eval'ы для дальнейшего развития.

Дополнительно: мы сами активно используем AI-инструменты для разработки последние ~4 года и получаем сопоставимое качество в 2–4 раза быстрее команд, только начинающих с ними работать.

Q07Где вы и в каких юрисдикциях работаете?+

Юрлица в РФ и Армении. Работаем во всех юрисдикциях. Действующие клиенты — Сингапур, США, ЕС, РФ, Индонезия. Контракт — под удобный вам периметр.

Q08У нас уже есть прототип — сможете доделать?+

Технически да. Но в большинстве случаев доделывать существующий прототип заказчику невыгоднее, чем переписать: дольше по срокам, дороже по деньгам и менее надёжно по результату — обычно в нём уже зашиты неверные архитектурные решения, и чинить их выходит дороже, чем сделать правильно с нуля.

Стандартный сценарий: существующая система используется как референс требований и как генератор тестовых данных для новой — то есть мы не берём данные «непонятно откуда», а гоняем новую систему на реальных входах и выходах старой. Интеграции и сами данные переиспользуем, ядро пишем заново.

Q09Что значит «помогаете нанять»? Вы рекрутёры?+

Мы не рекрутёры в классическом смысле. Помогаем там, где ломается технический найм AI-инженеров: дизайн самой роли (AI-инженер vs AI-native разработчик — это разные люди), дизайн технических собеседований (опыт с CodeSignal), проведение интервью или обучение ваших разработчиков их проводить. Плюс network в русскоязычном AI-сообществе.

Если у вас задача,
которую страшно отдавать AI —
нам интересно.

Напишите ваш кейс. Разбираем контекст, оцениваем границы, договариваемся о PoC. PoC обычно занимает дни или недели — так мы снижаем ваши риски на старте.

Telegram → t.me/nikolay_sheyko ↗ Email → nikolay.sheyko@grably.tech ↗

Кастомная разработка продуктов с LLM под капотом — для задач, которые обходятся дорого

Что мы делаем

LLM-продукты под ключ

Автоматизация B2B продаж

RAG / Agentic Search

On-device и edge

Engineering process для AI-команд

Обучение

Кейсы

Ещё мы делали

Как мы работаем

Бизнес-задача и границы риска

Проверка достижимости

Метрики приёмки + decision log

Рабочая система для пилота

Полная обвязка + handoff

Что у вас остаётся

Кто за это отвечает

FAQ

Если у вас задача, которую страшно отдавать AI — нам интересно.

Кастомная разработка
продуктов с LLM под капотом —
для задач, которые обходятся дорого

Если у вас задача,
которую страшно отдавать AI —
нам интересно.