AI-платформа · закрытый контур · 152-ФЗ

AI-платформа
для закрытого
контура

Запускайте собственные AI-решения поверх корпоративных данных с полным контролем качества, безопасности и бюджета. Агенты, данные, LLM — в одном стеке.

Посмотреть демо

Качество

94–95% на поисковых задачах

Деплой

От 1× H100 или в российском облаке

Комплаенс

152-ФЗ

Лицензия

С исходным кодом, без привязки к вендору

Три слоя — один стек

Три платформы
в одном контуре

Каждая новая AI-инициатива в компании заново решает один и тот же набор задач: где взять модель, как её безопасно вызвать, подключить корпоративные данные, собрать и развернуть агента в продакшене. Мы разнесли эти задачи на три связанные платформы. Каждая работает самостоятельно и предоставляет API соседним слоям.

01 · Верхний слой

Агентская
платформа

Быстрый сбор и деплой агентов с надёжным исполнением, участием оператора, наблюдаемостью и оценкой качества перед релизом.

Подробнее

02 · Средний слой

Платформа
данных

Превращает корпоративные документы, справочники и таблицы в инструменты для агентов: RAG, графовый поиск, табличный доступ, валидация и RBAC.

Подробнее

03 · Нижний слой

LLM-
платформа

Единый шлюз ко всем моделям: on-prem, российские облака, мировые SOTA. ПДн-роутер, гардрейлы, бюджеты, аудит.

Подробнее

Архитектура

Один контур, единый ID,
три слоя

Всё развёрнуто в закрытом контуре заказчика. Идентичность и RBAC насквозь — от клика пользователя в UI до вызова внешней модели через proxy. Деплой агентов и инструментов — из GitLab CI.

Пользователь · OIDC · HTTP

User Interface

Open WebUI · чат-боты · ваши системы

Точки входа конечных пользователей. Аутентификация через корпоративный SSO.

Агентская платформа

Платформа данных

Агентская платформа

Dev / CI

GitLab

Репо агентов и пайплайнов. Деплой через GitLab CI.

User Agents

Router · QA · Doc · Broker

Хранение состояния. Агенты ходят в Tools и вызывают друг друга через Broker.

Платформа данных

Tools

Doc Pipeline · Retrieve · MCP · APIs

RAG-индекс, реранкинг, S3, RBAC. MCP-серверы для разных источников.

Контур данных

XWiki · DWH · File shares · S3

Источники подключаются к Tools без дублирования.

ЛЛМ-платформа

LLMs · Закрытый контур

GoLLM gateway (наш) · vLLM Qwen3 · Guardrails · Langfuse · OIDC · Admin

Единый OpenAI-совместимый API. Qwen3 35B на 1× H100 и Qwen3 235B на 8× H100. LoRA-адаптеры с горячей подгрузкой. ПДн-роутер решает, куда уходит запрос.

Внешний контур · только без ПДн

Российские облака

YandexGPT · GigaChat · Cloud.ru · Selectel

Внешний контур · только без ПДн

Мировые SOTA

OpenAI · Anthropic · Google · DeepSeek · Qwen Cloud

Слой 01 · Верхний

Агентская
платформа

Превращает сборку нового агента из «проекта на квартал» в «деплой за пару часов».

Быстрый старт и деплой

Шаблоны под основные классы задач, деплой по коммиту через GitLab CI.

Надёжность исполнения

Повторные попытки и идемпотентность на каждом шаге, устойчивое исполнение для долгих сценариев.

Мультиагентное взаимодействие

Взаимодействие агентов друг с другом и с человеком — оркестрация каскадов и точки остановки для подтверждения оператора.

Наблюдаемость

Трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу.

Оценка качества

Регрессионные прогоны и сравнение метрик между промптами и моделями перед релизом.

Слой 02 · Средний

Платформа
данных

Четыре инструмента под разные типы вопросов — и пятый на качество и безопасность данных.

Классический RAG

Гибридный поиск (BM25 + векторный, BGE-M3 + Reranker). Поддержка PDF, DOCX, XLS — парсинг таблиц и схем.

Графовый RAG

Вдумчивый поиск по многосвязанным данным, где важны связи между фактами, а не отдельные фрагменты.

Табличный доступ

SQL, API, CSV, DWH — подключаются как инструменты через MCP. Без галлюцинирования чисел.

Валидация данных

Подсветка конфликтов и дублей в документах. Строит базу знаний из «свалки» файлов.

RBAC насквозь

Ролевая модель из корпоративной AD / Keycloak на каждом запросе — агент видит только доступные пользователю данные.

Слой 03 · Фундамент

LLM-
платформа

Единый AI-шлюз. Объединяет on-prem, российские облака и мировые SOTA. Закрывает безопасность и бюджеты на уровне инфраструктуры.

Единый шлюз GoLLM

OpenAI-совместимый API для on-prem, российских облаков (YandexGPT / GigaChat / Cloud.ru) и мировых SOTA. В реестре российского ПО.

Безопасность · 152-ФЗ

ПДн-роутер, гардрейлы на вход и выход (prompt injection, jailbreak, toxicity, banned topics), полный аудит.

SSO, RBAC, бюджеты

OIDC / SAML (Keycloak, AD FS), мультитенантность, квоты TPM / RPM, бюджетные лимиты, учёт расходов в реальном времени.

Наблюдаемость

Langfuse, Prometheus, OpenTelemetry — токены, стоимость, латентность, ошибки на каждый запрос.

Инференс в закрытом контуре

Развёртывание моделей on-demand из админки. Разделение GPU-ресурсов между несколькими LLM на одной карте. Горячая подгрузка LoRA-адаптеров без рестарта.

Независимость от вендора

100% open source. Поставка с исходным кодом и неисключительными правами — без привязки к вендору.

Три контура · один API

Куда уходит каждый запрос —
решает ПДн-роутер

Все три контура доступны через одну OpenAI-совместимую точку входа. Решение — в момент запроса, на основании содержимого и политик безопасности заказчика. Аудит каждого решения.

свой контур

GPU
заказчика

vLLM + Qwen3.5 на железе компании. ПДн, конфиденциальные данные, чувствительные коммерческие задачи.

российское облако

Российские
облака

YandexGPT, GigaChat, Cloud.ru. Российская юрисдикция, масштабирование без своих GPU.

за рубежом

Мировые
SOTA

OpenAI, Anthropic, Google, DeepSeek. Только запросы без ПДн, где критично качество SOTA-уровня.

Что вы получаете

Почему это работает
для закрытого контура

Закрытый контур по умолчанию

Все данные обрабатываются внутри периметра компании. За рубеж уходят только запросы без ПДн — и только если политика это разрешает.

100% open source

Без привязки к вендору на компонент. Можно купить по фикс-прайсу с передачей неисключительных прав и поддерживать самим.

Три платформы — один контроль

Единые идентичность (OIDC), RBAC и аудит — от клика пользователя в UI до вызова внешней модели через proxy.

Окупается на потоке, а не на одном кейсе

Архитектура под «завод гипотез» — десятки агентов на одной инфраструктуре. Маржинальная стоимость нового агента снижается с каждой итерацией.

Готовы посмотреть на ваших данных?

Дайте 10 PDF из любого вашего проекта. Через три рабочих дня покажем работающую демку. Сравните качество, замерьте стоимость, примите решение о пилоте.

AI-платформадля закрытогоконтура

Три платформыв одном контуре

Один контур, единый ID,три слоя

Агентскаяплатформа

Платформаданных

LLM-платформа

Куда уходит каждый запрос —решает ПДн-роутер

Почему это работаетдля закрытого контура

Готовы посмотреть на ваших данных?

AI-платформа
для закрытого
контура

Три платформы
в одном контуре

Один контур, единый ID,
три слоя

Агентская
платформа

Платформа
данных

LLM-
платформа

Куда уходит каждый запрос —
решает ПДн-роутер

Почему это работает
для закрытого контура