AI-платформа · закрытый контур · 152-ФЗ

AI-платформа
для закрытого
контура

Запускайте собственных AI-агентов поверх корпоративных данных с полным контролем над качеством, безопасностью и бюджетом. Агенты, данные, ЛЛМ — в одном стеке.

Качество
94–95% на поисковых задачах
Деплой
От 1× H100 или в рос. облаке
Комплаенс
152-ФЗ
Лицензия
С исходным кодом, без привязки к вендору
Три слоя — один стек

Три платформы
в одном контуре.

Каждая новая AI-инициатива в компании заново решает один и тот же набор задач: где взять модель, как её безопасно вызвать, как подключить корпоративные данные, как собрать и развернуть агента в продакшене. Мы разнесли эти задачи в три связанные платформы. Каждая работает самостоятельно и предоставляет API соседним слоям.

Архитектура

Один контур, единый ID,
три слоя.

Всё развёрнуто в закрытом контуре заказчика. Идентичность и RBAC насквозь — от клика пользователя в UI до вызова внешней модели через proxy. Деплой агентов и инструментов — из GitLab CI.

Пользователь · OIDC · HTTP
User Interface
Open WebUI · чат-боты · ваши системы
Точки входа конечных пользователей. Аутентификация через корпоративный SSO.
Агентская платформа
Платформа данных
Агентская платформа
Dev / CI
GitLab
Репо агентов и пайплайнов. Деплой через GitLab CI.
User Agents
Router · QA · Doc · Broker
Хранение состояния. Агенты ходят в Tools и вызывают друг друга через Broker.
Платформа данных
Tools
Doc Pipeline · Retrieve · MCP · APIs
RAG-индекс, реранкинг, S3, RBAC. MCP-серверы для разных источников.
Контур данных
XWiki · DWH · File shares · S3
Источники подключаются к Tools без дублирования.
ЛЛМ-платформа
LLMs · Закрытый контур
GoLLM gateway (наш) · vLLM Qwen3 · Guardrails · Langfuse · OIDC · Admin
Единый OpenAI-совместимый API. Qwen3 35B на 1× H100 и Qwen3 235B на 8× H100. LoRA-адаптеры с горячей подгрузкой. ПДн-роутер решает, куда уходит запрос.
Внешний контур · только без ПДн
Российские облака
YandexGPT · GigaChat · Cloud.ru · Selectel
Внешний контур · только без ПДн
Мировые SOTA
OpenAI · Anthropic · Google · DeepSeek · Qwen Cloud
Слой 01 · Верхний

Агентская
платформа

Превращает сборку нового агента из «проекта на квартал» в «деплой за пару часов».
Быстрый старт и деплой
Шаблоны под основные классы задач, деплой по коммиту через GitLab CI.
Надёжность исполнения
Повторные попытки и идемпотентность на каждом шаге, устойчивое исполнение для долгих сценариев.
Мультиагентное взаимодействие
Взаимодействие агентов друг с другом и с человеком — оркестрация каскадов и точки остановки для подтверждения оператора.
Наблюдаемость
Трассировка всей цепочки: промпты, инструменты, стоимость, латентность по каждому шагу.
Оценка качества
Регрессионные прогоны и сравнение метрик между промптами и моделями перед релизом.
Слой 02 · Средний

Платформа
данных

Четыре инструмента под разные типы вопросов — и пятый на качество и безопасность данных.
Классический RAG
Гибридный поиск (BM25 + векторный, BGE-M3 + Reranker). Поддержка PDF, DOCX, XLS — парсинг таблиц и схем.
Графовый RAG
Вдумчивый поиск по многосвязанным данным, где важны связи между фактами, а не отдельные фрагменты.
Табличный доступ
SQL, API, CSV, DWH — подключаются как инструменты через MCP. Без галлюцинирования чисел.
Валидация данных
Подсветка конфликтов и дублей в документах. Строит базу знаний из «свалки» файлов.
RBAC насквозь
Ролевая модель из корпоративной AD / Keycloak на каждом запросе — агент видит только доступные пользователю данные.
Слой 03 · Фундамент

ЛЛМ-
платформа

Единый AI-шлюз. Объединяет on-prem, российские облака и мировые SOTA. Закрывает безопасность и бюджеты на уровне инфраструктуры.
Единый шлюз GoLLM
OpenAI-совместимый API для on-prem, рос. облаков (YandexGPT / GigaChat / Cloud.ru) и мировых SOTA. В реестре рос. ПО.
Безопасность · 152-ФЗ
ПДн-роутер, гардрейлы на вход и выход (prompt injection, jailbreak, toxicity, banned topics), полный аудит.
SSO, RBAC, бюджеты
OIDC / SAML (Keycloak, AD FS), мультитенантность, квоты TPM / RPM, бюджетные лимиты, учёт расходов в реальном времени.
Наблюдаемость
Langfuse, Prometheus, OpenTelemetry — токены, стоимость, латентность, ошибки на каждый запрос.
Инференс в закрытом контуре
Развёртывание моделей on-demand из админки. Разделение GPU-ресурсов между несколькими LLM на одной карте. Горячая подгрузка LoRA-адаптеров без рестарта.
Независимость от вендора
100% open source. Поставка с исходным кодом и не-исключительными правами — без привязки к вендору.
Три контура · один API

Куда уходит каждый запрос —
решает ПДн-роутер.

Все три контура доступны через одну OpenAI-совместимую точку входа. Решение — в момент запроса, на основании содержимого и политик безопасности заказчика. Аудит каждого решения.

свой контур
GPU
заказчика

vLLM + Qwen3.5 на железе компании. ПДн, конфиденциальные данные, чувствительные коммерческие задачи.

рос. облако
Российские
облака

YandexGPT, GigaChat, Cloud.ru. Российская юрисдикция, масштабирование без своих GPU.

за рубежом
Мировые
SOTA

OpenAI, Anthropic, Google, DeepSeek. Только запросы без ПДн, где критично качество SOTA-уровня.

Что вы получаете

Почему это работает
для закрытого контура.

01
Закрытый контур по умолчанию

Все данные обрабатываются внутри периметра компании. За рубеж уходят только запросы без ПДн — и только если политика это разрешает.

02
100% open source

Без привязки к вендору на компонент. Можно купить по фикс-прайсу с передачей не-исключительных прав и поддерживать самим.

03
Три платформы — один контроль

Единая идентичность (OIDC), единый RBAC, единый аудит — от клика пользователя в UI до вызова внешней модели через proxy.

04
Окупается на потоке, а не на одном кейсе

Архитектура под «завод гипотез» — десятки агентов на одной инфраструктуре. Маржинальная стоимость нового агента снижается с каждой итерацией.

Готовы посмотреть на ваших данных?

Дайте 10 PDF из любого вашего проекта. Через три рабочих дня покажем работающую демку. Сравните качество, замерьте стоимость, примите решение о пилоте.