Практический гайд по настройке единого входа (SSO) для ML-стека (JupyterHub, MLflow, Airflow) с использованием Keycloak, включающий примеры интеграции RBAC и управления токенами.
Тонкости обновления драйверов NVIDIA в Yandex Managed Kubernetes
7 626
9
DevOps
Инструкция по обновлению драйверов NVIDIA в Yandex Managed Kubernetes: от ручного способа через привилегированные поды до автоматизации с помощью DaemonSet для решения конфликтов версий CUDA.
GitOps для Airflow: как мы перешли на лёгкий K8s-native Argo Workflows
5 911
20
1
DevOps
Опыт миграции ML-пайплайнов с Airflow на Kubernetes-native стек на базе Argo Workflows и Argo CD с примерами манифестов и разбором преимуществ GitOps-подхода для масштабирования.
Я управляю тестированием ИИ-моделей 4 года. Что я понял за это время?
12 517
30
3
DevOps
Ретроспектива выстраивания процессов QA для ML-моделей с нуля: от ручных проверок и нагрузочного тестирования до полной автоматизации на pytest и Allure с советами по организации команды.
Firezone, или как спрятать свою инфраструктуру от посторонних глаз
6 200
56
3
Гайды
DevOps
Защитить инфраструктуру и обеспечить коллегам бесперебойный доступ к глобальным сервисам? Еще и с помощью решения с открытым исходным кодом? Легко. Делимся опытом использования Firezone