Pull to refresh

MLOps без боли в облаке: как развернуть Kubeflow в продакшен-кластере Kubernetes

Reading time10 min
Views8.2K

Новые экспериментальные модели машинного обучения важно быстро разворачивать в продакшене, иначе данные устареют и появятся проблемы воспроизводимости экспериментов. Но не всегда это можно сделать быстро, так как часто процесс передачи модели от Data Scientist к Data Engineer плохо налажен. Эту проблему решает подход MLOps, но, чтобы его реализовать, нужны специальные инструменты, например Kubeflow.

При этом установка и настройка Kubeflow — довольно непростой процесс. Хотя существует официальная документация, она не описывает, как развернуть Kubeflow в продакшен-варианте, а не просто на тестовой локальной машине. Также в некоторых инструкциях встречаются проблемы, которые нужно обходить и искать их решения.

Я Александр Волынский, архитектор облачной платформы Mail.ru Cloud Solutions. В этой статье познакомлю вас с Kubeflow на базовом уровне и покажу, как его разворачивать. Мы не будем подробно знакомиться со всеми компонентами Kubeflow, потому что это выходит за рамки базового ознакомления.

Читать далее
Total votes 30: ↑29 and ↓1+28
Comments4

Построение ML-пайплайна для рекомендательной системы с помощью Google Cloud Platform

Level of difficultyMedium
Reading time11 min
Views1.6K

Построение ML-пайплайна для рекомендательной системы с помощью Google Cloud Platform

Данный материал будет описывать опыт нашей команды по построению end-to-end рекомендательной ML-системы визуального поиска похожих товаров с помощью инструментов, предоставляемых облачной платформой Google Cloud Platform (далее –  GCP) и структурно будет состоять из трех частей, описывающих три этапа разработки: от простой реализации задачи к более сложной, или точнее – из двух с половиной, так как второй этап оказался не жизнеспособным, но обо всем по порядку.

Читать далее
Total votes 1: ↑1 and ↓0+1
Comments0

Злоумышленники атаковали ноды Microsoft Azure для майнинга криптовалюты

Reading time2 min
Views5.3K

Компания Microsoft сообщила о кибератаках на ноды облачного сервиса Microsoft Azure. Злоумышленники добывали за счёт сервиса криптовалюту Monero.

Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments0

Вебинар «MLOps без боли. Разворачиваем Kubeflow» 22 декабря от Mail.ru Cloud Solutions

Reading time2 min
Views1.1K


Когда количество проектов переваливает за разумные пределы, управлять инфраструктурой для машинного обучения становится сложно. Здесь на помощь приходит MLOps — современный подход к автоматизации работы аналитика данных. С ним легко эффективно выстроить процессы работы с технологиями машинного обучения, чтобы они приносили пользу бизнесу.

22 декабря (вторник) присоединяйтесь к вебинару «MLOps без боли в облаке MCS #1: Разворачиваем Kubeflow. Простые масштабируемые воркфлоу для ML на Kubernetes», где мы расскажем, как создавать индивидуальные окружения для тестирования: с гибкой настройкой, используя Docker и Kubernetes, — а также решить проблему воспроизводимости экспериментов. Присоединяйтесь!
Подробнее о вебинаре
Total votes 6: ↑5 and ↓1+4
Comments0

Kubeflow: новый проект для работы с машинным обучением в Kubernetes

Reading time3 min
Views11K
Разработчики Google объявили о запуске нового проекта Kubeflow. Проект упрощает работу с машинным обучением, предоставляя необходимый инструментарий для масштабирования и настройки системы в среде Kubernetes. В статье расскажем:

  • о компонентах Kubeflow;
  • как начать работу с решением;
  • о перспективах проекта.

Читать дальше →
Total votes 19: ↑17 and ↓2+15
Comments0

OpenShift 4.5, лучшие практики edge-разработки и горы полезных книг и ссылок

Reading time2 min
Views2.6K


Полезные ссылки на живые мероприятия, видео, митапы, техтолки и книги – ниже в нашем еженедельном посте.
Читать дальше: OpenShift 4.5, лучшие практики edge-разработки и горы полезных книг и ссылок
Total votes 3: ↑3 and ↓0+3
Comments0

Red Hat Flatpak, DevNation Day, шпаргалка по программированию на Cи и пять вебинаров на русском

Reading time3 min
Views2K


Полезные ссылки на живые мероприятия, видео, митапы, техтолки и книги – ниже в нашем еженедельном посте.
Читать дальше: Red Hat Flatpak, DevNation Day, шпаргалка по программированию на Cи и ...
Total votes 1: ↑1 and ↓0+1
Comments0

Как работать с Big Data быстрее и эффективнее: Kubernetes для Data Science

Reading time10 min
Views9.5K


Big Data by Batjorge


Традиционный подход к построению работы с большими данными — развернуть Hadoop-кластер, установить дополнительные инструменты и построить на нем платформу для работы с данными. Но в таком подходе есть несколько ограничений, вроде невозможности разделения Storage- и Compute-слоев, сложностей масштабирования и изоляции сред для разных приложений. Даже несмотря на то, что Hadoop можно арендовать у облачного провайдера как сервис (aaS), такой подход все равно мало чем отличается от развертывания на собственном оборудовании.


Однако есть другой, Cloud-Native подход работы с большими данными. Он позволяет решить эти проблемы, а также получить дополнительные возможности от облачных технологий. Для этого используют Kubernetes, интегрируя его с различными инструментами.


Я Александр Волынский, архитектор облачной платформы Mail.ru Cloud Solutions. Расскажу, как Kubernetes помогает в работе с Big Data, какие используются инструменты и какие преимущества можно получить по сравнению с классическим развертыванием.


Также вы можете посмотреть видеовыступление на митапе «Большие данные: не хайп, а индустрия».
Читать дальше →
Total votes 17: ↑17 and ↓0+17
Comments4

Программа PyCon Russia: чем живет python-сообщество в 2021

Reading time4 min
Views2.3K

8-й по счету PyCon Russia пройдет 5-6 сентября в Клязьма Резорт. Как всегда, встречаемся старой и новой тусовкой питонистов, отдыхаем на природе, поем песни под гитару и пиво, слушаем, какие проекты и как пилят в разных компаниях, и прокачиваемся на мастер-классах.

В этом году программу разделили на 2 тематики: разработка на python и ML& Data Science. 

Смотрите, чем живет и куда двигается python-сообщество.

Читать далее
Total votes 3: ↑3 and ↓0+3
Comments0

Вебинар «Deploying deep learning models with Kubernetes and Kubeflow»

Reading time1 min
Views1.1K

Команда Data Phoenix Events приглашает всех завтра, 8 сентября в 17:00, на третий вебинар из серии "The A-Z of Data", который будет посвящен деплою deep learning моделей при помощи Kubernetes и Kubeflow.

Читать далее
Total votes 1: ↑0 and ↓1-1
Comments1

Что такое Kubeflow? Основы машинного обучения с Kubeflow

Reading time4 min
Views10K

У фотографов есть Photoshop, у архитекторов — AutoCAD, а у инженеров машинного обучения — Kubeflow. Каждый получает свои преимущества от использования специализированного программного обеспечения, инженеры ML — не исключение.


В этой статье разберем чем полезен и как работает Kubeflow.

Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments0

Опыт внедрения Kubeflow в кластере Kubernetes

Reading time17 min
Views4.1K

В статье мы рассказали о внедрении ML-платформы Kubeflow в кластере Kubernetes на площадке заказчика. 

Инструменты, которые мы использовали в рамках проекта, являются программным обеспечением с открытым исходным кодом, поддерживаются авторами и сообществом. Платформа виртуализации - Hyper-V.

Инструменты, созданные для облаков, не всегда быстро и легко разворачиваются, а предугадать все риски невозможно. В статье мы рассказали про поиск подходящей архитектуры, подбор версий компонентов, общие технические аспекты установки кластера Kubernetes и настройки Kubeflow. Мы описали исследование и опыт внедрения, выделив проблемные места и моменты, на которые стоит обратить внимание.

Читать далее
Total votes 5: ↑3 and ↓2+1
Comments2

Open Source для MLOps: сравнение популярных решений

Reading time6 min
Views4.2K


Здравствуй, Хабр! Меня зовут Александр Волынский, я занимаюсь разработкой ML Platform в VK Cloud. Наша ML-платформа стала доступна пользователям совсем недавно, некоторые из её компонентов сейчас находятся на этапе бета-тестирования. В этой статье я расскажу, как мы выбирали Open-Source-инструменты для MLOps-платформы, какие решения сравнивали, на каком варианте остановили выбор и почему. 
Читать дальше →
Total votes 39: ↑39 and ↓0+39
Comments0

Kubeflow: учимся устанавливать и запускать Kubeflow на локальной машине

Reading time6 min
Views3.5K
Пошаговое руководство по установке и конфигурированию всех компонентов kubeflow на локальной машине.

image
Рис. 1. Взаимодействие Kubeflow и Kubernetes | рисунок автора |иконки от Eucalyp

Kubeflow [1] – это созданная Google опенсорсная платформа, на которой разворачивается весь жизненный цикл разрабатываемой модели машинного обучения. Kubeflow представляет собой инструментарий, каждый компонент которого применяется для отработки каждой из стадий жизненного цикла при машинном обучении, а именно: исследования данных, конструирования признаков, преобразования признаков, обучения модели, оценки модели, тонкой настройки модели, предоставления модели и версионирования модели. Главный атрибут kubeflow заключается в том, что он предназначен для работы на базе kubernetes [2]. Таким образом, kubeflow пользуется именно теми преимуществами, которые предоставляет кластер kubernetes, в частности, оркестрацией контейнеров и автомасштабированием.
Читать дальше →
Total votes 15: ↑14 and ↓1+13
Comments1

Взгляд с высоты на современные инструменты MLOps

Reading time10 min
Views1.7K

MLOps относится к практике интеграции машинного обучения в жизненный цикл разработки программного обеспечения, которая направлена на повышение эффективности и результативности разработки и развертывания машинного обучения за счет автоматизации и оптимизации различных связанных задач.

Для MLOps обычно используются несколько инструментов и фреймворков, каждый из которых имеет свои преимущества и недостатки. В этой статье приведем примеры популярных инструментов MLOps и краткий обзор их основных функций, включая краткий гайд о настройке и запуска пайплайна.

Читать далее
Total votes 9: ↑7 and ↓2+5
Comments1

Как упаковывать и дистрибутировать модели машинного обучения с помощью MLFlow

Reading time11 min
Views8.5K

MLFlow - это инструмент для управления всеми стадиями жизненного цикла модели машинного обучения. Более того, в статье рассматриваются вопросы инсталляции и настройки службы MLFlow, а также приводятся примеры создания и совместного использования проектов с помощью MLFlow.

На каждом этапе разработки жизненного цикла ML-модели одним из основных видов деятельности является сотрудничество. Прохождение пути ML-модели от концепции до внедрения (деплоя) требует участия и взаимодействия различных функций, вовлеченных в создание модели. Кроме того, природа разработки ML-модели включает в себя проведение экспериментов, отслеживание артефактов и метрик, версий модели и т.д., что требует эффективной организации для корректной поддержки жизненного цикла ML-модели.

К счастью, существуют инструменты для разработки и обеспечения жизненного цикла модели, такие как MLflow. В этой статье мы расскажем о MLflow, его основных компонентах и характеристиках. А также приведем примеры, показывающие, как MLflow работает на практике.

Читать далее
Total votes 11: ↑10 and ↓1+9
Comments2

Челленджи деплоя, сетевых политик и планировщика: как мы внедряли ML-платформу Kubeflow

Reading time7 min
Views1.8K


Kubeflow — фреймворк на базе Kubernetes, который помогает быстро запускать модели машинного обучения. Мы в VK решили внедрить его в свои рабочие процессы и столкнулись с некоторыми трудностями.

Меня зовут Федюнин Андрей, я системный инженер в команде платформы, которая предоставляет разработчикам Kubernetes для запуска приложений, и отвечаю за ML-кластер в нашей команде. Сегодня расскажу, зачем и как мы внедряли Kubeflow, как решали проблемы и к чему пришли.
Читать дальше →
Total votes 31: ↑31 and ↓0+31
Comments0

Как переехать на Kubeflow в качестве ML-платформы?

Reading time11 min
Views3.1K

Привет, Хабр! В этом материале мы поделимся докладом Сергея Савватеева о переходе сервиса Mediascope на Kubeflow, который он подготовил к ML MeetUp.

Поговорим о роли команды в компании, как был устроен процесс разработки до перехода на Kubeflow. Разберем подробно сам переход, какие архитектурные решения принимались. С какими сложностями столкнулись и какие наметили шаги.
Читать дальше →
Total votes 39: ↑39 and ↓0+39
Comments0

Инструменты для MLOps: выбираем между вендорскими и Open Source-решениями

Reading time9 min
Views4.5K


MLOps использует проверенные методы DevOps для автоматизации создания, развертывания и мониторинга конвейеров ML в производственной среде. По мере развития MLOps-инструментов для работы с ним становится больше — как проприетарных, так и Open Source. Из этого разнообразия часто сложно выбрать стек для своего проекта.

Меня зовут Александр Волынский, я технический менеджер Cloud ML Platform в VK Cloud. В этой статье я сравню подходы к работе с MLOps на основе Open Source и проприетарного ПО и расскажу, какие инструменты и почему мы выбрали для Cloud ML Platform.
Читать дальше →
Total votes 42: ↑42 and ↓0+42
Comments3

MLOps-платформа Dognauts для разработки и эксплуатации ML-моделей. Часть 1: предыстория создания

Level of difficultyMedium
Reading time10 min
Views2.3K

Добрый день! Меня зовут Евгений Овчинцев, я работаю в компании Neoflex и в настоящее время являюсь архитектором продукта Dognauts. В данной серии статей я планирую рассказать о том, как создавался и развивался продукт: почему принимались те или иные решения, с какими проблемами пришлось столкнуться и что из всего этого получилось. 

Читать далее
Total votes 6: ↑5 and ↓1+4
Comments1
1