Search results for «[kubeflow]» / Habr

Publications Hubs Companies Users Comments

volinski Mar 17 2021 at 18:02

MLOps без боли в облаке: как развернуть Kubeflow в продакшен-кластере Kubernetes

10 min

8.2K

VK corporate blogMachine learning*DevOps*Kubernetes*Data Engineering*

Tutorial

Новые экспериментальные модели машинного обучения важно быстро разворачивать в продакшене, иначе данные устареют и появятся проблемы воспроизводимости экспериментов. Но не всегда это можно сделать быстро, так как часто процесс передачи модели от Data Scientist к Data Engineer плохо налажен. Эту проблему решает подход MLOps, но, чтобы его реализовать, нужны специальные инструменты, например Kubeflow.

При этом установка и настройка Kubeflow — довольно непростой процесс. Хотя существует официальная документация, она не описывает, как развернуть Kubeflow в продакшен-варианте, а не просто на тестовой локальной машине. Также в некоторых инструкциях встречаются проблемы, которые нужно обходить и искать их решения.

Я Александр Волынский, архитектор облачной платформы Mail.ru Cloud Solutions. В этой статье познакомлю вас с Kubeflow на базовом уровне и покажу, как его разворачивать. Мы не будем подробно знакомиться со всеми компонентами Kubeflow, потому что это выходит за рамки базового ознакомления.

+28

neoflex Oct 13 2023 at 14:27

Построение ML-пайплайна для рекомендательной системы с помощью Google Cloud Platform

Medium

11 min

1.6K

Neoflex corporate blogPython*Google Cloud Platform*Cloud services*

Review

Построение ML-пайплайна для рекомендательной системы с помощью Google Cloud Platform

Данный материал будет описывать опыт нашей команды по построению end-to-end рекомендательной ML-системы визуального поиска похожих товаров с помощью инструментов, предоставляемых облачной платформой Google Cloud Platform (далее – GCP) и структурно будет состоять из трех частей, описывающих три этапа разработки: от простой реализации задачи к более сложной, или точнее – из двух с половиной, так как второй этап оказался не жизнеспособным, но обо всем по порядку.

AnnieBronson Jun 16 2020 at 14:51

Злоумышленники атаковали ноды Microsoft Azure для майнинга криптовалюты

2 min

5.3K

Information Security*Microsoft Azure*Cryptocurrencies

Компания Microsoft сообщила о кибератаках на ноды облачного сервиса Microsoft Azure. Злоумышленники добывали за счёт сервиса криптовалюту Monero.

Читать дальше →

AnnaPhc Dec 11 2020 at 17:05

Вебинар «MLOps без боли. Разворачиваем Kubeflow» 22 декабря от Mail.ru Cloud Solutions

2 min

1.1K

VK corporate blogVirtualization*Machine learning*Kubernetes*Data Engineering*

Когда количество проектов переваливает за разумные пределы, управлять инфраструктурой для машинного обучения становится сложно. Здесь на помощь приходит MLOps — современный подход к автоматизации работы аналитика данных. С ним легко эффективно выстроить процессы работы с технологиями машинного обучения, чтобы они приносили пользу бизнесу.

22 декабря (вторник) присоединяйтесь к вебинару «MLOps без боли в облаке MCS #1: Разворачиваем Kubeflow. Простые масштабируемые воркфлоу для ML на Kubernetes», где мы расскажем, как создавать индивидуальные окружения для тестирования: с гибкой настройкой, используя Docker и Kubernetes, — а также решить проблему воспроизводимости экспериментов. Присоединяйтесь!

Подробнее о вебинаре

it_man Jan 21 2018 at 17:00

Kubeflow: новый проект для работы с машинным обучением в Kubernetes

3 min

11K

CloudMTS corporate blogSystem administration*Programming*Virtualization*Machine learning*

Разработчики Google объявили о запуске нового проекта Kubeflow. Проект упрощает работу с машинным обучением, предоставляя необходимый инструментарий для масштабирования и настройки системы в среде Kubernetes. В статье расскажем:

о компонентах Kubeflow;
как начать работу с решением;
о перспективах проекта.

Читать дальше →

+15

redhatrussia Aug 10 2020 at 10:05

OpenShift 4.5, лучшие практики edge-разработки и горы полезных книг и ссылок

2 min

2.6K

Red Hat corporate blogOpen source*Studying in ITCloud services*Openshift*

Полезные ссылки на живые мероприятия, видео, митапы, техтолки и книги – ниже в нашем еженедельном посте.

Читать дальше: OpenShift 4.5, лучшие практики edge-разработки и горы полезных книг и ссылок

redhatrussia Aug 27 2020 at 15:40

Red Hat Flatpak, DevNation Day, шпаргалка по программированию на Cи и пять вебинаров на русском

3 min

Red Hat corporate blogOpen source*Development for Linux*Studying in ITCloud services*

Полезные ссылки на живые мероприятия, видео, митапы, техтолки и книги – ниже в нашем еженедельном посте.

Читать дальше: Red Hat Flatpak, DevNation Day, шпаргалка по программированию на Cи и ...

volinski Jun 28 2021 at 09:48

Как работать с Big Data быстрее и эффективнее: Kubernetes для Data Science

10 min

9.5K

VK corporate blogCloud computing*Big Data*Kubernetes*Data Engineering*

Big Data by Batjorge

Традиционный подход к построению работы с большими данными — развернуть Hadoop-кластер, установить дополнительные инструменты и построить на нем платформу для работы с данными. Но в таком подходе есть несколько ограничений, вроде невозможности разделения Storage- и Compute-слоев, сложностей масштабирования и изоляции сред для разных приложений. Даже несмотря на то, что Hadoop можно арендовать у облачного провайдера как сервис (aaS), такой подход все равно мало чем отличается от развертывания на собственном оборудовании.

Однако есть другой, Cloud-Native подход работы с большими данными. Он позволяет решить эти проблемы, а также получить дополнительные возможности от облачных технологий. Для этого используют Kubernetes, интегрируя его с различными инструментами.

Я Александр Волынский, архитектор облачной платформы Mail.ru Cloud Solutions. Расскажу, как Kubernetes помогает в работе с Big Data, какие используются инструменты и какие преимущества можно получить по сравнению с классическим развертыванием.

Также вы можете посмотреть видеовыступление на митапе «Большие данные: не хайп, а индустрия».

Читать дальше →

+17

kate_shlyakhova Jul 26 2021 at 13:52

Программа PyCon Russia: чем живет python-сообщество в 2021

4 min

2.3K

IT-People corporate blogPython*Django*Conferences

8-й по счету PyCon Russia пройдет 5-6 сентября в Клязьма Резорт. Как всегда, встречаемся старой и новой тусовкой питонистов, отдыхаем на природе, поем песни под гитару и пиво, слушаем, какие проекты и как пилят в разных компаниях, и прокачиваемся на мастер-классах.

В этом году программу разделили на 2 тематики: разработка на python и ML& Data Science.

Смотрите, чем живет и куда двигается python-сообщество.

m31 Sep 7 2021 at 12:14

Вебинар «Deploying deep learning models with Kubernetes and Kubeflow»

1 min

1.1K

Big Data*Machine learning*ConferencesDevOps*Artificial Intelligence

Команда Data Phoenix Events приглашает всех завтра, 8 сентября в 17:00, на третий вебинар из серии "The A-Z of Data", который будет посвящен деплою deep learning моделей при помощи Kubernetes и Kubeflow.

-1

SITibekin Sep 27 2021 at 06:20

Что такое Kubeflow? Основы машинного обучения с Kubeflow

4 min

10K

Nixys corporate blogSystem administration*IT Infrastructure*DevOps*

Translation

У фотографов есть Photoshop, у архитекторов — AutoCAD, а у инженеров машинного обучения — Kubeflow. Каждый получает свои преимущества от использования специализированного программного обеспечения, инженеры ML — не исключение.

В этой статье разберем чем полезен и как работает Kubeflow.

Читать дальше →

shut0v Nov 12 2021 at 12:44

Опыт внедрения Kubeflow в кластере Kubernetes

17 min

4.1K

GlowByte corporate blog

В статье мы рассказали о внедрении ML-платформы Kubeflow в кластере Kubernetes на площадке заказчика.

Инструменты, которые мы использовали в рамках проекта, являются программным обеспечением с открытым исходным кодом, поддерживаются авторами и сообществом. Платформа виртуализации - Hyper-V.

Инструменты, созданные для облаков, не всегда быстро и легко разворачиваются, а предугадать все риски невозможно. В статье мы рассказали про поиск подходящей архитектуры, подбор версий компонентов, общие технические аспекты установки кластера Kubernetes и настройки Kubeflow. Мы описали исследование и опыт внедрения, выделив проблемные места и моменты, на которые стоит обратить внимание.

volinski Oct 24 2022 at 14:57

Open Source для MLOps: сравнение популярных решений

6 min

4.2K

VK corporate blogOpen source*Cloud computing*DevOps*Cloud services*

Здравствуй, Хабр! Меня зовут Александр Волынский, я занимаюсь разработкой ML Platform в VK Cloud. Наша ML-платформа стала доступна пользователям совсем недавно, некоторые из её компонентов сейчас находятся на этапе бета-тестирования. В этой статье я расскажу, как мы выбирали Open-Source-инструменты для MLOps-платформы, какие решения сравнивали, на каком варианте остановили выбор и почему.

Читать дальше →

+39

Shyhartskoi Feb 1 2023 at 17:01

Kubeflow: учимся устанавливать и запускать Kubeflow на локальной машине

6 min

3.5K

Timeweb Cloud corporate blogDevelopment for MacOS*Machine learning*Kubernetes*

Tutorial

Translation

Пошаговое руководство по установке и конфигурированию всех компонентов kubeflow на локальной машине.

Рис. 1. Взаимодействие Kubeflow и Kubernetes | рисунок автора |иконки от Eucalyp

Kubeflow [1] – это созданная Google опенсорсная платформа, на которой разворачивается весь жизненный цикл разрабатываемой модели машинного обучения. Kubeflow представляет собой инструментарий, каждый компонент которого применяется для отработки каждой из стадий жизненного цикла при машинном обучении, а именно: исследования данных, конструирования признаков, преобразования признаков, обучения модели, оценки модели, тонкой настройки модели, предоставления модели и версионирования модели. Главный атрибут kubeflow заключается в том, что он предназначен для работы на базе kubernetes [2]. Таким образом, kubeflow пользуется именно теми преимуществами, которые предоставляет кластер kubernetes, в частности, оркестрацией контейнеров и автомасштабированием.

Читать дальше →

+13

MaxRokatansky Feb 7 2023 at 14:54

Взгляд с высоты на современные инструменты MLOps

10 min

1.7K

OTUS corporate blogMachine learning*

MLOps относится к практике интеграции машинного обучения в жизненный цикл разработки программного обеспечения, которая направлена на повышение эффективности и результативности разработки и развертывания машинного обучения за счет автоматизации и оптимизации различных связанных задач.

Для MLOps обычно используются несколько инструментов и фреймворков, каждый из которых имеет свои преимущества и недостатки. В этой статье приведем примеры популярных инструментов MLOps и краткий обзор их основных функций, включая краткий гайд о настройке и запуска пайплайна.

MaxRokatansky Nov 8 2022 at 16:57

Как упаковывать и дистрибутировать модели машинного обучения с помощью MLFlow

11 min

8.5K

OTUS corporate blogMachine learning*

MLFlow - это инструмент для управления всеми стадиями жизненного цикла модели машинного обучения. Более того, в статье рассматриваются вопросы инсталляции и настройки службы MLFlow, а также приводятся примеры создания и совместного использования проектов с помощью MLFlow.

На каждом этапе разработки жизненного цикла ML-модели одним из основных видов деятельности является сотрудничество. Прохождение пути ML-модели от концепции до внедрения (деплоя) требует участия и взаимодействия различных функций, вовлеченных в создание модели. Кроме того, природа разработки ML-модели включает в себя проведение экспериментов, отслеживание артефактов и метрик, версий модели и т.д., что требует эффективной организации для корректной поддержки жизненного цикла ML-модели.

К счастью, существуют инструменты для разработки и обеспечения жизненного цикла модели, такие как MLflow. В этой статье мы расскажем о MLflow, его основных компонентах и характеристиках. А также приведем примеры, показывающие, как MLflow работает на практике.

and-1 Nov 16 2022 at 16:42

Челленджи деплоя, сетевых политик и планировщика: как мы внедряли ML-платформу Kubeflow

7 min

1.8K

VK corporate blogSystem administration*DevOps*Kubernetes*

Kubeflow — фреймворк на базе Kubernetes, который помогает быстро запускать модели машинного обучения. Мы в VK решили внедрить его в свои рабочие процессы и столкнулись с некоторыми трудностями.

Меня зовут Федюнин Андрей, я системный инженер в команде платформы, которая предоставляет разработчикам Kubernetes для запуска приложений, и отвечаю за ML-кластер в нашей команде. Сегодня расскажу, зачем и как мы внедряли Kubeflow, как решали проблемы и к чему пришли.

Читать дальше →

+31

selenzorn Nov 17 2022 at 13:28

Как переехать на Kubeflow в качестве ML-платформы?

11 min

3.1K

Selectel corporate blogHigh performance*Machine learning*Kubernetes*

Привет, Хабр! В этом материале мы поделимся докладом Сергея Савватеева о переходе сервиса Mediascope на Kubeflow, который он подготовил к ML MeetUp.

Поговорим о роли команды в компании, как был устроен процесс разработки до перехода на Kubeflow. Разберем подробно сам переход, какие архитектурные решения принимались. С какими сложностями столкнулись и какие наметили шаги.

Читать дальше →

+39

volinski Mar 9 2023 at 11:53

Инструменты для MLOps: выбираем между вендорскими и Open Source-решениями

9 min

4.5K

VK corporate blogBig Data*Machine learning*

Review

MLOps использует проверенные методы DevOps для автоматизации создания, развертывания и мониторинга конвейеров ML в производственной среде. По мере развития MLOps-инструментов для работы с ним становится больше — как проприетарных, так и Open Source. Из этого разнообразия часто сложно выбрать стек для своего проекта.

Меня зовут Александр Волынский, я технический менеджер Cloud ML Platform в VK Cloud. В этой статье я сравню подходы к работе с MLOps на основе Open Source и проприетарного ПО и расскажу, какие инструменты и почему мы выбрали для Cloud ML Platform.

Читать дальше →

+42

neoflex Apr 18 2023 at 15:20

MLOps-платформа Dognauts для разработки и эксплуатации ML-моделей. Часть 1: предыстория создания

Medium

10 min

2.3K

Neoflex corporate blogBig Data*Machine learning*Cloud services*

Review

Big data season

Добрый день! Меня зовут Евгений Овчинцев, я работаю в компании Neoflex и в настоящее время являюсь архитектором продукта Dognauts. В данной серии статей я планирую рассказать о том, как создавался и развивался продукт: почему принимались те или иные решения, с какими проблемами пришлось столкнуться и что из всего этого получилось.