itmo Feb 3 2016 at 18:57

Подборка: Более 70 источников по машинному обучению для начинающих

5 min

103K

ITMO corporate blogWebsite development*Python*Professional literature*Machine learning*

+27

Comments 16

volanddd Feb 3 2016 at 23:17

А насколько инструментарий на Питоне применим для практических задач? Как у него с производительностью и интеграцией с GPU?

axsapronov Feb 4 2016 at 09:04

Много success stories про использование есть.

Большинство инструментов аналитики, обучения и прочего в Python базируются на numpy, а numpy почти полностью написан на C.
Есть биндинги к системам анализа, который могут работать кластерами — например для Spark — PySpark
Интеграция с GPU тоже есть — через CUDA или NumbaPRO.
Есть куча библиотек для Deep Learning, например, Caffe

pak63 Feb 4 2016 at 10:13

Дополнение по Spark.

Spark в скором будущем будет поддерживать GPU: прототип на Github , Jira

Идеи по использованию мобильных архитектур в кластере: Jira , новость от Databricks

Dumbris Feb 4 2016 at 17:42

Идеи по использованию мобильных архитектур в кластере: Jira, новость от Databricks

Вас не смутила подпись [Just in case you didn’t realize – it’s April 1st!]?

pak63 Feb 5 2016 at 09:23

Не заметил, буду внимательнее.

NetBUG Feb 4 2016 at 10:23

Для практической задачи обучения ML — вполне, ровно как и для визуализации работы алгоритма, например, при пошаговой обработке в интерфейсе Jupyter.
Для практической задачи модификации или адаптации алгоритма — вполне.

Для задач обработки крупных массивов либо окончательной подстройки коэффициентов на конкретном наборе данных — наверное, не очень, но это уже вопрос качества написания кода и применения нативных расширений, например, Cython и MKL для компиляции кода на C.

Stas911 Feb 4 2016 at 20:26

Дык зависит от размера ваших данных — не все задачи ML требуют терабайтов данных.

UFO just landed and posted this here

A1ien Feb 4 2016 at 15:08

Да уж, курс как то не очень, я одновременно прохожу его в месте с этим www.coursera.org/learn/machine-learning небо и земля.
Хотелось бы услышать отзывы по вот этому www.coursera.org/specializations/mashinnoye-obucheniye

za90 Feb 15 2016 at 09:44

Похоже отзывов по последнему пока нет. Записался, прохожу первый курс: экстремумы функций, производные первого и второго порядка, питон/блокнот — вот это вот всё. Вроде бы можно ускориться, но если одновременно с несколькими другими, то труднаа )

Да, а на «Введение» на всякий случай перезаписался, но вряд ли продолжу.

yorko Feb 15 2016 at 10:20

На мой взгляд, в курсе «Введение в машинное обучение» не хватает только лабораторных работ — чтоб тебе еще показали, как пользоваться библиотеками. А то так действительно курс распадается на 2 части, не особо связанные друг с другом. Из плюсов выделил бы финальный проект. И задача интересная, и для многих это быстрое погружение в соревнования Kaggle.
А то что теоретический материал «суховат»… ну да, у Andrew Ng все увлекательней, но там где, он 5 минут рассказывает, что такое производная (и 2 раза повторяет, что вы эксперт в ML), хочется давно уже просто формулу увидеть. Если ставить себе задачу действительно разбираться в машинном обучении — надо уметь воспринимать и такую подачу материала, как у Воронцова.

A1ien Feb 15 2016 at 10:46

Потому и прохожу оба:) А вообще по курсу Воронцова www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%28%D1%81%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%D1%8B%2C_%D0%92%D0%9C%D0%9A_%D0%9C%D0%93%D0%A3%29/2015-2016_%D0%B3%D0%BE%D0%B4%2C_%D0%BE%D1%81%D0%B5%D0%BD%D1%8C вот этот набор конспектов очень помогает.

arreqe Feb 4 2016 at 09:29

А какже знаменитый курс от Стэнфордского профессора Эндрю Энг (Andrew Ng) на coursera: www.coursera.org/learn/machine-learning

yorko Feb 4 2016 at 14:54

Есть еще обзор полезных репозиториев по Data Science и машинному обучению (там же и Python).

yorko Feb 4 2016 at 14:57

На мой взгляд, неплохой вариант приступить к практике (помимо Kaggle) — это попроходить интерактивные тьюториалы типа Dataquest и Datacamp. А стратегия становления классным специалистом в области Data Science неплохо описана тут.

xenohunter Feb 4 2016 at 17:17

Стоило бы указать, что это перевод: github.com/hangtwenty/dive-into-machine-learning.