Pull to refresh

Comments 16

А насколько инструментарий на Питоне применим для практических задач? Как у него с производительностью и интеграцией с GPU?
Много success stories про использование есть.

Большинство инструментов аналитики, обучения и прочего в Python базируются на numpy, а numpy почти полностью написан на C.
Есть биндинги к системам анализа, который могут работать кластерами — например для Spark — PySpark
Интеграция с GPU тоже есть — через CUDA или NumbaPRO.
Есть куча библиотек для Deep Learning, например, Caffe

Идеи по использованию мобильных архитектур в кластере: Jira, новость от Databricks

Вас не смутила подпись [Just in case you didn’t realize – it’s April 1st!]?
Не заметил, буду внимательнее.
Для практической задачи обучения ML — вполне, ровно как и для визуализации работы алгоритма, например, при пошаговой обработке в интерфейсе Jupyter.
Для практической задачи модификации или адаптации алгоритма — вполне.

Для задач обработки крупных массивов либо окончательной подстройки коэффициентов на конкретном наборе данных — наверное, не очень, но это уже вопрос качества написания кода и применения нативных расширений, например, Cython и MKL для компиляции кода на C.
Дык зависит от размера ваших данных — не все задачи ML требуют терабайтов данных.
UFO just landed and posted this here
Похоже отзывов по последнему пока нет. Записался, прохожу первый курс: экстремумы функций, производные первого и второго порядка, питон/блокнот — вот это вот всё. Вроде бы можно ускориться, но если одновременно с несколькими другими, то труднаа )

Да, а на «Введение» на всякий случай перезаписался, но вряд ли продолжу.
На мой взгляд, в курсе «Введение в машинное обучение» не хватает только лабораторных работ — чтоб тебе еще показали, как пользоваться библиотеками. А то так действительно курс распадается на 2 части, не особо связанные друг с другом. Из плюсов выделил бы финальный проект. И задача интересная, и для многих это быстрое погружение в соревнования Kaggle.
А то что теоретический материал «суховат»… ну да, у Andrew Ng все увлекательней, но там где, он 5 минут рассказывает, что такое производная (и 2 раза повторяет, что вы эксперт в ML), хочется давно уже просто формулу увидеть. Если ставить себе задачу действительно разбираться в машинном обучении — надо уметь воспринимать и такую подачу материала, как у Воронцова.
Есть еще обзор полезных репозиториев по Data Science и машинному обучению (там же и Python).
На мой взгляд, неплохой вариант приступить к практике (помимо Kaggle) — это попроходить интерактивные тьюториалы типа Dataquest и Datacamp. А стратегия становления классным специалистом в области Data Science неплохо описана тут.
Sign up to leave a comment.