Articles / Bookmarks / Profile of xopxe / Habr

@xopxe

User

Profile Publications 7Comments 12Bookmarks 112

wunder_editor Jan 31 2017 at 12:45

Как отлаживать модели машинного обучения

5 min

12K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Я размышлял, в основном с точки зрения преподавателя, о том, как научить отлаживать модели машинного обучения. Лично мне кажется полезным рассмотреть модель с точки зрения ошибок разного рода: байесовская ошибка (насколько ошибочен лучший из возможных классификаторов), ошибка аппроксимации (что мы потеряем из-за ограничения класса гипотезы), ошибка оценки (связанная с ограниченной длиной выборки), ошибка оптимизации (что случится, если не найти глобальный оптимум для задачи оптимизации). Я понял, что полезно попытаться отнести ошибку к определенной области, а потом устранять недостатки в этой конкретной области.

Читать дальше →

+14

Parilo Jan 16 2017 at 01:52

Нейросетка играет в Доту

8 min

38K

Programming*C++*Algorithms*Machine learning*Robotics development*

Всем привет! На самом деле нейросетка играет не в привычную Dota 2, а в RussianAICup 2016 CodeWizards. RussianAICup — это ежегодное открытое соревнование по программированию искусственного интеллекта. Участвовать в этом соревновании довольно интересно. В этом году темой была игра похожая на Доту. Так как я уже какое-то время занимаюсь обучением с подкреплением, то мне хотелось попробовать применить это в RussianAICup. Главной целью было научить нейронную сеть играть в эту игру, хотя занятие призового места — это, конечно, было бы приятно. В итоге нейросеть держится в районе 700 места. Что, я считаю, неплохо, ввиду ограничений соревнования. В этой статье речь пойдет скорее об обучении с подкреплением и алгоритмах DDPG и DQN, а не о самом соревновании.

Но обо всем по-порядку

+42

wunder_editor Dec 19 2016 at 21:05

Статьи, лежащие в основе подхода Facebook к компьютерному зрению

8 min

14K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Знаете такую компанию — Facebook? Да-да, ту самую, у сайта которой 1,6 миллиардов пользователей. И если взять все посты-поздравления с днем рождения, ваши позорные детские фотографии (у меня они такие), того дальнего родственника, лайкающего каждый ваш статус, — и вот вам множество данных для анализа.

С точки зрения анализа изображений Facebook весьма далеко продвинулся со сверточными нейронными сетями (Convolutional Neural Network, CNN). В августе подразделение Facebook по исследованиям в области искусственного интеллекта (Facebook AI Research, сокращенно FAIR) опубликовала блог-пост об алгоритмах компьютерного зрения, которые лежат в основе некоторых их алгоритмов сегментации изображений. В этом посте мы кратко изложим и разъясним три статьи, на которые ссылается этот блог.

Читать дальше →

+18

Leono Dec 4 2016 at 18:53

Порождение и выбор моделей машинного обучения. Лекция в Яндексе

11 min

22K

Entertaining tasksЯндекс corporate blogAlgorithms*Mathematics*Machine learning*

Применение машинного обучения может включать работу с данными, тонкую настройку уже обученного алгоритма и т. д. Но масштабная математическая подготовка нужна и на более раннем этапе: когда вы только выбираете модель для дальнейшего использования. Можно выбирать «вручную», применяя разные модели, а можно и этот процесс попробовать автоматизировать.

Под катом — лекция ведущего научного сотрудника РАН, доктора наук и главного редактора журнала «Машинное обучение и анализ данных» Вадима Стрижова, а также большинство слайдов.

+48

wunder_editor Nov 7 2016 at 18:47

Глубокое обучение для новичков: распознаем рукописные цифры

11 min

104K

Algorithms*Machine learning*Wunder Fund corporate blog

Tutorial

Translation

Представляем первую статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).

Читать дальше →

+31

habr_career Nov 3 2016 at 01:49

Что рассказать о компании, чтобы получить отклики от разработчиков (чек-лист)

4 min

29K

Хабр Карьера corporate blogPersonnel Management*IT career

Специально для блога «Моего круга» ИТ-рекрутеры из агентства DigitalHR проанализировали самые частые вопросы, которые задают соискатели о будущих работодателях, и составили список наиболее важных тем, которые компания должна раскрыть, привлекая к себе сотрудников. Этот чек-лист больше подойдет для компаний, заинтересованных в долгосрочном построении HR-бренда, а не в разовом поиске специалистов. Тем не менее, советы будут полезны всем, и даже при краткосрочных целях помогут увеличить поток желающих пройти собеседование.

Составленный чек-лист также должен помочь компаниям, размещающим свои вакансии на «Моём круге» правильно заполнять свой профиль и использовать его максимально эффективно. Из профиля компании на «Моем круге» можно узнать о ее деятельности, размере, увидеть фото офиса, а также просмотреть все открытые или архивные вакансии. Это полезный и эффективный инструмент для HR-позиционирования компании, но не все используют его правильно.

Например, если вы известная оффлайновая компания, которая начала активно развивать отдел разработки, лучше сделайте акцент в описании на IT-отделе, его успехе и команде: даже если у компании богатая история, но она сосредоточена в оффлайне, это не несет большой ценности для разработчика. Также в ИТ-сфере много и молодых проектов, о которых рынок ещё не знает. Ваш шанс заявить о себе — правильно заполнить профиль организации на «Моем круге».

Читать дальше →

+18

xopxe Oct 31 2016 at 15:40

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 2

8 min

40K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Публикуем вторую часть статьи о типах архитектуры нейронных сетей. Вот первая.

За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать дальше →

+36

xopxe Oct 26 2016 at 19:44

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1

10 min

92K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Это первая часть, вот вторая.
За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать дальше →

+49

xopxe Oct 4 2016 at 19:50

Как проверить причинную связь без эксперимента?

9 min

15K

Algorithms*Machine learning*Wunder Fund corporate blog

Translation

Сегодня поговорим об установлении причинных связей между явлениями, когда невозможно провести эксперимент и А/В-тесты. Это довольно простая статья, которая будет полезна начинающим в статистике и машинном обучении или тем, кто раньше над такими вопросами не задумывался.

Действительно ли пациентам, тестирующим новое лекарство, становится лучше из-за лекарства, или они все все равно бы выздоровели? Ваши продавцы действительно эффективны или же они говорят с теми клиентами, которые и так готовы совершить покупку? Действительно ли Сойлент (или рекламная кампания, которая обойдётся фирме в миллион долларов) стоит вашего времени?

Читать дальше →

+26

Turbo Apr 26 2016 at 09:44

Соревнования по машинному обучению (весна-лето 2016)

7 min

9.4K

Machine learning*

С мая по сентябрь любители сложных задач по машинному обучению могут принять участие в нескольких конкурсах, предлагающих крупные денежные призы. Конкурсы проводят ресурсы: Kaggle, специализирующийся на соревнованиях такого плана, DCA, создающий сервисы на технологиях Big Data, платформа исследования искусственного интеллекта на базе игры Дум ViZDoom и Национальная библиотека медицины США.

Читать дальше →

+10

Roman_Kh Mar 3 2016 at 06:42

Разбираемся с войной нейронных сетей (GAN)

7 min

40K

Big Data*Machine learning*

Generative adversarial networks (GAN) пользуются все большей популярностью. Многие говорят о них, кто-то даже уже использует… но, как выясняется, пока мало кто (даже из тех кто пользуется) понимает и может объяснить. ;-)
Давайте разберем на самом простом примере, как же они работают, чему учатся и что на самом деле порождают.

Читать дальше →

+15

rocknrollnerd Jan 27 2016 at 13:03

Фальшивомонетчики против банкиров: стравливаем adversarial networks в Theano

13 min

35K

Algorithms*Image processing*Machine learning*

Вы бы никогда не подумали, но это прогулка по пространству нейросети-фальшивомонетчика. Сделано крутейшими людьми Anders Boesen Lindbo Larsen и Søren Kaae Sønderby

Допустим, у нас есть задача — понять окружающий мир.
Давайте для простоты представим, что мир — это деньги.

Метафора, может быть, с некоторой моральной двусмысленностью, но в целом пример не хуже прочих — деньгам (банкнотам) определенно свойственна какая-то сложная структура, тут у них цифра, тут буква, а там хитрые водяные знаки. Предположим, нам нужно понять, как они сделаны, и узнать правило, по которым их печатают. Какой план?

Напрашивающийся шаг — это пойти в офис центрального банка и попросить их выдать спецификацию, но во-первых, вам ее не дадут, а во-вторых, если выдерживать метафору, то у вселенной нет центрального банка (хотя на этот счет есть религиозные разногласия).

Ну, раз так, давайте попробуем их подделать.

Осторожно, тяжелые гифки

+34

1 2 3 4 5