Pull to refresh
84
0
Семён Лукашевский @uchitel

R&D (R>D)

Send message

Путешествие в космос или введение в симплекс-метод для школьников

Level of difficultyMedium
Reading time18 min
Views9.4K

На Хабре уже были публикации о симплекс-методе раз и два. И они очень даже хороши. Но это не те публикации, которые расчитаны на школьников или учителей школ. Я же хотел обратить внимание на одну довольно старую статью, вышедшую в журнале "Юный техник" в августе 1985 года. Естественно, она была нацелена на школьников. И мне давно хотелось разобрать её детально...

Ключ на старт!
Total votes 56: ↑56 and ↓0+56
Comments15

Регрессионный анализ в DataScience. Часть 2. Преобразование Бокса-Кокса. Проверка тренда и случайности

Reading time51 min
Views9.7K

Обзор построения и анализа линейной регрессионной модели с использованием преобразования Бокса-Кокса

Читать далее
Total votes 4: ↑4 and ↓0+4
Comments4

3D-моделирование в Blender для подростков: чему можно научиться

Reading time5 min
Views26K

В начале года многие школьники ищут новые направления для развития. Одним из наиболее популярных сегодня является 3D-моделирование. Рассказываем, как начать обучение анимации для детей и подростков и делимся полезной информацией.

Читать далее
Total votes 11: ↑8 and ↓3+5
Comments5

Python, корреляция и регрессия: часть 1

Reading time16 min
Views77K

В предыдущих сериях постов для начинающих из ремикса книги Генри Гарнера «Clojure для исследования данных» (Clojure for Data Science) на языке Python мы рассмотрели методы описания выборок с точки зрения сводных статистик и методов статистического вывода из них параметров популяции. Такой анализ сообщает нам нечто о популяции в целом и о выборке в частности, но он не позволяет нам делать очень точные утверждения об их отдельных элементах. Это связано с тем, что в результате сведения данных всего к двум статистикам - среднему значению и стандартному отклонению - теряется огромный объем информации.

Читать далее
Total votes 7: ↑6 and ↓1+5
Comments0

Торговая стратегия для торговли коинтегрированными парами акций

Reading time8 min
Views8.2K
Цель данной статьи — поделиться простейшей стратегией статистического арбитража, основанной на торговле коинтегрированными парами акций, которые были выявлены на Московской и Нью-Йоркской биржах.

Если мы возьмём пару коинтегрированных акций, то у нас есть возможность захеджироваться и построить рыночно-нейтральную стратегию, когда убытки по одной бумаге будут компенсироваться прибылями по другой. Как это выглядит на практике?
Читать дальше →
Total votes 16: ↑15 and ↓1+14
Comments11

Тест Йохансена на коинтеграцию

Reading time15 min
Views4.7K

Цель данной статьи - поделиться результатами сравнительного анализ двух тестов на коинтеграцию, теста Энгла-Гренджера и теста Йохансена. Для этого нам понадобится рассмотреть соотношение между двумя и более переменными, понять, что такое VAR процесс, как перейти к VECM модели, в чем заключается процедура Йохансена, и как интерпретировать результат статистического теста, полученного от стандартного пакета типа Matlab.

Читать далее
Total votes 4: ↑4 and ↓0+4
Comments4

Про вероятности

Reading time11 min
Views42K

image
(source)


Иногда мне приходится рассказывать другим людям как работает машинное обучение и, в частности, нейронные сети. Обычно я начинаю с градиентного спуска и линейной регрессии, постепенно переходя к многослойным перцептронам, автокодировщикам и свёрточным сетям. Все понимающе кивают головой, но в какой-то момент кто-нибудь прозорливый обязательно спрашивает:


А почему так важно, чтобы переменные в линейной регрессии были независимы?

или


А почему для изображений используются именно свёрточные сети, а не обычные полносвязные?

"О, это просто", — хочу ответить я. — "потому что если бы переменные были зависимыми, то нам пришлось бы моделировать условное распределение вероятностей между ними" или "потому что в небольшой локальной области гораздо проще выучить совместное распределение пикселей". Но вот проблема: мои слушатели ещё ничего не знают про распределения вероятностей и случайные переменные, поэтому приходится выкручиваться другими способами, объясняя сложнее, но с меньшим количеством понятий и терминов. А что делать, если попросят рассказать про батч нормализацию или генеративные модели, так вообще ума не приложу.


Так давайте не будем мучить себя и других и просто вспомним основные понятия теории вероятностей.

Читать дальше →
Total votes 29: ↑29 and ↓0+29
Comments20

Шаблон проекта на Джанго с инструментами сборки и утилитами

Reading time6 min
Views19K
Иногда приходится создавать с нуля сайт на Джанге. Это и тесты концепций, и простенькие странички (ведь если мы в проекте используем разные мощные инструменты, почему бы сайт-визитку не сделать тоже с их помощью, избавив себя от ручной работы?).

Итак, представляю публике проект под девизом «Поменьше писанины! Побыстрей, дебаг!» Набор для скоростной разработки на Джанго.

Это 2 шаблона:
  • шаблон конфига buildout, который подтягивает и собирает все необходимые проекту пакеты
  • шаблон проекта, а именно настройки, включающие все нужные инструменты, и набор статики (готовые файлы на Haml и Sass)


Читать дальше →
Total votes 60: ↑57 and ↓3+54
Comments19

4 анти-паттерна pandas и способы борьбы с ними

Reading time12 min
Views20K

Pandas — это мощная библиотека для анализа данных, API которой обладает широкими функциональными возможностями. Этот API позволяет решить любую задачу, связанную с обработкой данных, несколькими способами. Некоторые из подходов к решению задач лучше других. Часто бывает так, что пользователи pandas узнают о подходах, не отличающихся особой эффективностью, привыкают к ним и постоянно их применяют. Этот материал посвящён разбору четырёх анти-паттернов pandas и рассказу о приёмах работы, которые стоит использовать вместо них.

Автор черпал вдохновение из многих источников, ссылки на которые даны в статье. В частности — из замечательной книги Effective Pandas.

Читать далее
Total votes 28: ↑27 and ↓1+26
Comments15

Уравнение теории ценообразования. Ликбез для гика, ч. 9

Reading time11 min
Views7K

Меня зовут Алексей Ахметшин. Я математик. В этом посте мы поговорим о различных задачах оптимизации, с которыми встречается инвестиционный банк, про функцию полезности и стохастический коэффициент дисконтирования. А также о корреляции рисков и избыточную доходность.

Читать далее
Total votes 12: ↑12 and ↓0+12
Comments13

Цифровая логистика: решение транспортной задачи спроса и предложения с помощью библиотеки DOcplex от IBM

Reading time13 min
Views7.1K

Всем привет, меня зовут Дмитрий Кузин (Application Development Senior Analyst в Accenture), и в своей статье я делюсь историей о том, как запрос на решение задачи в корпоративной рассылке привел к освоению Python библиотеки DOcplex от IBM, предназначенной для решения оптимизационных задач.

Я бы хотел поделиться личным опытом решения транспортной задачи с применением Python-библиотеки DOcplex от IBM. Если вкратце, то это задача про то, как с наименьшими затратами доставить продукцию или товары от производителей к покупателям, учитывая предложение первых и спрос вторых. В статье я дам основные определения транспортной задачи, покажу, как правильно сформулировать её условие, а также приведу пример решения на Python.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments4

Новые нули дзета-функции

Reading time6 min
Views9.8K


Астрологи объявили на хабре неделю профанных доказательств великих теорем.

  1. Теорема о четырёх красках.
  2. Теорема Ферма.
  3. Перед вами «доказательство гипотезы Римана».

Сначала я хотел тоже, оформить статью по приколу, что типа автор полностью уверен, что всё доказал, где мои деньги, но у меня, похоже, нет такого запаса самоиронии. Так что, обманываться вам придётся сознательно. А ещё, статья же для плюсов пишется, а не для минусов. Так что, вспоминаем о существовании юмора и продолжаем читать.

Итак, сначала по-быстрому (и не по-настоящему) докажем потрясающее очень хорошо сбалансированное равенство

$\sum_{n=-\infty}^{\infty}e^{nx}=0 $

Для любого $x$.
Читать дальше →
Total votes 37: ↑36 and ↓1+35
Comments22

ML для оптимизации цен на основе эластичности по цене

Reading time25 min
Views17K

Кривая эластичности спроса по цене – это то, как продажи зависят от цены.Чем меньше цена, тем больше продаж и наоборот.

В этой статье рассказывается про ML методы получения кривых спроса сразу для сотен тысяч товаров (нейросети, pyTorch), а также как, имея кривые спроса, решать бизнес задачу про баланс оборота и прибыли – в этом нам поможет метод множителей Лагранжа. Что первично – ограничение на прибыль или множитель Лагранжа? Как инженерам объяснить, что такое kvi-товары и товары-герои? Это и многое другое

Читать далее
Total votes 9: ↑8 and ↓1+7
Comments18

Удивительное путешествие Нильса с дикими гусями по стране алгоритмов оптимизации

Reading time11 min
Views2.6K

За 16 лет существования Хабра на его страницах не один, и даже не тысячу раз публиковались топики, так или иначе касающиеся вопросов решения задач оптимизации и алгоритмов в целом. В этой статье я хочу рассказать о достаточно новом алгоритме — «алгоритме диких гусей».

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments0

Теория чисел. Новый метод анализа распределения чисел, в том числе и простых

Reading time6 min
Views17K

В статье рассказывается о новом подходе к анализу распределения простых чисел.
О подходе с использованием формулы распределения чисел для всего натурального ряда.

Читать далее
Total votes 45: ↑41 and ↓4+37
Comments15

Как перейти к байесовским доверительным интервалам, не потеряв понимание классического частотного вывода

Reading time5 min
Views6.1K

Много слов уже сказано о доверительных интервалах для оценки параметра в байесе и частотке. Существуют десятки объяснений, но ни одно из них не показывает "на пальцах", чем отличаются механизмы создания этих интервалов. Так вот давайте еще и я попробую объяснить вам так, чтобы вы больше никогда не конфузились при их упоминании.

Читать далее
Total votes 16: ↑16 and ↓0+16
Comments0

Формула образования будущего: 4 слагаемых и покемоны

Reading time17 min
Views45K

Пикачу, Венузавр, Бульбазавр, Ивизавр, Сильвеон, Мьюту, Чаризард, Метапод, Бидрилл, Псидак, Пиджи, Пиджит, Пиджеотто, Электабазз, Оманайт… Я честно списала эти названия покемонов с сайта, потому что запомнила только двух: Пикачу и Бульбазавра (одного знала, второй смешной). А в 2017 году 10-летний сын моего соседа по даче бодро перечислил мне несколько десятков покемонов и очень злился, что я не в курсе разницы между всеми ними. Как это видела я: в голове простого мальчишки без всяческих гениальных наклонностей хранится целая база данных — таблицы имён, таблицы видов, таблицы свойств, эволюционные цепочки и т. д. И всё это безотказно воспроизводится. А вот с таблицей умножения у него была беда, несмотря на третий класс без троек. Часть лета я довольно плотно общалась с этим мальчиком (и его покемонами) и уже тогда искала ответ на вопрос: что там такое особенное в голове, как оно устроено? В принципе, ответ лежал на поверхности: постоянная практика (смартфон врос в руку), геймификация процесса и огромная, просто колоссальная мотивация разобраться, запомнить и оперировать данными. Угадайте, какими методами школа и родители впихивали в него ту же таблицу умножения? 

Постойте, а ведь на любом уровне образования сейчас что-то такое же: кто-то уже научился мотивировать и зарабатывать на этом, а кто-то заслушивает ответы на семинарах по распечаткам и принимает плохо скомпилированные рефераты. А что будет дальше?

Читать далее
Total votes 38: ↑30 and ↓8+22
Comments34

Галерея лучших блокнотов по ML и Data Science

Reading time3 min
Views33K
Привет, читатель.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

image

Итак, приступим.

Вводные курсы в Jupyter Notebook


Читать дальше →
Total votes 41: ↑34 and ↓7+27
Comments7

Беда “войти в айти” или курсы тестировщика отзывы: Интермедия про чек-лист выбора IT-курса (upd. 19.04.2023)

Level of difficultyEasy
Reading time10 min
Views33K

Однажды, давным-давно, автор по локти погрузился в тестирование рынка подготовки тестировщиков с нуля. Он размышлял об обучении, общался с десятками продажников, слушал вводные лекции множества курсов с иногда противоречивыми чувствами, знакомился со многими интересными лекторами и анкетировал 100+ абитуриентов, текущих студентов и вчерашних. 

В общем за прошедший месяц много чего произошло. Также автор получил множество вопросов от абитуриентов по выбору курсов. Исследование предполагает большое число общения и автору это нравится. Но некоторые вещи повторять каждый раз скучно, поэтому в ожидании результатов затянувшегося “Этап 3: Объективно оцениваем наполненность курсов (для этого привлечем QA-эксперта с опытом 15+ лет подготовки)” решил здесь зафиксировать следующее...

Читать что там дальше написано по делу
Total votes 3: ↑1 and ↓2-1
Comments0

Физика в Python с использованием Pymunk

Reading time6 min
Views31K

Физика. Кто-то её любит, кто-то нет, но определённо это неотъемлемая часть нашего существования. В этой статье мы рассмотрим как самому создавать физические симуляции используя всего 2 библиотеки Python.
К концу статьи мы сделаем интерактивную симуляцию взаимодействия тел и поймём основы использования библиотеки Pymunk.

В этом туториале вы сможете создать симуляцию тел как на гифке сверху!

Читать далее
Total votes 41: ↑41 and ↓0+41
Comments10

Information

Rating
Does not participate
Location
Хакасия, Россия
Date of birth
Registered
Activity