Articles / Bookmarks / Profile of uchitel / Habr

Цель данной статьи — поделиться простейшей стратегией статистического арбитража, основанной на торговле коинтегрированными парами акций, которые были выявлены на Московской и Нью-Йоркской биржах.

Если мы возьмём пару коинтегрированных акций, то у нас есть возможность захеджироваться и построить рыночно-нейтральную стратегию, когда убытки по одной бумаге будут компенсироваться прибылями по другой. Как это выглядит на практике?

AdrenaLeen Oct 3 2022 at 11:10

+14

Тест Йохансена на коинтеграцию

15 min

4.7K

ffriend Mar 19 2018 at 12:42

Цель данной статьи - поделиться результатами сравнительного анализ двух тестов на коинтеграцию, теста Энгла-Гренджера и теста Йохансена. Для этого нам понадобится рассмотреть соотношение между двумя и более переменными, понять, что такое VAR процесс, как перейти к VECM модели, в чем заключается процедура Йохансена, и как интерпретировать результат статистического теста, полученного от стандартного пакета типа Matlab.

Про вероятности

11 min

42K

Data Mining*

Tutorial

(source)

Иногда мне приходится рассказывать другим людям как работает машинное обучение и, в частности, нейронные сети. Обычно я начинаю с градиентного спуска и линейной регрессии, постепенно переходя к многослойным перцептронам, автокодировщикам и свёрточным сетям. Все понимающе кивают головой, но в какой-то момент кто-нибудь прозорливый обязательно спрашивает:

А почему так важно, чтобы переменные в линейной регрессии были независимы?

или

А почему для изображений используются именно свёрточные сети, а не обычные полносвязные?

"О, это просто", — хочу ответить я. — "потому что если бы переменные были зависимыми, то нам пришлось бы моделировать условное распределение вероятностей между ними" или "потому что в небольшой локальной области гораздо проще выучить совместное распределение пикселей". Но вот проблема: мои слушатели ещё ничего не знают про распределения вероятностей и случайные переменные, поэтому приходится выкручиваться другими способами, объясняя сложнее, но с меньшим количеством понятий и терминов. А что делать, если попросят рассказать про батч нормализацию или генеративные модели, так вообще ума не приложу.

Так давайте не будем мучить себя и других и просто вспомним основные понятия теории вероятностей.

siberiano Nov 7 2011 at 19:31

+29

Шаблон проекта на Джанго с инструментами сборки и утилитами

6 min

19K

Django*

Иногда приходится создавать с нуля сайт на Джанге. Это и тесты концепций, и простенькие странички (ведь если мы в проекте используем разные мощные инструменты, почему бы сайт-визитку не сделать тоже с их помощью, избавив себя от ручной работы?).

Итак, представляю публике проект под девизом «Поменьше писанины! Побыстрей, дебаг!» Набор для скоростной разработки на Джанго.

Это 2 шаблона:

шаблон конфига buildout, который подтягивает и собирает все необходимые проекту пакеты
шаблон проекта, а именно настройки, включающие все нужные инструменты, и набор статики (готовые файлы на Haml и Sass)

mr-pickles Aug 22 2022 at 12:05

+54

4 анти-паттерна pandas и способы борьбы с ними

12 min

20K

Python*System Analysis and Design*API*Wunder Fund corporate blog

Translation

Pandas — это мощная библиотека для анализа данных, API которой обладает широкими функциональными возможностями. Этот API позволяет решить любую задачу, связанную с обработкой данных, несколькими способами. Некоторые из подходов к решению задач лучше других. Часто бывает так, что пользователи pandas узнают о подходах, не отличающихся особой эффективностью, привыкают к ним и постоянно их применяют. Этот материал посвящён разбору четырёх анти-паттернов pandas и рассказу о приёмах работы, которые стоит использовать вместо них.

Автор черпал вдохновение из многих источников, ссылки на которые даны в статье. В частности — из замечательной книги Effective Pandas.

+26

akhmale Feb 5 2021 at 15:00

Уравнение теории ценообразования. Ликбез для гика, ч. 9

11 min

Reading roomТехнологический Центр Дойче Банка corporate blogPopular scienceFinance in IT

Меня зовут Алексей Ахметшин. Я математик. В этом посте мы поговорим о различных задачах оптимизации, с которыми встречается инвестиционный банк, про функцию полезности и стохастический коэффициент дисконтирования. А также о корреляции рисков и избыточную доходность.

+12

kuzin_d Dec 11 2020 at 18:13

Цифровая логистика: решение транспортной задачи спроса и предложения с помощью библиотеки DOcplex от IBM

13 min

7.1K

Algorithms*TransportIT-companiesAxenix (ex-Accenture) corporate blog

Technotext 2021

Всем привет, меня зовут Дмитрий Кузин (Application Development Senior Analyst в Accenture), и в своей статье я делюсь историей о том, как запрос на решение задачи в корпоративной рассылке привел к освоению Python библиотеки DOcplex от IBM, предназначенной для решения оптимизационных задач.

Я бы хотел поделиться личным опытом решения транспортной задачи с применением Python-библиотеки DOcplex от IBM. Если вкратце, то это задача про то, как с наименьшими затратами доставить продукцию или товары от производителей к покупателям, учитывая предложение первых и спрос вторых. В статье я дам основные определения транспортной задачи, покажу, как правильно сформулировать её условие, а также приведу пример решения на Python.

yurixi Jul 3 2022 at 10:40

Новые нули дзета-функции

6 min

9.8K

Астрологи объявили на хабре неделю профанных доказательств великих теорем.

Теорема о четырёх красках.
Теорема Ферма.
Перед вами «доказательство гипотезы Римана».

Сначала я хотел тоже, оформить статью по приколу, что типа автор полностью уверен, что всё доказал, где мои деньги, но у меня, похоже, нет такого запаса самоиронии. Так что, обманываться вам придётся сознательно. А ещё, статья же для плюсов пишется, а не для минусов. Так что, вспоминаем о существовании юмора и продолжаем читать.

Итак, сначала по-быстрому (и не по-настоящему) докажем потрясающее очень хорошо сбалансированное равенство

$\sum_{n=-\infty}^{\infty}e^{nx}=0$

Для любого

$inline$ .

greck Jul 8 2022 at 13:41

+35

ML для оптимизации цен на основе эластичности по цене

25 min

17K

Development for e-commerce*Machine learning*E-commerce management*Sales management*

Tutorial

Кривая эластичности спроса по цене – это то, как продажи зависят от цены.Чем меньше цена, тем больше продаж и наоборот.

В этой статье рассказывается про ML методы получения кривых спроса сразу для сотен тысяч товаров (нейросети, pyTorch), а также как, имея кривые спроса, решать бизнес задачу про баланс оборота и прибыли – в этом нам поможет метод множителей Лагранжа. Что первично – ограничение на прибыль или множитель Лагранжа? Как инженерам объяснить, что такое kvi-товары и товары-герои? Это и многое другое

lordebian Jul 7 2022 at 11:00

Удивительное путешествие Нильса с дикими гусями по стране алгоритмов оптимизации

11 min

2.6K

Algorithms*Mathematics*FirstVDS corporate blogPopular science

Translation

За 16 лет существования Хабра на его страницах не один, и даже не тысячу раз публиковались топики, так или иначе касающиеся вопросов решения задач оптимизации и алгоритмов в целом. В этой статье я хочу рассказать о достаточно новом алгоритме — «алгоритме диких гусей».

swotix Jul 6 2022 at 14:45

Теория чисел. Новый метод анализа распределения чисел, в том числе и простых

6 min

17K

kategera6 Jan 20 2021 at 15:06

В статье рассказывается о новом подходе к анализу распределения простых чисел.
О подходе с использованием формулы распределения чисел для всего натурального ряда.

+37

Как перейти к байесовским доверительным интервалам, не потеряв понимание классического частотного вывода

5 min

6.1K

Statistics in IT

Exosphere Mar 10 2022 at 14:20

Technotext 2021

Много слов уже сказано о доверительных интервалах для оценки параметра в байесе и частотке. Существуют десятки объяснений, но ни одно из них не показывает "на пальцах", чем отличаются механизмы создания этих интервалов. Так вот давайте еще и я попробую объяснить вам так, чтобы вы больше никогда не конфузились при их упоминании.

+16

Формула образования будущего: 4 слагаемых и покемоны

17 min

45K

Habr corporate blogStudying in ITPersonnel Management*IT career

Пикачу, Венузавр, Бульбазавр, Ивизавр, Сильвеон, Мьюту, Чаризард, Метапод, Бидрилл, Псидак, Пиджи, Пиджит, Пиджеотто, Электабазз, Оманайт… Я честно списала эти названия покемонов с сайта, потому что запомнила только двух: Пикачу и Бульбазавра (одного знала, второй смешной). А в 2017 году 10-летний сын моего соседа по даче бодро перечислил мне несколько десятков покемонов и очень злился, что я не в курсе разницы между всеми ними. Как это видела я: в голове простого мальчишки без всяческих гениальных наклонностей хранится целая база данных — таблицы имён, таблицы видов, таблицы свойств, эволюционные цепочки и т. д. И всё это безотказно воспроизводится. А вот с таблицей умножения у него была беда, несмотря на третий класс без троек. Часть лета я довольно плотно общалась с этим мальчиком (и его покемонами) и уже тогда искала ответ на вопрос: что там такое особенное в голове, как оно устроено? В принципе, ответ лежал на поверхности: постоянная практика (смартфон врос в руку), геймификация процесса и огромная, просто колоссальная мотивация разобраться, запомнить и оперировать данными. Угадайте, какими методами школа и родители впихивали в него ту же таблицу умножения?

Постойте, а ведь на любом уровне образования сейчас что-то такое же: кто-то уже научился мотивировать и зарабатывать на этом, а кто-то заслушивает ответы на семинарах по распечаткам и принимает плохо скомпилированные рефераты. А что будет дальше?

+22

Syurmakov Jul 17 2019 at 00:32

Галерея лучших блокнотов по ML и Data Science

3 min

33K

Python*Data Mining*Big Data*Machine learning*

Привет, читатель.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

Итак, приступим.

Вводные курсы в Jupyter Notebook

100chuk Dec 11 2021 at 18:47

+27

Беда “войти в айти” или курсы тестировщика отзывы: Интермедия про чек-лист выбора IT-курса (upd. 19.04.2023)

Easy

10 min

33K

IT systems testing*Web services testing*Studying in ITPersonnel Management*IT career

Tutorial

Однажды, давным-давно, автор по локти погрузился в тестирование рынка подготовки тестировщиков с нуля. Он размышлял об обучении, общался с десятками продажников, слушал вводные лекции множества курсов с иногда противоречивыми чувствами, знакомился со многими интересными лекторами и анкетировал 100+ абитуриентов, текущих студентов и вчерашних.

В общем за прошедший месяц много чего произошло. Также автор получил множество вопросов от абитуриентов по выбору курсов. Исследование предполагает большое число общения и автору это нравится. Но некоторые вещи повторять каждый раз скучно, поэтому в ожидании результатов затянувшегося “Этап 3: Объективно оцениваем наполненность курсов (для этого привлечем QA-эксперта с опытом 15+ лет подготовки)” решил здесь зафиксировать следующее...

Читать что там дальше написано по делу

-1

Nikuson Dec 6 2021 at 00:59

Физика в Python с использованием Pymunk

6 min

31K

Python*