Pull to refresh

Comments 5

Это, можно сказать, большое счастье для аналитика, если данные действительно распределены по нормальному закону… На практике она чаще лишь напоминают нормальные, а на самом деле оказываются распределёнными по другим законам с более тяжёлыми хвостами, например по Стьюденту или по Коши. Если данные заведомо положительные, то ищите что-то из семейства Гамма-распределений…
Хотя, всё написанное про кластеризацию и машинное обучение не так чувствительно к закону распределения исходных данных.
Так, например, некоторые поисковые системы используют Gradient Boosting Machine для автоматического анализа качества сайтов.


Спасибо за статью. А могли бы вы указать практические примеры использования машинного обучения в web? Что там нужно классифировать и для чего?
Вам спасибо за интерес. Наверно я не совсем правильно понял вопрос. Так как примеров может быть очень много: от известных поисковых систем, которые анализируют сайты, до различных масштабных исследований открыто опубликованной информации.
Я имел в виду, один пример применения. Допустим, я беру данные посещений страниц сайта, несколько переменных, характеризующих каждую страницу. Страницы ведут на продукты, реализуемые на сайте. Можно, например, обучить модель предсказывать продажи продуктов в зависимости от посещений страниц этих продуктов и представить важность предикторов? Просто мысли…
Оператор связи, миллионы записей добавляются регулярно, обидно, что не используются, обнаружил возможность выделения групп по возрасту и интересам на основе Яндекса. Интересно скорее теоретически что из информации можно вытаскивать и скорее автоматические подходы к автоматическому же их поиску. Т.е. когда не человек заведомо знает возможные закономерности, а чтобы машина самостоятельно искала закономерности, в том числе сложные, во времени, о которых её создатель и не подозревал заранее. Что изучить по теме?
Sign up to leave a comment.

Articles