Articles / Bookmarks / Profile of sle

Мария Изофатова @sle_mary

User

Profile Publications 1Comments Bookmarks 4

valexv Sep 18 2021 at 01:29

Apache Spark: оптимизация производительности на реальных примерах

13 min

23K

Apache*Big Data*Data storages*Neoflex corporate blogData Engineering*

From sandbox

Apache Spark – фреймворк для обработки больших данных, который давно уже стал одним из самых популярных и часто встречаемых во всевозможных проектах, связанных с Big Data. Он удачно сочетает в себе скорость работы и простоту выражения своих мыслей разработчиком.

Разработчик работает с данными на достаточно высоком уровне и, кажется, что нет ничего сложного в том, чтобы, например, соединить два набора данных, написав всего одну строку кода. Но только задумайтесь: что происходит в кластере при соединении двух наборов данных, которые могут и не находится целиком на каком-либо из узлов кластера? Обычно Spark со всем справляется быстро, но иногда, а особенно, если данных действительно много, необходимо все-таки понимать – что происходит уровнем ниже и использовать это знание, чтобы помочь Spark работать в полную силу.

+18

totsamymatveev Oct 31 2023 at 12:24

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Medium

12 min

8.9K

Python*МегаФон corporate blogBig Data*Machine learning*Artificial Intelligence

Tutorial

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

DariaSatco Nov 16 2023 at 13:45

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Medium

10 min

2.7K

МегаФон corporate blogBig Data*Machine learning*Artificial Intelligence

Case

В этой статье расскажем про подход к решению задачи о персонализации тарифных планов для абонентов новой базы в рамках CVM-проекта. Поговорим о том, как с помощью ML определить оптимальные параметры тарифа для абонентов с короткой историей, и как посчитать привлекательность полученного тарифа.

Extremesarova Feb 21 at 16:33

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Medium

14 min

17K

Python*SQL*МегаФон corporate blogAlgorithms*Big Data*

Roadmap

Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor).

В данной статье разберемся что такое live coding интервью и как к нему готовиться.

Материал в первую очередь будет полезен Data Scientist'ам и ML инженерам, при этом некоторые разделы, например, Алгоритмы и структуры данных подойдут всем IT специалистам, которым предстоит пройти секцию live coding.

Apache Spark: оптимизация производительности на реальных примерах

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Персонализация тарифного плана для новых абонентов: как оцифровать привлекательность

Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 1: Live Coding

Information

Specialization