Алгоритмы *

Все об алгоритмах

Статьи Посты Новости Авторы Компании

MichaelEk 9 часов назад

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

12 мин

4.8K

Блог компании ЯндексOpen source*Алгоритмы*Машинное обучение*Natural Language Processing*

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

+63

ru_vds вчера в 16:00

Эвристики морских просторов: математическая оптимизация океанских контейнеровозов

Средний

7 мин

2.8K

Блог компании RUVDS.comАлгоритмы*Математика*Научно-популярноеФинансы в IT

Обзор

Перевод

Такие контейнеровозы называют «post-Panamax», потому что они слишком велики, чтобы поместиться в Панамском канале

Посмотрите вокруг. Есть высокая вероятность того, что какие-то из окружающих вас предметов прибыли к вам по морю. 90% товаров в мире перемещается по океану, зачастую на ужасно огромных грузовых судах: длина четыреста метров, масса 250 тысяч тонн, вмещают в себя 12 тысяч контейнеров суммарной стоимостью в миллиард долларов. В отличие от самолётов, поездов и грузовых автомобилей, грузовые суда работают практически непрерывно, двигаясь по цикличным маршрутам в океанах.

Но какими же будут наилучшие, наиболее оптимальные маршруты таких судов? Для специалиста по computer science это задача из теории графов; для бизнес-аналитика — это задача цепочки поставок. Если её решить плохо, то контейнеры будут простаивать в портах, суда впустую тратить время в открытом море, неспособные причалить, а в конечном итоге подорожают товары из-за того, что поток физических ценностей замедлится и станет менее предсказуемым. Каждой занимающейся контейнерными перевозками компании приходится справляться с этими задачами, но обычно они решаются по отдельности. При их комбинировании сложность умножается; насколько нам известно, эту задачу так пока и не удалось решить для самых крупных контейнерных операций (500 судов и 1500 портов).

Команда Operations Research с гордостью представляет Shipping Network Design API, реализующий новое решение этой задачи. Наша методика лучше масштабируется, позволяя находить решения задач цепочек поставок общемирового уровня, будучи при этом быстрее, чем все остальные известные решения. Она способна удвоить прибыль компании-перевозчика, доставлять на 13% больше контейнеров, задействуя при этом на 15% меньше судов. В этой статье мы расскажем, как нам это удалось.

Читать дальше →

+21

mr-pickles вчера в 15:33

Простые способы ускорения обучения PyTorch-моделей

Средний

13 мин

2.7K

Блог компании Wunder FundPython*Алгоритмы*Машинное обучение*Искусственный интеллект

Туториал

Перевод

Не знаю — нужно ли вступление к статье, посвящённой ускорению машинного обучения (Machine Learning, ML)?

Ускорение обучения моделей — это именно то, в чём нуждаются все ML‑инженеры. Более быстрое обучение модели означает ускорение экспериментов, что, в свою очередь, ведёт к ускорению выпуска новых версий программных продуктов. Кроме того — чем выше скорость обучения — тем меньше ресурсов нужно на каждую итерацию обучения модели. Поэтому предлагаю перейти сразу к делу.

+23

VeryLysyj вчера в 15:08

Быстрое вычисление степени

Средний

15 мин

6.1K

Высокая производительность*Занимательные задачкиАлгоритмы*C#*Математика*

В статье описан процесс разработки алгоритма функции вычисления любой степени положительного числа, использующего «магическую константу». Приведены результаты её сравнения с исходной функцией вычисления обратного квадратного корня, а также со стандартной функцией вычисления степени Math.Pow.

+14

alexstich 9 июн в 12:25

Хитрый Алгоритм: Решение задачи Continuous Subarray Sum

Простой

2 мин

3.6K

Занимательные задачкиАлгоритмы*Математика*Интервью

Из песочницы

За последние две недели я занимался различными задачами на Leetcode. И сегодня я наткнулся на интересную задачу: Сумма последовательного подмассива - решением которой хотел бы с вами поделиться.

aio350 9 июн в 11:25

Учимся летать: симуляция эволюции на Rust. 2/5

Средний

20 мин

2.9K

Блог компании Timeweb CloudПрограммирование*Системное программирование*Алгоритмы*Rust*

Туториал

Перевод

Это вторая часть серии статей по разработке симуляции эволюции с помощью нейронной сети и генетического алгоритма.

Первая часть

В этой статье мы заложим основы нашего проекта и реализуем простую FFNN (feedforward neural network — нейронная сеть прямого распространения), которая впоследствии станет мозгом. Мы также рассмотрим множество тонкостей и идиом, которые встречаются в коде Rust, включая тесты.

Готовы? Тогда поехали.

Читать дальше →

+27

Sivchenko_translate 5 июн в 15:35

Сверхскоростные связные списки

14 мин

8.5K

Высокая производительность*Программирование*Алгоритмы*Rust*

Перевод

На курсах по программированию связные списки преподаются как одна из фундаментальных структур данных, но на самом деле такие списки чаще встречаются на технических собеседованиях, чем в реальных проектах.

В этом посте будет продемонстрирован практический пример, в котором связный список существенно обгоняет Vec. Мы напишем простую библиотеку для валидации данных, которая будет показывать, где именно находится ошибка в невалидном вводе. Здесь будет наглядно показано, как можно использовать связные списки при обходе графа.

В этом посте отражены в основном собственные изыскания и ошибки автора, имевшего дело с крейтами jsonschema, поэтому пост не претендует на полное руководство по связным спискам, а скорее призван донести идею о том, как они могут использоваться на практике.

Мы начнём с азбучной реализации, а потом будем постепенно её оптимизировать и рассматривать, как это отразится на производительности.

От читателя поста ожидается, что он на базовом уровне понимает Rust, обычные структуры данных, а также концептуально представляет, как выделяется память (в стеке и куче).

Дополнение (14.05.2024): Я учёл поступившую обратную связь и подчеркнул, какие идеи объективно плохи, прояснил некоторые отступления и удалил идею о imbl.

Чтобы было проще прослеживать этапы реализации и исследовать код, отсылаю вас к репозиторию, сопровождающему этот пост.

+17

AlekseiPodkletnov 5 июн в 10:37

Как Toutiao взорвал китайский интернет и породил рекомендательный алгоритм ТикТока

10 мин

Алгоритмы*История ITИскусственный интеллектСоциальные сети и сообществаIT-компании

TikTok знают все. ByteDance - тоже, ведь эта компания сделала TikTok. Но мало кто знает, что первый выстреливший продукт ByteDance - отнюдь не приложение с вирусными клипами, а нейроагрегатор новостей Toutiao. Именно в недрах Toutiao возник TikTok и его знаменитый алгоритм, за право над которым китайская компания сейчас воюет с американскими регуляторами.

Как только закон о запрете Тиктока в США вступил в силу, сразу начался цирк с конями. Сначала глава ByteDance выступил с обращением, где призвал американцев “встать на защиту свободы слова”, а еще заявил, что “компания не смирится и будет бороться”. Потом СМИ писали, что китайцы хотят продать Тикток американцам без алгоритма (ага, больно он кому-то нужен без алгоритма...). А совсем недавно технологические медиа начали пробрасывать версию, что ByteDance разработает отдельный алгоритм для ускользающей из рук ByteDance (и КПК) американской версии Тиктока. Видимо, чтобы можно было скинуть отжатый актив без особенных мук китайской совести.

Рискну предположить, что стороны будут еще долго бодаться на счет алгоритма. Неудивительно, ведь рекомендательный движок можно смело назвать главным бриллиантом китайского приложения. Эксперты зачастую называют алгоритм Тиктока настоящим произведением искусства, а техноэнтузиасты регулярно пытаются разобраться в его внутреннем мире.

Многие в курсе, что Тикток - это брат-близнец китайского сервиса Douyin (прямо-таки однояйцевый). В 2016 года хитрые китайцы запустили у себя Douyin, а потом “клонировали” его для западной аудитории. Еще чуть позже ByteDance купил платформу musical.ly, объединил её с Тиктоком, влил мегатонны юаней в маркетинг, и вот мы здесь.

+27

neuromancertdi 4 июн в 15:00

Система команд на основе переменных

Простой

10 мин

2.5K

Программирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Я пытаюсь описать одну концепцию ИИ, сам ее пока понимаю плохо. Думаю суть этой концепции в том, чтобы создавать различные переменные в системе нейросетей, которые отвечают за различные действия, процессы. В этой статье я расскажу про идею, суть которой в том, что все знания программы, такие как команды или слова, рассматриваются как переменные, и немного про эту концепцию ИИ (в конце статьи). Чтобы лучше понять идею описанную в этой статье, нужно прочитать предыдущую статью про систему команд.

PatientZero 4 июн в 13:39

Укрощаем суммы с плавающей запятой

Простой

9 мин

7.1K

Программирование*Алгоритмы*Компиляторы*Математика*Rust*

Туториал

Перевод

Допустим, у нас есть массив чисел с плавающей запятой, и мы хотим их суммировать. Можно наивно подумать, что их достаточно просто сложить, например, на Rust.

Однако это запросто может привести к произвольно большой накопленной погрешности. Давайте проверим:

naive_sum(&vec![1.0; 1_000_000]) = 1000000.0 naive_sum(&vec![1.0; 10_000_000]) = 10000000.0 naive_sum(&vec![1.0; 100_000_000]) = 16777216.0 naive_sum(&vec![1.0; 1_000_000_000]) = 16777216.0

Ой-ёй… Что произошло? Проблема в том .что следующее 32-битное число с плавающей запятой после 16777216 — это 16777218. Так что при вычислении 16777216 + 1, значение округляется до ближайшего числа с плавающей запятой, имеющей чётную мантиссу, то есть снова до 16777216. Мы зашли в тупик.

К счастью, есть более совершенные способы суммирования массива.

+35

YuriPanchul 4 июн в 08:03

Мысли по поводу доклада на FPGA-Systems про маршрут ИРИС из МГУ

Средний

7 мин

3.2K

C++*Алгоритмы*Компиляторы*FPGA*Программирование микроконтроллеров*

На конференции FPGA-Systems был предоставлен маршрут проектирования блоков микросхем на основе использования C++ под названием ИРИС. Докладчик - заведующий кафедрой Мехмата МГУ Эльяр Гасанов. Его группа имеет значительный опыт проектирования оптимизированных по производительности блоков, например LDPC декодера, и ведет свои истоки из сотрудничества с LSI Logic в середине 1990-х годов.

Мои мысли после просмотра презентации:

+19

Rebelqwe 3 июн в 21:37

Про обязательность поправки на множественные сравнения, которая часто игнорируется адептами Data Driven методов

Простой

11 мин

1.1K

Data Mining*Алгоритмы*Математика*R*Исследования и прогнозы в IT*

Обзор

Когда проводится один статистический тест на значимость различий, всегда есть шанс (ошибка первого рода = 5%, на уровне значимости p=0.05) получить ложный положительный результат случайно. Эта ошибка означает, что мы можем ложно утверждать, что значимое различие существует, притом, что в реальности этой значимости нет.

Когда проводится несколько однотипных тестов подряд, каждый из них имеет 5% шанс на ложный положительный результат. Если коррекция отсутствует, то вероятность, что хотя бы один из этих тестов даст ложный положительный результат, быстро возрастает.

Предположим, что делается 20 однотипных тестов. Вероятность того, что получится ложный положительный результат равна 1 - (1 - 0.05)^20 ≈ 64%.

Как контролировать ошибки читать далее

+11

evaclick 3 июн в 13:51

Сравниваем популярные алгоритмы кластеризации DBSCAN и OPTICS

10 мин

3.2K

Python*Алгоритмы*R*Julia*Машинное обучение*

Привет, хаброчеловек)
В этой статье рассмотрим алгоритмы кластеризации DBSCAN и OPTICS, посмотрим их особенности, обсудим, когда что лучше применять
Welcome под кат

+13

ChatApp1 3 июн в 11:10

Блюда и блоки: как «Программатор» помог улучшить бизнес-процессы в сети ресторанов

Средний

3 мин

348

Блог компании ChatAppJavaScript*IT-инфраструктура*Алгоритмы*Интернет-маркетинг*

Обзор

Recovery Mode

Сеть ресторанов запустила акцию в честь 8 марта: забронируйте столик в праздник, приходите в одиночку или с друзьями, затем закажите праздничный ужин и получите бесплатный десерт. Рекламу акции настроили через Facebook Ads. Менеджерам приходили уведомления об отклике.

Они звонили, но в ответ слышали удивленные и раздраженные вопросы: «А вы кто? Какой ресторан? Акция? Я никуда не нажимал, как вы мне позвонили?»

Менеджеры объясняли, кто они и какую акцию устраивает ресторан. Люди отказывались или сразу сбрасывали трубку.

Вместо того, чтобы бронировать столики для потенциальных клиентов, менеджеры тратили время на объяснения. А заинтересованные в акции не дозвонились.

Давайте разбираться, почему так вышло:

Люди, которым звонили менеджеры, оставляли номер телефона в рекламном посте часто по случайности или из любопытства. Спустя время забыли об этом и не поняли, почему им звонят.

Как не допустить такой ситуации в будущем?

Во-первых, нужно принять: люди будут случайно нажимать не на те кнопки. Значит, надо придумать, как из списка кликнувших на рекламное объявление сразу выбрать тех, кто заинтересован в продукте или услуге. И сделать это сможет бот лидогенерации. Он станет лакмусовой бумажкой, помогающей выявить потенциального клиента.

Человек через рекламу Google Ads, Яндекс.Директ, Facebook Ads или другую будет сразу попадать в бота. Тот задаст необходимые вопросы, а пользователь сможет принять решение.

Для таких случаев мы разработали сценарий в ChatApp Конструкторе ботов. Давайте взглянем на него.

apodavalov 2 июн в 01:36

Механика и стратегия игры «5букв»

Простой

7 мин

3.3K

Алгоритмы*Логические игры

Разберемся как выигрывать в игру 5букв с вероятностью 100%.

На основе вырабатанной стратегия игры разработано консольное приложение, помогающее играть в игру.

aio350 1 июн в 11:01

Учимся летать: симуляция эволюции на Rust. 1/5

Средний

10 мин

Блог компании Timeweb CloudПрограммирование*Системное программирование*Алгоритмы*Rust*

Туториал

Перевод

В этой серии статей мы создадим симуляцию эволюции с помощью нейронной сети и генетического алгоритма.

Я расскажу вам, как работают простая нейронная сеть и генетический алгоритм, затем мы реализуем их на Rust и скомпилируем приложение в WebAssembly.

Предполагается, что вы немного знакомы с Rust, остальное я постараюсь объяснить.

Эта серия состоит из нескольких статей:

Введение (что мы будем симулировать, как работает нейронная сеть и генетический алгоритм).
Реализация нейронной сети.
Реализация генетического алгоритма.
Реализация глаз, мозга и самой симуляции (в двух частях).

Интересно? Тогда поехали.

Читать дальше →

+32

Sivchenko_translate 31 мая в 23:33

Все числа равны, но некоторые равнее. Как в Python сравниваются Int и Float

17 мин

14K

Python*Программирование*Алгоритмы*C*Математика*

Перевод

Ещё одна причуда Python, исследование её подноготной и попытка понять, почему так случается.

Недавно в сети X был популярен этот твит (см. скриншот), и я обратил внимание. Это очередной сюрприз в Python, связанный с характерными для него уникальными деталями реализации.

+44

mikhailpautov 31 мая в 19:48

Как защититься от кражи нейронной сети: устойчивые цифровые водяные знаки

Сложный

8 мин

3.8K

Блог компании AIRIИнформационная безопасность*Алгоритмы*Машинное обучение*Искусственный интеллект

Кейс

Привет, Хабр! Меня зовут Миша Паутов, я аспирант Сколтеха и научный сотрудник группы Доверенные и безопасные интеллектуальные системы Института AIRI. Совсем недавно вместе коллегами мы предложили новый метод создания цифровых водяных знаков для нейронных сетей. Такие объекты, по-другому называемые ватермарками, можно использовать для определения того, что вашу нейросеть кто-то скопировал и выдаёт за свою. Здесь я расскажу, в чем состоит идея предложенного метода, а более детально о нем можно почитать в препринте статьи, принятой на международную конференцию IJCAI.

PatientZero 31 мая в 11:13

Сложно ли генерировать 1024-битные простые числа?

Простой

28 мин

11K

Информационная безопасность*Криптография*Алгоритмы*Математика*

Туториал

Перевод

Простые числа удивительны!

С одной стороны, их легко объяснить: это просто числа, которые делятся только на единицу и на себя; с другой стороны, они содержат в себе бесконечную сложность. Они встречаются во множестве разных сфер, от математических концепций и гипотез до любопытных визуализаций и криптографии, лежат в основе многих Интернет-стандартов и протоколов безопасности, которые мы используем ежедневно.

Несмотря на моё восхищение простыми числами, я никогда не исследовал их подробно, поэтому решил бросить себе вызов. А есть ли лучший способ изучить простые числа, чем воспользоваться моей любовью к кодингу для их генерации?

Вызов

Но какие простые числа мне генерировать? Нахождение миллиардного числа — это слишком просто, а попадание в таблицу рекордов самых больших известных простых чисел — слишком амбициозная задача для первой попытки. Соединив простые числа и интерес к криптографии, я придумал такую задачу:

Генерировать простые числа, способные генерировать ключи для алгоритма RSA

На момент написания этой статьи хорошей длиной ключей RSA считаются 2048 битов. Ключи RSA генерируются перемножением двух простых чисел, так что для получения 2048-битного ключа нам нужны два числа длиной примерно 1024 бита. Это ограничивает рамки задачи генерацией 1024-битных простых чисел. Теперь вы знаете, откуда взялось число из заголовка поста.

+71

TVExpert 30 мая в 14:54

Здравый смысл «вне закона»?

Средний

8 мин

2.4K

Алгоритмы*

Мнение

Необычные и при этом "вне понимания" ситуации были всегда, их появление можно оправдать/понять в нестандартных ситуациях, где участники впервые встретились с задачей, которую до этого они никак не встречали/не решали и т.п.
Но насколько оправданно такое поведение для "профи" ?

Несколько примеров

-1

2 3 ...

277 278

Алгоритмы *

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

Новости

Эвристики морских просторов: математическая оптимизация океанских контейнеровозов

Простые способы ускорения обучения PyTorch-моделей

Быстрое вычисление степени

Истории

Хитрый Алгоритм: Решение задачи Continuous Subarray Sum

Учимся летать: симуляция эволюции на Rust. 2/5

Сверхскоростные связные списки

Как Toutiao взорвал китайский интернет и породил рекомендательный алгоритм ТикТока

Система команд на основе переменных

Укрощаем суммы с плавающей запятой

Мысли по поводу доклада на FPGA-Systems про маршрут ИРИС из МГУ

Про обязательность поправки на множественные сравнения, которая часто игнорируется адептами Data Driven методов

Сравниваем популярные алгоритмы кластеризации DBSCAN и OPTICS

Ближайшие события

Блюда и блоки: как «Программатор» помог улучшить бизнес-процессы в сети ресторанов

Механика и стратегия игры «5букв»

Учимся летать: симуляция эволюции на Rust. 1/5

Все числа равны, но некоторые равнее. Как в Python сравниваются Int и Float

Как защититься от кражи нейронной сети: устойчивые цифровые водяные знаки

Сложно ли генерировать 1024-битные простые числа?

Здравый смысл «вне закона»?

Вклад авторов