Pull to refresh

Comments 10

Спасибо! Интересная статья. Пробовали ли вы использовать возможности, например, OpenMP 4.5 (или какие-либо другие технологии) для применения векторизации вместо интринсиков, чтобы снизить расходы на реализацию и поддержку кода и новых наборов инструкций? Если пробовали, насколько различается производительность на разных поколениях hardware?
Здравствуйте. С OpenMP 4.5 не работал. В современных компиляторах достаточно неплохо работает автовекторизация кода. К сожалению, она хорошо работае только для тривиальных случаев. Чуть что посложнее — и приходится ручками оптимизировать. Например, я совершенно не представляю, как бы компилятор справился с автовекторизацией алгоритма из статьи.
Да, я понимаю. Про OpenMP я спросил, так как эта технология позволяет векторизовать код используя директивы препроцессора.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
Прошу прощения, промахнулся с сеткой.
Подскажите, пожалуйста, где еще можно посмотреть на фотографии Лены? Данная часть статьи заинтересовала больше всего!
вы используете буквально пару инструкций из SSE4.1. Можно с минимальными изменениями адаптировать код под sse2/sse3, для более старых процов.
Да. Можно. Мне наверное не сильно сложно было бы добавить. Но на сколько это актуально?
UFO just landed and posted this here
Не везде есть возможность работать на GPU. Да и не все алгоритмы на GPU хорошо ложатся.
Sign up to leave a comment.

Articles