Comments 10
Спасибо! Интересная статья. Пробовали ли вы использовать возможности, например, OpenMP 4.5 (или какие-либо другие технологии) для применения векторизации вместо интринсиков, чтобы снизить расходы на реализацию и поддержку кода и новых наборов инструкций? Если пробовали, насколько различается производительность на разных поколениях hardware?
0
Здравствуйте. С OpenMP 4.5 не работал. В современных компиляторах достаточно неплохо работает автовекторизация кода. К сожалению, она хорошо работае только для тривиальных случаев. Чуть что посложнее — и приходится ручками оптимизировать. Например, я совершенно не представляю, как бы компилятор справился с автовекторизацией алгоритма из статьи.
0
Да, я понимаю. Про OpenMP я спросил, так как эта технология позволяет векторизовать код используя директивы препроцессора.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
Они в каком-то смысле помогают компилятору справится с векторизацией и оптимизацией кода.
0
Подскажите, пожалуйста, где еще можно посмотреть на фотографии Лены? Данная часть статьи заинтересовала больше всего!
0
вы используете буквально пару инструкций из SSE4.1. Можно с минимальными изменениями адаптировать код под sse2/sse3, для более старых процов.
0
UFO just landed and posted this here
Sign up to leave a comment.
Ускоряем метод Виолы-Джонса (Viola-Jones)