Comments / Profile of SmartEngines / Habr

How to become an author

Пользователь

Profile Publications 185Comments 384Bookmarks 25

Сказ о том, как мы искали новые векторные расширения на ARM

SmartEngines May 7 at 15:23

Приветствуем!

Да, в этом направлении мы тоже работаем. Однако несмотря на то, что графические ускорители есть практически везде, там тот еще зоопарк. Нужно поддерживать как минимум ветку для устройств Apple и OpenCL для всех остальных, но на практике оказывается, что не на всех мобильных GPU OpenCL работает одинаково хорошо.

0

Как мы сделали визуализатор трехмерных изображений с нуля

SmartEngines Apr 27 at 16:26

Про реконструкцию поверхностей: пока нет, но есть в планах. Следите за нашими новостями)

0

Как мы сделали визуализатор трехмерных изображений с нуля

SmartEngines Apr 27 at 15:19

Vulkan позволяет гораздо эффективнее общаться с видеокартой по сравнению с OpenGL, когда требуется отправлять большое количество команд или работать с несколькими видеокартами одновременно. Однако в нашем случае переход на Vulkan не принесет никаких преимуществ. Мы не сможем воспользоваться его возможностями, поскольку отправляем на видеокарту лишь небольшое количество несложных команд в процессе отрисовки. С другой стороны, OpenGL очень широко распространен, что для нас крайне важно.

+1

Как мы сделали визуализатор трехмерных изображений с нуля

SmartEngines Apr 27 at 15:18

Приветствуем! Благодарим за интерес к статье.

Про воксельный редактор: такой редактор — отдельный непростой продукт, и пока в наши планы его создание не входит. Нам кажется, что распыляться и делать кое-как — это неправильно. Мы будем делать свое и прекрасно, а другое сделает прекрасно кто-нибудь еще.

Про ОКТ: это может быть интересным направлением развития. Спасибо за идею. Но пока мы еще не начали экспансию за пределы области рентгеновских методов.

+1

Ученые Smart Engines нашли способ повысить эффективность работы нейросетей на 40%

SmartEngines Apr 27 at 14:44

Также сравнились с 4 битами, для которых есть быстрая ЦПУ имплементация (дальше только тернарные, тернарно-бинарные и бинарные сети, которые заметно хуже по качеству), и 4.6-битное квантование лучше по качеству и всего на 4% медленнее.

0

Ученые Smart Engines нашли способ повысить эффективность работы нейросетей на 40%

SmartEngines Apr 26 at 15:37

fp8/bf8 принципиально отличаются от нашей схемы квантования, так как это типы данных с плавающей точкой и для работы с ними нужны отдельные арифметико-логические устройства, которые есть не на всех центральных процессорах. Наш же тип использует линейную схему квантования и работает полностью в целых числах, скоро напишем подробную статью.

0

Ученые Smart Engines нашли способ повысить эффективность работы нейросетей на 40%

SmartEngines Apr 26 at 10:56

Для llama моделей схемы квантования qn_* устроены следующим образом: веса делятся на блоки и в каждом блоке квантуются независимо до n разрядов. То есть на каждый блок еще приходится несколько параметров схемы квантования (например, scale и bias, которые также могут иметь разную разрядность). В результате усреднения по сети получаются дробные значения bits per weight, которые можно, например, видеть в таблице. При этом на один вес приходится 2^n возможных значений.

Вычисление квантованных llama моделей, разумеется, использует AVX на CPU. Сначала квантованные веса загружаются в векторные регистры, чем сильнее квантована сеть, тем больше весов можно загрузить за один load. Далее эти веса распаковываются непосредственно на регистрах и вычисляется скалярное произведение с помощью AVX-инструкций. Проверили сейчас, непосредственно в llama.cpp для типов q4_0 и q8_0 выполняется распаковка в int8 для весов и fp16 для скейлов (сравните функции ggml_vec_dot_q4_0_q8_0 для типа q4_0 и ggml_vec_dot_q8_0_q8_0 для типа q8_0 тут) и скалярное произведение вычисляется умножением значений int8 c аккумулированием во float. То есть, разница в скорости для двух этих типов возникает за счет загрузки и распаковки весов, не самого вычисления скалярного прозведения.

В нашем случае диапазон значений веса не является степенью двойки и позволяет представить больше, чем 16 значений, однако позволяет нам имплементировать матричное умножение более эффективно, чем для 8-битных сетей.

В результате мы достигаем скорости практически как у 4-битных моделей, но 4.6-битные сети работают точнее.

+1

Ученые Smart Engines нашли способ повысить эффективность работы нейросетей на 40%

SmartEngines Apr 25 at 15:45

В случае больших языковых моделей основным ограничивающим фактором является пропускная способность памяти. GGUF является форматом хранения, при котором коэффициенты квантуются, и модель начинает занимать меньше места, а уже в оперативной памяти по частям преобразуется в fp16 или bf16 для вычислений.

Мы же работаем с моделями существенно меньшего размера и квантуем не для эффективного сжатия в памяти в первую очередь, а для вычислений. В результате, у нас отличается и сама схема квантования, и подход к ее вычислению: мы квантуем веса, входные сигналы и вычисляем свертки полностью в целых числах, оптимизируя все методы для центральных процессоров.

0

Как мы сделали визуализатор трехмерных изображений с нуля

SmartEngines Apr 25 at 10:23

Здравствуйте! Спасибо за ваш отзыв, очень рады, что статья показалась вам интересной.

Разработка подобных инструментов визуализации относится к области компьютерной графики и требует знаний в программировании GPU, так и понимания алгоритмов трассировки лучей, методов объемного рендеринга.

Порог входа достаточно высокий, особенно если целью является создание высокопроизводительных интерактивных инструментов. Необходимо хорошо разбираться в низкоуровневом программировании не только GPU, но и хорошо знать способы оптимизации CPU, а также иметь хорошие знания в оптимизации алгоритмов и работе с большими объемами данных.

Если будут еще вопросы - обращайтесь, будем рады помочь!

+1

Что дороже, томограф или драгоценный камень в нём?

SmartEngines Mar 21 at 15:10

Рентгеновская и механическая части производства российской компании ЭЛТЕХ-Мед, вся вычислительная часть (реконструкция, коррекция, сегментация и визуализация) - Smart Engines.

Основные параметры:
Диапазон тока: 0.05-0.15 мкА
Диапазон напряжений: 35-130 кВ
Размер пикселя детектора: 140х140 мкм
Предельное разрешение: ~30-35мкм

Характерные размеры загрузочной камеры на картинке.

0

Что дороже, томограф или драгоценный камень в нём?

SmartEngines Mar 21 at 13:33

Исследование драгоценных камней проводилось в рамках научной работы. Пока мы не планируем делать бизнес на проверках, наш бизнес – это софт. Чтобы делать такие исследования необходимы рентгеновская часть и софт, с вопросами по их покупке пишите нам через форму на сайте https://smartengines.ru/smart-tomo-engine/.

0

Как правильно генерировать обучающие данные для OCR?

SmartEngines Feb 15 at 11:51

Добрый день!

Ничего не знаем насчет всех остальных, но мы умеем и делаем)

+1

Как манекены калибруют томографы

SmartEngines Feb 1 at 13:35

Положив в КТ, мы узнаем, что внутри.

0

Россияне совершили более 0,5 млрд платежей по QR-кодам в 2023 году с использованием софта Smart Engines

SmartEngines Jan 26 at 15:38

Когда речь идет о распознавании выполненных по стандарту QR в хороших условиях распознавания - тут вы правы. Более того, даже десятки бесплатных библиотек, написанных студентами старших курсов, справятся с такой задачей.

Но когда речь о живых кейсах, включающих отклонения от стандартов, плохие условия освещенности, существенные повреждения баркода, наличие глубокой проективности и т.д. - требуется полноценное промышленное решение, которое не зависит от платформы.

+1

Россияне совершили более 0,5 млрд платежей по QR-кодам в 2023 году с использованием софта Smart Engines

SmartEngines Jan 26 at 15:28

Спасибо! Благодарим за интерес к нашим технологиям.

0

Томографический калейдоскоп, или подведение итогов уходящего 2023 года вместе с STE

SmartEngines Jan 17 at 13:32

Дорогие друзья! 19 января заканчивается марафон новогодних праздников. Поэтому еще три дня очень ждем ваши комментарии, после чего выберем победителя и направим ему наш календарик!

0

Smart Engines обучила ИИ видеть скрытые пространства и запатентовала технологию в США

SmartEngines Dec 31 2023 at 18:04

Добрый вечер!

Алгоритмы сами по себе не накладывают ограничений, все зависит от системы технического зрения, которую вы будете использовать. Параметры оптики и матрицы, расстояние от объекта — все это будет влиять, более того, для таких точностей будет влиять еще и стабильность их характеристик.

Будем рады быть полезными, за деталями — уже в 2024 году) С наступающими праздниками!

0

Smart Engines обучила ИИ видеть скрытые пространства и запатентовала технологию в США

SmartEngines Dec 31 2023 at 11:19

Добрый день!

Национальные патенты РФ не признаются в США. Поэтому мы и патентуем наши разработки как в России, так и в США.

С наступающим Новым годом!

0

Smart Engines обучила ИИ видеть скрытые пространства и запатентовала технологию в США

SmartEngines Dec 30 2023 at 11:37

Спасибо!

+1

Ученые Smart Engines создали ИИ, сканирующий обрезанные QR-коды для платежей

SmartEngines Dec 24 2023 at 10:50

Добрый день!

Речь идет о QR-кодах, использующихся для платежей, 7 поколения и позже

0

1

2 3 ...