YakMik Jul 12 2020 at 23:26

Линейная аппроксимация комбинации линий по набору зашумленных точек

3 min

9.4K

Algorithms*Image processing*

+15

Comments 37

Shkaff Jul 13 2020 at 00:05

Кажется, у вас получается вариант преобразования Хафа, который вроде как стандартный метод для таких дел.

YakMik Jul 13 2020 at 07:41

В Хафе расстояния тоже перебираются по фиксированной сетке, а тут более плавно)

m03r Jul 13 2020 at 09:57

а Вы не пробовали multiscale преобразование Хафа?

YakMik Jul 13 2020 at 10:12

Было бы классно если сразу ссылку дали где про него читать, и что именно имеется ввиду.

m03r Jul 13 2020 at 11:47

OpenCV предлагает два прохода детектора: сначала с обычным разрешением, а потом с увеличенным.

Но по зрелом размышлении Хаф не подходит по другой причине: OpenCV'шная, например, реализация совсем не дружит с такими линиями, выдавая кучу близкорасположенных прямых вместо одной необходимой.

Похожую проблему я решил однажды следующим способом: вручную проводил преобразование Хафа (потому что функция OpenCV выдаёт уже сами линии), а потом аккуратно blur'ил результат преобразования Хафа так, что несколько близкорасположенных линий сливались в одну усреднённую.

Соединяя всё вместе, получается какой-то такой алгоритм:
1. Провести преобразование Хафа с низким разрешением
2. Заблюрить его результат, выделить интересные области
3. Провести преобразование Хафа с высоким разрешением только по этим областям
4. Найти уточнённое значение: возможно с помощью лёгкого размытия, а, возможно, сразу считать центр масс всех точек.

YakMik Jul 13 2020 at 12:03

Вот вот, вы в разрешение упирались, а можно было смотреть сразу в разрезе расстояний) а какие точки использовать, какие не использовать — все что я понял какого то революционного подхода нет)

aamonster Jul 13 2020 at 08:59

Хороший подход, рабочий, но стоило бы сразу сравнить свой алгоритм с часто используемыми для подобных задач.
Навскидку – уже названное преобразование Хафа (по сути оно же) и RANSAC.

YakMik Jul 13 2020 at 09:13

В Хафе вы будете перебирать фиксированную сетку, а именно линии с определенным углом и смещением. Таким образом потом оценивая какой из вариантов больше всего подходит.
В данной схеме у вас изначальный подход другой. Вы измеряете всевозможные расстояния от точки до вариаций линий с различным углом, таким образом далее оценивая с каким смещением линия имеет максимальное количество точек.
Таким образом если вы действительно использовали Хафа от начала до конца, при этом реализовывая собственноручно, вы бы поняли что при необходимости более точного нахождения линии с первого шага преимущество данного метода. Данный метод изначально покрывает всевозможные вариации линий)

YakMik Jul 13 2020 at 09:16

На Хафа похоже) и он и использовался в начале) никто не спорит, но далее используются преимущества конкретной задачи, а именно, то что детектируем линии. Допустим мы перебираем сетку из 100 углов и 100 смещений, получаем расчёт расстояний для 10000 вариаций линий, а в данном случае мы рассчитываем вариации расстояний для 100 вариантов линий, а далее на базе полученных смещений, ищем то, на котором имеется максимальное количество приблизительно одинаковых расстояний. Чувствуете изменение сложности вычислений?)

Shkaff Jul 13 2020 at 09:51

Было бы любопытно сравнить скорость работы двух алгоритмов. А еще, вот что интересно: как себя ведет ваш алгоритм с увеличением шума и уменьшением угла между прямыми? Если не ошибаюсь, если смотреть на гистограммы, ширина пиков будет задаваться уровнем шума, а разрешающая способность — углом между кривыми (для какого-то угла при заданном уровне шума вы не сможете отличить одну от другой).

YakMik Jul 13 2020 at 10:17

В выводе я как раз указал на то, что точки должны быть максимально раскиданы пространственно, тогда все будет работать стабильно. Если точки будут рядом друг с другом, естественно две линии будет детектировать проблематично.
Но в случае если мы знаем про особенность что линии у нас близко расположены друг другу мы можем навешать новые ограничительные условия и использовать особенность данной задачи.
Классический Хаф тоже будет проблематично детектировать две близко расположенные линии.
По поводу скорости распознавания, то данная схема должна работать веселее) Из за того что не нужно перебирать разные варианты расстояний.

Shkaff Jul 13 2020 at 11:01

Да, вот мне было интересно, будет ли один из алгоритмов лучше в смысле различения двух линий. Но, наверное, нет причин для принципиальной разницы.

А Хафа, наверное, можно рандомизировать для ускорения. Или по адаптивной сетке пустить.

YakMik Jul 13 2020 at 11:23

Смотрите, по Хафу у вас есть фиксированный набор смещений, все, мы уперлись в то что нужно много считать. Хотим найти смещений с точностью 1 ед нужно выполнить 1000 вычислений, с шагом 0.5 ед нужно выполнить 2000 вычислений.
А по данной схеме, вы за одно вычисления определили все расстояния. Т.е. мы берем линию с нулевым смещением и определяем расстояния всех точек до этой линии с этим нулевым смещением. Далее мы просто смотрим на каком расстоянии больше всего точек сконцентрировано => то расстояние на котором расположена линия. Итого 1 вычисление + вспомогательные вычисления по определению того самого расстояния, на котором больше всего точек.

Shkaff Jul 13 2020 at 11:55

Хотим найти смещений с точностью 1 ед нужно выполнить 1000 вычислений, с шагом 0.5 ед нужно выполнить 2000 вычислений.

А вот я нашел рандомизированный Хаф. А вот еще на байесовской оценке.

Но вообще, ваш метод выглядит быстро, действительно.

aamonster Jul 13 2020 at 17:04

По сложности – вроде сопоставимо получается.
Пусть у нас M точек и делаем преобразование Хафа N*N (N значений угла, N значений исходной точки). Для «нанесения образа» каждой точки на итоговую картинку надо «нарисовать» кривую (синусоиду или что там) длиной O(N). Итого сложность O(M*N).
Для вашего варианта: цикл по углам (N), для каждого строим гистограмму по M точкам – итого опять O(M*N). Более того: эта гистограмма – это аккурат строчка в результате преобразования Хафа (если его выполнять по тому же преобразованию координат, которое используетет вы). По сути, вы меняете местами циклы в преобразовании Хафа (ну и вносите дополнения типа сглаживания строки, обычная практика). Не знаю, как выгоднее – надо проверять на конкретных данных. Но такого, чтобы один метод принципиально выигрывал у другого, вроде не должно быть – скорей удастся сыграть на более тонких вещах вроде уменьшения числа cache misses.

YakMik Jul 13 2020 at 17:12

Читайте внимательнее описание и комментарии и вы поймете где именно вы со сложности O(M*N*N) перепрыгните на сложность O(M*N)

YakMik Jul 13 2020 at 17:14

«Чёткие» пацанчики строят гистограмму за O(N) ))))

aamonster Jul 13 2020 at 17:25

Нигде не перепрыгиваем. Нету в алгоритме Хафа O(M*N*N). Есть O(M*N): для каждой точки строим кривую, наносимую на образ.

Вы, наверное, попутали из-за того, что считали алгоритм Хафа для перевода изображения в изображение, а не списка точек в изображение (там M=N*N). Ну так он, как и ваш алгоритм, «любит», когда входных точек мало.

aamonster Jul 13 2020 at 10:08

Хаф всё равно именно для нахождения линий используется, а уточнение параметров – отдельный шаг (а вам всё равно придётся уточнять угол – ну да, не оба параметра линии, а один).

Imho более важное отличие чуть другое (хотя по нынешним временам это не очень существенно): вам единовременно нужна одномерная гистограмма, а не двумерная.

Интереснее разница с RANSAC. Хотя RANSAC скорее актуален для более сложных случаев – когда у нас 3 и более параметра, определяющих объект.

Меня на самом деле смутила фраза «единственный способ, который пришел в голову» – ну, вы понимаете)

YakMik Jul 13 2020 at 10:20

«единственный способ, который пришел в голову» тут согласен) просто это не совсем Хаф был) Скажите как написать корректно и литературно, исправлю)

aamonster Jul 13 2020 at 16:51

Да это несущественно на самом деле: кто разбирается – поймёт, кто не разбирается – тем и описание вашего подхода сгодится, чтобы разобраться.

Смутила – в том плане, что для подобных статей характерен обзор «люди делают так, так и так; у этих методов такие-то недостатки, поэтому сделаем так – получим такие-то плюсы и такие-то минусы, плюсы в нашей задаче перекрывают минусы».

a_podshivalov Jul 13 2020 at 10:08

К части 2 — откройте учебник Александрова по аналитической геометрии, расстояние от точки до прямой вычисляется гораздо проще:

bookre.org/reader?file=440728&pg=28

К тексту вообще — а почему бы не использовать что-нибудь тупое, типа метода наименьших квадратов?

YakMik Jul 13 2020 at 10:21

Я уверен именно так и вычисляется) Просто привел вывод формулы)

YDR Jul 13 2020 at 10:53

Я не могу сразу понять, почему это не простейший линейный МНК?

YakMik Jul 13 2020 at 10:57

Когда не можете понять, берете и пробуете) Получаете картинку с 3 рисунка)

Arastas Jul 13 2020 at 16:57

Справедливости ради, для случая двух прямых эта задача сводится к МНК с квадратичной нелинейностью, что при отсутсвии шумов точно восстанавливает требуемые прямые, а при наличии шумов даёт оптимальную в некотором смысле оценку. Которую потом резонно использовать как начальное приближение для локальной оптимизации с требуемым критерием оптимальности.
Точнее сказать, задача сводится к линейной регрессии с квадратичными функциями координат и билинейностями по параметрам. А дальше хоть МНК, хоть что угодно.

YakMik Jul 13 2020 at 17:07

А теперь помедленнее и поподробнее, что вы имели ввиду)

Arastas Jul 13 2020 at 17:15

Я имел ввиду, что вашу задачу можно решить с использованием МНК.

YakMik Jul 13 2020 at 17:26

Сразу две линии по методу МНК? это как?) тут я что то не понимаю)
Как я себе представляю 2 линии в общем понимании: это набор из 4 коэффициентов, а именно k1 b1 и k2 b2. МНК это по сути взятие производных по этим 4 параметрам и решение общей системы уравнений с 4 неизвестными, нооооооо так как у нас две разные линии, а мы априори не знаем какие точки в какой линии участвуют, как вы решать собираетесь?)
Если действительно есть какой то способ, расскажите, это действительно интересно)

Arastas Jul 13 2020 at 17:38

Ну так ваши две линии это же на смом деле одна кривая второго порядка, верно? Точнее, если я правильно помню, это вырожденная гипербола.
Смотрите, у нас каждая точка должна принадлежать либо прямой y=k1 x+b1, либо прямой y=k2 x+b2. То есть для любой точки на этих прямых вы получите
(k1 x+b1-y) (k2 x+b2-y) = 0,
или
A x^2+B xy+C x+D y + E = y^2,
где A, B, C, D, E зависят от k1, b1, k2 ,b2 (зная одни можно найти другие, в обе стооны). А это, кстати, уже почти что обобщенное уравнение кривой второго порядка на плоскости.
Применяете МНК, находите A, B, C, D, E, а из них k1, b1, k2, b2. Если использовать в качестве измерений не x1, x2, y1, y2, а попарные разницы, то можно обойтись без нахождения E, так как оно всё равно не нужно.
я мучительно страдаю от отсутствия поддержки LaTeX в комментариях. Ну как так...

YakMik Jul 13 2020 at 17:51

По ходу это то, что я искал) Буду изучать дома)
А вы всмысле решали подобную задачу? Она имеет аналитическое решение в конце? Не будет там что корни невозможно найти аналитически?
Вы красавчик! Это реально красиво с перемножением)

Arastas Jul 13 2020 at 18:00

Просто знакомая область.
С нахождением корней — там получится одно квадратное уравнение для k1, k2, и либо линейная система из двух уравнений для b1, b2, либо ещё одно квадратное уравнение. Но осторожно, так как вычисление b1 и b2 через линейную систему может быть плохо обусловлено когда k1 и k2 почти одинаковые (параллельные прямые).

Shkaff Jul 13 2020 at 11:02

Наверное, суть в том, что у вас не два набора данных, куда надо аппроксимировать, а один, где вы не можете отделить две последовательности.

YakMik Jul 13 2020 at 17:54

Так вы это и подразумевали?) То, что дальше писал Arastas?)

iShrimp Jul 13 2020 at 18:06

В общем, суть вашей задачи — преобразовать облако точек из пространства (х, у) в пространство (r, θ), где θ — угол наклона прямой, а r — расстояние до центра.
В вашей реализации, если я правильно понимаю, вы заполняете массив (r, θ) с помощью 3 вложенных циклов: радиус, угол, номер точки.
Не пробовали ли вы решить задачу с другого конца: для каждой точки перебирать все возможные прямые (т.е. пары значений r, θ), которым она может принадлежать? Тогда у вас получится не 3, а 2 вложенных цикла — с параметрами n и θ.
Этот метод может сработать быстрее, но с ним намного труднее контролировать точность детекции прямых, так как собственно сама по себе операция преобразования координат очень нелинейна.

YakMik Jul 13 2020 at 18:14

Неееее) перебираются только углы, для каждого угла определяется расстояние до линии с нулевым смещением, таким образом перебирая набор расстояний до этой линии, мы видим на каком расстоянии сосредоточено больше всего точек. Таким образом там всего 2 вложенных цикла.

iShrimp Jul 13 2020 at 19:01

Да, я понял, внешний цикл — перебор углов, внутренний цикл — перебор точек.
У меня была похожая задача по поиску прямых линий, и я делал массив (r, θ) c таким разрешением, чтобы линия определялась с точностью до пикселя. Т.е. в Вашем случае из одномерных гистограмм можно сложить двумерную и искать в ней локальные максимумы. Но, если чрезмерно поднять разрешение, гистограмма станет очень шумной и потребует сглаживания фильтром Гаусса, ширина которого зависит от требуемой точности разделения линий.

Заголовок спойлера

Show the best of all time