Pull to refresh

Comments 7

Очень доходчиво, компетентно написано, прямо как научная работа. Спасибо!

Насчет неравенства треугольника и вообще почему это расстояние является расстоянием.


Расстояние в векторном пространстве можно задавать с помощью скалярного произведения. А само по себе скалярное произведение — это положительно определенная невырожденная симметрическая билинейная форма.
Если задан некоторый базис, то скалярное произведение (u, v) = u^T A v для некоторой матрицы A, которая должна быть симметричной и иметь только положительные собственные значения. В обратную сторону по любой такой матрице A строится скалярное произведение.


Так вот, матрица ковариаций набора случайных величин, конечно, является симметричной и положительно определенной (то есть у нее все собственные значения положительные, потому что отвечают ковариациям главных компонент с самими собой), поэтому обратная матрица к матрице ковариаций задает корректно определенное скалярное произведение и, следовательно, расстояние.

Ещё бы до ката было написано, что это за махалабонис такой…
расстояние Махаланобиса предполагает, что точки множества сферически распределены вокруг центра масс.

Какие ограничения это накладывает на применение критерия? Является ли сферичность множества следствием нормальности распределения? В каких умозрительных примерах критерий может адекватно применяться (я читал финальное перечисление, можно пример попроще — например, применим ли он к спутникам на орбите Земли (сферически-симметричное гравитационное поле), сферическому облаку выпущенной из ружья дроби (как неинерциальной системе отсчета), звездам в галактиках с активным центром и т.д.)?
1. «Какие ограничения это накладывает на применение критерия?»
Все ограничения связаны по большей части с необратимостью матрицы ковариаций.
Многое зависит от цели исследования. Все ограничения не описать в одном сообщении.
Можно привести одно ограничение, которое не было рассмотрено в статье — при расчете расстояния Махаланобиса между двумя классами по принципу центроида можно натолкнуться на редкий случай, когда два класса не совпадают, но имеют одинаковые центроиды (по сути один класс окружен другим), и расстояние, соответственно, равно 0 (опять же, по принципу центроида). Это ограничение устраняет расстояние Бхаттачарьи.
Вкратце — все зависит от ситуации.

2. «Является ли сферичность множества следствием нормальности распределения?»
Вопрос: «Если точки нормально распределены, описывают ли они сферообразное множество?».
Ответ: в общем случае — нет (оно и понятно, сфера — частный случай).
А эллипс в общем случае? Вряд ли. Существует т. н. эллиптическое распределение, которое обобщает многомерное нормальное распределение.

Вопрос: «Если точки описывают сферообразное множество, то они нормально распределены?»
Ответ: да, многомерно нормально распределены.

Расстояние Махаланобиса в общем случае описывает эллипс. Сделал исправление в статье:
«расстояние Махаланобиса предполагает, что точки множества эллипсоидально (частный случай — сферически) распределены вокруг центра масс».

3. «В каких умозрительных примерах критерий может адекватно применяться?»
В приведенных вами примерах теоретически может применяться (практически — нужно проверять).
Я видел следующие применения (статьи с картинками):
— в многоклассовой классификации изображений дистанционного зондирования (статья);
— в кластеризации объектов, изображенных на космических снимках (статья).
Отдельный респектосище за код и примеры. Статья огонь.
UFO just landed and posted this here
Sign up to leave a comment.

Articles