kpeo Jul 4 2012 at 13:15

Подсчет ссылок атомарными переменными в C/C++ и GCC

7 min

C++*C*

+26

Comments 20

JustLuckyGuy Jul 4 2012 at 16:46

Меня всегда радуют такие топики. Все еще есть достойные статьи и тут. Но где обсуждение?

injecto Jul 4 2012 at 18:19

Где-то рядом. В топиках с прикольными картинками, инновационными свистелками и очередными клонами очередных девайсов.

Unhandled_Exception Jul 4 2012 at 17:34

> Второй поток (стиратель) удаляет устаревшие объекты. Время от времени, первый поток пытается оперировать объектом, который второй поток пытается удалить. Это классический сценарий, который можно найти практически в любой многопоточной программе.

А можно пример? На самом деле непонятно.

Когда надо получить ссылку на объект из списка, лочим список. Когда надо удалить ссылку на объект из списка, лочим список. В общем, манипуляции со списком делаем под локом.

Объект удаляется, когда число ссылок на него становится равным нулю.

> А если его счетчик ссылок больше, чем один? В этом случае мы должны ждать, пока счетчик ссылок потоков не станет нулевым.

Зачем надо ждать? Если число ссылок больше, чем один, значит кто-то захватил объект. Вот когда он освбодит, будет проверено, есть ли еще ссылки не объект. Если нет, то объект удаляется.

Скорее всего я просто не понял сценарий.

kpeo Jul 4 2012 at 18:24

Насчет примеров — самые яркие из них это работа с данными в БД. Положим, в некоторой непродуманной архитектуре есть процесс 1, который периодически чистит таблицу, например вчерашние данные («DELETE FROM mytable WHERE mydate<SYSDATE-1»), а другой процесс 2, оперируя закешированными данными или непосредственно делая предварительную выборку данных захочет поменять какую-то строку, предполагаемую для удаления процессом 1. процесс 2 считывает данные, процесс 1 удаляет данные, процесс 2 пытается изменить удаленную строку. Упс. Это еще не худший вариант, ибо есть deadlock'и

Лочить весь список — не вариант в многопоточном приложении. Как и было сказано «Если все, что делает поток манипулятора — это поиск записей и их обработка, то поток стирателя просто не сможет получить доступ к структуре данных». Т.е. манипулятор в этом случае будет лочить список постоянно и без остановок.

Зачем надо ждать? Если число ссылок больше, чем один, значит кто-то захватил объект. Вот когда он освободит, будет проверено, есть ли еще ссылки не объект. Если нет, то объект удаляется.

Именно об этом и говорится в тексте. Если число ссылок больше чем один, значит объект еще пользуется каким-то процессом, мы его удалить не можем и потоку придется ждать его освобождения.
Можно еще, чтобы не ждать, реализовать callback на нулевое число ссылок, хотя в этом случае никто не гарантирует отсутствие дополнительных проблем.

kpeo Jul 4 2012 at 20:04

Скорее всего я просто не понял сценарий.

Если кратко, то при наличии структуры объектов, лочить ее mutex'ом всю при операциях над объектами несколькими потоками — слишком накладно и может увеличить простои одного из процессов в бесконечность.
В этом смысле аналогией может быть работа общественной уборной.
Если при каждом заходе в уборную на 10 кабинок будет лочится вся уборная — вырастет огромная очередь.
А уборная должна периодически чиститься. И уборщица не знает заняты ли места в уборной или нет.
Заходящий в уборную должен оповестить других о занятости кабинки. Потому заходя в кабинку сигнализирует об этом (atomic counter). Не исключено, что он может туда зайти и не один, но выйти все равно должны когда-то все из кабинки и разлочить ее. Периодически в уборную заглядывает уборщица. И когда она видит, что все двери разлочены — оставляет знак перед входом об уборке (mutex) и чистит уборную.

Cupper Jul 4 2012 at 17:36

Интересный подход с мютексом на весь список и счетчиком в каждом объекте, жаль что сугубо заточен под задачу где есть поток удалятор, и 1-N поток юзателей.

И я не очень понял и как получить (использовать) объект? получается мне нужно перед использованием объекта сделать что то вроде iterator->lock(), iterator->unlock()?

В принципе было бы логично и итераторы тогда для такой очереди сделать которые как смарт поинтеры работали бы. Но в этом случае нельзя полагаться на то что объект используется минуту. Тогда встает вопрос, а как это делать?

kpeo Jul 4 2012 at 19:44

жаль что сугубо заточен под задачу где есть поток удалятор, и 1-N поток юзателей

да, можно еще сказать, что наличие объекта определяется единичным счетчиком, а остальные операции — счетчиком большим 1.
Можно еще обобщенно представить это в таком подобии псевдокода (разумеется, в оригинале объект сразу инициализируется в 1, как частный случай реализации):

eraser {
  atomic++;
  updater1 {
    atomic++;
    job();
    atomic--;
  }
  updater2 {
  ...
  }
  atomic--;
}

Может, это натолкнет на мысли об альтернативном использовании. А какая именно схема интересна?

И я не очень понял и как получить (использовать) объект?

Похоже, автор статьи больше «затачивался» в ней на чистом Си, потому и не стал писать примеры C++.

Использование зависит от реализации. В этом смысле, думаю, мысль в правильном направлении — можно сделать шаблон аналогичный смарт поинтерам или даже наследоваться от какого-нибудь из них с перегрузкой для инкремента/декремента атомарного счетчика. Т.е. получается, что итератор будет модифицированным смарт поинтером. Но тут проблема — получается, что локинг будет при каждом обращении к поинтеру, потому iterator->lock()/unlock() вполне вариант. Можно еще как вариант сделать класс сессионности, лочащего и разлочивающего объект в своей зоне видимости.

Но в этом случае нельзя полагаться на то, что объект используется минуту.

На это точно не стоит полагаться. Какой-то из потоков может вовсе зависнуть.
Но в данном случае минута — относится больше к специфике задачи.
В остальном, можно рассмотреть, как вариант, сериализацию доступа к объекту (пул потоков).

gridem Jul 5 2012 at 19:56

Интересно, а чем не нравится реализация std::shared_ptr или boost::shared_ptr? Там в моменте, когда счетчик равен 0 автоматически удаляется объект и сам счетчик. Почему необходимо обязательно выжидать дополнительного момента и проверять объект через некоторое время, да еще и сравнивать timestamp?

Cupper Jul 6 2012 at 10:44

интересно а как вы ее использовать собрались? Список в самом простом его представлении это структура вида
{
next*
prev*
data
}

когда вы удаляете элемент вам нужно изменить не один а три элемента. next у предыдущего должен указывать на следующий за удаляемым. prev следующего за удаляемым должен указывать на предыдущий перед удаляемым. И только потом уже можно удалять элемент.
Тут есть два вариант, либо лочить всю очередь. Либо, может быть, возможно придумать, как лочить только три объекта удаляемые, и те что слева справа от него. Но это крайне сложно, так как делать это по сути нужно атомарно. Но так же это будет офигенски многопоточная очередь.

gridem Jul 6 2012 at 21:57

Насколько я понял, здесь речь идет о том, что у нас есть объекты в каком-то контейнере, например hashmap, правильно? Тогда рассмотрим следующее утверждение:

В этом случае потоку манипулятора приходится удерживать мьютекс заблокированным до тех пор, пока он не найдет объект и не обработает его.

Т.е. речь идет о том, что необходимо залочить весь контейнер, пока мы не найдем объект и не завершим операцию над ним. Так вот, это утверждение в корне ошибочно. Можно поступить следующим образом:

— лочим наш контейнер
— находим объект
— инкрементируем счетчик
— анлочим контейнер
— лочим объект
— работаем
— анлочим объект
— уменьшаем счетчик
— если счетчик==0 => удаляем

Как видно, эта последовательность решает нашу задачу без каких-либо проблем, которые связаны с дополнительным потоком и таймстемпами. Т.е. во время работы над объектом можно производить удаление и поиск объектов, а также их изменение. А вот проблема, которая действительно есть в статье: это то, что объект может быть использован двумя потоками одновременно. Как она решается?

Cupper Jul 6 2012 at 23:38

еще раз, вы не можете сделать

— если счетчик==0 => удаляем

не залочив весь список. Удаление объекта сказывается как минимум на предшествующем и последующем объекте. А если это ассоциативный контейнер то может и на всем списке.

А вот проблема, которая действительно есть в статье: это то, что объект может быть использован двумя потоками одновременно. Как она решается?
read-write блокировки. И ни как иначе.

gridem Jul 7 2012 at 01:13

Можем. Только об этом надо написать немного подробнее.

В самом начале у нас объект есть в контейнере, счетчик равен 1. Когда мы его получаем из контейнера, то счетчик становится равным 2. Затем, например, мы его удаляем из контейнера, используя следующую последовательность:
— лочим контейнер
— удаляем элемент из контейнера, счетчик = 1
— анлочим контейнер

Затем когда счетчик становится равным нулю, то удаляем из памяти. Локи берутся на короткое время, поэтому можно не бояться проблем с производительностью. Все просто и понятно.

kpeo Jul 6 2012 at 13:27

Добавлю к предыдущему комментарию, что shared_ptr — не обеспечивает полного thread safety.

Как сказано в документации к последнему Boost 1.50:

Объекты shared_ptr обеспечивают тот же уровень потокобезопасности что и встроенные типы. Экземпляр shared_ptr-а может «считываться» одновременно несколькими потоками (доступ с использованием только константных операций). В различные экземпляры shared_ptr-а может производиться «запись» (доступ с использованием изменяемых операций, таких как оператор= или reset) одновременно несколькими потоками (даже если эти экземпляры — копии и разделяют внутри один и тот же счетчик ссылок).
Любые другие варианты одновременного доступа приводят к непредсказуемому поведению.

В c++0x говорится о том же.

В целом же, основная проблема потокобезопасности shared_ptr в том, что его экземпляр — потокобезопасен, а объект, на который он ссылается — нет.

gridem Jul 6 2012 at 21:58

А как эта проблема решается в статье? Т.е. вот я получил доступ к объекту, а как происходит понимание, что никто не может его изменить кроме меня?

kpeo Jul 8 2012 at 19:27

в статье — не решается. да и статья не предназначалась быть панацеей.
как и было сказано выше Cupper — можно использовать для этой цели read()/write()-блокировки, но опять же — реализация зависит от задачи.

gridem Jul 8 2012 at 20:26

Отлично! Тогда другой вопрос: раз в статье не решается, то почему shared_ptr должен это решать? Я всего лишь привел аналог того, что описано в статье, ни больше ни меньше.

kpeo Jul 8 2012 at 21:21

в чистом виде полного thread safety для любых задач нельзя получить ни основываясь описанным в статье, ни с использованием shared_ptr.
у каждой из этих методов есть свои преимущества и недостатки.
задача статьи была не столько описать 100% решение, сколько раскрыть вариант логики работы со списком объектов пользуясь мьютексными и атомарными блокировками.

-1

gridem Jul 9 2012 at 00:23

Все правильно, только моя идея состояла в том, что это можно сделать проще с использованием shared_ptr.

kemsky Jul 5 2012 at 20:25

недавно попалась хорошая презентация по java pdf, где расписаны некоторые приемы программирования без блокировок.

petropavel Jul 11 2012 at 17:50

Спорно.

Начиная с «Мы можем поместить мьютекс в сам объект, но это создаст следующую дополнительную проблему.… Ой». Потому что решение этой проблемы описано чуть ниже «Как только поток стирателя решит удалить какой-либо объект, ему нужно сначала удалить его из структуры данных», только почему-то это решение стоит под заголовком «атомарные переменные». То есть проблема (общая) описана для мьютексов, а ее решение (общее) — для атомарных переменных. Не очень хорошо так передергивать.

И это «RCU» решение. RCU — это Read-Copy-Update. Что-то я не заметил, что там куда копируется в авторском варианте. При чем тут RCU?

Show the best of all time