Silvar Oct 15 2013 at 02:12

Большой Адронный Коллайдер: круги LHC и путь данных

2 min

8.6K

IT Infrastructure*

+20

Comments 8

limitium Oct 15 2013 at 12:02

Без картинок?

Silvar Oct 15 2013 at 13:14

Добавил схему.
За картинками вам нужно к andy_p сходить. Он 4 поста с фотографиями про LHC сделал.

limitium Oct 15 2013 at 13:20

Там фото материалы. А тут надо схемы структуры и распределения объема данных и мощностей.

Silvar Oct 15 2013 at 14:23

Соотношение примерно 1:1:1 (Tier0: Сумма Tier1: Сумма Tier2).
А диски с ядрами соотносятся как 1,5-2:1.
Ленты с дисками 1:1 для Tier1 и 3:1 для Tier0.

Спасибо за идею. Соотношения мощностей сайтов Tier-1 вечером дорисую, хотя WLCG rebus дает вполне наглядные цифры.

aml Oct 16 2013 at 01:52

А где вы взяли эту картинку? В реальности между потребителями данных устроена большая peer-to-peer сеть. Система сама распределяет, куда какие данные доставлять. В том числе, есть и горизонтальные пути на графе.

Silvar Oct 16 2013 at 02:16

Ссылка на источник живет под картинкой.

У разных экспериментов разный подход к данным. LHCb, например, данные в Tier-2 вообще не хранит. А в ATLAS все поделено на регионы и каждый Tier-2 ходит исключительно к Tier-1 своего региона (у нас, пока, это Голландия). ALICE имеет действительно распределенное глобальное пространство, но подробностей, к сожалению, не знаю, так как с ними много не работал.

Горизонтальные трансферы — это реплицирование. Поскольку данные первичны и задачи могут прийти только туда где есть данные для них, а один вычислительный центр редко работает с одним экспериментом, важно что бы не было ситуации что некуда запускать задачи.

И сеть далеко не p2p. Трансфер всегда идет точка-точка. Данные разделены на блоки и такого что половина блока берется с одного сайта, а половина с другого не бывает (за Алису точно не скажу, поскольку они были первыми кто для установки софта на вычислительные узлы начал пользоваться торентами. Могли и к данным что-нибудь хитрое прикрутить, в плане алгоритмов).

aml Oct 16 2013 at 12:18

Я подробностей тоже не знаю. Просто с одним из разработчиков системы доставки данных общался — он мне рассказывал на пальцах, как это всё работает. Про то, что институты заказывают данные, описывая на специальном языке, какие данные нужны, и куда их доставить. А система уже сама определяет, как это дешевле сделать — гнать, например, данные для американского института через Атлантику или запросить локально у другого института, если они там уже есть. В этом смысле, p2p. По поводу того, к каким экспериментам это относится, не знаю. Могу уточнить.

Silvar Oct 16 2013 at 15:55

Институты (вычислительные центры) данные сами не заказывают. Они только предоставляют физикам вычислительные мощности. Решение что у вычислительного центра должны быть те или иные данные принимается на уровне команды отвечающий за вычисления в самом эксперименте.

Show the best of all time