Pull to refresh

Comments 8

Добавил схему.
За картинками вам нужно к andy_p сходить. Он 4 поста с фотографиями про LHC сделал.
Там фото материалы. А тут надо схемы структуры и распределения объема данных и мощностей.
Соотношение примерно 1:1:1 (Tier0: Сумма Tier1: Сумма Tier2).
А диски с ядрами соотносятся как 1,5-2:1.
Ленты с дисками 1:1 для Tier1 и 3:1 для Tier0.

Спасибо за идею. Соотношения мощностей сайтов Tier-1 вечером дорисую, хотя WLCG rebus дает вполне наглядные цифры.
А где вы взяли эту картинку? В реальности между потребителями данных устроена большая peer-to-peer сеть. Система сама распределяет, куда какие данные доставлять. В том числе, есть и горизонтальные пути на графе.
Ссылка на источник живет под картинкой.

У разных экспериментов разный подход к данным. LHCb, например, данные в Tier-2 вообще не хранит. А в ATLAS все поделено на регионы и каждый Tier-2 ходит исключительно к Tier-1 своего региона (у нас, пока, это Голландия). ALICE имеет действительно распределенное глобальное пространство, но подробностей, к сожалению, не знаю, так как с ними много не работал.

Горизонтальные трансферы — это реплицирование. Поскольку данные первичны и задачи могут прийти только туда где есть данные для них, а один вычислительный центр редко работает с одним экспериментом, важно что бы не было ситуации что некуда запускать задачи.

И сеть далеко не p2p. Трансфер всегда идет точка-точка. Данные разделены на блоки и такого что половина блока берется с одного сайта, а половина с другого не бывает (за Алису точно не скажу, поскольку они были первыми кто для установки софта на вычислительные узлы начал пользоваться торентами. Могли и к данным что-нибудь хитрое прикрутить, в плане алгоритмов).
Я подробностей тоже не знаю. Просто с одним из разработчиков системы доставки данных общался — он мне рассказывал на пальцах, как это всё работает. Про то, что институты заказывают данные, описывая на специальном языке, какие данные нужны, и куда их доставить. А система уже сама определяет, как это дешевле сделать — гнать, например, данные для американского института через Атлантику или запросить локально у другого института, если они там уже есть. В этом смысле, p2p. По поводу того, к каким экспериментам это относится, не знаю. Могу уточнить.
Институты (вычислительные центры) данные сами не заказывают. Они только предоставляют физикам вычислительные мощности. Решение что у вычислительного центра должны быть те или иные данные принимается на уровне команды отвечающий за вычисления в самом эксперименте.
Sign up to leave a comment.

Articles