iamwizard Sep 4 2012 at 12:22

Как правильно скопировать файлы и папки исключая некоторые из них

2 min

49K

Configuring Linux**nix*

From sandbox

+66

Comments 67

Alukardd Sep 4 2012 at 12:25

Написали же ответ в комментариях, с нормальным решением в одну команду! man rsync.

iamwizard Sep 4 2012 at 12:31

Мало того, rsync — не единственный способ. Однако, во-первых, он не в входит в стандартную поставку множества дистрибутивов. А во вторых — цель топика не показать одну строчку «как сделать», а рассказать, о том как самому искать решения не изобретая велосипедов.

Или вы думаете что топику не место на хабре?

+11

datacompboy Sep 4 2012 at 12:40

этому топику — место. исходному — место в QA

Alukardd Sep 4 2012 at 13:01

этому топику — место

ну скажем так, вроде информация годная, но вот статьёй это назвать тяжело. Это можно свернуть в комментарий к предыдущей «статье», до фразы: «смотри на find и прочитай в man'е, что у cp есть ключ --parents».

-1

oxpa Sep 4 2012 at 13:03

а у find есть ключи name и exec. а так же возможность комбинировать ключи через опции -o, -a и скобки. Но кому это интересно?) Читать маны — не модно.

Alukardd Sep 4 2012 at 13:07

«читаю man'ы — $10, читаю man'ы с выражением — $15» ©

iamwizard Sep 4 2012 at 13:15

exec, если я не ошибаюсь, есть только в GNU find
-name и ещё -regex, если уж говорить об исходной задаче — укоротили-бы решение, но главной целью было показать возможности конвейера.

sledopit Sep 4 2012 at 13:34

Конвейер не предназначен для передачи имён файлов. В ссылке ниже подробное объяснение этому чуду.
exec есть и в POSIX версии. Даже + на конце exec'a там есть, если я не ошибаюсь.

iamwizard Sep 4 2012 at 13:38

Да, вы правы про exec, видимо у меня сложилось неверное впечатление после того как лет 10 назад я не нашел его в man-e

WiseLord Sep 4 2012 at 23:39

10 лет прошло — и вот решение найдено :)

UFO just landed and posted this here

sledopit Sep 4 2012 at 15:02

Ссылка не съелась. Я просто ссылался на свой комментарий ниже.

UFO just landed and posted this here

adeep Sep 4 2012 at 14:59

$ man cp | grep parents | wc -l
0

iamwizard Sep 4 2012 at 15:26

Вы правы, это умеет только GNU cp. В комментариях предложили cpio как замену.

Alukardd Sep 4 2012 at 12:52

Я бы сказал, что это не статья, а часть серии статей о том как писать скрипты. И видя заголовок «как решить то-то», я жду решение, а не экскурс в анализ и знание различных утилит окружения GNU.

iamwizard Sep 4 2012 at 13:09

Вы знаете, когда я только начинал изучать unix-like системы, главное чему я был поражен — это следование принципу «от понимания к действию» и прочитав одну статью становилось возможным решать весь класс подобных проблем. И этим статьи отличались от «howto» которые как вы и предлагаете — описывали последовательность действий необходимую для достижения конкретного результата в конкретных условиях.

Однако, мне кажется, что хабр уж точно не место для однострочных howto. А эта информация, возможно, поможет кому нибудь понять как решаются такие задачи.

+13

Alukardd Sep 4 2012 at 13:14

Возможны Вы правы, я обычно изучаю что-либо новое для меня методом индукции. В любом, случае дискуссию на тему «howto vs article» я разводить не хочу.

UFO just landed and posted this here

iamwizard Sep 4 2012 at 15:28

Боюсь ошибиться, но я много где его не встречал. В ubuntu 10.04 из не-linux — во freebsd.

P.S да, я понимаю, что это решается apt-get install rsync

UFO just landed and posted this here

iamwizard Sep 4 2012 at 16:04

Если и правда интересно, вечером проведу мини-исследование.

sledopit Sep 4 2012 at 16:15

В debian, ubuntu в стандартной поставке он точно отсутствует. Скорее всего в большинстве производных тоже.

Joshua5 Sep 5 2012 at 13:27

пишу из под 10.04, rsync есть.

qwerty135 Sep 5 2012 at 10:41

Отличная статья, познавательная. Спасибо!

На самом деле многому учит.

KawaiDesu Sep 4 2012 at 13:07

Для подстановки аргументов ещё можно использовать конструкцию $() внутрь которой мы помещаем файнд с грепом, а всё это целиком отдаём cp в качестве аргумента.

iamwizard Sep 4 2012 at 13:11

Да, это возможно, но только в bash, а csh, например, это не умеет.

samat Sep 4 2012 at 17:50

это умеет стандартный шелл

-1

fleshy Sep 5 2012 at 12:15

стандартный для какого дистрибутива? у всех могут быть разные «стандартные» шеллы. Даже /bin/sh почти нигде не является тем самым Bourne Shell, а чаще всего ссылкой на /bin/bash или еще куда-то

UFO just landed and posted this here

KawaiDesu Sep 5 2012 at 04:01

Полезная инфа, буду знать, спасибо :)

sledopit Sep 4 2012 at 13:17

Читать до полного просветления.
Автору исходного поста, кстати, тоже не помешало бы.
А ещё не помешало бы почитать man find и использовать вместо find | grep -v кошерную конструкцию

find /path ! -name "*exclude*"

И вообще, если вы такой противник rsync'a, то задача решается одним find'ом на раз два:

find /path -type f ! -name "*exclude*" -exec cp --parents -t /target/dir "{}" \+

А в целом, в статье я увидел лишь полное нежелание читать маны, стремление использовать странные решения и преподносить это как способ «как самому искать решения не изобретая велосипедов».

iamwizard Sep 4 2012 at 13:31

Вы правы, в случае, если в качестве исходного списка файлов у нас выступает файловая система — можно использовать find и множество других утилит. Топиком я хотел показать как решать подобный класс задач — комбинированием утилит. Ведь как только мы начинаем брать список файлов, например из файла, find нам уже не поможет.

Вообщем, судя по обилию комментариев с непониманием исходной цели топика, что-то было написано не так и его лучше убрать.

sledopit Sep 4 2012 at 13:38

В таком случае, стоило сделать акцент на этом в самом топике. В противном случае тонны конструктивной критики выльются на вас. И комментирующие будут правы.
А в случае чтения списка из файла, стоит тогда включить проверку, есть ли вообще такой файл, и не сломает ли что запускаемая команда.

Вы просто выбрали неудачный пример для того, что хотите продемонстрировать.

-1

iamwizard Sep 4 2012 at 13:59

Внес изменения в исходный топик, надеюсь этого будет достаточно.
Спасибо за конструктивность.

VBart Sep 4 2012 at 13:45

Если вы хотите что-то продемонстрировать, как то «брать список файлов, например из файла» — так и делайте именно так. Не надо подавать дурных примеров. Те, кто будет это читать, скорее всего не знают о том, что умеет find сам по себе, а стоило бы.

-1

iamwizard Sep 4 2012 at 14:04

Внес изменения в исходный топик, добавлен дискламер, и готовый рецепт для этой конкретной задачи.

Однако не могли-бы Вы пояснить почему вы считаете использование более универсальных методов дурным примером?

VBart Sep 4 2012 at 16:23

Вы же хотите научить хорошему? Тогда надо учить использовать для каждой задачи подходящий инструмент. Я вполне допускаю, что когда времени нет, лень посмотреть ман, и набрал в консоли первое, что в голову пришло — это одно, но не надо это показывать в качестве обучающего материала. Автор, который осмелился учить чему-то остальных, должен нести большую ответственность.

off

Может быть я брюзжу тут как старый дед =), но уж больно универсалов много развелось, орудующих одним молотком по всем гвоздям, специалистов вот только не найти. И куча how-to в сети только способствует.

iamwizard Sep 4 2012 at 20:42

Насколько я понял, проблема в том, что очень общую тему я объяснил на примере излишне конкретной задачи.
Думаю, стоит написать отдельный топик, с большим количеством теории и рассмотрев больше примеров, про который нельзя будет сказать что «это решается одной командой». Но так уж получилось, что я собрался написать статью именно в ответ на тот топик.

off reply

Мне кажется, что непрофессионализм, частным случаем которого является поверхностный подход (естественно, подразумевая ситуации, где такой подход не допустим) — является скорее свойством личности, а не результатом неправильного обучения

Evengard Sep 4 2012 at 13:35

Никогда не понимал, что означает конструкция

"{}" \+

в конце find-а?

sledopit Sep 4 2012 at 13:40

Очень полезная штука. find с \; запускает по одному процессу на каждый найденный файл. find с \+ на конце группирует файлы и запускает по одному процессу на много файлов. Экономия времени и ресурсов, однако. Появилась лет 7 назад.

С вас 10$ за краткую выжимку из man'а =)

UFO just landed and posted this here

Kastrulya Sep 4 2012 at 15:18

Но ведь за каждое использование пайпа там, где без него можно обойтись, бог будет убивать котенка.
Экий вы бездушный

UFO just landed and posted this here

Kastrulya Sep 5 2012 at 23:58

Но в священном писании говорится про каждого котенка за каждый проход пайпа. Не несите ересь.

iamwizard Sep 4 2012 at 13:42

man find говорит нам, что:

Строка `{}' будет заменена именем текущего обрабатываемого файла

NoN Sep 4 2012 at 14:09

У меня этот вариант работает и без слеша. Но безопаснее/привычнее экранировать.

Вообще есть 2 варианта запуска find -exec:

find -exec echo {} ;
find -exec echo {} +

Попытка скопировать это и выполнить в шелле провалится, т.к. шелл съест «; ». Чтоб символ дошёл до find, его экранируют от шелла слешем.

Ещё можно взять в кавычки с тем же эффектом:

find -exec echo {} ';'

Evengard Sep 4 2012 at 21:11

Спасибо всем за справку.

Livid Sep 4 2012 at 15:20

Вместо 'xargs cp --parents' можно использовать 'cpio -pd'

immaculate Sep 4 2012 at 16:00

Необязательно писать find ./, достаточно find .. Меньше набирать, и выглядит красивее.

iamwizard Sep 4 2012 at 16:03

Да, это привычка, да и кнопки всё равно рядом находятся.

Zyamilon Sep 4 2012 at 21:57

Годная статья. Спасибо.
Как раз недавно задавался подобным вопросом.
Вообще надо будет ознакомиться и начать использовать такие true-юниксойдные штуки, как sed, awk, xargs, find, for, узнать больше о любимом grep. :) Отпугивает то, что выглядит всё это по-шамански сложно.

iamwizard Sep 4 2012 at 22:30

Пожалуйста.
Не бойтесь, главное преимущество этого подхода то, что каждая отдельная утилита достаточно проста.
Ваш любимый grep выполняет одну функцию — фильтрует. Просто делает он это кучей разных способов, но вам-же не обязательно изучать их все сразу — просто имейте ввиду что grep может отфильтровать всё что угодно, а конкретные параметры всегда можно посмотреть в man в тот момент, когда они понадобятся.

NickLion Sep 4 2012 at 22:33

А у меня есть файлы с переводами строк в именах (да, перевод строки — допустимый символ). Как там grep отработает? Подсказываю: неправильно :)

iamwizard Sep 4 2012 at 22:41

Значит вам, очевидно, нужно будет использовать способы отличные от описанного в основной части топка. Например — один из готовых рецептов в заключении.

NickLion Sep 4 2012 at 22:44

Я к этому и веду, что стоит написать, что всё это хорошо, но неверно. А сейчас написано «Задача решена», как будто это верное решение. А в заключении эквивалентное решение.

iamwizard Sep 4 2012 at 22:47

Вы правы, исправил формулировку.

lomalkin Sep 5 2012 at 05:37

На самом деле тема многострочной фильтрации не сказать, что хорошо раскрыта. На последнюю задачу выковыривания данных из постраничного вывода я убил приличное количество времени, а от переводов избавлялся с помощью tr`а, что ну никак нельзя назвать элегантным решением. Был бы рад увидеть обзорную статью на эту тему, например. Начинание то у вас хорошее.

NickLion Sep 5 2012 at 05:55

Если сильно хочется использовать grep, то тогда нужно в качестве разделителя использовать нулевой символ (гарантировано не часть имени файла).

find . -type f -print0 | grep -z -v 2 | xargs -0 ...

Такой вариант будет правильным. Может, iamwizard будет тоже интересно.

iamwizard Sep 5 2012 at 06:05

Как уже писалось выше, имхо, эта информация излишня для статьи ориентированной на новичков.
Думаю, что этот и другие интересные варианты решения найдут себе место в более цикле статей ориентированном на более подготовленную публику.

iamwizard Sep 5 2012 at 07:36

Если найду время написать, то обязательно затрону тему сепараторов и экранирования

Nashev Sep 5 2012 at 21:10

Декомпозиция требует первым делом выписать все файлы, а спасает от первичного формирования громадной простыни юниксовая потоковость команд, да? Без возможности организовать поток такой подход был бы чреват неэффективным использованием ресурсов, для предварительного формирования того огромного списка…

iamwizard Sep 6 2012 at 00:16

«Получить список файлов» и «Получить список всех файлов» — это разные вещи, а итеративность возможно организовать и в отсутствии пайпа.

RusMikle Jan 29 2015 at 17:00

некогда озаботился проблемой сложного копирования файлов, пробовал xcopy, robocopy итп и пришел к выводу что во многих ситуациях нужно писать скрипт. Тогда сел и в качестве развлечения написал свою консольную программку для копирования. Основной фишкой которой было разделение ключей для копирования на ключи для файлов и пля папок. Так же реализовал возможность задания множества масок для каждого ключа. С тех пор перестал пользоваться вышеуказанными утилитами и по мере нужды добавляю в свою прогу новые возможности. На данный момент уже получился хороший список, и точно могу сказать, то что в этой проге можно сделать одним запуском проги в других, без написания скрипта не получится. Кому интересно тут последняя альфа. Если кому что то надо добавить обращайтесь.

RusMikle Oct 5 2017 at 15:26

маленький пример:

copymik "c:\Папка откуда" "d:\Папка куда" /MF *.txt *.doc *.pdf /MD Doc* Scan /XCF __*.pdf bak*.doc ~*.pdf /XCD Temp Tmp

скопирует файлы с масками *.txt *.doc *.pdf исключив файлы с масками __*.pdf bak*.doc ~*.pdf из папок с масками Doc* Scan пропуская в них папки с масками Temp Tmp
где:

Заголовок спойлера

[/MF[ МаскаФайла1[ МаскаФайла2[ ....]]]] Маска для копирования файлов (по умолчанию маска * — все)
[/MD[ МаскаПапки1[ МаскаПапки2[ ....]]]] Маска для копирования папок (по умолчанию маска * — все)
[/XCD [МаскаПапки1[ МаскаПапки2[ ....]]]] Не копировать папки с указанными масками (по умолчанию маска * — все)
[/XCF [МаскаФайла1[ МаскаФайла2[ ....]]]] Не копировать файлы с указанными масками (по умолчанию маска * — все)

если надо перезаписать то добавить /OF
если в каких то папках ненадо проверять маски файлов то /XDMF или /XDMD

Заголовок спойлера

[/XDMD МаскаПапки1[ МаскаПапки2[ ....]]] Не проверять маску папки для подпапок с указанной маской (будет использована маска * — все)
[/XDMF МаскаПапки1[ МаскаПапки2[ ....]]] Не проверять файловую маску для подпапок с указанной маской (будет использована маска * — все)

и.т.п
в этой программке Вас многое, надеюсь приятно, удивит

macik Jan 20 2021 at 13:02

Ребята подскажите как мне исправить.

find /home/vmail/vp/cur/ -type f -exec grep -H "To: office@vp.com" {} \; | xargs -n 1 -I % cp --parents "%" /home/OFFICE/

У меня в результате находит файл но при копировании подставляет «To: office@vp.com». А как сделать так что бы подставляло только пусть?

macik Jan 20 2021 at 14:49

сам нашел ответ. ключ -l в grep выводит тольк имя файла

Show the best of all time