Любому разработчику в определенный момент может понадобиться скачать все картинки с сайта по определенной ссылке. С wget скачать сайт или его части (наример, картинки, стили и т.д.) не составить проблемы. В этой записи, я покажу как скачать все картинки с сайта, а также как исправить возможные ошибки.
Пример wget запроса
Ниже представлен пример использования wget:
wget -r -np -k http://ссылка-на-сайт-с-картинками.ru
-r
— использовать рекурсию для получения картинок-np
— не нужно следовать по ссылкам, которые ведут на родительские директории-k
— позволяет сделать все HTML/CSS файлы в отдельной папки, без перемешивания данных
Другие параметры, которые вы можете использовать:
-nd
(исключить папки): загрузить все файлы в текущей директории-e robots.off
: игнорировать файл robots.txt, то есть он загружаться не будет-A png,jpg
: загружать картинки только в формате png и jpg-m
(зеркало или на англ. mirror):-r --timestamping --level inf --no-remove-listing
-nc, --no-clobber
: пропустить загрузку, если файл существует
Удалить файлы с определенным расширением
Если вы скачали все картинки с сайта, но кроме них у вас получилось скачать еще другие форматы, на подобии .cfg
, .json
. То вам НЕ нужно удалять все файлы и снова загружать их используя уже правило для загрузок определенных форматов (-A png,jpg
), вы можете удалить файлы с определенным форматом и упросить себе жизнь.
Чтобы удалить файлы их, можно сделать так (с условием, что вы находитесь внутри директории, где хотите удалить эти файлы):
rm -f *.cfg rm -f *.json
Любое название файла с форматов .json
или .cfg
будут удалены. -f
— это принудить удаление файла.
Будьте аккуратны с этой функцией, потому что при условии «*» вы можете удалить все содержимое в месте где вы находитесь.