Скачать все картинки сайта с помощью wget

wget скачать все картинки сайта

· Другое и Снипеты · 1 мин чтения

Любому разработчику в определенный момент может понадобиться скачать все картинки с сайта по определенной ссылке. С wget скачать сайт или его части (наример, картинки, стили и т.д.) не составить проблемы. В этой записи, я покажу как скачать все картинки с сайта, а также как исправить возможные ошибки.

Пример wget запроса

Ниже представлен пример использования wget:

wget -r -np -k http://ссылка-на-сайт-с-картинками.ru
  • -r — использовать рекурсию для получения картинок
  • -np — не нужно следовать по ссылкам, которые ведут на родительские директории
  • -k — позволяет сделать все HTML/CSS файлы в отдельной папки, без перемешивания данных

Другие параметры, которые вы можете использовать:

  • -nd (исключить папки): загрузить все файлы в текущей директории
  • -e robots.off: игнорировать файл robots.txt, то есть он загружаться не будет
  • -A png,jpg: загружать картинки только в формате png и jpg
  • -m (зеркало или на англ. mirror): -r --timestamping --level inf --no-remove-listing
  • -nc, --no-clobber: пропустить загрузку, если файл существует

Удалить файлы с определенным расширением

Если вы скачали все картинки с сайта, но кроме них у вас получилось скачать еще другие форматы, на подобии .cfg, .json. То вам НЕ нужно удалять все файлы и снова загружать их используя уже правило для загрузок определенных форматов (-A png,jpg), вы можете удалить файлы с определенным форматом и упросить себе жизнь.

Чтобы удалить файлы их, можно сделать так (с условием, что вы находитесь внутри директории, где хотите удалить эти файлы):

rm -f *.cfg
rm -f *.json

Любое название файла с форматов .json или .cfg будут удалены. -f — это принудить удаление файла.

Будьте аккуратны с этой функцией, потому что при условии «*» вы можете удалить все содержимое в месте где вы находитесь.