Как скачать с сайта derpibooru.org все картинки по определенным тэгам

+89
в блоге IT Pony!
Добрый день.
Я хочу рассказать, как можно разом поставить на закачку сразу все картинки относящиеся к определенным категориям на сайте derpibooru.org.

Ниже будет инструкция, надеюсь это актуально, не баян, и будет кому-то интересно.

Пример использования
Например, мне захотелось иметь на жестком диске все работы автора известного под ником tsitra360. На DA его старый профиль заблокирован. На тумблере он выкладывает только новые и в разнобой.
Но как выяснилось (спасибо товарищу wizallion ), все эти работы люди старательно выкладывают на derpibooru.org в максимально доступном качестве, старательно помечая авторство. Таким образом, поиск на сайте по категории "artist:tsitra360" выдавал 24 страницы с 350ю искомыми картинками. Осталось только вручную загрузить в максимальном качестве каждую из этих картинок и вручную же сохранить каждую на жестком диске. Что делать мне было решительно лень. Я решил поискать, решал ли кто-то до меня аналогичные задачи более оптимальным способом. И вот что нашел.

Спойлер
Derpibooru Downloader
Выяснилось, что товарищ под ником misspelledletter для как раз таких целей уже написал скрипт на питоне и даже .exe обертку к нему.
Здесь гитхаб с программой, где можно искать свежие версии.
Там же ссылка на достаточно подробный ридми.
А это тема, где я и нашел обсуждение данной программы.
Без особых проблем мне удалось это скачать и настроить, чем и хочу поделиться.

Итак, что нужно сделать:
  1. Качаем архив c программой для Windows https://github.com/woodenphone/Derpibooru-dl/releases/download/derpibooru_dl-2014-11-4/derpibooru_dl-2014-11-4.zip

  2. Извлекаем архив, в появившейся папке запускаем файл derpibooru_dl-2014-11-4.exe для того, чтобы при первом запуске создались файлы конфиурации. Консольное окошко закрываем

  3. Далее нужно получить API key от сайта derpibooru.org. Для этого логинимся на сайте (регистрация там очень простая) и проходим по ссылке https://derpibooru.org/users/edit. На этой странице второй абзац сверху называется "API Key" и в тексте под ним жирным выделен тот самый ключ. Копируем его. Идем в папку config, открываем в блокноте файл derpibooru_dl_config.cfg и в нем после «api_key = » вместо «Replace_this_with_your_API_key» вставляем скопированный ключ.

  4. В той же папке config открываем файл derpibooru_dl_tag_list.txt. В этот файл нужно задавать тэги, по которым должен осуществляться поиск. Для меня это было «artist:tsitra360» и в моём случае этот файл выглядел так:
    Спойлер
    Подробнее про задание параметров поискаВо-первых, тэгов для поиска можно задавать несколько, каждый новый в отдельную строчку.
    Вообще, автор пишет, что «в принципе» можно использовать любой синтаксис поисковых запросов, который поддерживает derpibooru.org. Сам этот синтаксис описан тут https://derpibooru.org/search/syntax.
    Ниже пример заполнения файла derpibooru_dl_tag_list.txt:
    Tag1
    tag_2
    tag+3
    T4g 4
    tag-five || tag-six



  5. Запускаем снова derpibooru_dl-2014-11-4.exe. Не обращаем внимания на ошибки и сообщения о сомнительности API ключа. Должно появиться окшко примерно такого содержания:
    Спойлер
    Вводим цифру 5 и ждем Enter.

Ну и дальше уже должна начаться закачка.
Сначала пойдет сканирование картинок с разбиением на страницы, аналогичным старницам в результате поиска на сайте.
Спойлер
А после и собственно сама загрузка:
Спойлер
Здесь строчка «Now working on submission 9 of 357» означает прогресс загрузки — девятый файл из 357и.

Загруженные файлы будут лежать разбитые по папкам в подпапке download в папке с программой.
Все картинки загружаются в максимально доступном для каждой разрешение.


P.S. На аналогичную тему про DeviantArt Если у кого-нибудь есть 100% стабильно работающий способ качать с DeviantArt все картинки из конкретной галереи разом, буду благодарен за описание. Сам я пробовал пару программ предназначенных для этой цели, но ни одна не качала корректно. В результате остановился на способе с выгрузкой списка ссылок на все картинки из галерии с помощью js скрипта для Chrome и последующего пакетного добавления в менеджер закачек. Подобный способ по крайней мере позволяет осуществлять оперативное вмешательство, когда вместо картинок по этим ссылкам начинают качаться заглушки в 300 байт. Или может с этой 300 байтовой проблемой может кто помочь?
Ну и если ничего более универсального по этой теме нет и кому-то интересны мои манипулиции, могу описать их в отдельном посте.

23 комментария

Как скачать с сайта derpibooru.org все картинки по определенным тэгам, и главное — зачем?
Lee
0
Ну пример я привел. Если для тебя он не актуален, что ж поделать. Кому-то может пригодится.
dkarm
+1
Например что бы вытащить старые арты криппиюникорна, которые он потер. Это пригодится лично для меня.
Irbis
0
Ну, например, если художник со временем передумает и внесет себя в DNP. Или выборочно удалит старые работы.
ushiki
0
Опа! То что нужно!.. было… когда то…
Krueger
0
Аригато, то, что нужно было.
GarrySeward
+1
Подобный способ по крайней мере позволяет осуществлять оперативное вмешательство, когда вместо картинок по этим ссылкам начинают качаться заглушки в 300 байт. Или может с этой 300 байтовой проблемой может кто помочь?

В скрипт подкрути sleep и цикл while. За ночь выкачает
Sparin
0
у меня немного другой скрипт. он генерит ссылки, которые можно скопом поставить на закачку. но через несколько минут или мгновенно многие из них становятся неактивны. хоть всю ночь обновляй это не поможет. потому и спрашивал какой есть более действенный способ. можешь дать ссылку на свой скрипт с описанием?
dkarm
0
И да.
1. Мог бы сделать перевод конфига
2. Мог бы вместо спойлера прочитать FAQ
3. Мог бы перевести derpibooru.org/search/syntax
Sparin
0
1. Это просто обзорный пост. О том как это заставить работать, чтобы те, кому это может понадобиться, не оттолкнулись сразу, если что-то не сработает. А те кто заинтересуются и сами разберутся что ещё можно сделать. Переводить всю связанную справку слишком большой объем. А судя по отзывам (3 штуки, 1 отрицательный, 1 нейтральный, и лишь один положительный) это никому особо не надо.
2. Речь о том чтобы спрятать всё под кат? Так и говори. Терпеть не могу, когда дают туманные ссылки на FAQ, не говоря что конкретно не так. К тому же, и сам FAQ далеко не такой уж содержательный и подробный, чтобы считать его универсальной библией. Это в первую очередь имеет смысл, когда в посте куча больших картинок. Здесь же картинки маленькие, специально пожатые в jpg, ибо для их роли этого достаточно. При этом, если ставить ссылку под кат, то с учетом специфичности поста вероятность того, что человек листающий ленту заглянет на отдельную ссылку крайне мала. А тут спойлер, который всегда удобно развернуть и свернуть и при этом под ним совсем немного траффика.
3. См п. 1.

В любом случае спасибо за хоть какой-нибудь коммент.
dkarm
0
Программа нифига не работает!!!
Нет файла с названием «derpibooru_dl_tag_list.txt»(
P.S. Скачал последнюю версию.
JD-1993
0
Извлекаем архив, в появившейся папке запускаем файл derpibooru_dl-2014-11-4.exe для того, чтобы при первом запуске создались файлы конфиурации. Консольное окошко закрываем


это делал? файлы конфигурации создаются после первого запуска
dkarm
0
Делал, требуемый файл не появился.
А на каком моменте закрывать консольное окно? Через некоторое время (если не закрывать самостоятельно) оно закрывается автоматически и всё равно не создаёт «derpibooru_dl_tag_list.txt». И ещё: почему в окне появляется какая то абракадабра из рускких и европейских букв?

Только 2 файла — «derpibooru_dl_config.cfg» и «deleted_submissions.txt» присутствуют в папке config.
JD-1993
0
вот ссылка на архив с оставшимися файлами из папки config, которые созданы у меня:
ссылка на dropbox
dkarm
0
все работает, но иногда глючит — сутки не работало, потом стало само
wizallion
0
Сколько тебе потребовалось перезапусков эксешника, чтоб заработало?
JD-1993
0
само зароботал
wizallion
0
Короче всё ясно, прога с багами… хз, когда заработает(((
JD-1993
0
Скачал последнюю версию, получаю:
ERROR — API key contains invalid characters.
DEBUG — Invalid characters found: set(['_'])
Мб кто-то до сих пор использует эту прогу? Или у кого-то есть современный аналог?
Niko_de_Andjelo
0
Ну, судя по всему, у буры изменился API.
Sasha-Flyer
0
Значит своё пилить надо, эх. А ты куда из Дискорда пропал?
Niko_de_Andjelo
0
Лет пять назад писал на баше скрипт для выкачивания с DB по тегам. Работает до сих пор. API сайта не менялся.
ushiki
0
этот метод больше не работает?
reimond12
0
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.
Скрыто Показать