Анон с 4чана скачал всю дерпибуру и выложил в Bittorrent Sync. И на Dropbox тоже.

+277
в блоге Срочно в номер
Один из аутистов анонимов с 4чана упоролся по хардкору и выкачал весь архив ДБ (400+ ГБ), после чего выложил его в общий доступ в сервисе bittorrent sync. Анон обещает поддерживать архив в актуальном состоянии возможно долгое время.

Утащить к себе коллекцию можно вот по этой ссылке: https://link.getsync.com/#f=imagedata&sz=44E10&s=EJAPWDUWL7TTDVKSWVADAUNXPT57EVYV&i=CEWTH7NYI2LLHSB4RKRB4ZEP72ANRCJ6W&p=CBVJL37JAVOWMVQCQMTQZWIMSVUDE6JZ
Все что вам понадобится — клиент Sync (можно взять по ссылке выше) и 410+ гигабайт свободного места.
Оригинальный тред на 4чане

P.S. Оно же на УрониКоробке

190 комментариев

И как же он решил проблему с ограничением имени в 255 символов?
Sparin
+1
Переименовывал все пикчи вручную, ясное дело.
AlexFLS
+4
All images are saved using derpibooru's file naming scheme and is searchable by tag

1. Это явно не вручную скачано
2. Он не переименовывал, судя по цитате
Sparin
0
реал??? бле, я думал, что он все 400 гб аккуратненько подписывал((((9девять(9
AlexFLS
+6
Заюзал ReiserFS и все дела)
idem_id
0
BadWolf
+4
extfs?
idem_id
0
xtuj?
AlexFLS
0
блин… ВИНТ МНЕ! ДА ПОБОЛЬШЕ!.. ;)
xvc23847
0
410 гигов это около 15 современных игр. Всего-ничего.
KoP
+1
Вопрос: а нахрена?
Minos
+10
BadWolf
+8
Шоб как с понизом не было.
sleeply4cat
+1
А повторяющиеся удалены?
SL-RU
+1
Я вижу Чулку!
И она не млп!
А еще я вижу понево!
Ааааа!
JIOCb
+3
Неужто порнуха вперемешку с простыми картинками? Было бы у меня место, скачал бы…
Mister_BRONY
+1
All 400+GBs of pony related images.

ВСЕ картинки с ДБ.
BadWolf
+3
Ещё одно важное и полезное дело.
AmberPendant
+3
выкачал весь архив ДБ (400+ ГБ)

400+ ГБ

EvilKeeper
+16
У меня кошелёк весь диск заполнил.
Nirton_the_brony
0
Надо было положить рядом sqlite-файлик с проиндексированными тегами, рейтингом и добавлениями в избранное. А в ещё один sqlite-файлик — комментарии)
andreymal
+5
Можно предложить это автору в треде, пока ещё не утонул.
BadWolf
0
Я не умею ни в английский, ни в борды(
andreymal
0
А я, к сожалению, не умею в sqlite( Так что придется довольствоваться тем, что есть.
BadWolf
0
— SQLite? Да вы, батенька, извращенец знатный.
Orhideous
0
Предлагаешь страдать с csv или поднимать Redis? Да вы, батенька, изращенец знатный. Впрочем, я ещё несколько недель назад это понял и сильно расстроился.
andreymal
0
— CSV или Redis? Ещё фееричнее sqlite.

Вообще тут MongoDB как раз подойдет, потому как надо работать с документами, у которых полно разных атрибутов. Schema-free.
Orhideous
0
Да вы, батенька, изращенец знатный.
Тебя точно кто-то из ынтыпрайза ну очень сильно покусал. Сильнее, чем я предполагал раньше.
andreymal
0
Around 700'000 files.

необходим поиск по тегам и метаданным

предлагает использовать sqlite


Мне добавить нечего
Orhideous
+2
архив

предлагает использовать MongoDB

Мне добавить нечего
andreymal
+1
А в чем разница, если попроще?
BadWolf
+2
MongoDB — серьёзный такой навороченный документо-ориентированный сервер БД, который надо настраивать, поднимать, понимать, почему не поднимается, и как-то загружать туда сами данные, а SQLite — маленькая простенькая библиотека без всяких серверов для работы с .sqlite-файлами, встроенная в любой мобильник и дополняемая простеньким консольным клиентом (правда, есть ли этот клиент в любом мобильнике, не знаю, но в любом десктопном линуксе точно есть). А у Орхи тут в последнее время проявлятся привычка делать всё максимально хорошо и правильно и ынтырпрайзно даже тогда, когда это нахрен не надо. Психическую травму при работе с хайлоадом получил, что ли… бедняга.
andreymal
+5
Тем более на тестовой таблице в 7,8 миллионов записей с 2 тысячами тегов все запросы обрабатывались мгновенно. Только запись шла немного туговато по скорости, но вполне приемлемо, это мелочи.
andreymal
0
— Андреймал. Ты умеешь думать, или только говнокодить в cowboy-style (вида «а нам море по колено, пофиг что дальше, кто будет саппортить и какова производительность — открыл блокнот и впереееееед!»)?
Поясняю для тебя и таких как ты, диванных экспертов-погромистов.

Во-первых, цели. Цель проста — архив. Если архив — то индекс и поиск обязательно, иначе это не архив, а свалка бесполезных данных.
Во-вторых, средства.
Лирическое отступлениеТвоя беда в том, что ты уцепился за один любительский стек технологий и с ярым фанатизмом в глазах «зато просто, понятно, неънтерпрайзно и вотпрямщас на коленке работает!» толкаешь его везде, куда надо и куда не надо.
Для реализации быстрого поиска по денормализованным данным такого рода надобна документ-ориентированная база данных. Выбор конкретного движка будет зависеть от поставленных задач по поиску. Почему не реляционные БД, хоть и embedded? Они медленней при выборке, и не подходят для денормализованных данных.

Если что-то ориентированное на конечного пользователя — то embedded-решение: скрипт с простым GUI и что-то вида unQlite, EJDB, iBoxDB (я бы выбрал первую).
Если на домашний сервер вида «своя дерпибура сбоку» — тогда MongoDB или подобная вещь. И да, она вполне легко настраиваема.
Лирическое отступление #2
MongoDB — серьёзный такой навороченный документо-ориентированный сервер БД, который надо настраивать, поднимать, понимать, почему не поднимается, и как-то загружать туда сами данные

говорит только о твоем нулевом опыте работы с монгой и махровом дилетанстве. Будь вместо этого вполне обоснованный упрек о проблемах с репликацией, с десинхронизацией нод, с write-lock при серьёзной нагрузке на одну ноду в кластере — да, окай, нюхал пороху, можно поговорить и по делу. Но увы.

Если на продакшен и в паблик для большой нагрузки — тогда надо и поиск организовать нормальный, а не просто выборку по тегам средствами самой БД: Lucene, Solr и иже с ними тут тебе помогут.

Так что не дилетанствуй, а попробуй всё же поработать, а не ныть в МПП, как тебя такого красивого-умного-кодера обидели.
Orhideous
+2
Твоя беда в том, что ты уцепился за один любительский стек технологий и с ярым фанатизмом в глазах «зато просто, понятно, неънтерпрайзно и вотпрямщас на коленке работает!» толкаешь его везде, куда надо и куда не надо.

Это архив — именно то место, где надо. MongoDB тут ну вообще ни к чему.

Если что-то ориентированное на конечного пользователя — то embedded-решение

Именно поэтому и SQLite. Всем известная библиотека со стандартным SQL-синтаксисом, встроенная в каждую кофеварку. Это архив, рассчитанный на массового пользователя, а не на чокнутого программиста, считающего наносекунды на select-ах и заставляющего остальных программистов, желающих как-то поработать с базой, учить всякие «unQlite, EJDB, iBoxDB». Если кому-то надо будет, тот сам перегонит в нужный для себя формат (строго говоря, и из csv тоже, но вместо csv уж проще искать картинки по тегам поиском файлов, поэтому SQLite), а SQLite покрывает 99.9% потребностей и 99.9% невиндовых устройств (а для винды можно рядышком dll кинуть). И эти твои «unQlite, EJDB, iBoxDB» тут не нужны, даже если они и лучше.

говорит только о твоем нулевом опыте работы с монгой и махровом дилетанстве.

Это говорит о том, что ты не понял сути сообщения. Я всего лишь подчеркнул, что это сервер, и что архив — это архив, а не альтернативный сервер дерпибуры, и для него поднимать целый сервер — это глупость.

Прекращай идеализировать всё подряд — это именно то, на что я обижаюсь.
andreymal
+3
— Я не идеализирую, а наоборот, рационально смотрю на вещи. А в своем сообщении ты столько раз допустил логических ошибок, что проще тебя послать в пешее эротическое за бенчмарками. Может, как будешь смотреть на их результаты, поймешь, почему «продукт для массового потребителя» слабо коррелирует со средствами разработки.

/thread, потому что я не вижу смысла доказывать и объяснять очевидные вещи тебе. Дал ТРИ варианта с документ-ориентированными БД с разными масштабами — «это сложно, для чокнутых программистов, заставляешь учить непонятные вещи». Собственно, мне и не надо было с самого начала что-то тебе доказывать: поработаешь, поймешь сам, и тогда тебе станет очень стыдно, когда будешь вспоминать себя-прошлого.
Orhideous
+4
В таком случае я как тот самый массовый потребитель тоже посылаю тебя в пешее эротическое. Тем более раз ты успешно проигнорировал главный посыл моего предыдущего комментария. Может, ещё картинки в BPG переконвертировать предложишь? -_-
И да, мне стыдно за andreymal.org, tabun.andreymal.org (кроме самой архитектуры), chat.andreymal.org, а также плагины к боту Talisman и свой клон Juick. Но за img2html и данный тред мне никогда не будет стыдно, потому что это совершенно другие области разработки, которые ты упорно отказываешься понимать.
andreymal
+3
Зачем я это спросил…
BadWolf
+10
MongoDB стоит использовать, только если тебе не жалко потерять свои данные — для кешей, то есть. А еще это чудо чудное любит проебывать индексы.

Что касается сабжа — вы оба повернулись. Один на SQL, второй на тырпрайзе. У вас экспортированные данные и самым лучшим решением будет простой json-файлик на десяток мегабайт c простым задокументированным форматом. Тот, кто захочет эти данные использовать — возьмет и прочитает его, а потом перенесет в ту структуру, которая ему в данный момент удобнее: mongo, oracle, да хоть elasticsearch.
Liksys
+7
простой json-файлик

У него, как и любого другого текстового формата, печально с быстрым поиском по тегам и прочим индексам, а у sqlite вполне нормально. Но если забить на поиск из коробки, то да, пойдёт. Но изначально я писал свой коммент в начале ветки именно с расчётом на простенький поиск.
andreymal
+3
Похеру на скорость бекапа. Напрямую с ним никто не взаимодействует.
Тот, кто захочет эти данные использовать — возьмет и прочитает его, а потом перенесет в ту структуру, которая ему в данный момент удобнее
Liksys
0
Ну я попытался представить архив не как бэкап, а как нечто более юзабельное
andreymal
0
Если юзабельное, то орхи прав.
Sparin
+1
Не прав. SQLite — наиболее известное (я надеюсь, каждый уважающий себя программист знает SQL? А умеет ли среднестатистический программист в предложенные Орхидеусом решения?) и везде установленное решение (даже на моём андроиде каким-то чудом оказался консольный клиент, зато ни MongoDB, ни «unQlite, EJDB, iBoxDB» я не нашёл не только на устройствах, но и даже в репозиториях (кроме mongodb) — ваще капец какие прекрасные решения), реализовать поиск через которое можно безо всяких проблем (особенно надуманных проблем с производительностью — влияние стереотипов?). И я это вообще-то во всей ветке выше объяснял.
andreymal
+2
Масштаб другой. В данном случае, SQLite — личное предпочтение потребителя, нежели масштабируемое решение. С таким подходом, можно было прийти к MS Access кроссплатформенность не аргумент. И Орхи здесь окажется прав только потому, что самая грубая ошибка программиста — это неверное проектирование архитектуры, из-за недостатка опыта работы в охватываемой сфере.
Лично мне уже приходилось сталкиваться с ней, не потому что заказчик мудак (Да, именно заказчик, а не я в его лице), а потому что не уследили, что arduino.cc/en/Main/ArduinoEthernetShield не умеет в состояние Tri-State, из-за чего работа по SPI шине была невозможной. Тоже самое и тут. Орхи возьмет, вдолбит в свою БД очередной dump danbooru или Booruonrails и забудет о ней.
А с SQLite могут возникнуть трудности из-за особенностей того или иного Booru-движка. Спорить об этом можно бесконечно. Вопрос лишь в том, кто на практике будет насиловать свой мозг дольше.

я надеюсь, каждый уважающий себя программист знает SQL?

Я до сих пор знаю его лишь поверхностно с минимальным словарным запасом: WHERE, FROM, SELECT, CREATE…
На то есть свои причины, почему я такой мудак. Времени нет на изучение нового, имхо спортивное программирование это пздц, а изучать в моём спектре много чего: ООП, Паттерны, SQL, IIS, WPF, ASP.NET. Но если потребуется, то я буду рад изучить MongoDB.
Sparin
0
А с SQLite могут возникнуть трудности из-за особенностей того или иного Booru-движка.

Никаких особенностей. Я в начале ветки дал вполне конкретные условия — поиск по тегам, рейтингу и избранному. С этим SQLite справляется чуть более чем прекрасно. Если приспичит использовать «особенности», то тогда это уже совсем другой разговор, и в зависимости от задачи подход Орхи может стать вполне обоснованным. А подход Ликсиса обоснован и годен вообще в любом случае)

Лично мне уже приходилось сталкиваться с ней

А при чём тут вообще это? Мы не про клон дерпибуры говорим, это просто архив картинок.

Я до сих пор знаю его лишь поверхностно с минимальным словарным запасом: WHERE, FROM, SELECT, CREATE…

И этого для требуемых целей более чем достаточно. Вот тебе и аргумент.
andreymal
0
Я к тому, что когда у тебя возникнет данная «особенность», то метаться уже будет поздно. И придется начинать сначала.
Sparin
0
Вот когда возникнет первая «особенность», тогда и надо будет начинать сначала. И это правильно. А пытаться охватить всё и сразу и потратить годы на проектирование какого-то несчастного архива картинок, учитывая все возможные пиздецы, вплоть до сохранения целостности данных при падении метеорита на жёсткий диск, и прикручивая функции, 99% которых не потребуются никогда — неправильно. За исключением случая, когда абсолютно точно известно (или неточно, но когда неучёт этого может случайно привести к пиздецу, как в описанном тобой случае), что это всё пригодится в будущем.
andreymal
0
Наверни Макконелла «Совершенный код»
Sparin
0
Недавно как раз навернул половину. И она учит именно тому, что я написал в предыдущем комментарии.
andreymal
+1
Что-то я не помню, чтобы он призывал тратить время и деньги на отладку/реворкинг. Пойду тоже наверну.
Sparin
0
Он призывал при проектировании продумывать, что требуется и что может потребоваться, и не тратить силы на реализацию того, что не потребуется. Может, сейчас попробую цитату найти, если скилла гугла хватит.
andreymal
0
Кстати, опять вспоминаются Вася с Петей.)
andreymal
0
Хренасе рейтинг прокачали!
Ukiwa
0
Но планирование не есть реализация. Мы просто оставляем у себя возможность в реализации других потребностей, которые могут возникнуть по ходу дела.
Sparin
0
Тотальное переделывание архива в полноценную booru по фичам — шибко маловероятная и сомнительная потребность по-моему.
andreymal
+3
И ещё: там же писалось, что если могут возникнуть сомнения в возможности реализации или что-то не очень чётко проектируется или какая-то область не очень известна, то надо набросать прототип. Я не работал с ардуинами и прочими и не знаю, что и как там, но предположу, что написание прототипа могло бы выявить отсутствующую фичу и помочь проектированию.
andreymal
0
Не проще сохранять готовые json от самой Derpibooru?
Sparin
0
Если у них есть — то проще.
Liksys
0
Переделай как надо.
Nirton_the_brony
0
— Ты мне за это заплатишь?
Orhideous
0
Смотря сколько.
А поскольку брони очень хорошо собирают внушительные суммы денег, перспектива оплаты для тебя уже не выглядит столь туманно.
Только чтоб от повторяющихся картинок было очищено!
Nirton_the_brony
0
— Значит, не заплатишь.</business>
Orhideous
0
— А ты на энтузиазме.
Nirton_the_brony
0
— Ты не входишь в число тех, ради которых я делаю просто так неинтересные мне вещи.
Orhideous
0
— А не ради меня лишь?
Nirton_the_brony
0
— Не переливай из пустого в порожнее. Если есть конкретное предложение — почта в профиле, туда ТЗ и бюджет. Нет — значит </thread>
Orhideous
0
монгопетухи неможащие в реляционные базы данных закукарекали
Hibonicus
-2
А вот так категорично тоже не надо
andreymal
+1
XML ФАЙЛЫ!11 C:
SL-RU
+1
Вот примерно так же мне ТЗ поставили =\
sleeply4cat
0
В приличном обществе человеку, всерьез предлагающему XML, принято забивать в голову чугунную дилду.
Liksys
+4
Или хотя бы в имя пикч в начало добавить ещё рейтинг. Не сложно ведь, выкачивальщики бур такое позволяют, а сколько бы нервов сэкономило в поиске годноты.
kvasya
0
И тут, и ниже — попытки реализации индексов через имена файлов без СУБД)
Беда, что индекс в именах файлов можно выбрать лишь один.
andreymal
0
Беда, что индекс в именах файлов можно выбрать лишь один.
А надо больше одного? Не понимаю. На дерпибуре тоже один индекс — номер файла.

Я просто говорю, что если бы я выкачивал картинки, я бы картинки сохранял в формате «рейтинг — теги.jpg». Тогда сортировка по имени файла дала бы нам сортировку по рейтингу. А поиск файлов дал бы нам поиск по тегам. Без всяких sql-ей. Собственно говоря, я так и выкачивал когда-то давно картинки. Ещё с понибуры.
kvasya
0
На дерпибуре тоже один индекс — номер файла.

Индекс с первичным ключом не путай. Каждый первичный ключ — индекс (по крайней мере в известных мне СУБД), но не каждый индекс — первичный или хотя бы просто уникальный ключ.

Тогда сортировка по имени файла дала бы нам сортировку по рейтингу.

Вот о том и речь. Прикрутить в имена «индекс» по рейтингу — будет сортировка по рейтингу. А я, например, хочу сортировку по числу добавлений в избранное. А кто-то по числу комментариев. Вот тут бида. И про реализацию этого целый срач выше)

Хотя интересно, чем автор архива руководствовался — просто скачал как есть или зачем-то сортировка по айдишнику нужна (а такое тоже может быть).
andreymal
0
Окей, давно с бд не связывался, всё забыл.

Что же до срача выше, могу только одно ИМХО высказать. Излишество вредит. И никогда я на дерпибуре не делал сортировку по комментариям или по добавлениям. Ну да дело вкуса конечно =)
kvasya
0
Я просто говорю, что если бы я выкачивал картинки, я бы картинки сохранял в формате «рейтинг — теги.jpg».

О, линуксоиды повылезали. Напомню что в винде траблы с длиной полного пути в районе 252+\-2символа, а размер тегов даже на покойной понибуре легко превышал 260 символов.
ShprotaNa
+2
Лол, виндопроблемы.
arheus
+1
Надо сохранять в виде sha1.jpg. Заодно дедупликация. Рядом класть файлик с метаинфой.
Liksys
+2
— И перцептуальные хэши для полного счастья.
Orhideous
0
Но одну и ту же картинку в разных размерах так не определить.
Вот Орхи правильно сказал.
Nirton_the_brony
0
Вот, кстати, помятуя о том, как устроены локальные версии Flibusta и Lib.Rus.Ec, всеми копытами плюсую за небольшую утилиту-обёртку + базу в SQLite. На таких объёмах в однопользовательском сценарии — лучше не придумаешь.

Другое дело было бы, если из этого делать сервис общедоступный, но это действо не имеет смысла, т.к. все эти картинки — и так из общедоступного сервиса стянуты.
eeyupbrony
+2
Этот пак уже не актуален, на буре обновления чуть ли не раз в десять минут.
KoP
0
А пак, как я понял по тамошним файликам, тоже регулярно обновляется
andreymal
+5
ОМГ, сделайте из этого избранную коллекцию раз в двадцать меньшего объёма, пожалуйста! ;)
VIM
+1
Зачем когда у тебя есть «избранная» коллекция в двадцать раз большего объёма? Мужики берут размером.
AmberPendant
+5
Ну, не слоновьим же! )))
VIM
0
Конским.)) Цветом радуги.))
AmberPendant
+5
Чем удобна дерпибура и любой боору-подобный ресурс — это теги. Поиск по одному, двум, трём тегам — это круто и ок. Зачем хранить на винте всю дерпибуру, но без сортировки по тегам — мне не понять.
ArFey
+2
Вот захочешь поклопать, а у тебя крысы оптоволокно погрызли.
GL_DOS
+6
А) Эдакий бэкап
Б) Слава организатора раздачи мегапака пони
В) Over 400 GB поней у тебя на винте!
Endor
0
Святые принцессы
Slaaneshi
0
О! Пришло время пополнения папки «На случай важных переговоров».
Archi
+2
Какое нам то дело до того что, там творят всякие форчановские анонисты? Опять засорение бесполезной информацией блога «срочно в номер» и ленты.
Bf109
-8
Не бесполезной!
RaCa
+4
Спойлер
ShprotaNa
+4
Не позорь.
Nirton_the_brony
0
И как ты теперь предлагаешь отредактировать комментарий?
ShprotaNa
0
Сейчас уже никак, но потом так делать не надо.
Nirton_the_brony
0
Когда «потом» и как «так»?
Постить в комментариях картинки под спойлерами? Хорошо, буду как остальные постить без спойлеров. Ты это хотел услышать?
ShprotaNa
0
Я говорил про надписи на картинках.
Nirton_the_brony
0
То есть мне это надо было своими словами написать? Может и верно.
Ибо «не указывайте что мне делать, и я не скажу куда тебе пойти» (не тебе, а в данном случае Мессершмитту)
ShprotaNa
0
Тогда ладно. Уйду непонятым, но по собственному маршруту.
Nirton_the_brony
0
Уйдём вместе непонятыми, но по собственным маршрутам.
ShprotaNa
0
А чего такого-то?
Вроде уже у всех харды больше 500гб.

Вот если бы он вручную с дб качал, то тогда да.
LPD
+1
Харды-то, может, и больше, но всё равно они вечно чем-нибудь забиты и места постоянно не хватает
andreymal
+4
3тб свободных, что-то тут не так.
LPD
+1
Ты особенный)
andreymal
+4
Те не особенный. Это лишь значит, что у тебя есть ненужный винт на 3Тб. А если они нужны, то значит, они не свободны, а зарезервированы.
dkarm
0
Не обязательно.
Nirton_the_brony
0
Почему не нужный? Хочешь сказать, чтобы я бы я вернулся к своим старым 40гб винту от сигейта и считал каждый мегабайт?
Не знаю что тебе не нравится в этом, я ведь при таком свободном месте могу на ровном месте закачать сериальчик весь в 1080р и не страдать поиском лишних файлов на удаление.
LPD
+1
я имел ввиду, что если он всё таки-так предназначен для хранения временной информации неопределенных размеров, значит он не «свободен» в смысле «не используется».
dkarm
+1
А если не предполагалось никакой временной информации таких размеров?
Nirton_the_brony
0
Тогда любое свободное место на харде не считается свободным.
LPD
+2
ну примерно это и имел ввиду — если вы покупаете винт, то наверное он вам для чего-то нужен.
dkarm
0
Ну блин, а я вручную выкачивала…
Shabi
0
andreymal
0
Нет, прон я исключительно вручную качаю :3 А просто картинки я качаю с девианта или тумблера. В общем сохранять с понибуры нет смысла, там почти под всеми годными картинками ссылки на оригинал, по которым я и качаю. К тому же сортировкой по персонажам приходится заниматься вручную.
Shabi
0
Там сыллки битые уже как полгода :D
Sparin
0
Учитывая разнообразие контента на дерпибу я бы относился к этому паку крайне скептически.
madman
+3
О да. Полазил я по дропбоксу. Такого контента я не встречал
RainbowBird
0
А кто-нибудь вообще качает? ) У меня минут 10 уже висит «В ожидании подтверждения»
nogard
0
Конечно. Автор сборника сидит у компьютера 24 часа и всем подтверждает доступ
RainbowBird
0
Так там ещё и ждать подтверждение доступа надо…
nogard
0
Если можно было бы качать выборочно, а так...
Как-то половину диска жалко одними только картинками забивать
Matrosha
0
Подвиг анона достоин похвалы, но несколько бессмысленнен так как 90%(возможно даже 95%) артов с Дерпибуры – откровенный мусор, не говоря об использовании *.PNG там, где в этом нет необходимости (и как следствие арты по 20 мегабайт) и повторных изображений. Сам я веду пони-пак с конца 2011 года и сейчас там 29 400 артов (21,2гб) без р34, конечно же, для этого есть отдельная папка которые я считаю более-менее достойными назваться искусством. Так что, я бы посоветовал лучше скачать какой-нибудь готовый пак (благо их в сети, по крайней мере раньше, хватало) и по мери сил и времени дополнять его самому.
DragonKnight
+1
Но это далеко не подвиг. Любой может скачать таким образом Derpibooru.
Sparin
0
Может — любой, но потратить на это почти пол терабайта траффика/дискового пространства решится не каждый.
DragonKnight
0
Трафик у многих сейчас безлимит, если нет, то для таких специально дописываю Luna's Gallery (бывший tabun.everypony.ru/blog/computers/87375.html). В остальных случаях, проще людям дать скрипт и объяснить как он работает.
Sparin
0
а может и ты выложишь свой пак куда-нибудь, в помощь одухотвориться брони-новичкам, которые не готовы перелопачивать бесконечные пони-интеренеты в поисках годноты?
СпойлерОбе, папочки конечно...
dkarm
+1
Бывает же.
Dimone
+1
Вот лучше бы он разобрал и отделил годноту от говна, которого на буре к сожалению хватает.
Atlantisit
+1
А как отделить, если то, что для одних говно, для других годнота, судя по рейтингу картинок?
andreymal
+1
Ну там есть откровенная ересь в виде мазни) С остальным да, сложнее, но можно же было бекапить по тегам, чтоб в папках были картинки примерно одного содержания. А то всё в перемешку — клопота, гурота, мазня и нормальные арты.
Atlantisit
0
там есть откровенная ересь в виде мазни

Это такие как ты полтора года назад развалили ЯРОК криками «уберите своё гавно отсюда!», «полутоновые рисунки гавно!», «наброски гавно», «стри пикселя в ППП!» и так далее.
Давай, продолжай в том же духе!
ShprotaNa
-1
А где ЯРОК развален? Отличный сборник отличных артов. Еще бы награнщиков выпнуть, было бы совсем норм. Зато выглядит, как высший дивизион, и ничего плохого нет в том, чтобы там публиковались только хорошие работы. Но рисункам, нарисованным за 5 минут в паинте там делать нечего. А бура ими кишит.
Atlantisit
+3
Зарегистрирован: 26 апреля 2013, 17:24

Вопросов не имею. Иди разжигать картинкосрачи дальше.
ShprotaNa
0
> такие как ты
> полтора года назад
> Вопросов не имею.

Где логика?
Ох уж эти алтфаги, у которых вечно трава раньше зеленее была xD
Atlantisit
+2
Ох уж эти ньюфаги, которые вечно всем недовольны, и у которых выше крыши идей как испортить улучшить исправно (до их появлени) работающую систему
ShprotaNa
-1
Nirton_the_brony
0
Можно ещё так и так.
Nirton_the_brony
0
andreymal
+2
По сути это настоящий акт слабоумия и отваги! Объём информации — огромен, полезность большей части этого объёма- стремится к нулю, ибо много никому не нужных зарисовок. Нет разделения по типам контента и персонажам, а самому этот архив возможно отсортировать только методом визуального контроля, так вот для этого нужно быть действительно — аутистом!
Pony4tonado
+3
По сути это настоящий акт слабоумия и отваги!

Акт слабоумия и отваги — надрочить трехлитровую банку чтобы утопить там фигурку Рейнбоу Дэш. А это просто дамп картинок, чтобы у каждого желающего была своя личная бура, на случай роскомнадзора непредвиденной ситуации.
BadWolf
+2
А это интересный челендж
Sparin
+1
Жесть…
Pony4tonado
+1
Научный экскремент.
Nirton_the_brony
+1
Эксперимент — экспериментом, а с Дашкой так нельзя. Да и с любой другой пони тоже.
Pony4tonado
+2
Вот полностью согласен! Твин бы убил этого экспериментатора.
Nirton_the_brony
0
Твин бы убил этого экспериментатора.

Да я бы тоже мимо не прошёл.
Pony4tonado
0
I think we can put our differences behind us… for science…
Hohner
+1
Nirton_the_brony
+2
Такое только анонисты с форчана придумать могли


(моя реакция)
Bf109
0
99% там просто мусор, даже качать не стоит. Не говоря уже о внушительном объеме)).
Кто-то все-равно купится.
Centaur
0
Круто! Давно о таком мечтал!
Krueger
+2
Повторю уже заданный до меня вопрос — хоть у когото качает, или «pending approval»?
У меня такоеже писало если вставить неправильную «ссылку» в битторентсинк.
ShprotaNa
0
Что ты собралась с ними делать?)) Там ж тысячи их.
AmberPendant
+1
Удалю у себя уже имеющиеся устаревшие варианты?!
ShprotaNa
0
Но зачем они тебе если они имеются на ресурсе, да ещё и с поиском. В ручную ковырять мб чё выпадет?))
AmberPendant
0
А ты в курсе что некоторые провайдеры уже полгода блокируют дерпибуру?
ShprotaNa
+2
Как-то забыл. Уже аргумент.))
AmberPendant
+1
Например у меня без танца с бубном (в виде поиска рабочих прокси и прочего) не открывается уже несколько месяцев.
ShprotaNa
0
Контент то стоит того?))
AmberPendant
0
Как ни странно, местами да.
Если уж даже на e621, пахиле и флаффиибуре можно найти годные SFW картинки, то на дерпибуре и подавно
ShprotaNa
+2
Найдется ли Геракл который разгребет весь мусор, очистит от шлака и примесей, и оставит одну лишь рафинированную годноту, а потом запилит её одним архивом?
Когда-то занимался подобным, а потом мне прострелили колено, но стоит признать, что я это дело давно бросил и теперь лишь рандомно тягаю понравившиеся картинки…
Omegon
0
А вот как раз ответили, что там 700000 картинок.
Если на определение годности каждой тратить 1 минуту и заниматься этим по 8 часов в день, то выполнение задачи займёт 4 года. За которые будет нарисовано ещё такое же количество картинок.
Полагаю, это ответ.
Nirton_the_brony
+2
Сколько там картинок?
Nirton_the_brony
0
В свете последни крайних сообщений в треде — не ясно, представляет ли это хоть какуюто ценность. Или проект уже автором признан мертворожденным
ShprotaNa
0
А вот похоже и ответ на мой вопрос:

BFXEWWBBPFQH65O2JAXJCW46N2LE4OCIY




Правда не ясно как понимать вот это —
ShprotaNa
0
Похлопаем в ладоши и дальше идём сохранять то что нравится. Прямо из разряда рекордов книги Гинесса.
ncuxonam
+1
Кто-нибудь здесь уже скачал эти файлы?
Etihw
0
Лучше задай вопрос по другому: кто-нибудь хотя бы получил в программе информацию о том, что ожидаемый размер овер 400 гигов? А не на пару порядков меньше
ShprotaNa
0
А у вас тут интересно… Я тут новый, подскажите, есть на табуне отдельный блог для программисров?
dkarm
0
AmberPendant
0
да я и не пытался. Это типа шутки было… Как-то не думал Спойлер, что тут всё настолько серьезно найти тут понихабр)
dkarm
0
Не думал он...
Ты лучше на хабре пони поищи.
Nirton_the_brony
0
Лучше это: habrahabr.ru/post/155131/
Wolfram
0
Спаибо, Вам большое за эту ссылку. Это было очень интересно!!! Я пока ещё не знаю, зачем мне могут понадобиться эти знания, но настроение поднимет очень сильно)
dkarm
0
Nirton_the_brony
0
— Отдельного нет, есть общеайтишный. Ну, и «Электроброни» для тех, кто с микроконтроллерами работает.
Orhideous
+1
А еще МПП, у нас постоянно какие-то терки за операционки и языки. Есть порно :D
Liksys
0
ой, нет спасибо, моя нежная психика, наверное, еще не готова к порно с цветными лощадями и антромутантами, всему свое время… baby steps, pony, baby steps
dkarm
0
Продолжение темы — в более подходящем блоге!
( tabun.everypony.ru/blog/news/119032.html )
tabun.everypony.ru/blog/torrents/119188.html
ShprotaNa
0
Здравствуйте. Я человек, который сделал дамп derpibooru. Я наткнулся на вашу статью здесь и увидел, что там был большой интерес со стороны вас, ребята. Теперь, я не знаю ни России, поэтому я буду использовать Google Translate. BitTorrent Sync больше не будет работать. Я повредила. Сеялки торренты была битва. Я работаю, чтобы получить все части, как быстро, как это возможно. Если вы хотите связаться со мной, присоединиться ко мне в #anonarchive на IRC.rizon.net я готов говорить и помочь всем, кто хочет копию этого. Спасибо!
SpikeyWike
+1
— Nice to see you, and thanks for your work!
BTW, you can use English here as well without fear to be misunderstood.
Orhideous
0
Oh good. That google translation was just awful…
SpikeyWike
+2
Thanks you.
ncuxonam
0
This is what I meant to say:

Hey. I am the person who made the dump of derpibooru. I came across your article here and saw that there was a lot of interest from you guys. Now, I don't know any Russian so I'm using Google translate. The Bittorrent Sync won't work anymore. And seeding the torrents has been a struggle. I'm working to get all the parts out as quickly as possible. If you want to contact me, join me in #anonarchive on IRC.rizon.net I am willing to talk and help anyone who wants a copy of this. Thanks!
SpikeyWike
0
чуваки подскажите мне как скачать через Sync, а то мне пишут (В ожидании подтверждения) и не чего не качается.
ShadowsDie
0
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.
Скрыто Показать