DomenForum.net

DomenForum.net (https://domenforum.net/index.php)
-   Для новичков домен-индустрии (https://domenforum.net/forumdisplay.php?f=11)
-   -   webarchive (https://domenforum.net/showthread.php?t=165090)

Инвест 30.04.2013 17:48

webarchive
 
есть домен. выкичаю webarchive. впервые сталкиваюсь.

что означают?

Nomerkov 30.04.2013 18:15

captures - сколько всего есть копий сайта по разным датам
snapshot - это если на 1 дату есть несколько копий в разное время, имхо так.

Инвест 30.04.2013 20:01

Цитата:

Сообщение от Nomerkov (Сообщение 1149531)
captures - сколько всего есть копий сайта по разным датам
snapshot - это если на 1 дату есть несколько копий в разное время, имхо так.

подходит. что качать? дела такие. у сайта было 10 разных версий. все в архиве. на одной падает снег, на второй копии обычная шапка. есть еще 8 шапок более менее нормальных. какую из 10 копий выбрать для выкачки? я так понимаю следует делать так:
  1. берем все точки входа, допустим их 350
  2. считаем количество внутренних страниц, которые есть у каждой точки входа, сортируем по убванию
  3. смотрим сверху вниз по кол-ву стр и выбираем точку входа с нормальным дизайном
  4. выкачиваем

так или я что-то не так предполагаю? кажется не так, потому что открыв один snapshot, я хожу по контенту сайта вперед-назад и изменяется snapshot.

Инвест 01.05.2013 11:55

видели подобное? http://web.archive.org/web/201206201...obiliaria.com/

загружается и исчезает.

Nomerkov 01.05.2013 13:10

Цитата:

Сообщение от Инвест (Сообщение 1149684)
видели подобное? http://web.archive.org/web/201206201...obiliaria.com/

загружается и исчезает.

видимо подгружается какой-то ява скрипт. Если успеть нажать "стоп" после загрузки всех картинок, то не исчезнет )

UFO 01.05.2013 13:32

Цитата:

Сообщение от Nomerkov (Сообщение 1149712)
видимо подгружается какой-то ява скрипт. Если успеть нажать "стоп" после загрузки всех картинок, то не исчезнет )

+1.

Цитата:

Сообщение от Nomerkov (Сообщение 1149531)
captures - сколько всего есть копий сайта по разным датам
snapshot - это если на 1 дату есть несколько копий в разное время, имхо так.

Да, именно так.

Цитата:

Сообщение от Инвест (Сообщение 1149552)
подходит. что качать? дела такие. у сайта было 10 разных версий. все в архиве. на одной падает снег, на второй копии обычная шапка. есть еще 8 шапок более менее нормальных. какую из 10 копий выбрать для выкачки?

В Вашей затее, скорее всего, надо выкачивать последнюю копию. Если там мало страниц, то докачать из предпоследней и предпредпоследней, пусть с другим дизайном.

Инвест, чем, если не секрет, Вы собираетесь выкачивать копии?

Nomerkov 01.05.2013 14:00

Цитата:

Сообщение от UFO (Сообщение 1149716)

Инвест, чем, если не секрет, Вы собираетесь выкачивать копии?

Если нужен софт или сервис, я юзаю http://r-tools.org/page/start он платный, но не дорого, вроде ок работает ;)

Regarer 01.05.2013 16:29

Цитата:

Сообщение от Nomerkov (Сообщение 1149719)
http://r-tools.org/page/start он платный, но не дорого, вроде ок работает ;)

ага, я тоже пару раз качал, нормально работает ...

Инвест 02.05.2013 02:14

Цитата:

Сообщение от UFO (Сообщение 1149716)
В Вашей затее, скорее всего, надо выкачивать последнюю копию. Если там мало страниц, то докачать из предпоследней и предпредпоследней, пусть с другим дизайном.

я так понимаю, что при переходе со страницы 2010 на новость 2003 отдается сайт за 2003. то есть специально идти в те другие даты на нужно.
но вот я думаю, что можно добавить кое-то интересно чтобы дизайн базировался по 1 шаблону.

Цитата:

Сообщение от UFO (Сообщение 1149716)
Инвест, чем, если не секрет, Вы собираетесь выкачивать копии?

собственным.

добавлено через 2 минуты
Цитата:

Сообщение от Nomerkov (Сообщение 1149719)
Если нужен софт или сервис, я юзаю http://r-tools.org/page/start он платный, но не дорого, вроде ок работает ;)

а мне не нравится. он ни УРЛы не меняет на адекватные, ни карту не создает, да и выкачать у меня не то что нормально, а вообще не удалось.

Инвест 04.05.2013 04:50

как выкачивать:
  1. заменять/удалять названия и логотипы
  2. удалять элементы рекламы
  3. удалять элементы, которые есть ссылками на страницы выкачаемого сайта, которых нет архиве
  4. ?

добавлено через 1 минуту
думаю, надо еще высчитвать кол-во битых изображений для версий


Текущее время: 05:39. Часовой пояс GMT +4.

Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Техническая поддержка — DevArt.PRO. Перевод: zCarot.