Сохранение и резервное копирование веб-сайтов с помощью HTTrack

Вы можете скачивать веб-сайты для автономного просмотра. Иногда это критически важно.


Возможно, вам нужно продемонстрировать сайт клиенту по месту его нахождения, или просмотреть какой-то ресурс во время поездки на работу. Резервное копирование сайта позволяет сделать те только это, но и многое другое.

Доступ к полному архиву веб-сайта дает вам гораздо больше свободы, чем несколько отдельных сохраненных  страниц. В то время как с помощью расширений браузера для чтения в автономном режиме, вроде ScrapBook для Firefox, можно сохранить отдельные страницы, HTTrack представляет собой отдельное приложение, которое позволяет загружать целые веб-сайты, в том числе медиа-файлы и внешние ссылки.
 
В этой статье вы узнаете, как настроить HTTrack, чтобы загружать веб-сайты для автономного просмотра. Обратите внимание, что приложение не обновлялось с 2015 года, но его тестировали на последней версии Windows 10, и не обнаружили никаких проблем.

Что такое HTTrack?

С помощью HTTrack можно скачивать сайты для автономного просмотра. Вы можете скопировать веб-страницу полностью из Интернета в локальный каталог, в том числе HTML-код, изображения и другие файлы, хранящиеся на сервере. После того, как вы скачали сайт на свой компьютер, вы можете запустить его в вашем браузере и ходить по страницам, как в оригинальной версии.

Можно также обновить загруженные страницы, чтобы получить недавно добавленные.
 


Вот несколько вещей, которые может HTTrack:
-загрузка всего веб-сайта;
-аутентификация с помощью имени пользователя и пароля;
-зеркалирование внешних файлов и веб-сайтов;
-исключение отдельных файлов из проекта, например, ZIP или GIF-файлов;
-просмотр или тестирование своих закладок с помощью файла bookmark.html;
 
Опытные пользователи могут применять сложные команды и фильтры для загрузки именно того, что им нужно. 
 
Обратите внимание, что HTTrack не поддерживает захват аудио/потокового видео в реальном времени. Кроме того, Java Script и Java-апплеты могут не загружаться. Программа может завершиться сбоем, если вы загрузите слишком сложный проект.
 
Настройка HTTrack для загрузки первой страницы

HTTrack прост в использовании, хотя он становится немного сложнее, когда настройки по умолчанию не работают.
 
Новый проект

На стартовой странице нажмите кнопку Next >, чтобы создать свой первый проект. Введите название проекта и установить категорию, если хотите. Также надо выбрать путь «Base path», который является локальным каталогом, в котором HTTrack сохранит проект. Нажмите кнопку Next >, когда закончите.
 


Режимы загрузки

Для базового проекта зеркалирования, вы можете просто вставлять в поле адреса URL веб-сайтов, резвные копии которых вы хотели бы создать. Вы также можете добавить список URL-адресов с помощью txt-файла. Если веб-сайт, который требуется скопировать, требует аутентификации, выберите Add URL… и — в дополнение к URL — введите логин (имя пользователя или адрес электронной почты) и пароль. Нажмите OK для подтверждения.
 
Не забудьте выбрать действие для вашего проекта. Действие зависит от вашей цели. В этом примере используется загрузка — Download.
 


Вот что различные действия позволяют делать:

Download web site(s) — загружать нужные страницы с параметрами по умолчанию.
Download web site(s) + questions — загружать нужные сайты с параметрами по умолчанию, а
также задавать вопросы, если какие-либо ссылки рассматриваются как потенциально загружаемые.
Get separated files — получать только файлы, заданные в опции, но не ходить по ссылкам через HTML-файлы.
Download all sites in pages (multiple mirror) — загружать только сайты, связанные с выбранным сайтом (сайтами). Если перетащить файл bookmark.html в поле веб-адреса, эта опция позволяет зеркалировать все ваши закладки.
Test links in pages (bookmark test) — тестировать указанные ссылки.
* Continue interrupted download — продолжать прерванную загрузку.
* Update existing download — обновить существующий проект. Движок будет проходить через полную структуру, проверяя каждый загруженный файл на наличие каких-либо обновлений на сайте.

Параметры и опции зеркалирования

Если необходимы дополнительные опуии, кликните на ссылку «Set options…» в правом нижнем углу окна.
 
Как вы видите, HTTrack поддерживает настройки прокси. Вы можете настроить адрес, порт и аутентификацию. В Scan Rules вы можете использовать шаблоны для определения файлов, которые проект должен включать/исключать в/из резервной копии. Limits, вероятно, самая важная вкладка, потому что здесь вы можете задать глубину внутреннего и внешнего зеркалирования. Кроме того, вы можете ограничить размер HTML-файлов, время, скорость передачи данных, количество соединений в секунду, и количество ссылок.
 


Если вы столкнетесь с проблемами, например, с немедленным завершением работы проекта, можете попробовать изменить Browser ID, или поиграть с настройками на вкладке Spider.

Обратитесь к разделу FAQ & Troubleshooting на домашней странице HTTrack, если столкнулись с непреодолимыми препятствиями. Нажмите кнопку OK, чтобы подтвердить изменения. Затем нажмите кнопку Next >, чтобы перейти к последнему шагу в создании проекта.

Окончательная корректировка

Этот последний шаг позволяет подрегулировать незначительные настройки. Например, вы можете позволить HTTrack выключить ПК после завершения, поставитьл проект на паузу в течение заданного промежутка времени, или сохранить только настройки, а не запускать сразу загрузку.
 
 
Начинаем!

После того, как вы нажмете Finish, инструмент немедленно начнет сохранять файлы. Вы можете отслеживать прогресс работы HTTrack.
 


Чтобы проверить проект, откройте его папку, и щелкните файл index.html для запуска зеркалированного сайта в вашем браузере.
 


Если ваш проект сразу не заработает, поиграйте с параметрами. Это может занять некоторое время — методом проб и ошибок. И даже если некоторые параметры прекрасно работали в предыдущий раз, они могут не работать в следующий раз. Как упоминалось ранее, лучшие варианты — изменить Browser ID, или перейти на официальную страницу FAQ & Troubleshooting.
 
Вы можете отменить работу в любое время. После первого нажатия на соответствующую кнопку, программа завершит все запущенные процессы. Если вы хотите немедленно прервать проект, просто нажмите снова на кнопку cancel. Чтобы возобновить резервное копирование запустите проект снова и выберите * Continue interrupted download из меню на соответствующем шаге установки, описанном ранее.
 
Готовы к автономному просмотру? 

Это замечательно – иметь возможность взять с собой часть Интернета в любое место, независимо от наличия подключения. 
  • admin,
  • 1401
  • 0