Ответы об IT

Ответы об IT

» » Что такое сохраненная копия страницы в яндексе. Удаление страниц из индекса поисковых систем. Создание веб-архива в национальных библиотеках

Что такое сохраненная копия страницы в яндексе. Удаление страниц из индекса поисковых систем. Создание веб-архива в национальных библиотеках

Если кто-то сейчас подумал, что в данном случае речь пойдет о резервной копии сайта, то он ошибается. Сохраненная копия сайта и резервная копия сайта далеко не одно и то же. Восстановить сайт из сохраненной копии сайта вы не сможете.

В интернете есть веб-архив, где находятся сохраненные копии сайтов. Если у вас сайт еще совсем молодой и ему всего несколько месяцев, то скорее всего сохраненная копия сайта в веб-архиве отсутствует. Если же ваш сайт представлен в интернете уже достаточно продолжительное время, то сохраненная копия сайта там должна быть.

Находится этот веб-архив по адресу http://archive.org/web/ и там можно посмотреть как выглядел ваш сайт в определенный промежуток времени. Сразу оговорюсь, что сохраняются копии сайтов далеко не каждый день, а порою даже не каждый месяц. Хотя конечно восстановить сайт из сохраненной копии сайта нельзя, но если повезет, то можно восстановить первоисточники.

Бывают иногда ситуации, что произошел на сайте какой-то сбой, или сайт взломали и какая-то информация оказалась утерянной. В этом случае хотя и не всегда, но может помочь сохраненная копия сайта. Я, например вытащила из сохраненной копии сайта некоторые свои статьи, которые уже считала безнадежно утерянными.

Делается это очень просто. Заходите на сайт http://archive.org/web/ В поле для ввода вводите адрес сайта, сохраненную копию которого вы хотите посмотреть и нажимаете на кнопку "Browse History". Сейчас на изображении в поле для ввода вы можете видеть адрес моего сайта.

Попадаете на другую страницу и видите за какой год можно посмотреть сохраненную копию сайта. Там, где сайт сохранялся есть черные пометки.

Выбираете год, за который вы хотите посмотреть сохраненную копию сайта. Дни, когда сайт сохранялся находятся в светло-голубом круге. При нажатии на дату в голубом круге откроется сохраненная копия сайта. Другие даты не активны.

Загружается сохраненная копия сайта достаточно медленно. Сайтов в веб-архиве много.

Что значит «Отсутствует сохранённая копия в Яндексе!» и как это влияет на сайт в целом. Во-первых, если вы продаете ссылки со своего сайта, то отсутствие страниц в кэше Яндекса негативно отразится на доходе веб-мастера.

Например, в Сеопульте есть параметр, контролирующий наличие страницы в кэше поисковой системы.

Называется он nic (no index cache) - это означает что у страницы нет «сохраненной копии».

На сегодняшний день в Сеопульте проверяется индекс Яндекса. В перспективе планируют добавить и проверку в Гугле.

Вот как это выглядит на графике. Долгое время траст был равен девяти, но потом резкое падение.


Я стал искать причину отсутствия сохраненной копии сайта в поисковом индексе. И даже написал в службу поддержки TrustLink.

Добрый день. Скажите, пожалуйста с чем может быть связано падение траста у моего блога. Параметр XT за последние два апа Яндекса снизился с 9 до 7. Одновременно и снизился доход в Трастлинк.

Здравствуйте! Этот показатель не является официальным представлением Яндекса, потому причины его паденя нам не известны

То есть уменьшение количества расставленых ссылок сеопультом с этим не связано. А по какой причине наблюдается уменьшение дохода?

При проверке часть страниц, на которых были куплены ссылки, отсутствовала в кэше Яндекса. Ссылки были сняты, потому просел доход.

А не подскажите почему страницы отсутствуют в кэше Яндекса? В индексе есть, а в кэше нет? Как-то можно повлиять на то, чтобы они оказались в кэше?

Это уже вопрос к техподдержке Яндекса, часто апдейт кэша происходит немного позже апдейта выдачи/индекса, отсюда выходит такая проблема

Да, именно так. Для достижения максимальной эффективности ссылки необходимо наличие страницы в кэше.

Потом я задал вопрос в техподдержку Яндекса.

Добрый день.

Сейчас отсутствует сохранённая копия в Яндексе. Подскажите, пожалуйста в чем причина. Блог работает на Вордпрессе.

Кроме того мой блог имел траст xt = 9. За последние два апдейта траст упал до 7. Я стараюсь улучшать свой блог, а тут два таких негативных момента. С чем это может быть связано и как можно исправить ситуацию?

Адрес сайта: //www.сайт

С уважением, Илья.

И продолжал искать причину.

Статья по теме: Как найти обратные ссылки

Оказывется, после обновления плагинов, флажок напротив значения noarchive был включен. В результате чего на каждой странице моего блога появилась строка, запрещающая кэширование страницы. Возможно по этой причине я потерял две единицы траста.

Убрав этот тег, выключив флажок в плагине Robots Meta , я убедился в его отсутвии на страницах своего блога.

Add noarchive meta tag

Prevents archive.org and Google from putting copies of your pages into their archive/cache.to put copies of your pages into their archive/cache.

Будьте внимательны при настройке плагина Robots Meta для Вордпресс!

Узнав о наличии тега, запрещающега кэширование, я написал в суппорт Трастлинка.

Здоравствуйте. Я уже выяснил причину падения траста и отсутствия копии блога в кэше Яндекса. Видимо при обновлении плагинов Вордпресса на страницах присутствовал тег noarchive. Обнаружив это я немедленно убрав его и сегодня уже траст опять стал 9, поднявшись сразу на 2 единицы Зря оптимизаторы поснимали свои ссылочки.

Здравствуйте! Ожидайте восстановление закупки в ближайшее время.

И тут мне приходит ответ из службы поддержки Яндекса.

Здравствуйте!

Дело в том, что на момент последней индексации страниц, в их коде содержался мета-тег noarchive. Это явный запрет на показ сохраненной копии в результатах поиска. Сейчас тег убран, но сохраненная копия не появится пока робот не обновит документы в нашей поисковой базе.

В некоторых случаях, робот может посчитать изменения внесенные на странице незначительными, например, если текст на странице практически не поменялся или изменения касаются только html-разметки. Такие документы не обновляются в нашей поисковой базе, так как внесенные изменения на поиск никак не влияют.

С уважением, Платон Щукин

Служба поддержки Яндекса

//help.yandex.ru/

На следующий день я опять проверил свой блог в сервисе //xtool.ru/ . И о чудо! Моментальный подъем на 2 единицы!

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Сохраненная копия в Яндексе - это версия страницы, которая занесена в поисковой системы Яндекс.

Больше видео на нашем канале - изучайте интернет-маркетинг с SEMANTICA

При просмотре выдачи результатов поисковика на введенный пользователем запрос в сниппете каждого сайта можно увидеть блок с дополнительной информацией. Одним из разделов блока с дополнительной информацией является «Сохраненная копия».

Чтобы понять, что из себя представляет сохраненная копия Яндекса, разберем простую аналогию. Представьте, что вы написали доклад или сочинение. Вы сдали работу, отправили ее на конкурс, но перед этим успели скопировать. Затем вам нужно еще раз сделать эту работу уже для другого конкурса. Чтобы не писать все заново, не восстанавливать в памяти все детали, вы достаете сохраненный файл и по ней пишите новое сочинение. Сохраненная страница Яндекса выполняет функцию данной копии. С ее помощью можно просмотреть сайт, если по тем или иным причинам нет доступа к интернет-ресурсу.

Для чего нужна сохраненная копия страницы в Яндексе

Прежде всего, отметим, что сохраненная копия в поисковой системе Яндекс - это важный инструмент SEO оптимизатора. С ее помощью можно увидеть, какая версия документа уже проиндексирована роботами поисковой системы и участвует в ранжировании, а какие страницы еще не прошли данный процесс. Таким образом, наличие сохраненной страницы в Яндексе - индикатор успешно пройденной индексации.

  • В ходе работы с интернет-ресурсами могут возникнуть самые различные ситуации. В частности на сайтах периодически осуществляются технические работы: внесение корректировок в дизайн/изменение шаблона /редактирование или удаление текстовых материалов. В ходе данных работ легко можно допустить ошибку, которая ведет к негативным последствиям: исчезновение дизайна/текста/другого элемента, изменение шаблона не по плану и так далее. Наверняка, каждый разработчик сайтов имел такой печальный опыт. Если есть возможность бэкапа или подключен качественный хостинг, через который можно вернуть все как было - прекрасно. Но начинающие ресурсы, как правило, не имеют такой возможности. В этом случае поможет сохраненная копия страницы в Яндекс. С ее помощью можно увидеть, как все было на момент индексации роботами и восстановить вид страницы, исправить ошибки. Но учтите, что хранение страницы в индексе не вечно, и если на нее робот зашел в период, когда она уже была в нерабочем состоянии, вы вполне можете не увидеть старой информации...
  • Еще одна ситуация, когда полезна будет сохраненная копия страницы в Яндексе: в ходе работы над сайтом вы изменили текстовый материал, с целью увеличения релевантности страниц. Теперь вам нужно посмотреть, выполнено ли обновление страницы, где вы внесли изменения. Сделать это можно просмотрев сохраненную копию.
  • Нередко сайты бывают недоступны, причин для этого может быть много: технические неполадки, истек срок хостинга и так далее. Чтобы в этой ситуации зайти на сайт, нужно найти сохраненную копию и просмотреть ее. Таким образом, польза сохраненных страниц Яндекса очевидна.

Как посмотреть сохраненную копию страницы в Яндексе

Все современные поисковые системы, и Яндекс не исключение, позволяют пользователям открыть нужные веб-документы через их индекс. Это можно сделать быстро с помощью специальных сервисов или вручную. В первом случае на помощь придут сервисы: Page Promoter в Firefox, RDS bar для Хроме и другие. Однако плагины периодически могут некорректно работать и выходить из строя, поэтому владеть ручным методом тоже нужно.

Первый способ

Открываем поисковик Яндекс и в строке поиска прописываем сам адрес нужной страницы или интересующий запрос. В результатах поиска мы видим, что в сниппете каждого результата есть маленькая стрелочка. Нажимаем на стрелочку и выбираем «Сохраненная копия». После этого мы посетим сайт, его сохраненную страницу от какой-то прошедшей даты.

Второй способ

Способ заключается в применении специальных расширений браузера/плагинов/онлайн сервисов. Наиболее популярным сегодня является «RDS bar». Интерфейс плагина более чем простой, с его помощью можно просмотреть последние изменения страницы, когда страницу в последний раз посещал робот, следовательно и копия предоставляется за это число. Если нужная страница не прошла индексацию Яндекса, ее сохраненная копия не будет отображаться в результатах выдачи поисковика.

Почему нет сохраненной копии страницы в Яндексе

Иногда при поиске сохраненной копии страницы можно не увидеть нужного пункта при нажатии на стрелочку в сниппете. Причин тому может быть несколько:

  1. Первый вариант - некорректная работа ПС. Сам Яндекс признается, что не гарантирует наличие и показ таких копий для всех страниц в силу большого кол-ва причин.

2. Вторая ситуация - в коде документа находится метатег “robots” и он имеет значение «noarchive» - запрет кэширования. Чтобы избежать падения трафика, необходимо внимательно настраивать подобные вещи.

Чем может грозить отсутствие копии в Яндексе

Само по себе отсутствие копии не будет влиять как-то негативно на продвижение. А вот причины, которые привели к отсутствию могут повредить, поэтому разберитесь с ними.

Чем действительно может обернуться проблема с копиями страниц, так это затруднениями при работе с биржами ссылок.

Например, в Сеопульте сегодня есть параметр, который осуществляет контроль над тем, есть ли сохраненная копия Яндексе. Данный параметр называется NIC - No Index Cache. Он свидетельствует о том, что страница не имеет сохраненной копии. С такого ресурса не будут покупать ссылки, никому не хочется рисковать и платить за то, что может не принести пользы.

Как вы видите, сохраненная копия в Яндексе позволяет решить ряд проблем и оптимизировать использование интернет-трафика. Данные рекомендации позволят оперативно открывать и просматривать их.

Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.

Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.

Во-вторых, далеко не все владельцы сайтов ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.

В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.

Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, «интернет-архив» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!

Что нужно, чтобы найти копии сайтов интернета

Для того, чтобы отправиться в прошлое, нужно перейти на сайт archive.org и воспользоваться поисковой строкой.

Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.

Из этого видно, что сайт сайт был создан в 2012 году (Кстати, важно отметить, с помощью практически идеального хостинга Спринтхост — рекомендую!). Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2015 году, пока можно будет увидеть только одну копию от 7 февраля.

Конечно, это потрясающий ресурс! Ведь здесь индексируются и архивируются все сайты интернета! Это не только скриншоты… Имея в руках такой инструмент, можно восстановить массу потерянной со временем информации.

Надо заметить, что, безусловно все восстановить однозначно не получится, так как если на страницах сайта используются элементы Java Script, или скрипты или графика взяты со стороннего сервера, то на восстановление такой информации рассчитывать не придется. Поэтому к сохранению данных своего сайта нужно относиться с особенным вниманием, несмотря ни на что.

Пользуясь случаем, я сделала скриншоты и восстановила в памяти, как выглядел мой сайт, начиная с 2012 года. Любопытно посмотреть))

Сайт буквально недавно «родился»)) Январь 2012.. .

Проходит время, и хочется что-то изменить… Конец 2012-го.

Наверное, пора уже что-то менять. 2013-й. Это тема, которая и сегодня установлена на моем сайте.

К смене темы отношусь с осторожностью, так как помню последний «переезд», после которого несколько месяцев восстанавливала посещаемость сайта. Как-то не очень удачно получилось.

Надеюсь, что и моим читателям эта замечательная интернет-библиотека — «машина времени» сможет помочь перемещаться во времени, когда они этого захотят. Посмотрите, как выглядели раньше некоторые сайты, еще во времена своего зарождения. Какими раньше были google или яндекс, можно увидеть только на archive.org, аналогов у этого ресурса нет. Приятного путешествия, друзья!

Представьте ситуацию: вы создаете сайт. Нанимаете веб-мастера или делаете его сами, потратив на это много денег и личного времени. Размещаете свое детище на хостинге и любовно заполняете его информацией, не задумываясь о том, что нужно сохранить копию сайта, чтобы не потерять данные.

В один день, не очень для вас прекрасный, вы заходите на свой сайт, а он не работает. Вы начинаете узнавать, в чем дело, и, о ужас, сгорел дата-центр или полетел хостинг. А может, к вам забрался вирус и уничтожил данные. Потеря информации на сайте сравнима с потерей информации на компьютере. Так как же сохранить копию сайта?

Разберемся сначала с определением. Процесс архивирования веб-сайтов — это сохранение текущей версии страницы или сайта в архиве для последующей работы с ним. Для данных целей используется специализированное программное обеспечение. Крупнейшей компанией в мире является Internet Archive, о которой мы поговорим ниже.

Для частного архива вы можете воспользоваться офлайн-браузерами, которые были специально созданы для работы в офлайн-режиме. Они помогут создать локальные копии отдельных веб-страниц или сайтов целиком. К ним, например, относятся:

  • Кросс-платформенный HTTrack-браузер, который поддерживает 29 мировых языков и способен возобновлять прерванные закачки, обновлять зеркало сайта.
  • Условно бесплатный Offline Explorer, который позволяет скачивать не только файлы или страницы, но и целые сайты из Интернета по протоколам FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
  • Free Download Manager. Он интегрируется со всеми браузерами, имеет встроенный FTP, поддерживает протокол BitTorrent, может создавать torrent-файлы, перехватывать ссылки из буфера обмена.
  • Teleport Pro с закрытым исходным кодом для Windows. Программа позволяет скачивать сайты целиком.
  • Свободная консольная неинтерактивная программа для загрузки файлов и сайтов из Интернета Wget. Программа поддерживает протоколы HTTPS, HTTP, FTP, а также может работать через HTTP прокси-сервер. Подходит для Linux.

Создание резервной копии на хостинге

Можно настроить сайта на вашем хостинг-провайдере. Для этого вам нужно зайти в админпанель, в раздел создания резервных копий. У каждого хостинга своя админпанель, и тяжело сказать, где именно у вашего размещается этот раздел. Если не можете разобраться, напишите в техническую поддержку.

Создание резервной копии плагинами

Если ваш сайт размещается на CMS-платформе, такой как, например, WordPress, вы можете сохранить копию сайта, установив плагин wp-db-backup (ru.wordpress.org/plugins/wp-db-backup/) или похожие на него. Правильно настроив плагин, вы будете получать бэкап сайта каждый день или каждую неделю, как пожелаете.

Как сохранить копию сайта на компьютер

На компьютер можно сохранить сайт, используя FTP-клиент. Если вы пользуетесь программой FileZilla, то создайте на своем компьютере папку "Бэкап" (имя папки может быть любым). Подключитесь к серверу через FTP-клиент и простым перетаскиванием сделайте полный бэкап сайта в папку "Бэкап".

Кроме этого, можно воспользоваться сервисом Site2ZIP (сайт в архив), программой для скачивания WinHTTrack WebSite Copier. Как посмотреть сохраненную копию сайта? Для этого нужно открыть папку, в которой был сохранен сайт, и кликнуть на файл index.html.

Интернет-архив

В Сан-Фарнциско в 1996 году Брюстер Кейл основал некоммерческую организацию "Архив Интернета". Он собирает копии всех веб-страниц, аудио- и видеозаписи, графические файлы и программы. Здесь очень долго хранятся архивы собранного материала и имеется к своим базам бесплатный доступ для всех желающих.

Если вы задаетесь вопросом о том, как открыть сохраненную копию сайта, то перейдите по адресу archive.org/web/ и в соответствующем поле введите адрес сайта или страницы. В конце 2012 года размер Интернет-архива составлял 10 петабайт - это 10 000 терабайт! А к середине 2016 года в нем накопилось 502 млрд копий веб-страниц.

поисковыми системами

Сохраненная копия сайта Google — это не что иное, как кэш страниц сайта, который был сделан поисковой системой. Любой пользователь в любой момент может использовать для своих нужд копию страницы. Сохранение их на серверах поисковых систем занимает много ресурсов, и для этого выделяется немало денег, но такая помощь окупает себя, так как мы все равно заходим на поисковые системы. Правда, этот способ подходит только для существующих сайтов или для тех, которые были удалены недавно. Если же это произошло достаточно давно, то поисковая система стирает данные.

Специализированный поисковик

Кроме того, что вы можете вручную искать кэшированные страницы в Google или "Яндексе", вы можете воспользоваться специализированным поисковиком cachedview.com. У него есть аналог: cachedpages.com.

Если вы хотите сохранить копию сайта или его отдельной страницы, вы можете сделать это самостоятельно и бесплатно на сайте archive.is. Кроме этого, там есть и глобальный поиск по версиям, которые были когда-либо сохранены пользователем.

Создание веб-архива в национальных библиотеках

На сегодняшний день перед национальными библиотеками стоит задача создания архивов интернет-документов, которые являются частью научного, культурного и исторического наследия человечества. Но это очень проблематично.

Проведенные исследования выявили, что количество веб-документов в Сети растет экспоненциально, и в среднем документ живет от одного до четырех месяцев. В качестве единицы учета архива веб-документов удобнее всего использовать веб-сайт. Процесс создания фонда состоит в создании копии или "зеркала" сайта. Так как информация на нем изменяется со временем, библиотеке нужно создавать зеркала одного и того же веб-сайта с определенной периодичностью.

Так, в Швеции 60 000 сайтов, что в 20 раз превышает количество традиционных печатных изданий. Экземпляры печатных документов в библиотеке Швеции занимают 1,7 км полок в год. Веб-архив занял бы 25 км полок! Сейчас их архив содержит 138 млн файлов общим весом 4,5 гигабайта.

Интернет растет каждый день. Есть множество компаний и сайтов, которые заботятся о том, чтобы сохранять копии веб-страниц в своих архивах. Но не стоит полагаться только на них. Делайте своевременные бэкапы, и вы не потеряете свой сайт никогда.