<
  • Главная
Статьи

Пошук битих посилань на сайті, журнал 404 помилок

  1. Нові можливості seo-модуля Ми випустили оновлення модуля « Інструменти seo-фахівця ». Тепер...
  2. Звідки беруться биті посилання на сайті
  3. Програми для пошуку 404 помилок на сайті
  4. Пошук битих посилань за допомогою нашого seo-модуля
  5. Включення логування 404 помилок
  6. механіка роботи
  7. інтерфейс
  8. Що * Не * знаходить модуль
  9. Виправлення битих посилань на сайті

Нові можливості seo-модуля

Ми випустили оновлення модуля « Інструменти seo-фахівця ». Тепер в ньому є Журнал битих посилань на сайті. Журнал працює повністю автономно, у фоновому режимі. Звіт доступний в будь-який час, без додаткових «парсинга». Подробиці про нову функцію нижче.

seo-модуль + журнал 404 = новий seo-модуль

Що таке Помилка 404 або 404 Not found

Помилка 404 або Not Found ( «, не знайдено») - стандартний код відповіді HTTP про те, що клієнт був в змозі спілкуватися з сервером, але сервер не може знайти дані згідно із запитом (цитата з Вікіпедії, https://ru.wikipedia.org/wiki/HTTP_404 ).

Це означає - запитуваної сторінки зараз немає на сервері. Можливо, раніше була (http не зберігає історію станів). Сама по собі помилка 404 на сторінці не страшна.

Погано, якщо на сторінки з 404 помилками посилаються інші. Такі посилання називають «битими», або «мертвими». Биті посилання заважають користувачам і пошуковим системам сприймати інформацію сайту:

  1. Зменшують трафік. Одного разу відкривши биту посилання, користувач (як і пошукова машина), що не перейде по ній знову.
  2. Збільшують відмови. Користувачі бачать сторінку з помилкою і залишають сайт.
  3. Зменшують час, проведений користувачем на сайті.
  4. Створюють «погану карму» посилальному профілем сайту. Пошуковик витрачає зайвий час на переходи по битим посиланнях.

Велика кількість битих посилань - серйозна проблема. Розповімо, як її виправити.

Звідки беруться биті посилання на сайті

Биті посилання можуть бути як наслідком неправильно налаштованого CMS, так і результатом людських помилок.

  • На сайті неправильно налаштовані ЧПУ, Інфоблоки, компоненти. При спробі відкрити сторінку новини, наприклад, з'являється помилка.
  • Товар знятий з продажу або закінчився на складі. Деякі сайти в цьому випадку видаляють сторінку товару з каталогу.
  • Адреса сторінки змінився, ви не поставили 301 редирект, сторінка видає помилку (стаття - https://www.intervolga.ru/blog/marketing/301-redirect-bitrix/ ).
  • Користувач (або інший сайт) помилково скопіював посилання на сторінку.
  • Ви видалили картинку, pdf-ку, відеоролик з сайту, не перевіривши, є на нього посилання чи ні.

Якщо в перших трьох випадках ви можете помилки запобігти грамотної налаштуванням сайту, від останніх ви не застраховані. Якщо до адресою будь-якого сайту дописати / abracadabra_404, скоріше за все побачите 404 помилку.

Програми для пошуку 404 помилок на сайті

Є кілька програм, які справляються з пошуком 404 помилок.

  1. Xenu's Link Sleuth ( http://home.snafu.de/tilman/xenulink.html ). Безкоштовна. Працює тільки під Windows (на віртуальній машині не перевіряли). Вивантажує результат в HTML і CSV (щоб відкрити в Excel треба змінити кодування). Приклад роботи програми:

  2. Comparser ( http://parser.alaev.info/ ). Платна, 2000 руб. Працює тільки під Windows, роботу на віртуальній машині не перевіряли.
  3. Netpeak seospider ( https://netpeaksoftware.com/ru/spider ). Платна, від $ 9,80 / міс. На даний момент працює тільки під Windows. На сторінці програми написано, що версії MacOS і Linux в розробці.

Програми чудово справляються з пошуком битих посилань, але мають недоліки:

  1. Все-таки, це десктопні програми. Щоб отримати результат, вам треба запустити сервіс перевірки, дочекатися його завершення. Далі обробити результат. На великих обсягах даних це буває непросто.
  2. Для великих сайтів програма працює кілька годин. При цьому зростає навантаження на сайт. Сайт з 1 мільйона сторінок ми за 2 тижні так і не змогли повністю обійти, сервер не справляється з навантаженням і блокує програму.
  3. Програми не працюють у фоновому режимі. Якщо ви робили перевірку місяць тому, ймовірно, на сайті з'явилися нові биті посилання, і парсер треба запускати заново.

Для невеликих сайтів (до 5 тисяч сторінок) використовуйте будь-яку програму або навіть звіт Вебмастера Яндекса. Для великих сайтів сканування проводять «частинами» або невеликими інтервалами.

Ми спростили роботу фахівцям з просування сайтів на 1С-Бітрікс і додали функцію пошуку битих посилань в модуль «Інструменти seo-фахівця». Ми плануємо зробити інструмент, що повністю закриває завдання оптимізації сайту. Замість кількох програм використовуйте наш seo-модуль.

Пошук битих посилань за допомогою нашого seo-модуля

Кілька років тому, коли оновлювали свій сайт, ми вже використовували схожий інструмент - Журнал 404 помилок. Стаття - https://www.intervolga.ru/blog/projects/404-redirect/ .

На його основі ми допрацювали і випустили нову версію модуля "Інструменти seo-фахівця". Тепер в ньому є функція відстеження і записи в єдиний журнал всіх помилок 404 на сторінках сайту.

Завдання - зберігати список свіжих битих посилань в зручному для seo-фахівця вигляді. Без додаткових налаштувань і програмування.

Сміливо скажімо - У нас вийшло! Як тільки ви встановите (або поновіть модуль), на сайті з'явиться журнал битих посилань, який автоматично почне поповнюватися в момент спрацьовування помилок 404.

Журнал битих посилань працює відразу після установки модуля.

Увага, на даний момент модуль оновлений до стабільної версії 2.2.4. Щоб журнал битих посилань з'явився у вас на сайті, встановіть оновлення модуля. Обов'язково зробіть резервну копію перед установкою.

Коротко про нові можливості.

Включення логування 404 помилок

При установці модуля функція логування відразу включена. Фіксація битих посилань починається, як тільки ви встановили модуль. Нічого додатково робити не треба!

У журналу є настройка, скільки днів зберігати записи. За замовчуванням коштує 90 днів. Якщо на сайті кілька мільйонів сторінок і ви переживаєте за розмір бази даних (биті посилання зберігаються в окремій таблиці iv_seo_error_log), встановіть менший період.

механіка роботи

Коли активований, модуль відстежує на кожній сторінці поява помилки 404. Навіть якщо це робить компонент (повідомлення Елемент не знайдене).

При спрацьовуванні 404 помилки модуль додає в таблицю iv_seo_error_log новий запис про помилку. Для існуючої пари {URL - реферер} модулів не створює новий запис, а збільшує лічильник відвідувань. Ви будете знати, скільки разів на конкретну посилання переходили з конкретного джерела.

Таблиця створюється при установці модуля (або при оновленні). Якщо вимкнути цю функцію, запис в таблицю не відбувається. При видаленні модуля таблиця зберігається в базі.

інтерфейс

В меню модуля «Сервіси - SEO-властивості» з'явився новий пункт «Биті посилання».

На сторінці типова «адмінських» таблиця. У ній виводиться список відомих модулю URL, на яких спрацювала 404.

Для кожного URL зберігається реферер переходу і кількість хітів, щоб знайти і усунути джерело помилки.

Для таблиці доступне редагування порядку і складу стовпців, а також вивантаження в Excel. Якщо вибрати сторінки за допомогою фільтра, вивантаження в Excel спрацює тільки для них. Наприклад, можна вивантажити список 404 з певним реферером.

Що * Не * знаходить модуль

Модуль визначає відсутність документів (php, html, doc, xls, pdf) - запити, в результаті яких можна побачити сторінку 404 вашого сайту (їх перехоплює і обробляє 1С-Бітрікс).

При цьому, в залежності від налаштувань сервера, файли картинок, js, css можуть бути оброблені на рівні Nginx. Такі звернення модуля не зафіксує.

Для їх пошуку користуйтеся запропонованими програмами або панеллю вебмастера. Як правило,% таких битих посилань низький.

Виправлення битих посилань на сайті

Для початку фільтром виберіть потрібні сторінки і скачайте список 404 помилок для обробки. Проведіть аналіз битих посилань і вирішите, що робити з кожної. Для виправлення битих посилань можна:

  1. Розмістити за цією адресою релевантний документ.
  2. Налаштувати редирект зі старої адреси на новий. Якщо на сторінку посилаються інші сайти, і ви не можете їх відредагувати, можливо так і доведеться зробити.
  3. Відредагувати сторінку-джерело - видалити посилання або замінити на коректну.

Модуль не знає про виправлення помилок, і зберігає всі посилання в базі. Щоб перевірити, що нових помилок після чистки не з'являється, використовуйте фільтр по "датою останньої зміни".

Для кожного посилання підходить один варіант. Який - вирішує фахівець з seo. Оновлений модуль «Інструменти seo-фахівця» допоможе знайти биті посилання і відновити інформацію на сайті.

Оцініть статтю:



Новости
  • Виртуальный хостинг

    Виртуальный хостинг. Возможности сервера распределяются в равной мере между всеми... 
    Читать полностью

  • Редизайн сайта

    Редизайн сайта – это полное либо частичное обновление дизайна существующего сайта.... 
    Читать полностью

  • Консалтинг, услуги контент-менеджера

    Сопровождение любых интернет ресурсов;- Знание HTML и CSS- Поиск и обновление контента;-... 
    Читать полностью

  • Трафик из соцсетей

    Сравнительно дешевый способ по сравнению с поисковым и контекстным видами раскрутки... 
    Читать полностью

  • Поисковая оптимизация

    Поисковая оптимизация (англ. search engine optimization, SEO) — поднятие позиций сайта в результатах... 
    Читать полностью