Сайт newsproauto.ru

Кейс создания сайта newsproauto.ru
Pro Авто
Информационный портал

Регион: Владимир

Дата создания сайта: 2015 год

newsproauto.ru

Сайт владимирского глянцевого автомобильного журнала Про Авто попал ко мне в работу в 2015 году. В первый раз я работал с новостным информационным порталом.

Цель - увеличить посещаемость сайта. Сделать это можно публикацией интересными материалами, акциями, конкурсами, сотрудничеством с другими проектами. В первую очередь, нужны регулярные полноценные самостоятельно написанные новости. В случае Про Авто на сайте было около 650 материалов. Для регионального специализированного сайта этого предостаточно для сбора трафика. Но посетители шли в основном из социальных сетей (иногда более 300 переходов в сутки) и по ссылкам с других сайтов. Почему же не было переходов из поисковых систем, хотя теоретически там могут быть сотни переходов в день.

Причин оказалось много. Первая - система управления сайтов Netcat. Признаюсь, чем глубже я копал, тем больше я впадал от неё в уныние. Начинается все с того, что она не воспринимает знак кавычек " в коде. Надо обязательно использовать такую ' кавычку. Логика этой CMS пугает - чтобы найти раздел, где отредактировать какой-нибудь кусок кода нужно быть детективом. Особенно мне понравилось где был запрятан robots.txt.

Но главная проблема этой CMS это дубли. На сайте их было просто бесконечное количество. Только по тэгам каждая новость дублировалась несколько раз. Никаких редиректов, тэгов canonical, запрещающих строк в файле robots.txt. Просто бесконечное количество дублей. Всего на сайте 667 страниц, а через Xenu link sleuth я нашел более 15000, потом мне надоело ждать (прошло только 30-40% поиска) и я вышел из этой программы. В Яндекс.Весмастере в "Загружено робот" было 3134 страниц, а в "Страницы в поиске" - 153 страницы. Винешнка на торте - фильтр АГС.

Кстати, дубли были не только внутри одного домена, но и на зеркалах сайта, где не было редиректов. Таких зеркал было 6 штук. Это домены с www и без, в com, ru и рф зоне.

Итак, работа над сайтом началась. В первую очередь, мы определили какие блоки не нужны: форум, блоги, отзывы, регистрация на сайте, целый модуль для покупки/продажи автомобилей. Поменяли внешний вид - сайт стал более легким для восприятия. Увеличили ширину сайта, ширину основного блога для новостей и статей.

Обновление сайта автомобильного журнала Про Авто

Время загрузки главной страницы удалось снизить с 9 до 4,5 секунд. Вес главной страницы уменьшился с 2,99 мегабайт до 824 килобайт, количество запросов браузера с 90 до 32.

Затем я взялся за настройку файла robots.txt. Как видите, сейчас он достаточно большой. Были закрыты все нежелательные страницы и дубли.

Индексирование сайта автомобильного журнала Про Авто

С появлением файлов robots.txt и sitemap.xml, устранением ошибок в коде и ускорением загрузки, Яндекс начал нормально индексировать страницы.

Переходы из поисковых систем

Большой бедой стала динамика ссылочной массы. Видно, что с февраля было закуплено около 5000 ссылок. Причем, они оказались арендными, без никакой фильтрацией, а самым популярным анкором были "Автоновости". Это прямая дорога в бан поисковых систем. Ссылки сняли. Но поисковым системам надо несколько месяцев, чтобы они отошли от такого ссылочного взрыва.

Ссылочный взрыв

Продолжая исправлять технически ошибки, я понял, что на этой системе управления сайтом сделать по-нормальному будет практически невозможно. Мы приняли решение о переносе сайта на Modx Revo. Но на сайте сотни новостей и статей - вручную копировать и вставлять нецелесообразно. Я написал парсер, благодаря которому сохранил нужную информацию сайта в удобном CSV формате. Сохранялись html-названия страниц, заголовки, иллюстрации, тексты статей. Затем через плагин importX это было добавлено в Modx. Особых сложностей не возникло.

В процессе парсинга обнаружилось множество ссылок на левые внешние сайты - это был ещё один из пунктов для поисковых систем, что сайт надо забанить. Все ссылки автоматически были закрыты тэгом nofollow, некоторые просто удалены. Также оказалось, что для пары сотен новостей отсутствовали иллюстрации и картинки (то есть на старом движке их уже не было). Также нашёл множество нежелательных ссылок на несуществующие документы - плохой знак. Всё исправил.

Парсинг статей со старого сайта

Посмотреть другие кейсы

Давайте поработаем вместе!