Обновление сайта newsproauto.ru

Сайт владимирского глянцевого автомобильного журнала Про Авто попал ко мне в работу всего 1,5 месяца назад. В первый раз я работал с сугубо новостным информационным порталом. Основная финансовая задача таких порталов - привлечь большую посещаемость, а затем и рекламодателей.

Посещаемость можно увеличить интересными материалами, акциями, конкурсами, сотрудничеством с другими проектами. В первую очередь нужны регулярные полноценные самостоятельно написанные новости. В случае Про Авто на сайте было около 650 материалов. Для регионального специализированного сайта этого предостаточно. Но посетители шли в основном из социальных сетей (иногда более 300 переходов в сутки) и по ссылкам с других сайтов. Почему же не было трафика с поисковых систем, хотя теоретически там должно было быть минимум несколько сотен переходов в день?

Причин оказалось много. Первая - система управления сайтов Netcat. Признаюсь, чем глубже я копал, тем больше я впадал от неё в уныние. Начинается все с того, что она не воспринимает знак кавычек " в коде. Надо обязательно использовать такую ' кавычку. Логика этой CMS пугает - чтобы найти раздел, где отредактировать какой-нибудь кусок кода надо быть детективом. Особенно мне понравилось где был запрятан robots.txt.

Но главная проблема этой CMS это дубли. На сайте их было просто бесконечное количество. Только по тэгам каждая новость дублировалась несколько раз. И классика жанра неполноценных CMS - это доступность страниц по адресу со знаком вопроса + дальнейший код. Никаких редиректов, тэгов canonical, запрещающих строк в файле robots.txt. Просто множество дублей. Всего на сайте 667 страниц, а через Xenu link sleuth я нашел более 15000, потом мне надоело ждать (прошло только 30-40% поиска) и я вышел из этой программы. В Яндекс.Весмастере в "Загружено робот" было 3134 страниц, а в "Страницы в поиске" - 153 страницы. В итоге, оказалось, что сайт под фильтром АГС.

Кстати, дубли были не только внутри одного домена, но и на зеркалах сайта, где не было редиректов. Таких зеркал было 6 штук. Это домены с www и без, в com, ru и рф зоне.

Итак, работа над сайтом началась. В первую очередь мы определили какие блоки не нужны: форум, блоги, отзывы, регистрация на сайте, целый модуль для покупки/продажи автомобилей. Поменяли внешний вид - сайт стал гораздо более легким для восприятия. Увеличили ширину всего сайта, ширину основного блога для новостей и статей - ведь это то, для чего люди переходят на сайт.

Обновление сайта автомобильного журнала Про Авто

Время загрузки главной страницы упало с 9 до 4,5 секунд. Вес главной страницы уменьшился с 2,99 мегабайт до 824 килобайт, количество запросов браузера (одновременно может загружаться только 8 элементов на странице) с 90 до 32. Будет сильный рост скорости загрузки сайта когда владельцы перейдут на хороший хостинг. Время загрузки главной страницы вполне уложиться в 2 секунды. Это неплохо скажется на восприятие сайта поисковыми системами.

Затем я взялся за настройку файла robots.txt. Как видите, сейчас он достаточно большой. Были закрыты все нежелательные страницы и дубли.

Индексирование сайта автомобильного журнала Про Авто

С появлением файлов robots.txt и sitemap.xml, устранением ошибок в коде и ускорением загрузки, Яндекс начал по-хорошему индексировать страницы. К сожалению, с момента начала моей работы над сайтом прошло только 4 апдейта поисковой базы Яндекса, поэтому результаты только начальные (дополню эту статью через пару апдейтов свежими данными).

Переходы из поисковых систем

Буквально сегодня начал реагировать и Гугл на прошедшие изменения. Пока цифры несерьезные, но это только первая ласточка. Думаю, что через месяца 2 будет минимум 50-60 переходов из поисковых систем в день.

Большой бедой стала динамика ссылочной массы. Видно, что с февраля было закуплено около 5000 ссылок. Причем, они оказались арендными, без никакой фильтрацией, а самым популярным анкором были "Автоновости". Это прямая дорога в бан поисковых систем. Ссылки сняли. Но поисковым системам надо несколько месяцев, чтобы они отошли от такого ссылочного взрыва.

Ссылочный взрыв

Продолжая исправлять технически ошибки, я понял, что на этой системе управления сайтом сделать по-нормальному будет практически невозможно. Мы приняли решение о переносе сайта на Modx Revo. Но на сайте сотни новостей и статей - руками копировать и вставлять можно очень долго. Я написал парсер, благодаря которому сохранил нужную информацию сайта в удобном CSV формате. Сохранялись html-названия страниц, заголовок, иллюстрация, текст статьи. Затем через плагин importX это было добавлено в Modx. Особых сложностей не возникло.

В процессе парсинга обнаружилось множество ссылок на внешние сайты - это был ещё один из пунктов для поисковых систем, что сайт надо забанить. Все ссылки автоматически были закрыты тэгом nofollow, некоторые просто удалены. Также оказалось, что для пары сотен новостей пропали иллюстрации и картинки. Ещё множество нежелательных ссылок на несуществующие документы - плохой знак. Исправили (кроме некоторых иллюстраций-превьюшек, но сейчас путь к страницам, где они есть все равно закрыт в robots.txt).

Парсинг статей со старого сайта

Была сделана полная копия сайта на запасном домене + несколько дополнительных фишек (перенос новостей и статей на один уровень выше с редиректом, внедрение разметки schema.org, раздел с архивом журнала и так далее). В один прекрасный основной сайт был удален, а новый установлен на его место.

Итоги работы

Сейчас сайт работает на Modx Revo, он продолжает наполняться новостями и прочими материалами. Среди материалов и тест-драйвы, которые мы снимаем вместе (я писал о них тут, тут и тут). Грубых технических ошибок нет, дублей нет, левых ссылок нет, загружается быстро. Но раньше июля ждать хороших результатов не стоит. Поисковые системы - это достаточно инертные существа.
Будем надеяться, что сайт, как можно быстрее, получит свою заслуженную посещаемость.

Автор: . Дата публикации:

Больше материалов с сайта: