Как узнать на каком движке сделан сайт?
WebDataStats – лучший бесплатный онлайн сервис для определения движка сайта. Умеет узнавать все популярные и большое количество малоизвестных CMS или фреймворков. Отдельное внимание уделяется специфическим платформам для бизнеса, таким как TIU, GetCource и т.п., а также облачным конструкторам сайтов. Что называется, «всех героев нужно знать в лицо».
За разработкой сервиса стоит российская команда (из Санкт-Петербурга) – ООО «ВебТехРазработка». Клиентам предлагается в том числе готовое расширение для браузеров на базе Google Chrome.
На сайте WebDataStats можно также получить готовые базы по доменным зонам и списки сайтов, работающих на определённых движках. Они будут полезны в рамках профильных исследований и при мониторинге конкурентов. При желании можно заказать выборку на основе своих критериев (в личном порядке, через специальную форму).

Бесплатная версия сервиса работает с ожиданием между запросами. Если хотите снять ограничения, то можно зарегистрировать аккаунт. Зарегистрированные пользователи получают до 50 проверок в день без ожидания.
Веб-студиям, SEO-шникам, программистам и представителям бизнеса предлагаются специальные тарифы.
Несгораемые пакеты проверок (тариф «Стандарт») покупаются от 100 штук.
Тарифы с обновляемым ежемесячным лимитом:
- Light, от 105 руб./месяц – 1000 проверок в месяц по 1 домену за раз.
 - Premium, от 210 руб./месяц – 5000 проверок в месяц, можно по 50 доменов за раз, доступно получение данных по истории изменений CMS домена (может быть полезно для определённых задач и расширенной статистики).
 - Business, от 1260 руб./месяц – 20 000 проверок в месяц по 100 доменов за раз, история смены движков домена, загрузка контактных данных сайтов там, где они есть.
 - API, от 5460 руб./месяц – 50 000 проверок в месяц по 1000 доменов за один заход, экспорт истории проверок, контактных данных, а также получение доступа к API системы для использования инструмента в собственных продуктах.
 

В личном кабинете хранится полная история проверок доменов. Помимо тарифных пакетов услуг, можно приобрести готовые базы в разрезе конкретных движков (онлайн-конструкторов или CMS-систем) или доменных зон. При желании можно заодно скачать базу контактов, размещённых в открытом доступе на страницах сайтов. Если нужных критериев нет, можно обсудить параметры баз с техподдержкой сервиса.

Каждый месяц разработчики обновляют базу данных и вручную обрабатывают запросы, по которым система не смогла выдать ответ. Кстати, на платных тарифах учитываются лишь положительные результаты проверок: если вдруг система не сможет опознать движок, проверка не спишется. И ещё: образцы отчётов по индивидуально подобранным критериям вы можете получить бесплатно для оценки качества.

Таким образом, WebDataStats в бесплатной версии подходит для личного использования и разовых проверок, в коммерческой – для компаний: студий web-разработки и веб-дизайна, маркетинговым агентствам, профессиональным веб-мастерам и вообще всем, кому подробная информация по доменам нужна в больших масштабах для анализа тенденций рынка и конкурентов.
Браузерное расширение для определения движка сайта
WebDataStats – CMS Сhecker
Тот же WebDataStats предоставляет бесплатное расширение для самых популярных браузеров (на базе Chromium: Google Chrome и Яндекс.Браузер). Учитывая точность основного сервиса, это будет максимально простой и доступный способ гарантированно узнать CMS-систему целевого сайта.
Расширение работает максимально просто:
- Оно устанавливается и активируется (закрепляется иконка в панели расширений).
 - Далее вы переходите на целевой сайт (движок которого хотите определить).
 - Кликаете на иконке расширения WebDataStats CMS Сhecker.
 - После завершения проверки результат будет показан во всплывающем окне (тултипе, связанным со значком расширения).
 
В каких случаях WebDataStats может не справиться со своей задачей:
- Если целевой сайт блокирует автоматический трафик. Технически WebDataStats представляет собой web-парсер. И если он не может получить код страницы, то и определить CMS он не может.
 - Если в базе WebDataStats пока ещё нет отпечатков нужного движка или структура HTML-кода никак не выдаёт конкретный движок. Так тоже бывает. Некоторые «хитрые» CMS никак себя не выдают. Например, нет характерной структуры URL, блоков кода, скриптов, путей/ссылок и т.п. Обычно в этом случае за работой сайта стоит сложный фреймворк или что-то самописное, а это минимальный процент сайтов (мизерная доля рынка).
 - У сайта реально нет CMS. Например, если сайт представляет собой свёрстанные вручную HTML-страницы, выгруженные на хостинг.
 
Как вручную узнать CMS сайта через исходный код
- Открываем сайт в браузере, поддерживающем просмотр HTML-разметки страниц сайтов (Google Chrome, Mozilla Firefox и т. д.).
 - Заходим на интересующий сайт, кликаем правой кнопкой мыши в любом месте и активируем функцию «Просмотр кода страницы» или нажимаем сочетание клавиш Ctrl+U. Вместо полного просмотра можно задействовать инструменты разработчиков – клавиша F12. В этом случае откроется специальная панель для изучения и отладки кода.
 - Среди множества строчек ищем мета-тег следующего содержания: <meta name=”generator” content=”здесь будет указано название движка” />.
 


Этот метод определения движка не самый точный, так как строку с названием платформы используют далеко не все движки и конструкторы. Например, точно можно найти WordPress, Joomla, Wix и некоторые другие. Не менее часто признаки, наоборот, пытаются скрыть.
Но движок можно определить и по другим характерным параметрам. Например, это может быть каталог со скриптами, темами или плагинами:
- Упоминание префиксов «wp-…» явно намекает на WordPress.
 - Для конструктора mottor – ищите вхождение путей «/mottor-frontend/» или ссылки на CDN с доменом «m-files.cdn1.cc».
 - Для конструктора Tilda в коде обычно присутствует характерные ссылки на CDN – «static.tildacdn.com» (для картинок и скриптов).
 - Внутри скриптов может быть прямое упоминание копирайтов. Вот так выглядит скрытие логотипа uKit на уровне кода: homeClusterDomain”:”ukit.com”,”isRemove”:{“header”:true,”footer”:true}.
 - На uCoz-сайтах можно найти упоминания JS-скриптов с указанием платформы – ищите «UCOZ-JS» в коде.
 - И т.д.
 
Но лучше всего движок сайта определяется по файлам, поставляемым вместе с дистрибутивом: это лицензии, копирайты, важные скрипты, чейндж-логи, благодарности и т.п. Очень редко кто правит дефолтные файлы robots.txt. А если и правит, то намеренно исключает из индекса системные каталоги, которые как раз однозначно могут идентифицировать движок.
По аналогии можно определять не только движок, но и задействованные на сайте технологии или виджеты:
- Метрики (Яндекс, Аналитика Google, счётчик Live Internet и т.п.), инструменты веб-мастеров.
 - Конструкторы форм и калькуляторов (например, виджеты uCalc, WebAsk и т.п.).
 - Темы и шаблоны (например, для WordPress путь к теме всегда пишется в коде, это будет что-то типа «wp-content/themes/ТУТ-НАЗВАНИЕ-ТЕМЫ/…»).
 - Плагины (опять же для WordPress ищите – «wp-content/plugins/НАЗВАНИЕ-ПЛАГИНА», в других CMS структура будет отличаться).
 - Иные скрипты и web-технологии (jQuery, Google Fonts, Bootstrap, интеграции рекламных сетей, кнопки «поделиться», чаты онлайн-консультантов, формы CRM и т.п.).
 
Технически можно написать свой парсер и прогонять код страниц через него. Но так как многие современные сайты работают с динамическим контентом, нужно продумать интеграцию с headless-браузерами или антидетектами. Для массового парсинга потребуются ещё и прокси.
Выводы и рекомендации
Благодаря современным онлайн-сервисам узнать CMS сайта не проблема. Самый простой и надёжный инструмент определения движка без погружения в код – WebDataStats. Здесь огромная база отпечатков CMS, готовое браузерное расширение, пакетные проверки и API для профи. Плюс есть готовые датасеты и выборки по самым интересных критериям. К примеру, можно посмотреть рейтинг самых популярных CMS. По доменам можно получить историю смены движка. В общем, в наличии всё для глубокой аналитики (ну или для детального изучения конкурентов в своей нише).
Если вам нужно максимум технических деталей (списки поддерживаемых технологий, интегрированные виджеты, шрифты, скрипты, плагины, темы и прочее) – нужно ковыряться в HTML-коде вручную. Без специальных знаний и понимания того, что именно и где нужно искать, может ничего не получиться.
- Автор: Дмитрий Луценко
 
Источник: uguide.ru
