Jak sprawdzić CMS i technologię na jakiej jest strona?

Analiza konkurencji jest bardzo istotna. Zwłaszcza na płaszczyźnie wirtualnej czyli stron internetowych. Wtedy zależy nam na jak najdokładniejszym zdiagnozowaniu tego co i jak robią nasi antagoniści zwani też przyjaźniej konkurentami. Oprócz ich działań marketingowych i związanych z pozycjonowaniem oraz poprawianiem widoczności, zazwyczaj warto się przyjrzeć konstrukcji ich stron internetowych i zastosowanych rozwiązań. Jednym z ważniejszych aspektów w tej materii jest określenie CMS’a (Content Managment System) czyli systemu zarządzania treścią na jakim działa oraz jakie dodatki do niego są wykorzystywane.

Nie wiesz Czym właściwie jest pozycjonowanie stron? Dowiedz się już dziś!

Co znajdziesz w tym wpisie?

Po co mi informacja o CMS’ach i technologii konkurencji?

Jest to istotne między innymi w celu teoretycznego określenia skali na jaką działają konkurenci oraz w jaki sposób. Poniżej kilka przykładów:

  • Niektóre dostępne rozwiązania są bardzo dobre dla małej i średniej skali, natomiast definitywnie nie sprawdzają się w skali makro (niektóre silniki sklepowe, takie jak Magneto, dla sklepów posiadających mniej niż kilkaset produktów zazwyczaj są zbyt potężne na to, co rzeczywiście wymaga się od takiej witryny / systemu).
  • W ten sam sposób można też określić teoretyczne wydatki konkurencji na zarządzanie takimi systemami lub ich podejście do bezpieczeństwa.
  • Przykładowo – jeśli korzystają ze stricte autorskiego systemu CMS, to pozostaje pytanie dlaczego? Czy dlatego, że standardowe nie pozwalały na integracje z ich innymi systemami i jeśli tak to z jakimi i czy można samemu te rozwiązania zduplikować?
  • A może indywidualny system CMS powstał ze względu na zwiększenie bezpieczeństwa witryny i ograniczenie ataków kierowanych na standardowe systemy (o ile w ramach tego CMS’a comiesięcznie przeznaczane są dodatkowe środki na jego modernizację, bo jego bezpieczeństwo nie jest wieczne).
  • Ewentualnie, czy wybór danego silnika nie był podyktowany stricte biznesowo-ekonomicznymi aspektami a jedynie zastosowaniem metody Misia przez developera (a mam takie widzi mi się, albo lubię ten CMS i stack technologiczny).

Niezależnie od diagnozy, czy jednej z wymienionych czy innych w wielu przypadkach warto wiedzieć na jakim CMS’ie jest postawiona strona i z jakich technologii korzysta (oczywiście w kontekście biznesowym, gdyż w aspekcie „hakerskim” i łamania zabezpieczeń jest to jeszcze istotniejsze).

Jakie typy witryn można spotkać w internecie?

Pytanie postawione w nagłówku może wydawać się trywialne lub banalne lecz odpowiedź na nie zależy od kontekstu. Przecież sieć obfituje w różnego rodzaju witryny, takie jak sklepy internetowe, strony firmowe, strony wizytówki, portale czy blogi.

Zastanawiasz się Jaki sklep internetowy otworzyć w Polsce? Zobacz najpierw wyniki analizy na blogu seoit!

Mimo to, każda z tego rodzaju witryn ma jeden wspólny mianownik – technologię w jakiej została wykonana lub ogólniej mówiąc, sposób jej wykonania. Starając się to możliwie jak najbardziej uogólnić można w tym zakresie wyróżnić następujące typy stron:

  • strony statyczne (oparte o „czysty HTML”)
  • strony oparte o standardowe CMS-y
  • witryny z dedykowanymi CMS-ami
  • strony oparte o kreatory
  • strony bazujące na rozwiązaniach SaaS (Software as a Service – jak na przykład platformy sklepowe)

W wielu przypadkach analitycznych warto wiedzieć, do którego z powyższych typów i z jakiego rozwiązania korzysta badana strona. Jednak jak to sprawdzić?

Jak rozpoznać technologię strony?

W ramach tego pytania skupię się na względnie najprostszych rozwiązaniach, które można podzielić na kilka płaszczyzn:

  • bezpośrednia analiza kodu strony (często wiele informacji tu można znaleźć)
  • analiza stopki strony (niektórzy się w końcu po prostu podpisują)
  • analiza stron błędu 404 (jeśli nie zostały nadpisane, co często się o dziwo zdarza)
  • wywoływanie błędów na witrynach (bo testowanie to zbędne koszty)
  • użycie ogólnodostępnego oprogramowania
  • wykorzystanie dedykowanych wtyczek
  • wykorzystanie i napisanie dedykowanych rozwiązań

W zależności od potrzeb i zakresu w jakim chce się działać, każde z powyższych rozwiązań jest dobre i warto je znać, chociażby po to by móc weryfikować otrzymywane wyniki.

Jak podejrzeć i czego szukać w kodzie strony?

Kod źródłowy strony można podejrzeć na różne sposoby. Można będąc na danej podstronie kliknąć prawym przyciskiem myszy i wybrać opcję „Wyświetl źródło strony”, przyciskiem F12 otworzyć konsolę developerską lub z użyciem kombinacji CTRL+U otworzyć w nowej karcie pełny kod źródłowy danego zasobu.

W celu zbadania czy wykorzystywane są konkretne technologie należy w dalszej kolejności wyszukać czy w kodzie znajdują się określone ciągi znaków (najprościej przez CTRL+F i wpisanie szukanych elementów). Na przykład po wpisaniu .js podświetlone zostaną konkretne pliki javascript, które są pobierane przez stronę, a wpisując ga lub Analytics można określić czy strona zawiera kod Google Analytics. Grunt by wiedzieć czego szukać :).

Najpopularniejsze systemy CMS jak określić ich obecność?

We wcześniejszych akapitach było trochę teorii i uzasadnień biznesowych, po co w ogóle sprawdzać CMS strony i wykorzystywane technologie. Teraz czas na praktykę i kilka popularnych przykładów:

Czy strona jest oparta o WordPress?

Ręczne sprawdzenie czy strona jest oparta na WordPressie nie jest zbyt wymagające. Wystarczy zajrzeć do kodu źródłowego strony (CTRL+U) i następnie wyszukać (CTRL+F) czy występuje w nim ciąg znaków wp-content. Jeśli tak, znaczy że mamy najprawdopodobniej (99,9%) do czynienia z najpopularniejszym CMS-em blogowym jakim jest WordPress.

Fragment kodu źródłowego strony opartej o CMS WordPress
Sprawdzanie czy strona jest oparta na WordPressie z poziomu kodu źródłowego

Czasami wyszukując w ten sam sposób ciągu znaków: WordPress możemy także określić jaka wersja tego oprogramowania jest wyskorzystywana.

Jak sprawdzić jaki szablon WordPressa został użyty?

Mając już zdiagnozowane, że ma się do czynienia z WordPressem, wystarczy poszukać, czy w kodzie występuje wyrażenie: wp-content/themes. Jeśli tak, to zazwyczaj następne słowo w znalezionym linku do zasobu css jest nazwą wykorzystywanego szablonu.

Fragment kodu źródłowego strony opartej o CMS WordPress wraz ze sprawdzeniem motywu
Sprawdzanie motywu strony opartej o WordPress z poziomu kodu źródłowego

Opcjonalnie można wykorzystać stronę: What WordPress Theme Is That i uzyskać dzięki niej odpowiedź.

Zobacz także wpis: Jak dodać link do strony w HTML?

Joomla! Jak ją wykryć?

Joomla od dawna traci na popularności (ale dziś nie opowiadam, jaki CMS jest najpopularniejszy), niemniej wciąż można spotkać strony o nią oparte. Można do jej wykrycia zastosować taką samą metodę jak dla WordPressa tylko wyszukać czy występują ciągi templates oraz assets.

Przykład panelu logowania do CMS Joomla pod adresem /administrator lub /admin
Widok panelu logowania stron opartych o CMS Joomla!

Powyższa metoda nie daje aż tak dużej pewności jak dla poprzedniego CMS-a. Żeby się dodatkowo upewnić można spróbować za adresem strony dopisać /administrator albo /admin lub wywołać stronę błędu. Jeśli przy którejś z metod pojawi się logotyp Joomla na stronie lub jako favicon to mamy do czynienia z tym CMS-em (często developerzy podmieniają logotypy na zwykłych stronach, ale na wyżej wymienionych już nie).

A może to jest Drupal?

To można sprawdzić tą samą metodą, co poprzednie CMS-y wyszukując w źródle odpowiednich wystąpień. Są one jeszcze bardziej intuicyjne, można szukać wystąpień: drupal, data-drupal, drupal-selector i tak dalej.

Fragment kodu źródłowego strony opartej o CMS Drupal
Sprawdzanie czy strona jest oparta na Drupalu z poziomu kodu źródłowego

Jednak ze względu na kilka wystąpień zjawiska żargonowo nazwanego Drupalgeddon, obecnie można spotkać mniej stron na nim opartych niż kiedyś.

Inne

Wystąpienie innych systemów zarządzania treścią sprawdza się w ten sam sposób. Jednak w przypadku autorskich rozwiązań jaki standardowych, trzeba wiedzieć czego szukać, bo jest ich dość dużo i aby odpowiedzieć na pytanie jak sprawdzić silnik sklepu albo autorski CMS, musiałbym poniżej przedstawić bardzo długą listę możliwości :).

CMS-y powstały do zarządzania treścią. Jednak by ich stosowanie miało sens trzeba wiedzieć: Jak optymalizować treść artykułów pod kątem SEO? Dowiedz się więcej już dziś i popraw widoczność swojej strony!

Dlatego najlepiej, albo zastosować jedną z ogólnie opisanych metod, jak wywoływanie błędów, sprawdzanie stopki, czy próba znalezienia stron logowania (admin, administrator, login. login.php, etc.), albo użycie półautomatycznych metod sprawdzania.

Automatyczne sposoby sprawdzania CMS i technologii strony

Automatyzacja jest zazwyczaj dobra. Nie tylko w marketingu, sprzedaży czy produkcji, ale w każdej płaszczyźnie życia. Dlatego bardzo możliwe, że zastanawiałeś się czy opisane wcześniej metody można stosować na skalę masową albo w zautomatyzowany, wydajny i przyspieszony sposób. No, oczywiście że się da i wiele osób to na co dzień robi, zwłaszcza gdy tego typu działania podejmuje częściej niż rzadziej. W związku z powyższym w kolejnych kilku akapitach prezentuję sposoby uproszczonego sprawdzania CMSów na jakich jest oparta strona, które mogą stosować osoby nie znające podstaw języków programowania oraz języka HTML i technologii tworzenia stron internetowych.

Warto wiedzieć jakie są najważniejsze języki programowania w technologiach webowych. Przeczytaj o tym na blogu w wolnej chwili!

What CMS?

Jedną z automatycznych możliwości, które pozwalają zidentyfikować skrypt na jakim jest strona a za razem CMS jest strona systemu What CMS? Po przejściu na stronę główną wystarczy tylko i wyłącznie podać adres URL badanej strony i … otrzymujemy informacje o wykorzystywanym przez badaną witrynę CMS’ie a nawet wersji.

Fragment audytu uzyskanego z pomocą What CMS
Przykład sprawdzania CMS-a z pomocą systemu What CMS

Dostawca tego narzędzia oferuje także inne usługi, jak na przykład detekcję motywu, na jakim jest strona oparta na WordPressie. Niestety nie agreguje tych danych zbiorczo więc każdorazowo trzeba podawać dany adres URL co w większej skali analiz może być uciążliwe.

Build With

Alternatywą jest inne online’owe – Build With, które nawet w podstawowej formie jest dużo bardziej rozbudowane od poprzednio przedstawionego. Przede wszystkim dlatego, że potrafi wykryć nie tylko CMS ale także wskazuje wtyczki, które są wykorzystywane przez stronę oraz biblioteki i informacje o serwerze.

Fragment audytu uzyskanego z pomocą Build With
Przykład sprawdzania CMS-a z pomocą systemu Build With

Wadą tylko jest ograniczona ilość wyszukiwań a za ich odblokowanie trzeba płacić jak za zboże, niestety. Jednak informacja jest walutą XXI wieku, więc nic dziwnego, ale … skoro nie widać różnicy to po co przepłacać zwłaszcza, że istnieje …

Wtyczka Wappalyzer

Korzystanie z online’owych narzędzi do sprawdzania technologii stron w wielu przypadkach nie jest zbyt wygodne. Zwłaszcza, gdy chce się takiej analizy dokonać ot tak w szybki i sprawny sposób. W takich przypadkach aż prosi się o użycie odpowiedniego dodatku czyli wtyczki do przeglądarki. I oczywiście takowa istnieje – Wappalyzer.

Fragment audytu technologii i CMS uzyskanego z pomocą wtyczki Wappalyzer
Przykład sprawdzania CMS-a i użytych technologii z pomocą wtyczki Wappalyzer

Z jej pomocą w łatwy sposób można określić czy strona jest oparta o któryś z podstawowych CMS-ów, jakie wtyczki, motywy, dodatki i skrypty wykorzystuje a nawet na jakim serwerze jest osadzona witryna.

Czy można inaczej automatyzować sprawdzanie CMSów i technologii?

Jak najbardziej można to inaczej zautomatyzować i ma to sens jeśli chce się to robić na masową skalę, bo stosowanie wspomnianych aplikacji w analizie seryjnej byłoby zbyt uciążliwe. W tym celu jednak należałoby samemu napisać lub zamówić odpowiednie oprogramowanie oparte o automatyzacje manualnych sposobów wymienionych wcześniej (wywoływanie błędów, analiza kodu, sprawdzanie charakterystycznych adresów, sprawdzanie stopki, etc.). Opcjonalnie można skorzystać z ofert firm świadczących tego typu możliwości abonamentowo. Wszystko zależy od skali do jakiej jest to potrzebne.

Ujawnianie CMS’a i stacku technologicznego a bezpieczeństwo

Czy należy ukrywać stack technologiczny własnej strony i jaki ma to wpływ na bezpieczeństwo. Są w tym zakresie dwie szkoły, ale pewne jest jedno – nie ma sensu chwalić się wykorzystywaną technologią na prawo i lewo :).

Teoretycznie można w wielu przypadkach maskować to na jakim serwerze osadzona jest strona. Oprócz podmiany nazw plików i poszczególnych adresów źródeł, można też podkładać standardowe strony błędów czy wywołań dla innych rozwiązań by wprowadzić atakującego lub zbyt ciekawskiego użytkownika w błąd. Pozostaje tylko pytanie po co?

Większość ataków przeprowadzają automaty a nie człowiek

Takie działania będą jak najbardziej sensowne dla ochrony przed działaniem osób z premedytacją, ataków ręcznych. Natomiast w momencie gdy większość ataków jest prowadzona przez automaty, lepszym zabezpieczeniem jest po prostu eliminowanie błędów własnego CMS-a aby nie można ich było wykorzystać. Przykład tego typu luki i sposobu jej znajdowania można znaleźć we wpisie o spamowych komentarzach w Wordpresie https://www.seostation.pl/wiedza/posiadasz-spamowe-komentarze-w-wordpress-uwazaj autorstwa Łukasza Suchego.

Podsumowanie sposobów sprawdzania CMS’a i technologii strony

Sposobów na sprawdzanie CMS-a strony internetowej jest wiele. Wybór stosownego rozwiązania zależy od skali dla jakiej chce się tego typu analizy robić oraz zakresu rozwiązań jakie chce się sprawdzać. Mam nadzieję, że ten artykuł pomógł Ci znaleźć ten najwłaściwszy dla Ciebie. Natomiast jeśli znasz jakieś inne sposoby, którymi warto się podzielić, zapraszam do podzielenia się nimi w komentarzach.

Może Ci się również spodoba

4 komentarze

  1. Grabol bloguje pisze:

    Nieźle kolego, widzę, że nie zdejmujesz sztangi z barków!

  2. Karol pisze:

    Ja korzystam z wtyczki jako dodatek do google chrome, żeby rozpoznać cmsa

    • Seoit pisze:

      I bardzo dobrze! Do sprawdzania pojedynczych stron w trakcie analizy jest to chyba najlepsze rozwiązanie! Niemniej czasem warto zajrzeć do kodu czy coś w dziwny sposób nie zostało ukryte.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *