Omslag van 'Webtechniek voor niet-techneuten'

17. ScreamingFrog

Onze meest geliefde tool voor het controleren van een site is Screaming Frog. Er is een gratis versie en een betaalde. De betaalde kost £ 149, maar die is zijn geld meer dan waard. Hieronder bespreken we de betaalde versie. In de training Webtechniek bespreken we deze tool uitgebreid.

17.1 Installeren

  • Ga naar ScreamingFrog en kies voor de optie Download.
  • Download en installeer het programma.

Wil je de betaalde versie, koop dan een licentie en kies in ScreamingFrog voor License » Enter License.

17.2 Over ScreamingFrog

Screaming Frog is een spider. Dus net zo'n stukje software als Google gebruikt voor het indexeren van jouw site. Hij bezoekt alle pagina's, bekijkt de code en geeft bijvoorbeeld ook terug welke server-response-codes worden gebruikt.

Voorbeelden van wat je kunt controleren:

  • Gebruik van inline stijlen (zie het hoofdstuk over CSS). Je controleert dan op de code style=".
  • Dode links
  • Duplicate titels
  • Responscodes
  • Aanwezigheid alt-tekst
  • Aanwezigheid tabellen (die je dan met de hand kunt controleren)
  • Aanwezigheid Google Analytics- of Piwik-trackingcode

17.3 Spideractie voorbereiden en starten

Beperk de snelheid van de spider voordat je start

Het spideren van een site kan belastend zijn voor de website die je spidert en ook voor je eigen computer. Het is daarom vaak verstandig om de snelheid van de spider te beperken. Dat doe je als volgt:

  1. Ga naar Configuration ▸ Speed.
  2. Vink de checkbox Limit URI/s aan.
  3. Kies voor Max URI/s 2,0.

Spideractie starten

  1. Open ScreamingFrog.
  2. Ga naar het invoerveld bovenin "Enter URL to spider".
    Invoerveld voor invoer url in ScreamingFrog
  3. Voer daar jouw domeinnaam in en klik op Start.
  4. De spider start nu met het indexeren van de site. Dat kan even duren. Als de spider klaar is, kunt je starten met analyseren.
    onderschrift

Enkele opmerkingen hierbij:

  • Gebruik geen 'https' of 'http' in de url, want dan kun je gelijk kijken of het redirecten hiernaar goed gaat.
  • Als de spider na 10 minuten nog doorgaat of als je intussen al duizenden pagina's hebt geïndexeerd, klik dan op stoppen. Op sommige onderdelen, zoals agenda's, blijft ze maar 'doorspideren'.
  • Als je op een later moment verder wilt met de resultaten kun je deze ook opslaan.
Opmerking: het kan zijn dat de site niet gespiderd kan worden. Dit kan namelijk worden geblokkeerd door de webbouwer of eigenaar.

17.4 Controleren op dode links (404-meldingen)

  1. Zorg dat in het bovenste menu het tabblad "Internal" open is.
  2. Klik in het venster met de webadressen op Status Code, zodat deze aflopend sorteert (vaak 2 x klikken). Als er 404-meldingen zijn, komen deze bovenaan (tenzij er nog 500-meldingen zijn).
    Statuscodes, aflopend gesorteerd
  3. Selecteer een 404-melding.
  4. Kies uit het ondermenu de optie InLinks.
    Rechtermuismenu bij 'From' in 'Inlinks'
  5. Daar zie je de pagina staan die leidde tot een 404-melding.
  6. Bekijk daar de anchor text. Dit is de linktekst. Onthoud deze, die heb je zo nodig.
  7. Klik met de rechtermuisknop op de url onder 'From'.
  8. Kies in de pop-up die opent de optie Open From in Browser.
  9. De pagina op de site opent nu. Zoek daar op de ankertekst om de dode link te vinden.

17.5 Controleren op unieke paginatitels

Het belangrijkste kenmerk van elke pagina is de paginatitel. Deze vind je in het HTML-element title. Voor Google is het belangrijk dat elke pagina een unieke titel heeft. Als dat niet het geval is en je hebt 2 verschillende pagina's met dezelfde titel is dat verwarrend voor Google.

Het is ook belangrijk voor de bezoekers van je site, want als ze in de zoekresultaten 2 resultaten zien met dezelfde titel, welke pagina is dan de juiste?

Vergelijk dit met dat je een boekhandel binnenloopt en er liggen 2 verschillende boeken met dezelfde titel; welk boek was nu het boek dat je wilde kopen?

Ergo: het is een goed streven om elke pagina een unieke titel te geven. Om te controleren of je dat gedaan gebruik je ScreamingFrog.

  1. Kies in het bovenmenu voor Page Titles.
  2. Kies in het filter voor Duplicate
    Duplicate titels in onderdeel Page Titles
    .

Je krijgt nu een overzicht van pagina's die geen unieke titel hebben, zoals in het voorbeeld hieronder.

Dubbele titels voor Vacatures

Er zijn verschillende oorzaken van duplicate titels, bijvoorbeeld:

  • Webadressen zijn bereikbaar op http EN https. Het is beter slechts 1 protocol te gebruiken, waarschijnlijk bij voorkeur het https-protocol.
  • De website is bereikbaar op met en zonder www in het webadres. Beter is het om hier 1 domein voor te kiezen.
  • Alle vacatures hebben de titel 'Vacatures". Beter is het om hier elke vacature zijn eigen titel te geven, namelijk de titel van het vacature.

17.6 Controleren of elke pagina 1 h1 heeft

Elke pagina heeft bij voorkeur 1 h1, dus niet 0 of meer dan 1.

  1. Ga naar het tabblad h1 en klik op de kolomkop Occurences.
  2. De kolom wordt oplopend gesorteerd. Als er pagina's zijn zonder h1, dan komen deze bovenaan.
    Pagina's zonder h1
  3. Klik nog een keer op Occurences, de kolom is nu aflopend gesorteerd. De pagina's met meerdere h1's staan bovenaan.
    Pagina's met 2 h2's
  4. Open deze pagina (rechtermuisknop) en analyseer de headings met het programma Web Developer (zie vorige hoofdstukken).
  5. Inderdaad zijn er op 1 pagina 2 h1's.
    Pagina met dubbele h1, zichtbaar gemaakt met Web Developer

17.7 Custom filters

Handig in de betaalde versie van ScreamingFrog is het onderdeel Custom filters. Daarmee kun je zoeken op tekstfragmenten, bijvoorbeeld op het gebruik van inline stijlen (zie het hoofdstuk over CSS).

Je komt daar via Configuration ▸ Custom ▸ Search.

Starten custom filters

In het dialoogvenster dat je dan krijgt, stel je de filters in.

Instellen custom filters

Hierboven hebben we bijvoorbeeld enkele filters ingesteld om te kijken of er opmaakcode in de HTML staat. De code "<table" is opgenomen om de pagina's te vinden waarin tabellen worden gebruikt.

Indexeer vervolgens de hele site. Ga dan in het bovenmenu naar het item Custom en daar zie je alle URL's die voldoen aan een filter.

Je kunt deze optie ook gebruiken om te controleren of de Google Analytics trackingcode overal geïnstalleerd is. Als filter gebruik je dan Does not contain en als het goed is vind je na het spideren geen pagina's waarin de code niet voorkomt.

Custom filters om te controleren op de Google Analytics trackingcode
top

Was dit nuttig?

Feedback

Contact

Vul dit in als je wil dat we contact met je opnemen.