Ga naar inhoud

Aantal pagina's website

Geplaatst:

Ard-Sc

Is er een hulpmiddel om het aantal pagina's waaruit een website bestaat te tellen?

 

Het gaat om het bepalen van het aantal pagina's van een omvangrijke website.

 

Ter verduidelijking een voorbeeld: www.belastingdienst.nl

 

Hoe kom je erachter uit hoeveel pagina's deze website is opgebouwd.

 

Thnx voor de input.

Featured Replies

Geplaatst:

Johannes Regelink

Google zoeken

 

Laat het aantal pagina's zien die google geïndexeerd heeft... (zoeken op: site:[webadres] )

 

Edit: dat is inclusief subdomeinen, zonder zet je er www. voor.

Nieuwsgierig naar mijn kijk op organiseren? Lees: Organiseren als spreeuwen: www.terogroep.nl/organiseren

Geplaatst:

Frans Sijtsma

wat je snel kunt zien is het aantal url's dat google geindexeerd heeft

 

gebruik in google het commando site: gevolg door de url van het domein

 

belastingdienst heeft dit tot gevolg met 217.000 pagina's

 

Dit heeft wel beperkingen en is niet 100% zuiver maar geeft wel een aardige indicatie

 

Geplaatst:

Raoul K

wat je snel kunt zien is het aantal url's dat google geindexeerd heeft

 

gebruik in google het commando site: gevolg door de url van het domein

 

belastingdienst heeft dit tot gevolg met 217.000 pagina's

 

Dit heeft wel beperkingen en is niet 100% zuiver maar geeft wel een aardige indicatie

 

 

met WWW werkt niet zo goed.

Geplaatst:

Frans Sijtsma

klopt, zoals johannes al aangaf is met www ervoor ex subdomeinen,

Geplaatst:

sinan

Dit werkt beter
Geplaatst:

Raoul K

Dit werkt beter

 

nog cooler :) 8)

Geplaatst:

Frans Sijtsma

Dit werkt beter

 

Want?

Geplaatst:

Ard-Sc

  • Auteur

Dank jullie voor je reacties.

 

Als ik er inhoudelijk naar kijk wordt het lastig, volgens de ene methode dik 200.000 pagina's, de andere 18.000 ...

Ik zie dat er allerhande zoekresultaten inzitten die niet van de belastingdienst zijn.

 

Deze "telmethode" is dus voor deze toepassing niet geschikt. Er mag best een afwijking zijn van een paar % maar dit is voor mij helaas niet bruikbaar.

 

Hopelijk nog andere input.

 

Geplaatst:

Raoul K

is het een eigen url? (kun je op de server?) Dan kan je systeem admin het wel automatisch tellen

Geplaatst:

Frans Sijtsma

Wellicht via yahoo

 

yahoo

 

Frans

Geplaatst:

sinan

Dit werkt beter

 

Want?

Kijk eens bij je resultaten, vanaf pagina 2.

 

En kijk eens bij de resultaten van mij, op alle pagina's.

 

Je zal het verschil snel merken.

Geplaatst:

Ard-Sc

  • Auteur

is het een eigen url? (kun je op de server?) Dan kan je systeem admin het wel automatisch tellen

Nee. Ik moet het doen via internet.

 

De website is van een kaliber zoals de BD (of Wehkamp). Handmatig niet aan te beginnen om dat te tellen i.v.m. het vierkante ogen syndroom. Ben dus op zoek naar een geschikte (zo betrouwbaar mogelijke) tool.

Geplaatst:

willemj

Deze "telmethode" is dus voor deze toepassing niet geschikt. Er mag best een afwijking zijn van een paar % maar dit is voor mij helaas niet bruikbaar.

 

Paar procent gaat niet lukken denk ik. De definitie van 'een pagina' is om te beginnen al niet zuiver. Een url met een productoverzicht biedt meestal een sorteer mogelijkheid. Telt iedere sorteeroptie als aparte pagina? Dezelfde pagina heeft de optie om 5, 10 of 25 resultaten per pagina te tonen. Is iedere optie een aparte pagina? Printfunctie toont een pagina in een popup voor afdruk. Aantal pagina's van de site ineens verdubbeld. Een site heeft een kalender staan, klik je op de volgende maand dan ververst de pagina om die maand te tonen. Je ziet dus tweemaal dezelfde pagina met als enige verschil een andere maand in de kalender. En ga zo maar door.

Geplaatst:

Ard-Sc

  • Auteur

@Willem:

 

prima aanvulling.

 

Maar stel dat jij zou willen bepalen uit hoeveel pagina's de site van de BD bestaat en je moet het van buitenaf doen, welke telmethode zou je dan hanteren?

 

 

Geplaatst:

willemj

Maar stel dat jij zou willen bepalen uit hoeveel pagina's de site van de BD bestaat en je moet het van buitenaf doen, welke telmethode zou je dan hanteren?

 

Grove schatting: siteexplorer van Yahoo zoals genoemd.

 

Voor een echte telling eerst een definitie van pagina opstellen en dan zoiets proberen:

 

- misschien hebben ze een sitemap voor google met alle unieke pagina's

- zoekfunctie misbruiken en zoeken op de/het/een en unieke url's of titles tellen

- zelf crawlen / spideren met bijvoorbeeld wget (tooltje om sites te clonen) of een eigen spider

- site: zoekfunctie van google met verschillende zoekwoorden, levert iets betere resultaten als zonder zoekwoord (helaas is het geautomatiseerd gebruik van google wat beperkt tegenwoordig)

- als ze urls als index.php?index= gebruiken alle urls van 1 tot een miljoen opvragen

- kijken welk cms / blog ze gebruiken en kijken of daar structuur in zit

 

Nogal afhankelijk van de site dus.

 

Bedenk me nu dat je met je vraag ook mijn definitie van 'pagina' kunt bedoelen. Zo ja, roep even ;)

Geplaatst:

Agenda_Ondernemers

"vroeger" toen alle websites nog gewoon 100% HTML waren met wat CGI-scriptjes, kon je je nog afvragen "hoeveel pagina's heeft deze website" en daar een duidelijk, redelijk nauwkeurig antwoord op krijgen.

 

Tegenwoordig kan dit echt niet meer! Veel pagina's worden dynamisch gegenereerd. Je kan in webshops zoeken naar producten, de resultaten (of categoriën) sorteren op naam, prijs, het aantal resulaten per pagina instellen... zijn dat allemaal pagina's? Nee! Maar 1 pagina kan wel uit veel schillende achterliggende bestanden bestaan. Daarnaast, met nieuwe technieken als 'ajax' heeft 1 URL ook niet altijd dezelfde inhoud!!!

 

De relatie directe relatie tussen een bestand op de server en een webpagina, die is er niet meer!

 

Neem bijvoorbeeld mijn website http://www.agendavoorondernemers.nl. Je kan in de kalender steeds een maand verder gaan, tot in het oneindige! (eigenlijk tot december 2030 om technische redenen ;)) .. maar ik heb echt niet elke pagina geschreven! Je zou dus kunnen zeggen dat mijn site een oneindig aantal pagina's heeft!

 

De vraag uit hoeveel pagina's een website bestaat is mijns inziens een onzinnige (no offence).

 

Groet,

 

AgendaVoorOndernemers

 

Alle evenementen voor ondernemers online: http://www.agendavoorondernemers.nl

Seminars, beurzen, congressen, workshops over onderwerpen die jou als ondernemer aanspreken.

Geplaatst:

Iwan van Geelen

@ agenda, jouw pagina(s) zijn 'stuk' zie bijlage :-[

Schermafbeelding_2011-01-16_om_20_55_13.thumb.png.8207a6eff39234018654e53a9452d3b0.png

geverifieerd-adres.nl Laat maar zien wie je bent met logo & online certificaat Dat ben ik En ook een keurmerk oplossing voor je Belgische webshop geverifieerd-adres.be
Geplaatst:

Agenda_Ondernemers

100x bedankt voor de tip+screenshot Iwan :-[, maar ik zie alleen geen errors op mijn pc's. Zie je ze nog steeds?

 

@iedereen: sorry voor off-topic.

 

Alle evenementen voor ondernemers online: http://www.agendavoorondernemers.nl

Seminars, beurzen, congressen, workshops over onderwerpen die jou als ondernemer aanspreken.

Cookies op HigherLevel.nl

We hebben cookies geplaatst op je toestel om deze website voor jou beter te kunnen maken. Je kunt de cookie instellingen aanpassen, anders gaan we er van uit dat het goed is om verder te gaan.