Crawler-Info

Beim Team NorthArchive nutzen wir automatische Web-Crawler für die regelmäßige Archivierung von Webseiten.

Unser Crawler kann basierend auf seinem User-Agent erkannt werden, welcher einen Link zu dieser Seite beinhaltet.

Faire Limitierungen

Alle Crawl-Aufgaben sind standartmäßig konfiguriert um faire Limits einzuhalten. Diese umfassen Anfragefrequenz und Bandbreite je Domain. Diese Limits sind der jeweiligen Aufgabe angepasst.

Software

Unsere Crawl-Aufgaben laufen auf der Heritrix 3 Engine vom Internet Archive.

Kontakt

Der Administrator des Crawlers ist Kevin Kandlbinder. Er kann unter [email protected] per E-Mail erreicht werden.