Sitemapcrawler

Application de la console que Tchacks toutes les URL énumérées dans le fichier Sitemap.xml
Télécharger maintenant

Sitemapcrawler Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • Freeware
  • Nom de l'éditeur:
  • Summer Son
  • Site Internet de l'éditeur:
  • http://www.codeproject.com/Members/Summer-son
  • Systèmes d'exploitation:
  • Windows All
  • Taille du fichier:
  • 47 KB

Sitemapcrawler Mots clés


Sitemapcrawler La description

Le programme SitemapCrawler a été développé pour être une application de console que Tchacks toutes les URL énumérées dans Sitemap.xml File.Vous avez-vous déjà pensé à essayer de valider chaque URL répertoriée dans votre fichier de planification? J'ai un site avec des liens de page générés dynamiquement. Ces liens sont générés en fonction d'un titre de page qui peut être une combinaison de lettres, de chiffres et de symboles. Bien entendu, le site supprimera tous les caractères interdits du titre de la page avant de générer son URL, de couper et de raccourcir un peu ... Cependant, les erreurs se produisent toujours de temps en temps. Par exemple, une page avec un titre: '' ... IS_BRENK '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '' '»Du fait de mes spécificités de conversion d'URL aura l'URL suivante: /.is_broken+ Il y a des milliers de pages, donc il est clair que je ne peux pas vérifier Chaque page séparée que la base de données du site contient. Based sur une liste d'URL générées dynamiquement, je génère un fichier sitemap.xml. Qui contient toutes les pages de site. Donc, chaque fois qu'un fichier de carte est généré, j'ai besoin de s'assurer qu'il n'y a pas d'éléments répétitifs (cela peut arriver si différentes pages ont les mêmes titres) et chaque URL distincte est accessible, c'est-à-dire ne produit ni mauvaise demande, ni 404 ou quelque chose comme That.So j'ai créé un programme C # qui traverse chaque URL répertoriée dans le fichier Sitemap.xml et tente d'y accéder. Il enregistre toutes les erreurs survenues dans un fichier de sortie, il est donc facile de suivre les pages problématiques.Je utilisez la classe XMLDOCUMUME pour charger un site Sitemap.xml; Classes WebRequest et Webresponse pour déterminer si une URL existe.


Sitemapcrawler Logiciels associés

Magic Downloader

Téléchargez et enregistrez des vidéos de YouTube, SoundCloud, Instagram et d'autres sites Web de plus de 900+. ...

262 9.8 MB

Télécharger

RSDL

Téléchargement automatique des fichiers par lots de Rapidshare.com ...

224 6.8 MB

Télécharger