Machine à repasser

Machine de Wayback est une implémentation Java open source de la machine d'archivage sur Internet.
Télécharger maintenant

Machine à repasser Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • MPL
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • Jeff Kaplan
  • Site Internet de l'éditeur:
  • http://www.archive.org

Machine à repasser Mots clés


Machine à repasser La description

Wayback Machine est une implémentation Java open source de la machine d'archivage Internet de l'Internet. Wayback Machine est une implémentation de Java open source de la machine de navigation d'archive Internet.La version de production actuelle de la machine de navigager est mise en uvre dans Perl et manque de maintenabilité et d'extensibilité. En outre, le code n'est pas open source. La motivation principale de la nouvelle version consiste à répondre à ces trois questions, permettant la distribution publique de l'application et une expérimentation facile avec de nouvelles fonctionnalités et des technologies d'accès. La version Java actuelle de la machine de Wayback prend en charge deux modes d'accès ou de lecture de fonctionnement: mode "Archival URL" et mode "Proxy". Le mode URL d'archivage fournit une expérience utilisateur très proche de la machine de navigation de production actuelle. Toutes les demandes d'accès à la requête et à Replay peuvent être exprimées en tant qu'URRL. En mode de relecture d'URL d'archivage, les documents HTML sont livrés avec JavaScript supplémentaire intégré dans la page. Ce JavaScript modifie le document dans le navigateur, tente de faire des liens et du contenu intégré reportez-vous à la machine de navigation en les réécrisant comme des URL d'archives. Le mode URL proxy permet de réjouir des documents archivés dans un navigateur client en configurant le navigateur de proxy toutes les demandes HTTP via la machine de navigager. Cela a l'avantage fort qu'aucun point de vue de la page JavaScript n'est requis pour contraindre le navigateur client pour demander des URL supplémentaires et un contenu intégré à partir du contenu de la machine de Wayback fonctionne comme ça. Un inconvénient majeur de ce mode est qu'il n'ya aucun moyen de transférer des informations temporelles avec chaque demande de replay. En raison de cette limitation, seule la version la plus récente archivée de toute ressource est accessible à travers la machine de navigager en mode URL proxy.Autro la limitation du mode URL proxy est qu'elle nécessite une configuration spéciale du navigateur Web client pour accéder au service de navigager. Cette configuration du navigateur n'est pas complexe, mais cela signifie que le contenu ne peut pas être accédé en tant que URL globale. Voir le manuel d'utilisation pour en savoir plus sur les modes d'accès. La version Java actuelle est destinée à fonctionner comme WebApp autonome, en maintenant un index sur la machine hébergeant la webApp. Cet index contient des enregistrements des ressources dans un ensemble de fichiers Arc, qui sont également supposés être stockés sur la même machine hébergeant la webApp. Ce logiciel inclut la capacité de numérisation de fichiers arc dans un emplacement spécifié et d'indexer automatiquement et de servir du contenu dans les fichiers Arc nouvellement découverts tels qu'ils apparaissent. Diriger la machine de navigation pour rechercher des fichiers Arc dans le répertoire où une instance de Heritrix Web Crawler est en train d'écrire une sortie d'arc devrait fournir la capacité de parcourir le contenu archivé par Héritrix, car il est rampé. Les versions futures de ce logiciel peuvent s'intégrer plus étroitement avec l'application Heritrix Web Crawler.Quelle dans cette version: · Une implémentation de fichier de fichiers plate triés CDX a été ajoutée, permettant d'ajouter des ensembles de données beaucoup plus importants. · La prise en charge des demandes d'archivage Date-Plage a été ajoutée. . · La détection du jeu de caractères a été améliorée afin que les pages ne soient pas mangées lorsque la modification du côté serveur se produit. · Plusieurs nouveaux outils de ligne de commande ont été ajoutés pour générer et mettre à jour chaque type de ressourcesIndex. · L'indexation et le traitement de la fusion ont été séparés en différents threads. · BugFixes a été fait. permettre l'intégration avec la recherche de texte intégral de Nutchwax.


Machine à repasser Logiciels associés

métazip

un module Apache 2.0 qui vous permet de servir des fichiers zip construits de manière dynamique et non compressée ...

167

Télécharger

Datalus

Datalus permet à l'utilisateur de créer des applications Web compliquées à l'aide de descriptions de XML simples et de scripts courts. ...

134

Télécharger

forcer

Le plug-in Force-Aperçu aide à réduire le spam de commentaire sur un blog de type mobile. ...

223

Télécharger