INFERENCE DE CODEPAGE BASIÉE HTML

Hebci est une technique permettant à un gestionnaire de formulaire Web de détecter de manière transparente le jeu de caractères avec lequel ses données ont été codées.
Télécharger maintenant

INFERENCE DE CODEPAGE BASIÉE HTML Classement & Résumé

Publicité

  • Rating:
  • Licence:
  • GPL
  • Prix:
  • FREE
  • Nom de l'éditeur:
  • Josh Myer
  • Site Internet de l'éditeur:
  • http://www.joshisanerd.com/ruby_index/

INFERENCE DE CODEPAGE BASIÉE HTML Mots clés


INFERENCE DE CODEPAGE BASIÉE HTML La description

Hebci est une technique qui permet à un gestionnaire de formulaire Web de détecter de manière transparente le jeu de caractères avec lequel ses données ont été codées. Hebci est une technique permettant à un gestionnaire de formulaire Web de détecter de manière transparente le jeu de caractères de manière transparente avec laquelle ses données ont été codées. En utilisant des références de caractères soigneusement choisies, le codage du navigateur peut être déduit. Il est possible de garantir que les données sont dans un encodage standard sans s'appuyer sur (souvent peu fiable) WebServer / Browser codant des interactions. La solution idéale sera entièrement navigateur. neutre et passif. Malheureusement, la spécification HTML ne définit aucun mécanisme pour cela. Nous devons trouver un autre, snewnier, moyen d'extraire le personnage actuel de l'encodage du navigateur.Luckily pour nous, il y a une astuce que nous pouvons utiliser pour cela: codes d'entité. Les codes d'entité sont des cordes telles que (sont) utilisées pour coder des caractères spécifiques sans utiliser Unicode. Lorsque le navigateur affiche une page, il les remplace avec le caractère approprié à partir du codage actuel.thus et devient le caractère 0x26 dans la plupart des points de code. En lui-même, il s'agit simplement de la mise en uvre de la triviale. Cependant, ce processus de traduction se produit chaque fois qu'un utilisateur soumet un formulaire. C'est-à-dire que le navigateur analyse des entités dans les variables de forme et les remplace par la représentation du codage actuel de ces caractères lorsque l'utilisateur clique sur Soumettre. Ainsi, toutes les codes d'entité dans les champs de formulaire sont transmises comme des valeurs de caractère dans le codage actuel du navigateur.SO, tout ce que nous avons à faire est de trouver une entité codée différemment dans deux codes de code différents. Nous glissons cela dans un champ de formulaire, puis regardons sa valeur lorsque nous obtenons des données. Cela nous permet de différencier les deux codages. En fait, nous pourrions examiner toutes les entités de nombreux codépages et trouver ceux qui nous ont permis de désamorger entre de nombreux papiers. C'est ce que j'ai fait.Nous ajoutons des éléments de forme cachés avec des valeurs contenant divers codes d'entité, tels que °, et -. Ensuite, lorsque l'utilisateur soumet le formulaire, nous prenons chacun de ceux-ci et les comparons à une liste de quel personnage a la valeur dans quel codePage. C'est-à-dire que chaque code code a une empreinte digitale unique pour les valeurs de °, -. Pour macroman, c'est A1, D6, D1; Pour UTF-8, C2B0, C3B7, E28094. Ainsi, nous ne devons donc passer à travers notre table de mappages de codépage à digital et voir quelles empreintes digitales correspondent. Note que, une fois que cette table est découverte, le coût de l'empreinte digitale d'une soumission de formulaire donnée est très faible. Et, dans le cas de Misses, vous pouvez assumer le point de code par défaut de votre page. Cet étui à mort est équivalent à ce que le code aurait fait avant d'ajouter cette couche de détection.


INFERENCE DE CODEPAGE BASIÉE HTML Logiciels associés