Miroir du site http://www14.brinkster.com/proxomitron
[Copie du site en format ZIP: mirroir.zip]

logo titre

 
Accueil
Présentation
Pour commencer
      Télécharger/Installer
      Fenêtre Principale
      Fenêtre Config.
      Fenêtre Filtres HTML
      Fenêtre Filtres HTTP
      Fenêtre Log
      Fenêtre Proxy.
Travailler avec les filtres
      Introduction
      Editeur Filtres HTML
      Editeur Filtres HTTP
      Fenêtre Test
      Importer des filtres
      Trucs & Astuces
      Caractères Spéciaux
Détails
      Block List
      Filtre d'URL
      Commandes d'URL
      Comm. de recherche
      Conn. Sec.
      Proxies CGI
      Pile
Mise en œuvre
      JavaScript
      Exercices
      Aide mémoire (.pdf)
      Menus déroulants
FAQ
Version Beta
Misc
Liens
Fil d'infos (RSS)
 


Les Block Lists

 

Le Proxomitron supporte désormais les block lists. Le plus souvent ce sont des listes d'URLs à utiliser avec des filtres donnés.
Cependant le terme "Block list" est un peu restrictif car ces listes peuvent faire beaucoup plus que bloquer certains URLs. Ce sont en fait des extensions de la zone "matching expression". Une "Block list" est simplement un fichier texte qui contient une série d'expressions à traiter. Chaque ligne de la liste est traitée jusqu'à ce que l'expression recherchée soit rencontrée, sinon la liste retourn un "false". Chaque "Block List" a un nom (dans le panneau de configuration du Proxomitron), et ce nom peut être intégré/appelé à n'importe quel endroit dans une requête d'expression à rechercher, en utilisant la syntaxe suivante :
$LST(nomdelaliste)

Le plus souvent vous appellerez la liste à partir de la zone "URL match", afin de restreindre l'application des filtres à certains sites donnés, mais pas seulement. Les listes peuvent contenir toutes les sortes d'instructions et de commandes supportées par le Proxomitron, et des listes peuvent également appeler d'autres listes !
Vous pouvez également traiter des lignes à exclure en préfixant la ligne par le caractère ~ .
Ces lignes "à exclure" peuvent être utilisées pour limiter ce qu'une liste doit chercher, elles ne seront traitées que si une expressions régulières est trouvée en premier. La ligne sera considérée comme "true" uniquement si aucune des ligne à exclure ne marche.

Les listes peuvent également être appelées dans le texte de remplacement. Dans ce cas elle ne sont pas utilisées pour chercher quoi que ce soit mais au contraire pour assigner une valeur à une variable de remplacement. En utilisant la commande $CON(#,#) , on peut par exemple faire tourner le texte de remplacement en fonction des numéros de connexion (Nous verrons cela en détail un peu plus tard).

Vous pouvez avoir jusqu'à 255 listes différentes et les utiliser dans n'importe quel sens. Un usage courant sera de leurs attribuer les URLs à bloquer, les sites dont vous voudrez accepter les cookies, les pages où tolérer l'usage du JavaScript, etc.

Une fois que vous aurez réalisé votre liste, un clic-droit sur l'icône du Proxomitron dans le system tray de windows, vous permettra de faire apparaître un menu contextuel, vous donnant accès à une option "Add to Blockfile" qui vous permettra d'ajouter de nouveaux URLs à vos listes très facilement. Copier simplement un URL à partir de n'importe quel document et il sera automatiquement collé dans la fenêtre de dialogue.

Normalement, chaque ligne dans une liste est traitée comme une expression indépendante. Néanmoins, les expressions longues peuvent être fractionnées sur plusieurs lignes. par exemple :
essaye(ça|cetruc|ceschoses|etcetruclà)
aurait tout aussi bien pu s'écrire :
essaye(
 ça|
 cetruc|
 ceschoses|
 etcetruclà)
Le résultat est exactement le même, mais c'est plus lisible (l'espace de début ou le retour pour chaque ligne sera ignoré).

Les listes peuvent contenir des commentaires en faisant précéder les ligne du signe # . Les commentaires seront ignorés, mais les premières lignes seront scannées à la recherche de certains mots-clefs qui peuvent influer sur la façon dont sera traitée la liste. Pour l'heure il y a deux mots clefs : NOADDURL et junkbuster .
NOADDURL masque la liste dans le menu "Add to blockfile". C'est utile pour prévenir le caviardage d'une liste.
Si Junkbuster est trouvé, le Proxomitron essaiera de traiter la liste comme Junkbuster le ferait avec ses propres listes. C'est bien sûr loin d'être parfait, mais cela semble bien fonctionner.
Notez que raisons des différentes méthodologies employées, construire de nouvelles listes en ajoutant les URL que vous trouver sera plus efficace que de réutiliser les anciennes Blocklists de Junkbuster. En particulier pour la raison que Junkbuster traite les listes à l'envers (du bas vers le haut), alors que le Proxomitron traite les URLs comme n'importe quel autre texte. De plus, il est conseillé (comme nous l'avons déjà vu) de ne pas utiliser l'astérisque en début d'expression. Par exemple (www.|)site.com sera beaucoup plus rapide à traiter que *site.com . Si vous avez besoin d'un astérisque de départ, essayez plutôt ceci [^/]++site.com . C'est beaucoup plus rapide qu'un * .

NoHash, NoUrlHash, NoPreHash sont employés pour désactiver certains algorithmes de hachages utilisés dans le traitement des listes. NoHash élimine tout hachage et peut être utilisé pour les listes rarement appelés ou dont la vitesse de traitement n'est pas un problème. NoUrlHash et NoPreHash désactivent certains types particuliers de hachage (voir ci-dessous). Vous n'aurez probablement pas a utiliser ceci très souvent (voir pas du tout).

 

Indexage des Blocklists (hachage)

Le Proxomitron peut désormais effectuer un index de totalisation sur les éléments composants les listes. Cela lui permet de trouver les expressions recherchées beaucoup plus rapidement. Normalement vous n'aurez pas à vous souciez de la façon dont cela fonctionne, mais si vous voulez garantir un traitement optimal de vos listes, voici quelques conseils.

Premièrement sachez que toutes les entrées composant les listes ne peuvent être hachés. Le Proxomitron analyse chaque élément pour voir s'il est hachable. S'il l'est, il est ajouter à une liste de hachage, s'il ne l'est pas il est ajouté à une liste non hachable qui sera scannée à chaque fois que la liste sera appelée. Evidemment, c'est mieux si c'est hachable.

Il y a deux type d'indexes que le proxomitron peut utiliser – l'un à préfixe fixe et l'autre de style URL. Chaque élément est analysé pour voir s'il peut être indexé suivant l'une ou l'autre méthode, si c'est le cas, la méthode qui peut indexer le plus de caractères est utilisée pour cet élément. La liste complète peut être un mélange des deux méthodes.

Les préfixes fixes sont les plus simples - c'est une simple expression qui a un nombre défini de caractères, sans joker (wildcard en anglais : les * ? ou autres). Plus longue est l'expression avant le joker, plus elle devient indexable. La plupart des Urls ajoutées par les utilisateurs entrent dans cette catégorie, mais des listes non composées d'Urls peuvent en profiter. Voici quelques exemples d'expressions éligibles :

www.quelquepart.com
127.0.0.
shonen(knife|)
foo(bar|bat)*bear

Les fonctions logiques ET sont correctes également, comme dans ceci*&cela – par contre les OU hors des parenthèses, comme ceci|cela, ne seront pas indexables car l'expression peut commencer par deux valeurs différents (ceci ou cela). Dans ce cas il est préférable de les placer chacune sur un ligne différente.

Le style URL permet l'utilisation du joker en début d'expression. Le programme regarde la fin de la partie host de l'Url (repérée par un ; ou /) et indexe à partir de là. Pour que cela fonctionne il ne doit y avoir aucun autre joker entre la fin du hostname et celui du début. Les joker valides sont : *, \w, [...]+, [...]++ et (...|). Cela couvre les plus utiles dans ce domaine. Voici quelques exemples :

*unsite.com/(ce|que|vous|voulez)/\w.html
\wunsite.com/
[^.]+.unsite.com/
[^/]++unsite.com/
(www.|)unsite.com[0-9]+/
([^/]++.|)un site.com/

par contre, des choses du style :

([^/]++.|)unsite.*/
([^/]++.|)unsite.(com|net)/

La chose importante à surveiller est que lorsque vous utilisez un joker en début d'Url, il doit se terminer par un /. Précédemment ce n'était pas nécessaire, mais maintenant ça l'est. Ainsi :

([^/]++.|)microtruc.

devrait être remplacé par

([^/]++.|)microtruc.com/

ou sous plusieurs entrèes si nécessaire. Autant dire qu'il y faudra éviter les chose du style :

www.(ad(server|engine|banner)|banner(site|click|)).(com|net)

A la place listez chaque Url sur une ligne différente, ce sera plus rapide à traiter - et à maintenir...

 

N.B. Vous pourrez trouver un exemple de Blocklist pour le Proxomitron sur http://blocklists.cjb.net/ .     


The Proxomitron is Copyrighted to Scott R. Lemmon