Miroir du site http://www14.brinkster.com/proxomitron
[Copie du site en format ZIP: mirroir.zip]

Logo Titre : Le proxomitron, un filtre web universel

 
Accueil
Présentation
Pour commencer
      Télécharger/Installer
      Fenêtre Principale
      Fenêtre Config.
      Fenêtre Filtres HTML
      Fenêtre Filtres HTTP
      Fenêtre Log
      Fenêtre Proxy.
Travailler avec les filtres
      Introduction
      Editeur Filtres HTML
      Editeur Filtres HTTP
      Fenêtre Test
      Importer des filtres
      Trucs & Astuces
      Caractères Spéciaux
Détails
      Block List
      Filtre d'URL
      Commandes d'URL
      Comm. de recherche
      Conn. Sec.
      Proxies CGI
      Pile
Mise en œuvre
      JavaScript
      Exercices
      Aide mémoire (.pdf)
      Menus déroulants
FAQ
Version Beta
Misc
Liens
Fil d'infos (RSS)
 


Travaux Pratiques

     

Créer et appeler une liste (Commande : $LST)

Nous prendrons un exemple relativement simple : vous voulez appliquer un filtre à certains sites (ou pages) et pas à d'autres, plutôt que de saturer la zone URL Match, vous allez y appeler une liste qui contiendra l'ensemble des URLs pour lesquels utiliser ce filtre.

  1. Créez un fichier texte, inscrivez-y les URLs auxquels appliquer le filtre :
    www.site1.com
    triplecloc.machin.com/dossier/
    1autresite.org/cettepage.html
    et ainsi de suite...
    Sauvegardez votre fichier texte, sous le nom de votre choix, par exemple : testlist.txt

  2. Dans le panneau Config du Proxomitron, section Blockfile, vous allez référencer votre liste. Cliquez Add, sélectionnez votre fichier testlist.txt, et donnez lui un nom : testlist.

  3. Vous pouvez à présent appeler cette liste dans votre filtre, grâce à la commande $LST suivi du nom de la liste entre (parenthèses). Nous avons donc :
    URL Match : $LST(testlist)

    NB : Si vous aviez voulu appliquer ce filtre à tous les URLs sauf ceux présent dans votre testlist, vous auriez écrit :
    URL Match : ^$LST(testlist)

     

Rotation (Commandes $LST, $SET, $CON)

Disons que vous vouliez créer un filtre qui remplace un élément par un autre, mais pas toujours le même. Comment vous y prendre. Prenons par exemple l'en-tête HTTP user-agent, par défaut le Proxomitron remplace le nom de votre logiciel de navigation par un mystérieux ShonenKnife. Vous souhaitez modifier ce filtre pour qu'il remplace l'user-agent de votre navigateur par d'autres, pas toujours les mêmes...

  1. Créez un fichier texte que vous allez utiliser comme Blocklist, cela vous permettra d'y inscrire vos instructions. Nommez-le, par exemple, usag.

  2. Dans votre liste écrivez les instructions nécessaires à effectuer la rotation entre différentes valeurs user-agent, par exemple :

    ($CON(1,4,5) $SET(0=Mozilla/4.08 [en] (Win98; I ;Nav))|
     $CON(2,4,5) $SET(0=Mozilla/4.6 [fr] (Win95; I))|
     $CON(3,4,5) $SET(0=Mozilla/4.51 [en] (WinNT; U))|
     $CON(4,4,5) $SET(0=Mozilla/4.5 (Macintosh; I; PPC)))

    Cela entraînera une rotation toutes les 5 connexions, donnant à la variable 0 la valeur de l'user-agent correspondant. Sauvegardez votre liste.

  3. Vous allez à présent appeler votre liste usag et la variable 0 dans votre filtre. Ouvrez le filtre HTTP user-agent, modifiez le de la sorte :
    Replacement text:$LST(usag)\0

 

Recherche sur Internet (Commande $JUMP, $SET)

La commande $JUMP, vous permet de créer des raccourcis : vous tapez quelque chose dans la barre d'adresse de votre navigateur et le Proxomitron vous y amène. Comme à l'habitude, il n'y a rien de magique là-dedans, vous créez une expression et le programme la traite. Par exemple si dans la Jumplist (URL Alias List.txt, dans le dossier Proxomitron) vous ajoutez la ligne suivante (sous la rubrique # Proxomitron Links) :

px-fr/ $JUMP(http://go.to/proxomitron-fr)

Il vous suffira de taper .px-fr (n'oublier pas le point) pour vous rendre directement à http://go.to/proxomitron-fr. Vous devez bien sûr avoir activé le filtre URL: Alias Redirector (Out). Lorsque vous tapez quelque chose qui commence par un point dans la barre d'adresse du navigateur, le Proxomitron le compare au contenu de la Jumplist, et si l'instruction existe, il vous amène où vous vouliez. Vous pouvez ainsi créer des raccourcis vers des sites que vous consultez souvent.

Vous remarquez que la dernière sous rubrique de la Jumplist est (ou devrait être – suivant la version utilisée) :

# Default catch-all: send anything else to Google
\1/ & $JUMP(http://www.google.com/search?q=\1)

Lorsque vous tapez .quelquechose dans la barre d'adresse du navigateur le Proxomitron le compare aux instructions contenues dans la Jumplist, si rien ne correspond, il considère que c'est une recherche et envoie le tout vers Google (par défaut). Vous pouvez donc utiliser la barre d'adresse de votre navigateur pour effectuer directement des requêtes sur Google.

Vous comprenez qu'il est bien sûr possible d'aller plus loin et d'utiliser la barre d'adresse du navigateur comme ligne de commande pour différents outils de recherche. Nous allons commencer simplement en créant, dans la Jumplist, au-dessus de # Default catch-all... une nouvelle sous-rubrique que nous appèlerons par exemple #Moteurs de recherche. Disons que vous utilisiez souvent Altavista.fr, Fast et Voila (ce n'est qu'un exemple, à vous de créer ce que vous voulez, avec autant de moteurs qu'il vous plaît), vous pouvez donc ajouter à la Jumplist des expressions de la sorte :

a-\1/ & $JUMP(http://www.altavista.fr/cgi-bin/query? pg=q&sc=on&q=\1&kl=XX&what=web)
f-\1/ & $JUMP(http://www.alltheweb.com/cgi-bin/search? type=all&query=\1&exec=FAST+Search)
v-\1/ & $JUMP(http://search.ke.voila.fr/S/voila?gb=site&kw=\1)

Si vous tapez dans la barre d'adresse du navigateur .a-truc, vous chercherez des choses relatives à truc avec altavista, si vous tapez .v-truc vous ferez de même sur Voila, .f-machin opèrera sur Fast, et pour chercher de l'aide à propos de machin chose sur Fast vous taperez par exemple .f-machin+chose. Si vous tapez .truc la recherche s'éffectuera sur Google puisque c'est le moteur par défaut.

Le tiret - est là pour éviter les confusions (par exemple en l'absence du tiret, si vous tapiez .archives pensant effectuer une requête sur Google, vous rechercheriez en fait rchives sur Altavista).

En étant attentif à la façon dont ils sont construits, il vous est possible de personaliser les URLs de recherche. Par exemple pour les recherches sur Google, vous pouvez afficher 50 réponses par page en modifiant l'URL, dans la Jumplist, de la sorte :

\1/ & $JUMP(http://www.google.com/search?as_q=\1&num=50)

Si vous tapez .machin+chose Google vous renverra 50 documents contenant machin et chose. Vous pouvez aller plus loin :

\1(-(fr $SET(2=lang_fr)|en $SET(2=lang_en))|)/ & $JUMP(http://www.google.com/search?as_q=\1&num=50&lr=\2)

Nous avons ici ajouté une option de recherche : en tapant .machin+chose-fr vous aurez 50 documents en français contenant machin et chose, en tapant .machin+chose-en vous en obtiendrez 50 en anglais (vous pouvez bien sûr ajouter des langues).

Nous allons à présent ajouter une nouvelle option pour savoir s'il faut chercher machin et chose (par défaut), machin ou chose (option -ou), ou la phrase machin chose (option -ph). Nous arriverons à ceci :

\1((-ou $SET(3=as_oq)|-ph $SET(3=as_epq)|$SET(3=as_q))|)((-fr $SET(2=lang_fr)|-en $SET(2=lang_en)|$SET(2=any+language))|)/ & $JUMP(http://www.google.com/search?\3=\1&num=50&lr=\2)

On peut lire ceci comme : rechercher mot(s), première option ou pas (dans ce cas valeur par défaut), deuxième option ou pas (dans ce cas valeur par défaut).

Par exemple .machin+chose cherchera machin et chose dans n'importe quelle langue, .machin+chose-ph cherchera la phrase machin chose dans n'importe quelle langue, . machin+chose-ph-en la cherchera en anglais quand .machin+chose-fr recherchera machin et chose en français (etc.). La requête sera valide si l'on utilise ou non l'une ou/et l'autre des options, mais il faut qu'elles soient dans l'ordre (car .machin+chose-fr-ph chercherait la phrase machin chose-fr dans n'importe qu'elle langue, il existe néanmoins un moyen assez simple de résoudre ceci, mais pour l'instant, je vous laisse chercher).

A vous de jouer maintenant. Gardez en tête que ce sera à vous de créer ce dont vous aurez besoin : développez et améliorez.
 

Traduire ?

Maintenant que vous avez compris le principe, vous pouvez l'appliquer à d'autres types d'outils. Supposons que, durant vos recherches, vous arriviez sur une page en russe ou en japonais. Vous ne comprenez pas ces langues. C'est là que les outils de traduction de site deviennent intéressants : les traductions ne sont pas parfaites (inutile de traduire de la littérature avec ça), mais suffisantes pour comprendre de quoi il s'agit et allez plus loin. Donc vous arrivez sur une page en japonais, l'URL en est par exemple : http://www.truc.com/pacopri.html

Dans votre Jumplist, vous avez créé une nouvelle rubrique que vous avez appelé # traduction. Après avoir choisi (en l'occurrence chez Altavista) et étudiez le fonctionnement d'un outil de traduction en ligne gratuit, vous avez construit l'expression suivante :

tr(ru $SET(2=ru_en)|jp $SET(2=ja_en))-\1 & $JUMP(http://fr.altavista.com/eu?url=http://\1&bblType=url&fish=1&lp=\2)

Si vous êtes sur la page http://www.truc.org/pacopri.html, il vous suffira donc de modifier l'URL de la sorte .trjp-www.truc.org/pacopri.html pour en obtenir la traduction immédiate. Si la page avait été rédigée en russe vous auriez tapé .trru-www.truc.org/pacopri.html.

A présent, ajoutez d'autres langues. Vous pouvez bien sur également choisir un autre outil de traduction...