|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
![]() |
Anti-spam - Outils à base de tests de TuringAnti-spam - Outils à base de tests de Turing
Les utilitaires anti-spam à base de test de Turing, rares pour l’instant, lorsqu'ils sont bien conduits, représentent LA solution anti-spam actuelle. En moins de 2 minutes, vous ne recevez plus aucun courrier. Après une micro phase d'apprentissage (récupération de votre carnet d'adresses) il n'y a quasiment plus rien à faire.
Historiquement, qu'est-ce qu'un test de Turing ? C'est un test conçu en 1950 par Alan Mathison Turing [1], l'un des 2 ou 3 fondateurs des sciences de l'informatique [2], basé sur un test antérieur qui, initialement, cherchait à déterminer le sexe d'une personne rien qu'en discutant avec elle par écrit (sans la voir, sans l'entendre). Puis ce test a été étendu (notamment via le Prix Loebner [3]) à la détermination de l'"humanité" de l'interlocuteur: celui-ci est-il un humain ou un robot parlant, comme Alice [4] ? Est-ce que l'ordinateur pense ? On met un expérimentateur-testeur d'un côté, et on cache une machine et un bonhomme de l'autre. Si le testeur se fait avoir par la machine et ne sait pas faire la différence entre l'homme et la machine, alors la machine pense. Dans une variante du test, la machine seule doit se faire passer pour un homme. En fait, ce test se résume à une expérience dans laquelle un observateur tient une conversation avec un tiers inconnu. Comment cet observateur, par l'unique analyse des messages échangés, pourra-t-il distinguer l'homme de la machine ? Turing était convaincu que tout n'était qu'un problème d'information et que le développement des technologies permettrait d'ici cinquante ans aux machines de tenir en échec l'être humain au moins cinq minutes. Aujourd'hui, que sont les tests de Turing anti-spam ? C'est une contre-mesure au spam. Il s'agit de s'assurer de l’humanité d’un émetteur de courrier électronique : est-ce bien un humain ou est-ce un robot ? Pour ce faire on va demander à l'expéditeur du courrier de faire quelque chose qu'un robot ne sait pas faire (ou ne peut pas faire dans des conditions économiques acceptables pour l'émetteur). On va lui demander de résoudre une énigme, simplissime pour l'humain, impossible pour la machine, raison pour laquelle certains tests de Turing s'appellent "Challenge Message" [5]. S'il y a une réponse satisfaisante, on considère que l'émetteur est réellement un humain, son adresse et placée automatiquement en liste blanche et sa correspondance sortie automatiquement de la quarantaine vers la boîte de réception. Il ne lui sera plus infligé de test de Turing. Dans tous les autres cas (mauvaise réponse ou pas de réponse du tout), l’émetteur n’est probablement pas légitime. Le résultat est immédiat:
Il ne faut jamais détruire automatiquement les e-mails reçus et suspectés d’être du spam, surtout dans le monde de l’entreprise ou un nouvel interlocuteur, un prospect par exemple ou un client ou un fournisseur potentiel..., n’est pas encore connu de la liste blanche. Dans les solution à base de test de Turing, le courrier non validé par les listes blanches, est automatiquement mis en quarantaine et l'expéditeur est avisé qu'il a à se justifier en tant qu'humain. En attendant qu'il le fasse (immédiatement s'il est là, dans quelques heures à quelques jours s'il n'accède pas en continu à sa boîte de réception (absence, déplacement, vacances etc. ...), vous avez, si vous êtes pressé, accès très simplement à la quarantaine. Il faut agir exactement comme pour le relevé du courrier papier. Un coup d’œil rapide à l’enveloppe (le sujet et l’expéditeur dans le cas des e-mails) permet de voir immédiatement, avec un peu d’habitude, ce qui est à conserver. Tout le reste sera jeté automatiquement. MailInBlack, la solution française basée sur un test de Turing, apporte une solution élégante et rapide à la gestion de la file d’attente. Qu'apportent ces services ? Un service qui ne serait qu’un bête test de Turing sans rien autour n’apporte pas grand chose. Aujourd’hui les quelques services anti-spam de cette nature, disponibles, sont des ensembles de services incorporant un web-mail, la gestion de plusieurs adresses, la gestion antivirale, la gestion auto-nettoyante de la file d’attente, la protection anti-spam même en cas d’attaque en force brute ou par dictionnaire etc.… Ils apportent donc un arrêt immédiat du spam (et des virus de mail lorsqu'ils sont couplés à un antivirus) sans pratiquement rien avoir à faire. Les mieux conçus demandent simplement de re paramétrer le compte mail, en 2 minutes. Quels problèmes posent ces services ?
C'est une contre-mesure au spam. Il s'agit de s'assurer que l'émetteur d'un courrier électronique est bien un humain et pas un robot. Pour ce faire on va demander à l'expéditeur du courrier de faire quelque chose qu'un robot ne sait pas faire (ou ne peut pas faire dans des conditions économiques acceptables pour l'émetteur). On va lui demander de résoudre une énigme, simplissime pour l'humain, impossible pour la machine, raison pour laquelle certains tests de Turing s'appellent "Challenge Message" [5] Quelques services anti-spam utilisant un test de Turing (Challenge/Response) Plusieurs produits ou services ci-dessous sont des anti-spam ordinaires (à filtres et à règles) mais ajoutent un test de Turing comme ultime solution lorsque les filtres et règles ne suffisent pas. On rappelle que les anti-spam ordinaires, à filtres et/ou à règles génèrent des faux positifs et des faux négatifs provoquant la disparition de correspondances légitimes et, inverse, la légitimation de spam. Ne pas utiliser d'anti-spam contenant une technologie ordinaire (filtre sur les mots, filtre Bayésien, règles à score, RBL... - utiliser exclusivement un anti-spam à base de test de Turing et n'utilisant aucune autre technologie que le test de Turing.
Références ![]() Mathématicien, logicien et informaticien britannique, il fut l'un des fondateurs de l'informatique moderne, avec Von Neumann John et Wiener Norbert. Il emet les concepts de La Machine de Turing, en 1936. En fait, c'est la théorie de la calculabilité. Il s'agit de formaliser le principe d'algorithme, représenté par une succession d'instructions agissant en séquence sur des données d’entrée susceptible de fournir un résultat. Les ordinateurs actuels sont encore entièrement basés sur l'architecture des machines de Turing. Il contribue grandement à la victoire de la bataille de l'Atlantique en perçant, grâce à sa méthode, le secret d'Enigma, le système de chiffrement des Allemands durant la seconde guerre mondiale (39-45). C'est en 1950 qu'il énonce son célèbre Test de Turing. Au lieu de devenir un héros, il fut accusé en 1952 d'avoir des relations homosexuelles (ce qui fut un crime jusqu'à la fin des années 60 en Angleterre). Il choisit, pour éviter la prison, de se soumettre à un traitement chimique basé sur des injections d'œstrogènes, des hormones féminines, et quand il commença à avoir de la poitrine, il enduisit une pomme de cyanure pour se suicider, le 7 juin 1954. [2] Alan Turing WebSite Un site entièrement consacré à Alan Turing http://www.turing.org.uk/ [3] Prix Loebner Tentative d'instanciation du Test de Turing, visant ici à déterminer si un interlocuteur (invisible, on lui parle via un clavier et un écran) est un humain ou un robot parlant. Ce prix est offert par le docteur Hugh Gene Loebner, docteur de l'Université du Massachussets. [4] Alice (A.L.I.C.E.) A.L.I.C.E. (Artificial Linguistic Internet Computer Entity) est un Bot Parlant, conçu par Richard Wallace, qui a gagné quelques prix (notamment le Prix Loebner). Son logiciel est un Logiciel Libre (et Open Source, sous Licence Gnu/GPL, Alicebot et AIML), dont l'essence est faite d'algorithme de traitements linguistiques mais aussi (et surtout) de connaissances écrites en AIML (format XML). Plusieurs implémentations existent, dans des langages divers (Java, Python, ...), mais toutes lisent les fichiers AIML. Ces fichiers de connaissances sont remplis / adaptés par les Bot Masters, et souvent partagés avant d'être adaptés. Ce qui fait sa force, c'est principalement la somme des connaissances que ces Bots ont accumulées (il y a quelques traitements linguistiques, mais souvent en anglais: Opale est un exemple d'adaptation du programme au français). [5] Challenge messages (Enigmes - Captcha) et contre-mesure Que sont les "Challenges messages" ou "Enigmes" ou "Captcha" et comment les spammeurs pourraient développer une contre-meesure à cette contre-mesure. Challenge messages (Enigmes - Captcha) [13] La chaîne du spam La chaîne du spam [14] Risque de complicité d'envoi de spam et de prolifération virale Votre complicité peut être recherchée à cause de votre laxisme à vous protéger et protéger les autres [15] Les filtres bayésiens Les filtres bayésiens |
![]() |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Rédigé en écoutant :
Music |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||