Les robots capteurs d'adresses e-mail
   
 

Il en existe probablement des milliers. Plusieurs existent en versions gratuites bridées mais suffisantes pour qu'un petit Webmaster qui veut promouvoir son tout nouveau site fasse quelques collectes et nous spamme.

Webmasters, voici quelques noms de ces oiseaux de malheur qui passent leur vie à écumer nos sites, noms à introduire dans vos fichiers .htaccess pour leur interdire la visite de vos sites et le pillage de vos adresses e-mail affichées sur lesdits sites (en plus de consommer votre bande passante, d'écrouler le site durant leur visite, de vous coûter en dépassement de limitation de trafic ou de bande passante ou en saturation du serveur etc. ...). Mais ils changent de nom de temps en temps et il en naît de nouveaux. Il faut analyser les logs et faire ressortir les http_user_agent qui ont visité, par exemple, plus de 50% des pages du site en peu de temps.


Le site The Web Robots Pages maintient une liste de robots d'autres natures que de spam (robots des moteurs d'indexation, des valideurs de liens, des statistiques du Web...) et explique comment utiliser .htaccess pour rediriger les robots (en anglais).


Robots pilleurs d'adresses e-mail (plus quelques autres) :

  1. [Ww]eb[Bb]andit
  2. Alexibot
  3. asterias
  4. BackDoorBot
  5. Black.Hole
  6. BlackWidow
  7. BlowFish
  8. BotALot
  9. BuiltBotTough
  10. Bullseye
  11. BunnySlippers
  12. Cegbfeieh
  13. CheeseBot
  14. CherryPicker
  15. ChinaClaw
  16. CopyRightCheck
  17. cosmos
  18. Crescent
  19. Custo
  20. DISCo
  21. DittoSpyder
  22. Download\
  23. eCatch
  24. EirGrabber
  25. EmailCollector
  26. EmailSiphon
  27. EmailWolf
  28. EroCrawler
  29. Express\
  30. ExtractorPro
  31. EyeNetIE
  32. FlashGet
  33. Foobot
  34. FrontPage
  35. GetRight
  36. GetWeb!
  37. Go!Zilla
  38. Go-Ahead-Got-It
  39. Googlebot-Image
  40. GrabNet
  41. Grafula
  42. Harvest
  43. hloader
  44. HMView
  45. httplib
  46. HTTrack
  47. humanlinks
  48. ia_archiver
  49. Image\
  50. Image\
  51. Indy\
  52. InfoNaviRobot
  53. InterGET
  54. Internet\
  55. JennyBot
  56. JetCar
  57. JOC\
  58. Kenjin.Spider
  59. Keyword.Density
  60. larbin
  61. LeechFTP
  62. LexiBot
  63. libWeb/clsHTTP
  64. LinkextractorPro
  65. LinkScan/8.1a.Unix
  66. LinkWalker
  67. lwp-trivial
  68. Mass\
  69. Mata.Hari
  70. Microsoft.URL
  71. MIDown\
  72. MIIxpc
  73. Mister.PiX
  74. Mister\
  75. moget
  76. Mozilla.*NEWT
  77. Mozilla/2
  78. Mozilla/3.Mozilla/2.01
  79. Navroad
  80. NearSite
  81. Net\
  82. NetAnts
  83. NetMechanic
  84. NetSpider
  85. NetZIP
  86. NICErsPRO
  87. NPBot
  88. Octopus
  89. Offline.Explorer
  90. Openfind
  91. PageGrabber
  92. Papa\
  93. pavuk
  94. pcBrowser
  95. ProPowerBot/2.14
  96. ProWebWalker
  97. ProWebWalker
  98. QueryN.Metasearch
  99. ReGet
  100. RepoMonkey
  101. RMA
  102. SiteSnagger
  103. SlySearch
  104. SmartDownload
  105. SpankBot
  106. spanner
  107. SuperBot
  108. SuperHTTP
  109. Surfbot
  110. suzuran
  111. Szukacz/1.4
  112. tAkeOut
  113. Teleport
  114. Telesoft
  115. The.Intraformant
  116. TheNomad
  117. TightTwatBot
  118. Titan
  119. TJvMultiHttpGrabber Component
  120. toCrawl/UrlDispatcher
  121. True_Robot
  122. turingos
  123. TurnitinBot/1.5
  124. URLy.Warning
  125. VCI
  126. VoidEYE
  127. Web.Image.Collector
  128. WebAuto
  129. WebBandit
  130. WebCopier
  131. WebEMailExtrac.*
  132. WebEnhancer
  133. WebFetch
  134. WebGo\
  135. WebLeacher
  136. WebmasterWorldForumBot
  137. WebReaper
  138. WebSauger
  139. Website.Quester
  140. Webster.Pro
  141. WebStripper
  142. WebWhacker
  143. WebZip
  144. Wget
  145. Widow
  146. WWW-Collector-E
  147. WWWOFFLE
  148. Xaldon\
  149. Xenu's
  150. Zeus




Révision - 13.03.05
Initial - 1999...

Rédigé en écoutant