La v5 n’aura pas tenu aussi longtemps que la v4, 1 an et demi ou presque sans intervention, c’était bien confortable :-).
Depuis une semaine, la lecture des pages de résultats de google est devenu problématique, très rapidement, il détecte votre activité et bloque votre adresse IP. Après quelques, parfois très, longues minutes d’attente, il est possible de repartir à l’action.
La solution : être très patient ou utiliser plusieurs adresses IPs.
Hormis quelques petites corrections de bugs et un assouplissement dans l’utilisation du cache, cette release sert essentiellement à contourner se problème.
Vous pouvez desormais agir sur 3 leviers ou type d’installation pour continuer à récupérer les pages de résultats par millier (ou un mix des 3). Dans tous les cas, les informations sont à mettre à jour dans le fichier config.php
- Version pauvre et patiente mais toujours 100% gratuite : lorsque le moteur vous bloque, faites patienter le script. Allez y franco, vous pouvez mettre la conf suivante :
DEFINE('CURLSLEEPSTART', 1800); DEFINE('CURLSLEEPSTEP', 3600);
- Version ‘j’ai plein de serveurs’ : dans le pack est livré un fichier smt_php_proxy.php, installez ca sur vos sites et/ou serveur ayant des IPs publiques différentes et configurez les proxies en conséquence. Plus le (nb de requêtes)/(nb de proxy) est grand, plus vous devrez augmenter les sleeps comme dans la version ci dessus. (il faut curl sur le serveur)
- Version Pro ‘je veux que ça marche vite et bien’ : Commander 10 proxies, copier ça dans config.php, et zou, vous pouvez charger environ 6000 pages à l’heure. il faut choisir ‘scrapebox’ sur leur page de commande pour l’utilisation.
Dans la version 2, je vous livre le script que vous pouvez adapter à vos besoins et votre configuration, il y a des dizaines de variantes pour ce script et en multiplier les possibilités. Je n’ai pas beaucoup dormi cette nuit en pensant à celle ci :-). Ce sera surement l’occasion de vous livrer quelques petits modules dans le futur…
Bonne install, bon ref et bon crawl 🙂
Le téléchargement, c’est par la : www.seomioche.com