SEO, BASH, PHP et plus si affinités

Scrapebox, des urls I-N-U-T-I-L-E-S !!

Scrapebox

Le titre provocateur qui fait que tout le monde va lire l’article, parce que tout le monde veut savoir ce que je reproche à Scrapebox ;). Plus sérieusement, cet article s’adresse avant tout aux utilisateurs avancés de Scrapebox (aux autres aussi ou pas). J’entends par avancés ceux qui ouvrent Scrapebox au moins une fois par semaine et qui savent comment récupérer plus de 1000 urls en 1 scrap. Pour ceux qui souhaitent découvrir scrapebox, je vous conseille l’article de @Papilouve « Tuto Scrapebox – Soft SEO Black Hat« . Maintenant que le décor est planté, passons à nos moutons.

Qu’est-ce qui cloche avec Scrapebox ?

Pour ceux qui ont pris le temps de lire ma bio twitter, vous savez surement que je ne suis pas fan (mais pas du tout) des softs dont on ne sait rien du code source et encore moins fan de l’OS qui les fait tourner. Mais la majorité de ces softs étant fait ainsi, difficile de faire sans.
Revenons en au sujet. Qu’est ce qui peut bien clocher avec Scrapebox ? Il fait tout, le check de PR, le scrap de proxies, le check link, le café, la revision de votre bagnole, plus que 21 licences dispo a prix réduit depuis 3 ans et bien sur sa fonction principal : LE SCRAP !!
Oui mais voila, cela fait plusieurs fois (et @Seoblackout en est temoin) que les résultats de mes scraps n’ont absolument rien à voir avec le footprint en question.

Identification du problème et solution

Avant de partir à la recherche du problème, bref résumé du fonctionnement de Scrapebox. Scrapebox scrap de la manière suivante : vous lui fournissez un footprint, accessoirement un ou plusieurs keywords et il se charge d’aller récupérer ce qui vous intéresse (des urls par exemple) sur le moteur sélectionné. Tant qu’il trouve des résultats, il vous les envoie. Voila, maitenant que vous savez tout, passons aux choses sérieuses.

– D’ou viennent ces URLs de *^%$ ? C’est LA question à laquelle il faut répondre afin de trouver une solution. Ma première intuition m’a mené à la gestion de l’exact match (une query entre « ) par notre ami Google. Tapons la query suivante (ne rêvez pas, je ne vais pas vous mettre un footprint non plus !!) : « patates roses en forme de bonbons » Exact Match query on Google

Bonne intuition !! Comme vous pouvez le constater, ce filou de Google me propose un truc dont je n’ai absolument rien à foutre, puisque ce n’est pas du tout ce que je recherche et par dessus tout il m’affiche les résultats !!

– A la recherche du paramètre magique Autant le dire tout de suite, ce paramètre ne fait pas partie des « Google websearch parametres cheat sheets« . Après quelques minutes de recherches, je découvre un nouveau critère de recherche personnalisée : la recherche « mot a mot » ou « verbatim » en anglais.

Google verbatim Search

Un coup d’oeil aux paramètres de la barre d’adresse et … bingo !! Il suffit d’ajouter

&tbs=li:1

Ce qui donne pour notre recherche : « patates roses en forme de bonbons »

Ca n’a pas été long, retournons maintenant dans le couteau suisse du SEO.

Y a t-il un remède pour Scrapebox ?

Et bien NON !!
Je vous vois venir. « Et le Add more google, patate, il sert a quoi ? »
Vous me prenez pour Martine achète Scrapebox ou quoi ?
Essayez par vous même, vous verrez. Pour tout vous dire je me suis même amuser à modifier le .ini et refus total de scrapebox. Il squize tout ce qui se situe après les « : ».

Vous comprenez maintenant pourquoi je n’aime pas les softs fermés. C’est quand même un comble pour un scraper de ne pas pouvoir choisir le moteur ET les paramètres avec lesquels on souhaite scraper.

Super, je fais comment alors ?

Etant donné que je n’ai pas que ca à faire d’attendre une prochaine release qui prendra en compte ce paramètre (sachant que bien sur je serai toujours limité aux moteurs de Scrapebox), j’ai décidé avec @Susmab de développer un scraper en bastos. Et vu que je ne souhaites pas que les gens qui l’utilise soient limités par ce scraper, vous avez la main totale dessus. Multi-plateforme, fonctionne avec les proxies, intégration en natif du scrap des tlds pour bypasser la limite des 1000 results, ne nécessite pas de {L|W}AMP pour fonctionner.
Nous cherchons maintenant à le rendre un minimum user-friendly. Mais si cela nous prend trop de temps (plus de 3H), je balancerai la beta release ici avec une page dédiée à son fonctionnement.
Ne vous attendez pas a un truc révolutionnaire, juste un scraper qui fonctionne 😉 Pour tout le reste vous aurez bien sur toujours besoin de Scrapebox !!

Edit du 27-01-2012 – Solution trouvée par @Beunwa

Un grand merci à @Beunwa de divioseo qui a trouvé la solution pour faire manger ce paramètre à Scrapebox. Il suffit parfois de ne pas trop se torturer le cerveau et de tester simplement dans des champs comme … les Keywords 😉

Donc voici la solution en image :

Google verbatim parameter in scrapebox

Merci encore l’artiste !!

P.S. : Ce n’est pas pour cette raison que le scraper ne sera pas mis à disposition, puisqu’il permettra de choisir vos propres moteurs de recherches.

46 Réponses to “Scrapebox, des urls I-N-U-T-I-L-E-S !!”

  1. Blacklink dit :

    Un peu provoc en effet mais j’aime le ton de l’article 😀
    Après tu peux aussi taper des footprints corrects, ça marche aussi 😛

  2. Aurélien dit :

    Après lecture de ton article, je me dis chouette, mais qu’attend-t-il comme réponse à un pareil billet ?
    Réponse : je ne sais pas…
    Tu m’éclaires ?

  3. Belle démonstration. Effectivement vu comme ça il est bien dommage de pas pouvoir customiser sa boite à scrape.
    Hâte de tester la bête en tout cas !!

  4. Emile@livraisons de fleurs à domicile dit :

    Cet article confirme bien que je me plante pas quand je scrap et que j’obtiens des résultats complètement à côté de ma recherche. Bon… ton scrapeur chef … payant ? Combien ?… Deadline ? … Need a logo ? :p

  5. RDD dit :

    @Blacklink
    J’aimerai tellement que ca soit le cas !!

    @Aurelien
    J’attends LA reponse 🙂 Si quelqu’un trouve le moyen de passer ce $%# de parametre, c’est la fete.

    @Spouiik
    C’est vraiment con, puisque c’est vraiment le SEUL truc chiant de Scrapebox (qui est un super tool).

    @Emile
    Et oui, sur certains scraps, il y a beaucoup a jeter 🙁
    Comme je le dis, le scrapeur est relativement basique, sera bien sur gratuit et devrait etre dispo la semaine prochaine.

  6. vince dit :

    Yep pareil pour moi : je passe des heures à checker des listes qui ne correspondent pas à certains footprints… parce qu’il ne faut pas généraliser non plus !! 😉
    Mais bon , mon « côté oriental » me fait dire que c’est la vie et donc je fais avec…
    En revanche si tu proposes du mieux, bah oui, on ne va pas hésiter !!

  7. j’étais un grand fan de scrapebox au début ,je le suis moins car comme toi les requêtes donne parfois….souvent n’importe quoi, mais ce soft est encore bien utile si l’on veux bien se donner la peine d’y ajouter quelques plug-in

    Ps:je suis fan de ton background

  8. slate(hat) dit :

    Avec hrefer tu peux modifier un peu tout ce que tu veux au niveau des paramètres, etc, je crois.

  9. monsieur dit :

    Intéressant.
    Mais pourquoi ne pas avoir contacté l’équipe de dev pour leur en causer ?
    Ils sont plutôt réactifs et ouverts…

  10. Maximiliens dit :

    Je ne connaissais pas cette limite de Scrapebox; en tout cas, c’est vraiment super sympa de ta part de proposer un nouveau Scraper fait maison !

    J’ai vraiment hâte de voir ce que ça donne 😉

  11. Beunwa dit :

    En fait il existe une solution très simple pour contourner ce problème, RDD vous en parlera demain :p

  12. arrêter de manger dit :

    c’est vrai que en général, les outils sont limité à une seule plateforme, sous linux et mac cela devient difficile de trouver ses softs …

    Alors j’attend avec impatience ton outil, peu importe si il est limité, du moment qu’il fait son taff correctement !
    ( si en plus on peut le bidouiller à sa guise … 🙂 )

  13. Le plus simple serait de contacter les mecs de Scrapebox pour leur soumettre l’idée,… C’est une case à rajouter, ca ne devrait pas leur prendre 100 ans,…

  14. Shelko@Doudou dit :

    Vraiment sympa l’astuce, c’est vrai que c’est pénible d’avoir un tas de scrap à mettre à la benne à chaque utilisation (mais bon je suis content, je vois que je me place dans les utilisateurs avancés)
    Enfin si t’as mieux à proposer je suis toujours partant pour tester 😉

  15. Je ne suis pas du tout un utilisateur avancé de Srapebox, comme tu le mentionnes, j’ai lu quand même l’article, mais un peu trop pointu pour moi lol, donc effectivement je vais plutôt lire l’article que tu as indiqué. Mais je voulais dire que j’ai essayé quand même! 😉

  16. seo dit :

    Je sais pas si vous aussi vous utilisez mais le scraper gratuit de sick submitter est vraiment super rapide, je l’ai adopté et mis de coté scrapebox pour çà.
    Avez-vous utilisez l’addon « learning mode » de scrapebox? c’est assez sympa 🙂

  17. Cherubin dit :

    C’est bien d’avoir soulevé le problème étant donné que ça a permis à Beunwa de préciser la chose 😉

    Maintenant on attend tout de mêem de tester le soft de RDD 😉

  18. Rmawatanya dit :

    J’ai jamais utilisé de soft. Mais, j’adore le travail manuel. Si comme vous le dite de scaper et d’obtenir des résultats aussi hors ce que je souhaiterai, je me connais bien je serai très mécontent. Je vous souhaite bon chance. J’aimerai bien tester votre outil après le lancement.

  19. Id meneo dit :

    C’est vrai qu’il faut souvent se battre avec la query de scrape box pour avoir des résultats corrects mais quand tu finis pa avoir une belle liste toute prête au PR élevé c’est le pied!

  20. Ca m’aurait bien aidé d’avoir ton footprint ^^
    Nan parce-que je n’ai jamais rencontré ce problème. Bon, j’utilise peut etre 5% du potentiel de scrapebox donc ça peut se comprendre.
    En tout cas merci pour l’astuce, si jamais je tombe sur ce probleme un jour ou l’autre. Je me demande si le scraper de Sick fait la même…

  21. photographe dit :

    Ca m’aurait bien aidé d’avoir ton footprint ^^
    Nan parce-que je n’ai jamais rencontré ce problème. Bon, j’utilise peut etre 5% du potentiel de scrapebox donc ça peut se comprendre.
    En tout cas merci pour l’astuce, si jamais je tombe sur ce probleme un jour ou l’autre. Je me demande si le scraper de Sick fait la même…

  22. Minh Chau dit :

    Bonjour,

    Je n’ai pas les compétences de la plupart d’entre vous mais il est vrai qu’avec l’outil Scrapebox, soit j’ai très peu de résultats, soit j’en ai mais complètement à côté de la plaque par rapport à mes requêtes. Je me disais que cela provenait de mon inexpérience. Merci pour l’info !

  23. Keeg@lunettes dit :

    C’est énorme d’arriver après la guère. Tu as la problématique, l’analyse et la réponse. Fais moi penser à continuer à te lire 3 jours après la publication. 😀

  24. J’hésite à utiliser Scrapebox franchement, je vais me replonger dedans dès que j’ai 5 minutes et un bon tutorial.Si quelqu’un pouvait m’en conseiller d’autres que celui mis dans l’article, ça m’aiderait bien d’ailleurs…Cheers!

  25. cable rca dit :

    Ouhla on va dire que c’était le coup de gueule anti-URL du mois !

    Je ne suis pas une grande utilisatrice de Scrapebox, mais si un jour je m’y met, j’adopterais ton astuce =)

  26. jeux football dit :

    tout a fait d’accord avec toi sur la grosse faille que tu décrit plus haut sur l’impossibilité de choisir moteur et paramètres, je trouve ca même un peu consternant…

  27. J’aimerai vraiment tester ton « soft » aussi! C’est pour quand?

  28. Seo Vietnam dit :

    Ton post m’a fait partir sur des paramètres de recherche que je ne connaissais pas, via le lien vers blueglass.com, merci de nous avoir orienté dans la bonne direction! Des news sur ton outil?

  29. Deguisement dit :

    Super cette petite astuce de Beunwa, ca m’a bien aidé à résoudre le soucis que j’avais =)

  30. jeux superman dit :

    Tu es loin d’être le seul à avoir eu des problèmes avec Scrapebox, d’après ce que j’ai lu et surtout entendu dire. Moi je ne m’en sers pas et j’ai l’impression que c’est pas plus mal des fois 😉

  31. Bonjour,
    merci pour ce tuto.
    Pour ma part je découvre ce logiciel depuis quelques jours.
    J’ai testé ta recherche sur google, mais pour ma part il ne me retourne qu’un unique résultat et c’est justement le lien avec ton site.
    Du coup j’ai fait le test sur scrapebox, et pareil ça ne me retourne que les résultats en rapport avec tes mots clefs improbables.
    Mais merci, je vais continuer mes recherches.

  32. Je suis vert… Non! MARRON! J’ai acheté le logiciel avant hier pour le prix fort (vous savez sans affiliation). J’ai testé avec les proxy bidons, j’en ai eu pour 3h sans récupérer d’intéressant. Donc, j’ai simplement prix un abo VPN Tunnel. Et là, ça n’a pas marché du tout.

    En définitive, même pour débuter, c’est inutile. 🙁

  33. RDD dit :

    @Tous
    Attention de ne pas me faire dire ce que je n’ai pas dis. Je ne crache pas du tout sur Scrapebox qui sans aucun doute THE soft a posséder (ça ne sert a rien de re-inventer la roue n’est-ce pas). Cependant, certains aspects de ce soft sont bloquants.

    Pour le soft – qui n’est pas vraiment un soft – je mets @susmab sur le coup (voila maintenant il a la pression), il devra sortir un petit article ici dans peu de temps et je ferai surement un screencast pour expliquer succinctement le fonctionnement.

    @Stephane
    En fait vu que l’article date un peu, c’est normal qu’il ressorte mon site maintenant. Mais si tu veux réaliser ton propre test, effectue une recherche bidon qui n’est pas censée te retourner de résultats : remplace patates par courgettes et bonbons par moto dans l’exemple, ça devrait faire l’affaire 😉

    @Colin
    Acheter Scrapebox au prix fort, ca fait mal ^^ Persévère, ce soft est vraiment un bon outil.

  34. jeux RPG dit :

    moi je suis très mitigé avec scrapebox, certes c’est le meilleur pour faire ce qu’il fait, mais bon il montre des limites parfois et c’est un peu chiant..

  35. J’hésite à investir dans Scrapebox.
    Il n’y a pas d’autres softs plus utiles à acheter en priorité?

  36. Je suis assez d’accord avec tout ca. J’avais essayé Scrapebox pendant un temps avec la complicité d’un possesseur, mais c’est vrai que j’hésite vraiment à investir dans ce type de produit. Peur s’en doute de ne pas savoir m’en servir à 100%.

  37. Merci pour l’astuce et surtout à Bewna que j’ai pu rencontré ce samedi au barcamp

  38. Excellente cette astuce. Je ne la découvre que maintenant mais je crois que ça va bien me servir. En effet parfois j’avais des résultats délirants.

    Bon, du coup ça a du te réconcilier avec SB ?

  39. malgré les défauts de scrapebox il reste encore bien utile

  40. misterexpo.fr dit :

    Bonjour,
    Merci pour l’article.
    J’ai découvert ce logiciel depuis quelques jours. Il tourne vraiment bien.
    Merci pour l’astuce.

  41. Buzz.tn dit :

    Bonjour,
    Y a-t-il une version demo ou test pour scrapebox ? J’aime bien tester ce soft.

  42. Jub dit :

    très bon article ! par contre, lorsqu’on clique sur ton lien dans la phrase :
    Ce qui donne pour notre recherche : « patates roses en forme de bonbons »

    là, c’est le drame si on a pas activé le safesearch en mode strict !… (même entre plusieurs résultats de RDD) … 😉

  43. se muscler dit :

    D’un autre côté j’ai envie de dire que c’est peut-être assez stricte comme environnement, mais bon pour 40 balles ça va, ça reste assez puissant et clean. Contrairement a du XRummer ou Sick. Bref j’aime ScrapBox 🙂

  44. Merci pour ce paramètre car j’avais vraiment l’impression d’obtenir une tonne de résultats bidons avec scrapebox !

  45. Rentalopinion dit :

    Bonjour,

    Merci pour cet article. Scrapbox c’est un abonnement mensuel ou one shot?

    Merci

  46. RDD dit :

    @Rentalopinion
    Le prix de scrapebox est one shot.

Trackbacks/Pingbacks

  1. Un billet comme un autre | WebMarketing, Design & SEO - [...] d’escragot de la publication de CP (et ouep ça râle sur CS ). C’est ensuite à Scrapebox qu’il s’est…
  2. Footprint Keywordluv et CommentLuv | Little Star : le blog inutile de Niko - [...] n’y ait pas trop de faux positifs, ce qui est fréquent. (vous avez des pistes pour virer les faux…

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Je suis un gros footer de merde !! - Powered by le Presse mot