Catégories
Referencement

Scrapebox, des urls I-N-U-T-I-L-E-S !!

Scrapebox

Le titre provocateur qui fait que tout le monde va lire l’article, parce que tout le monde veut savoir ce que je reproche à Scrapebox ;). Plus sérieusement, cet article s’adresse avant tout aux utilisateurs avancés de Scrapebox (aux autres aussi ou pas). J’entends par avancés ceux qui ouvrent Scrapebox au moins une fois par semaine et qui savent comment récupérer plus de 1000 urls en 1 scrap. Pour ceux qui souhaitent découvrir scrapebox, je vous conseille l’article de @Papilouve « Tuto Scrapebox – Soft SEO Black Hat« . Maintenant que le décor est planté, passons à nos moutons.

Qu’est-ce qui cloche avec Scrapebox ?

Pour ceux qui ont pris le temps de lire ma bio twitter, vous savez surement que je ne suis pas fan (mais pas du tout) des softs dont on ne sait rien du code source et encore moins fan de l’OS qui les fait tourner. Mais la majorité de ces softs étant fait ainsi, difficile de faire sans.
Revenons en au sujet. Qu’est ce qui peut bien clocher avec Scrapebox ? Il fait tout, le check de PR, le scrap de proxies, le check link, le café, la revision de votre bagnole, plus que 21 licences dispo a prix réduit depuis 3 ans et bien sur sa fonction principal : LE SCRAP !!
Oui mais voila, cela fait plusieurs fois (et @Seoblackout en est temoin) que les résultats de mes scraps n’ont absolument rien à voir avec le footprint en question.

Identification du problème et solution

Avant de partir à la recherche du problème, bref résumé du fonctionnement de Scrapebox. Scrapebox scrap de la manière suivante : vous lui fournissez un footprint, accessoirement un ou plusieurs keywords et il se charge d’aller récupérer ce qui vous intéresse (des urls par exemple) sur le moteur sélectionné. Tant qu’il trouve des résultats, il vous les envoie. Voila, maitenant que vous savez tout, passons aux choses sérieuses.

[box type= »shadow »]– D’ou viennent ces URLs de *^%$ ?
C’est LA question à laquelle il faut répondre afin de trouver une solution. Ma première intuition m’a mené à la gestion de l’exact match (une query entre « ) par notre ami Google.
Tapons la query suivante (ne rêvez pas, je ne vais pas vous mettre un footprint non plus !!) : « patates roses en forme de bonbons »
Exact Match query on Google[/box]

Bonne intuition !! Comme vous pouvez le constater, ce filou de Google me propose un truc dont je n’ai absolument rien à foutre, puisque ce n’est pas du tout ce que je recherche et par dessus tout il m’affiche les résultats !!

[box type= »shadow »]– A la recherche du paramètre magique
Autant le dire tout de suite, ce paramètre ne fait pas partie des « Google websearch parametres cheat sheets« . Après quelques minutes de recherches, je découvre un nouveau critère de recherche personnalisée : la recherche « mot a mot » ou « verbatim » en anglais.

Google verbatim Search[/box]

Un coup d’oeil aux paramètres de la barre d’adresse et … bingo !! Il suffit d’ajouter

&tbs=li:1

Ce qui donne pour notre recherche : « patates roses en forme de bonbons »

Ca n’a pas été long, retournons maintenant dans le couteau suisse du SEO.

Y a t-il un remède pour Scrapebox ?

Et bien NON !!
Je vous vois venir. « Et le Add more google, patate, il sert a quoi ? »
Vous me prenez pour Martine achète Scrapebox ou quoi ?
Essayez par vous même, vous verrez. Pour tout vous dire je me suis même amuser à modifier le .ini et refus total de scrapebox. Il squize tout ce qui se situe après les « : ».

Vous comprenez maintenant pourquoi je n’aime pas les softs fermés. C’est quand même un comble pour un scraper de ne pas pouvoir choisir le moteur ET les paramètres avec lesquels on souhaite scraper.

Super, je fais comment alors ?

Etant donné que je n’ai pas que ca à faire d’attendre une prochaine release qui prendra en compte ce paramètre (sachant que bien sur je serai toujours limité aux moteurs de Scrapebox), j’ai décidé avec @Susmab de développer un scraper en bastos. Et vu que je ne souhaites pas que les gens qui l’utilise soient limités par ce scraper, vous avez la main totale dessus. Multi-plateforme, fonctionne avec les proxies, intégration en natif du scrap des tlds pour bypasser la limite des 1000 results, ne nécessite pas de {L|W}AMP pour fonctionner.
Nous cherchons maintenant à le rendre un minimum user-friendly. Mais si cela nous prend trop de temps (plus de 3H), je balancerai la beta release ici avec une page dédiée à son fonctionnement.
Ne vous attendez pas a un truc révolutionnaire, juste un scraper qui fonctionne 😉 Pour tout le reste vous aurez bien sur toujours besoin de Scrapebox !!

Edit du 27-01-2012 – Solution trouvée par @Beunwa

Un grand merci à @Beunwa de divioseo qui a trouvé la solution pour faire manger ce paramètre à Scrapebox. Il suffit parfois de ne pas trop se torturer le cerveau et de tester simplement dans des champs comme … les Keywords 😉

Donc voici la solution en image :

Google verbatim parameter in scrapebox

Merci encore l’artiste !!

P.S. : Ce n’est pas pour cette raison que le scraper ne sera pas mis à disposition, puisqu’il permettra de choisir vos propres moteurs de recherches.

48 réponses sur « Scrapebox, des urls I-N-U-T-I-L-E-S !! »

Après lecture de ton article, je me dis chouette, mais qu’attend-t-il comme réponse à un pareil billet ?
Réponse : je ne sais pas…
Tu m’éclaires ?

Cet article confirme bien que je me plante pas quand je scrap et que j’obtiens des résultats complètement à côté de ma recherche. Bon… ton scrapeur chef … payant ? Combien ?… Deadline ? … Need a logo ? :p

@Blacklink
J’aimerai tellement que ca soit le cas !!

@Aurelien
J’attends LA reponse 🙂 Si quelqu’un trouve le moyen de passer ce $%# de parametre, c’est la fete.

@Spouiik
C’est vraiment con, puisque c’est vraiment le SEUL truc chiant de Scrapebox (qui est un super tool).

@Emile
Et oui, sur certains scraps, il y a beaucoup a jeter 🙁
Comme je le dis, le scrapeur est relativement basique, sera bien sur gratuit et devrait etre dispo la semaine prochaine.

Yep pareil pour moi : je passe des heures à checker des listes qui ne correspondent pas à certains footprints… parce qu’il ne faut pas généraliser non plus !! 😉
Mais bon , mon « côté oriental » me fait dire que c’est la vie et donc je fais avec…
En revanche si tu proposes du mieux, bah oui, on ne va pas hésiter !!

j’étais un grand fan de scrapebox au début ,je le suis moins car comme toi les requêtes donne parfois….souvent n’importe quoi, mais ce soft est encore bien utile si l’on veux bien se donner la peine d’y ajouter quelques plug-in

Ps:je suis fan de ton background

Avec hrefer tu peux modifier un peu tout ce que tu veux au niveau des paramètres, etc, je crois.

Intéressant.
Mais pourquoi ne pas avoir contacté l’équipe de dev pour leur en causer ?
Ils sont plutôt réactifs et ouverts…

Je ne connaissais pas cette limite de Scrapebox; en tout cas, c’est vraiment super sympa de ta part de proposer un nouveau Scraper fait maison !

J’ai vraiment hâte de voir ce que ça donne 😉

c’est vrai que en général, les outils sont limité à une seule plateforme, sous linux et mac cela devient difficile de trouver ses softs …

Alors j’attend avec impatience ton outil, peu importe si il est limité, du moment qu’il fait son taff correctement !
( si en plus on peut le bidouiller à sa guise … 🙂 )

Vraiment sympa l’astuce, c’est vrai que c’est pénible d’avoir un tas de scrap à mettre à la benne à chaque utilisation (mais bon je suis content, je vois que je me place dans les utilisateurs avancés)
Enfin si t’as mieux à proposer je suis toujours partant pour tester 😉

Je ne suis pas du tout un utilisateur avancé de Srapebox, comme tu le mentionnes, j’ai lu quand même l’article, mais un peu trop pointu pour moi lol, donc effectivement je vais plutôt lire l’article que tu as indiqué. Mais je voulais dire que j’ai essayé quand même! 😉

Je sais pas si vous aussi vous utilisez mais le scraper gratuit de sick submitter est vraiment super rapide, je l’ai adopté et mis de coté scrapebox pour çà.
Avez-vous utilisez l’addon « learning mode » de scrapebox? c’est assez sympa 🙂

C’est bien d’avoir soulevé le problème étant donné que ça a permis à Beunwa de préciser la chose 😉

Maintenant on attend tout de mêem de tester le soft de RDD 😉

J’ai jamais utilisé de soft. Mais, j’adore le travail manuel. Si comme vous le dite de scaper et d’obtenir des résultats aussi hors ce que je souhaiterai, je me connais bien je serai très mécontent. Je vous souhaite bon chance. J’aimerai bien tester votre outil après le lancement.

C’est vrai qu’il faut souvent se battre avec la query de scrape box pour avoir des résultats corrects mais quand tu finis pa avoir une belle liste toute prête au PR élevé c’est le pied!

Ca m’aurait bien aidé d’avoir ton footprint ^^
Nan parce-que je n’ai jamais rencontré ce problème. Bon, j’utilise peut etre 5% du potentiel de scrapebox donc ça peut se comprendre.
En tout cas merci pour l’astuce, si jamais je tombe sur ce probleme un jour ou l’autre. Je me demande si le scraper de Sick fait la même…

Ca m’aurait bien aidé d’avoir ton footprint ^^
Nan parce-que je n’ai jamais rencontré ce problème. Bon, j’utilise peut etre 5% du potentiel de scrapebox donc ça peut se comprendre.
En tout cas merci pour l’astuce, si jamais je tombe sur ce probleme un jour ou l’autre. Je me demande si le scraper de Sick fait la même…

Bonjour,

Je n’ai pas les compétences de la plupart d’entre vous mais il est vrai qu’avec l’outil Scrapebox, soit j’ai très peu de résultats, soit j’en ai mais complètement à côté de la plaque par rapport à mes requêtes. Je me disais que cela provenait de mon inexpérience. Merci pour l’info !

C’est énorme d’arriver après la guère. Tu as la problématique, l’analyse et la réponse. Fais moi penser à continuer à te lire 3 jours après la publication. 😀

J’hésite à utiliser Scrapebox franchement, je vais me replonger dedans dès que j’ai 5 minutes et un bon tutorial.Si quelqu’un pouvait m’en conseiller d’autres que celui mis dans l’article, ça m’aiderait bien d’ailleurs…Cheers!

Ouhla on va dire que c’était le coup de gueule anti-URL du mois !

Je ne suis pas une grande utilisatrice de Scrapebox, mais si un jour je m’y met, j’adopterais ton astuce =)

tout a fait d’accord avec toi sur la grosse faille que tu décrit plus haut sur l’impossibilité de choisir moteur et paramètres, je trouve ca même un peu consternant…

Ton post m’a fait partir sur des paramètres de recherche que je ne connaissais pas, via le lien vers blueglass.com, merci de nous avoir orienté dans la bonne direction! Des news sur ton outil?

Tu es loin d’être le seul à avoir eu des problèmes avec Scrapebox, d’après ce que j’ai lu et surtout entendu dire. Moi je ne m’en sers pas et j’ai l’impression que c’est pas plus mal des fois 😉

Bonjour,
merci pour ce tuto.
Pour ma part je découvre ce logiciel depuis quelques jours.
J’ai testé ta recherche sur google, mais pour ma part il ne me retourne qu’un unique résultat et c’est justement le lien avec ton site.
Du coup j’ai fait le test sur scrapebox, et pareil ça ne me retourne que les résultats en rapport avec tes mots clefs improbables.
Mais merci, je vais continuer mes recherches.

Je suis vert… Non! MARRON! J’ai acheté le logiciel avant hier pour le prix fort (vous savez sans affiliation). J’ai testé avec les proxy bidons, j’en ai eu pour 3h sans récupérer d’intéressant. Donc, j’ai simplement prix un abo VPN Tunnel. Et là, ça n’a pas marché du tout.

En définitive, même pour débuter, c’est inutile. 🙁

@Tous
Attention de ne pas me faire dire ce que je n’ai pas dis. Je ne crache pas du tout sur Scrapebox qui sans aucun doute THE soft a posséder (ça ne sert a rien de re-inventer la roue n’est-ce pas). Cependant, certains aspects de ce soft sont bloquants.

Pour le soft – qui n’est pas vraiment un soft – je mets @susmab sur le coup (voila maintenant il a la pression), il devra sortir un petit article ici dans peu de temps et je ferai surement un screencast pour expliquer succinctement le fonctionnement.

@Stephane
En fait vu que l’article date un peu, c’est normal qu’il ressorte mon site maintenant. Mais si tu veux réaliser ton propre test, effectue une recherche bidon qui n’est pas censée te retourner de résultats : remplace patates par courgettes et bonbons par moto dans l’exemple, ça devrait faire l’affaire 😉

@Colin
Acheter Scrapebox au prix fort, ca fait mal ^^ Persévère, ce soft est vraiment un bon outil.

moi je suis très mitigé avec scrapebox, certes c’est le meilleur pour faire ce qu’il fait, mais bon il montre des limites parfois et c’est un peu chiant..

Je suis assez d’accord avec tout ca. J’avais essayé Scrapebox pendant un temps avec la complicité d’un possesseur, mais c’est vrai que j’hésite vraiment à investir dans ce type de produit. Peur s’en doute de ne pas savoir m’en servir à 100%.

Excellente cette astuce. Je ne la découvre que maintenant mais je crois que ça va bien me servir. En effet parfois j’avais des résultats délirants.

Bon, du coup ça a du te réconcilier avec SB ?

très bon article ! par contre, lorsqu’on clique sur ton lien dans la phrase :
Ce qui donne pour notre recherche : « patates roses en forme de bonbons »

là, c’est le drame si on a pas activé le safesearch en mode strict !… (même entre plusieurs résultats de RDD) … 😉

D’un autre côté j’ai envie de dire que c’est peut-être assez stricte comme environnement, mais bon pour 40 balles ça va, ça reste assez puissant et clean. Contrairement a du XRummer ou Sick. Bref j’aime ScrapBox 🙂

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *