Catégories
Referencement

Heuristlink : L’heuristique au service de la linkwheel.

Je vais faire tomber ici un des plus grands mythes du SEO : la linkwheel parfaite n’existe pas et encore moins lorsqu’elle est automatisée.
Pour le prouver, je vais vous présenter une analyse avec MON point de vue à la clé.
Ce billet utilisera quelques termes techniques, notamment en algorithmie, mais restera bien sur totalement digeste pour la plupart d’entre vous.

La linkwheel

Je vais commencer par expliquer simplement la linkwheel, car cet article va se compliquer par la suite (sans pour autant devenir incompréhensible).
Une linkwheel permet de lier vos sites entre eux, d’établir un réseau. Waaouu, la révélation de 2011. Mais attention, au fur et à mesure de l’évolution des moteurs de recherche, les linkwheels se sont fortement complexifiées, afin d’établir un linking le plus « naturel » possible aux yeux des moteurs de recherche.
Avant l’apparition de la linkwheel, le linking se faisait de manière « croisée » : de A vers B et de B vers A.
Vint ensuite l’apparition du linking triangulaire : A vers B, B vers C et C vers A.
La linkwheel, la vraie, naquit avec l’apparition du mininet butterfly et je vous laisse lire l’excellent article à ce sujet posté sur le blog de rudy.
Ceci est un schéma simpliste, je vous laisse imaginer la complexité d’établir une linkwheel lorsque le nombre d’urls à linker se compte par centaines, voir par milliers.

L’Heuristique

Qu’est ce qu’une heuristique ?
Ca donne l’heure ce machin ?
A quoi ça me servira pour établir une linkwheel ?

C’est certainement ce paragraphe qui sera le plus long, puisque l’heuristique est souvent utilisée dans des domaines très spécifiques.
Je me permet d’en parler, puisque durant mes études (comme quoi ma mémoire est encore bonne) j’ai été confronté aux heuristiques et je sais donc de quoi je parle (attention, je n’ai pas dis que je maitrisais, la nuance à son importance).
Pour ceux qui iront voir sur wikipedia via le lien en bas de cet article, vous verrez qu’une heuristique, contrairement à un algorithme exact, ne donne pas la solution optimale à un problème, mais des solutions dites réalisables.
Vous vous demandez alors pourquoi je parle de linkwheel parfaite dans cet article ? Je vais y venir plus tard, patience.
Revenons au cas ou j’ai du faire appel aux heuristiques pour résoudre des problèmes « complexes » (pour les plus curieux c’est par ici).
Vous connaissez tous les sites comme : Mappy, viamichelin, Gmaps …
Et bien sachez que ces sites utilisent très certainement une heuristique pour calculer vos itinéraires. Pour aller plus loin on peut parler de métaheuristique et pour les grands malades que vous êtes on peut même dire qu’il s’agit surement de l’algorithme de Dijkstra.
L’heuristique est donc utilisée dans ces algorithme afin de fournir EN UN MIMIMUM DE TEMPS une solution à votre problème. Parce qu’il faut savoir que ce problème est d’une complexité énorme => comment se rendre d’un point A à un point B en choisissant la route la plus adaptée parmi la multitude de routes qui mène de A a B. Et je ne vous parle pas des cas ou vous ajoutez des « étapes » à votre itinéraire, ou là l’heuristique prend tout son sens !
Sachez également que les heuristiques sont utilisées dans les algorithmes de théorie des jeux : ce sont des IA (intelligences artificielles) minimalistes !!!

Une petite image pour vous montrer à quoi peut servir une heuristique.

Reprenons donc le cas d’un calcul d’itinéraire (et je pense que vous commencez à comprendre ou je veux en venir).
Pour ce problème, je souhaite aller du point A au point D en passant par les points B et C.
Les éléments connus sont les suivants :

  • Distance de A vers B
  • Distance de A vers C
  • Distance de A vers D
  • Distance de B vers C
  • Distance de B vers D
  • Distance de C vers D

Dans ce cas précis, un algorithme du simplexe serait largement suffisant, mais imaginons maintenant que pour aller de A vers B il existe 18 routes avec pour chacune des distances différentes et ainsi de suite pour les autres points.

Et donc, à quoi cela peut bien me servir pour établir une linkwheel parfaite ?

Combinaison des deux

Pour ceux qui pensent que c’est contradictoire de na pas utiliser un algorithme exact pour obtenir une linkwheel parfaite, et bien en fait pas tant que ca. Et je vais vous expliquer pourquoi.

Pour tous nos amis BH (et il n’y a pas qu’eux) qui doivent gérer une quantité de splogs titanesque, la tache n’est pas très simple.
Et je ne parles que des splogs, ajoutez à tout cela les profils de forums, digg-like, spam de commentaires et compagnie.

Pour imager ma pensée et rendre tout cela compréhensible, prenons un exemple simple.
Je possède 1000 splogs. Je souhaite que ma base (je parle de la base de mon linking) soit constituée de 300 de ces splogs. Ce qui me laisse donc 700 splogs à linker. Pour effectuer ce linking, je vais donc affecter des « notes » (vous vous rappeler, précédemment on parlait de distances pour les calculs d’itinéraire) à mes splogs. Les notes de ces splogs, je vais les définir en fonction de leur contenu. Plus le scrap+spin est dégueulasse, plus la note est élevée, plus le contenu devient clean, plus ma note baisse.
Il ne me reste plus qu’à définir les routes optimales pour arriver à mon money site en tenant compte des « notes » affectées à ces derniers.

Cela peut paraitre simple, mais est en fait très compliqué.

Voila donc ce qui – selon moi – serait une linkwheel parfaite.

Avantages :
– Le reverse sur ce type d’algo est BEAUCOUP plus complexe que sur un algo exact.
– Vous avez une linkwheel de fou !!
– Etant donné que ce n’est pas une linkwheel « optimale » elle paraîtra plus « naturelle » aux yeux de Google (et des autres moteurs).

Inconvénients :
Même en lisant le siteduzero en long en large et en travers, ça ne vous suffira pas pour mettre en place ce type d’algorithme.
Il faut posséder de réelles bases en programmation (et on préférera les langages bas niveau [de type C ou C++] afin d’optimiser méchamment l’algo). Et pour ceux qui se sentent courageux, ils pourront coder une extension PHP en C et la distribuer à l’élite pour faire peter THE linkwheel of the death.

Pour les curieux

Liens très utiles :
Heuristique
Metaheuristique
Algorithme du simplexe
Algorithme de Dijkstra (mon préféré, merci a toi l’ami de m’avoir retrouve le nom)

P.S. : CE N’EST PAS une attaque/critique envers les BH (ni les autres d’ailleurs) et leurs linkwheels.

Crédits
– scielo.br pour l’image d’intro
– di.ens.fr pour l’image du labyrinthe

19 réponses sur « Heuristlink : L’heuristique au service de la linkwheel. »

Il y a des jours ou je me dis que le BH va finir par prendre plus de temps que le WH, ce serait dommage, non ? 🙂

Un peu hors sujet (quoi que), mais ton approche technique me conforte dans l’idée qu’il y a vraiment des centaines de manières de positionner un site. Personne n’a tord ou raison dans les techniques employées, seul le résultat (et la longévité) compte.

Question : comment aller du point A (6ème page de GG) au point B (1ère position de la 1ère page) ?

Tu crois que je dois linkweeler ? 🙂

Ton article est très intéressant !
L’heuristique va effectivement permettre de créer des chemins aléatoires entre les différents noeuds du réseau et donc d’avoir une approche plus naturelle. Cependant, cet algo ne résout pas les problèmes rencontrés dans le montage d’un tel réseau, à savoir :
– on peut se retrouver avec des noeuds orphelins dans ce système
– plus on ajoute de noeuds à qualité de contenu variable, plus cela complexifie la gestion du réseau. Il serait plus aisé de mettre en place un bon spin de qualité sur tous les noeuds.
– on ne peut pas empêcher un « visiteur indélicat » (from Dublin ? :D) de faire tomber l’ensemble du réseau en remontant noeuds par noeuds
– dans tous les cas, il faut se monter un backoffice costaud pour suivre le maillage des noeuds et vérifier la cohérence de la linkwheel et d’en garder une certaine maitrise

Ben non, il suffit de tagger correctement ses splogs 🙂
Tu tagges « niveau:1, niveau:2, niveau:3 » et tu affectes éventuellement des LW.
Plus besoin d’heuristique, il suffit de maîtriser les arrays 😀

Oula! on rentre véritablement dans du BH de haut niveau a ce point la. Je ne doutes pas que si c’est bien implémenté sur une quantité de splogs astronomiques le résultats sur le long terme doit etre impressionnant, le probleme est que BH et long terme ne cohabitent que tres mal.

Reste que cet article (et celui de rudy) viennent de me couper dans mon élan sur le linking corporate… je suis démotivé la…

Merci pour le lien et l’article « scientifique » intelligemment vulgarisé mais je reste sur ma faim, arrivé à la fin je m’attendais à encore plein de texte… 🙁

Ta théorie est parfaitement valable dans le cas d’un réseau de sites ( ex: si je possède un réseau de 5000 sites de poker/casino se liant ) mais tu as oublié un inconnu extrêmement important qui fait que GG ne captera JAMAIS les bonnes linkwheels BH:
La linkweel naturelle SEO des parasites sur lesquels on pose nos liens.

Cela me parait pas très difficile à programmer, j’ai programmé l’année dernière un programme utilisant différents heuristiques pour le problème du voyageur de commerce ( génétique, Tabou, recuit, descente …)

Quelle partie te parait compliqué justement pour l’élaboration de l’algo ?

@Sylvain :
Si on part d’un instant T=0 ou le BH n’a pas de tool, doit coder le sien, trouver les plans, tester son tool, etc … Oui le BH prend plus de temps que le WH, puisque pendant ce temps la, le WH fait du concret. Le BH gagne du temps par la suite, c’est le but 😉

En effet en ce qui concerne les moyens et techniques employés, la seul limite reste le cerveau humain qui en terme de processus (je parle de multi-taches) et de projection dans l’espace est beaucoup plus limité qu’une machine (comment ça les machines fonctionnent grâce au cerveau humain ?) 😉

Pour la réponse à ta question, pour arriver en première page un wheeling serait plus approprié 😉

@Aybabtme :
– Le problème des noeuds orphelins peut-être évité, mais j’avoue que ça va être un coup à se faire fumer les neurones. Mais dans la pratique c’est réalisable.
– C’est indéniable qu’un bon spin sur les noeuds serait préférable à un classement par qualité de contenu. Le principe de note en fonction du contenu est utilisé dans l’article à titre d’exemple pour que ça soit facilement compréhensible. On pourrait tout aussi bien affecter une distance en fonction des adresses IP ou tout autre chose 😉
– C’est sur que pour le visiteur indélicat, si il se donne les moyens de le faire, il le fera c’est sur. Apres imagine que ton script tourne en standalone sur un serveur et qu’il génère via un cron ta linkwheel toute les 12 heures. Tu te servirai du temps UNIX comme variable afin que ton heuristique prenne en plus de la distance cette donnée. La tu compliques drôlement la tache de mister Dublin 😉 Bref no-limit, your brain is king !!
– Pour le back-office, étant donne la complexité de l’algo en lui même, je n’ose même pas y penser !! Comme je le dis dans l’article, c’est une IA minimaliste, donc il faut faire très attention aux répercussions (surtout celles non désirées).

@512banque :
Pour la petite histoire, je ne suis pas un développeur PHP à la base. J’ai codé pendant des années en langage C, je suis venu au PHP par la suite, qui j’avoue est un langage bien limité comparé au C : pas de typage de variable, impossibilite d’allouer des tailles mémoires (where is malloc ?), et bien d’autres défauts encore.
Bref, ce n’est pas le sujet, mais les arrays sont des bouffeurs de ressources, les opérations sur ces derniers n’en parlons pas et surtout, le array ne permet pas de travailler sur des noeuds (comme le fait le binary tree). C’est très simple, pour se rendre compte de la limite des tableaux il suffit de faire un test avec :
1 – Un arbre binaire
2 – Des callbacks sur des array
=> Résultat, le 1 gagne haut la main (et au niveau ressources système, les arrays peuvent mettre ton process en pole position lors d’un top).
Pour résumer, le array est bien tant qu’on ne fait pas de calculs complexes, après il faut pouvoir se tourner sur d’autres solutions plus appropriées.

@Sventovit :
Pour trouver le point G, il ne faut pas modifier l’algo mais augmenter l’ego 😉

@Le Juge SEO :
Meuh non, il ne faut pas se démotiver. Personnellement, je n’utilise pas d’algo d’heuristique sur des sites purement BH, disons que ça me facilite grandement la vie pour certaines taches. Moi je suis un no-hat 😉
Donc j’attends ton billet sur le linking corporate !!

@Rudy :
Le lien vers l’article de ton blog est justifié, c’est un peu le point de départ de ma réflexion sur l’heuristique. Désolé de ne pas avoir fait plus long, mais il fallait que ce billet reste digeste et ne soit pas trop technique non plus. Et surtout, l’heuristique est un terme très « large ». Il n’existe pas une heuristique, mais des tonnes !!
En ce qui concerne les bonnes linkwheel BH, je suis d’accord avec toi, c’est pour cette raison que dans l’article je me suis limité aux splogs : « Et je ne parles que des splogs, ajoutez à tout cela les profils de forums, digg-like, spam de commentaires et compagnie. »

@AutoEntrepreneur Lyon :
Le voyageur de commerce est en effet un grand classique pour se familiariser avec les heuristiques (ce fut un de mes premiers projets sur les heuristiques en 3eme année).
Pour la partie la plus compliquée : je te répondrai qu’il n’y a pas UNE partie compliquée, mais DES parties compliquées puisque seule ta façon d’approcher ton projet te permettra de réaliser la complexité des taches (cf ma réponse à @Aybabtme). Le simple fait de schématiser ton projet te donnera un bon aperçu de sa complexité.

Lorsque j’ai vue l’image de l’article , j’ai pris peur, c’est en fait assez techniques au final, le BH c’est pas si facil quand on s’y colle et on se demande comment vous trouvez ces astuces, il y à des failles chez ceux qui programment l’algo de google ou quoi? lol

merci en tout cas.

Je suis d’accord ave @ski nautique -> seul la fin justifie les moyens… Du moment que le site est propulsé dans le top des requêtes Google, c’est l’essentiel. Après au niveau de la qualité de la LinkWheel, les méthodes de référencement vont très certainement évoluer au cours du temps pour de plus se rapprocher de la perfection…

Je suis un peu scié devant le niveau de sophistication et de technicité qui faut pour référencer son site. Jusqu’à la lecture de votre article, je croyais que quelques liens à droite à gauche allait suffire…
Bon, je retourne lire les articles cités plus haut.

je cherchais des infos sur la linkwheel ..
et bien merci car je suis effectivement servi
je vais lire les autres article en espérant qu ils sont à la hauteur de celui ci

Wow, pour sortir des sentiers battus par la plupart des informations disponibles sur les linkwheels, nous somme servis avec cet article, merci. Je ne suis pas certain de comprendre la mise en pratique au final mais je comprends que c’est avec des variations comme celles que tu décris qu’on peut mettre en place un schéma plus difficile à détecter par G. et qui pourrait sembler plus naturel, après tout, c’est l’objectif pour que cette linkwheel tienne sur le long terme.

C’est clair que je préfère la notion de LinkWheel « propre », plutôt que parfaite.
Le concept fondamental de Google repose sur le suivi des liens. Il semble plutôt bien équipé pour y voir clair sur ce plan.
En plus, la notion de LinkWheel était plutôt destinée au départ à blouser les modérateurs des forums spammés qui vont illico dénoncer le vaurien chez son hébergeur.

Article très intéressant, mais cependant très complexe à mettre en oeuvre. De plus, cette technique n’empêche pas de remonter le réseau de liens mais juste de lui donner une apparence moins géométrique donc plus naturelle.

Est-ce qu’un tirage aléatoire du chemin à suivre par les liens ne mènerait il pas au même résultat ?

Pour ce qui est de bloquer le « reverse ingénierie » que ce soit par google ou un concurrent, j’utilise la technique décrite dans mon article Comment rendre ses réseaux de liens furtifs

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *