Freshness Update : que dit Google ?

Publié le par
facebooktwittergoogle_pluslinkedinmail

En novembre 2011, Google annonçait qu’il privilégierait la publication de contenu frais sur les pages de résultats. Cette mise à jour de son algorithme aurait un impact sur 35 % des résultats, soit plus ou moins un résultat par page.

Effrayant quand on lit que 73 % des sites Internet français, qu’ils soient professionnels, publics ou privés, n’ont pas été mis à jour depuis plus d’un an, selon une enquête menée par la société Email-brokers auprès des 2,6 millions de sites actifs existants.

Les contenus concernés par la promotion de contenus frais

Cette priorisation de résultats frais concerne :

  • Les événements récurrents appelés marronniers : élections, conférences annuelles, etc.
  • Les faits d’actualité : hot topics, nouvelles, etc.
  • Les contenus présentant des mises à jour fréquentes : commentaires des consommateurs sur un hôtel ou un produit, nouvelles sur un modèle de voiture récent, etc.

Beaucoup de critiques ont été émises contre les avis de consommateurs déguisés. Une norme est mise en place par Afnor, l’organisme chargé d’établir des normes afin de définir les pratiques garantissant la fiabilité de la collecte des avis des consommateurs.

La norme devrait permettre de mieux identifier les auteurs des messages en croisant les avis laissés par un même internaute afin de vérifier leur pertinence. Enfin, les commentaires seront encadrés afin d’éviter que les sites marchands ne censurent ceux qui sont négatifs.

A l’heure actuelle, en cas de non-respect des règles en vigueur, un contrevenant s’expose à une sanction pouvant aller jusqu’à 2 ans de prison et de 187 500 euros d’amende. Début 2012, 4 procédures ont été diligentées à l’encontre de sites marchands dans les secteurs de la téléphonie, des produits cosmétiques et des enchères. Trois P.V concernent des sites d’avis ou des forums (bonnes adresses de voyages, locations, loisirs). Enfin, une plate-forme d’e-réputation est également concernée.

Faux-avis de consommateurs : rappel à la loi du gouvernement français fin 2011.

Comment Google définit-il la fraîcheur du contenu ?

Il prend en compte de nombreux critères, notamment : la date, le freshrank, la disparition de vieux contenus, le microblogging et les réseaux sociaux.

Calcul à partir de la date de création

Il se base sur la date de création qui inclut la date et le temps.

Il peut y avoir 2 types de dates prises en comptes (inception scores).

  • La date du premier crawling de la page, de la première indexation, etc.
  • La date du premier affichage sur la page de résultats.

En bref, un document peut être découvert et se voir attribuer une date de création, mais ne jamais apparaître sur les pages de résultats.

  • La date de création peut être attribuée sur base de :
  1. La date à laquelle le document a été crawlé pour la première fois.
  2. La date à laquelle un lien vers le document a été découvert pour la première fois.

La date à laquelle un seuil de nombre de liens vers le document a été atteint (par exemple pour le microblogging, la date de création ne sera assignée que si le Tweet a été retweeté plusieurs fois ou si le Tweet émane d’une personne faisant autorité).

L’âge du document est donc défini sur base de la période située entre la date de création et la date de la requête. Cette période est également utilisée pour le calcul relatif aux liens (par exemple, un document d’un jour avec 10 liens sera pondéré différemment qu’un document de 10 ans avec 100 liens).

Historique

Sur base de ces informations, le moteur peut alors utiliser l’historique pour pondérer le document, selon le calcul suivant :

H=L/log(F+2)

Où :

H = score de l’historique ajusté (score de fraîcheur de l’URL ajusté)

L = score du lien (score de pertinence basé sur l’analyse traditionnelle des liens)

F = temps écoulé (période calculée sur base de la date de création)

Source : Document Scoring Based on Document Inception Date (PDF en téléchargement).

Résultat de cette équation : une URL bénéficiera de plus de poids dans la période suivant directement la date de création. Le score diminuera ensuite rapidement sur une courte période, mais la vitesse de cette « dépondération » ralentira ensuite jusqu’à ce que le contenu soit considéré comme non mis à jour.

Il est important de préciser que cette équation n’est applicable qu’à des requêtes qui requièrent un contenu frais.

Volume de contenu mis à jour

Le volume de contenu mis à jour intervient également, selon le calcul suivant :

U : f(UF,UA)

Où :

U = score de mise à jour

UF = score de fréquence de mise à jour

UA = score de volume mis à jour (en %)

 Illustration du volume mis à jour sur une page : faible ou grand volume

 

 

 

 

 

 

Ce score de mise à jour a pour conséquence qu’un faible volume de contenu doit être mis à jour plus fréquemment pour avoir la même valeur qu’un grand volume mis à jour moins fréquemment.

Mais d’autres facteurs interviennent dans le score. Du contenu en JavaScript par exemple aura peu de poids, contrairement aux title, textes d’ancrage des liens, qualité du contenu de la page. Le moteur peut également considérer le score de fréquence de mise à jour et le volume de contenu mis à jour et voir si la vitesse augmente ou ralentit.

Score basé sur la requête

Le nombre de requête d’une expression ou d’expressions en relation augmente sur une période de temps définie, il est probable que ce soit un signal pour les prendre en considération dans le calcul de fraîcheur.

L’augmentation du nombre de clics (CTR) sur un article pour une période définie peut également être prise en compte par les moteurs pour augmenter le score de cet article et le privilégier sur les pages de résultats.

Score basé sur le lien

Le nombre de liens entrants et les liens qui disparaissent, ainsi que la vitesse de ces changements pour définir si un contenu va devenir « frais » peuvent également être pris en compte par les moteurs de recherche. Le poids de ce document peut alors être ajusté.

En deux mots, si un « vieux » contenu continue à gagner de nouveaux liens entrants, il peut rivaliser avec un contenu frais.

FreshRank

Les moteurs de recherche peuvent également donner un score de fraîcheur par le biais des liens : la fraîcheur d’un document est ainsi déterminée par le score de fraîcheur des pages qui font des liens vers celui-ci. Le nombre de liens frais entrent aussi en ligne de compte.

La fraîcheur du document A est déterminée par le score de fraîcheur attribué aux pages qui font un lien vers le document A

Disparition de vieux contenus

Une autre façon de promouvoir le contenu frais est de mettre en place un système pour supprimer le vieux contenu. Lors de leur crawl, les moteurs repèrent les mises à jour importantes du contenu. Au plus les mises à jour sont fréquentes, au plus le crawl sera important. Les moteurs alignent la fréquence de leur crawl en fonction de celles-ci. Grâce à ce processus, les moteurs disposent de plus de ressources pour favoriser l’indexation de documents frais.

Microblogging et réseaux sociaux

Google utilise les microblogs pour identifier les hot topics partant du principe que les réseaux sociaux sont généralement les premiers à publier l’actualité brûlante.

Il y aurait des crawlers et index différents pour le contenu des sites et celui issu du microblogging.

Un index stocke les URL du Web tandis que l'autre stocke les URL issues des microblogs.

 

 

 

 

 

 

 

 

 

 

 

 

 

Sources :
Comment la fraîcheur est-elle calculée ? (en anglais)
Google à propos de la fraîcheur du contenu (en anglais)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>