Bing a déréférencé 1,5 million de sites Neocities. Voici pourquoi cela a des conséquences pour le web ouvert.
Neocities est l'un de ces rares services internet qui donne encore l'impression d'être...vieuxSur le web : des pages faites à la main, d’étranges petits sanctuaires dédiés à des fans, des carnets de recherche personnels, des expérimentations artistiques et des articles sincères du type « voici ce que j’ai appris ». C’est tout le contraire de l’expérience standardisée, axée sur l’engagement et les résumés générés par l’IA, qui caractérise de plus en plus la vie en ligne traditionnelle.
Ainsi, lorsque le moteur de recherche Bing de Microsoft est effectivementNeocities a été retiré de la liste, ainsi que ses quelque 1,5 million de sites hébergés.Ce n'était pas qu'un simple problème de référencement. C'était une étude de cas illustrant ce qui se produit lorsque l'infrastructure de découverte du web moderne devientopaque, automatisé et difficile à contester— en particulier pour les petites communautés non commerciales.
D'après les informations d'Ars Technica et les déclarations publiques de Neocities, le blocage de Bing semble avoir eu deux conséquences néfastes simultanément :
- Cela a rendu une part importante du « petit web » quasiment invisible pour quiconque utilisait Bing ou un moteur de recherche basé sur Bing.
- Cela a permis à des imitateurs et à des pages d'hameçonnage potentielles de se positionner sur les requêtes liées à Neocities, tandis que le site authentique était étouffé.
Cet article analyse ce qui s'est probablement passé, pourquoi les plateformes comme Neocities sont particulièrement vulnérables aux déclassements massifs, et ce que cet épisode nous apprend sur l'avenir de la recherche dans un monde submergé de contenus de faible qualité.
Qu'est-ce que Neocities (et pourquoi cela intéresse-t-il les gens) ?
Neocities est un hébergeur de sites statiques fondé pour perpétuer l'esprit de GeoCities : un internet où des particuliers disposaient de pages personnelles et d'esthétiques originales sans avoir besoin de l'autorisation d'une plateforme. Il s'agit explicitement decontrôle et individualité: vous pouvez écrire du code HTML/CSS à la main, télécharger des fichiers et créer un site qui ressemble àtoi.
C'est important car la recherche sur le web d'aujourd'hui est de plus en plus centralisée :
- On ne « surfe » pas autant sur les sites qu'on fait défiler les flux RSS.
- On ne navigue pas autant sur les liens qu'on interroge un chatbot.
- Vous ne mettez pas autant de pages en favoris que vous faites confiance à la récupération algorithmique.
Dans ce contexte, les moteurs de recherche fonctionnent comme une infrastructure publique. Si un index majeur supprime discrètement un site web entier – ou le considère par défaut comme peu fiable – il ne se contente pas de nuire au trafic ; il modifie aussi la nature des contenus créatifs qui restent accessibles.
Qu'a fait Bing exactement ?
Selon Kyle Drake, fondateur de Neocities, Binga bloqué l'intégralité du domaine neocities.org, y compris le site principal et les sous-domaines des utilisateurs (par exemple :exemple.neocities.org), d'apparaître dans les résultats de recherche Bing.
L'article de blog de Neocities prend soin de préciser ce que le blocn'était pas:
- Il ne s'agit pas d'une épidémie de logiciels malveillants connue.
- Il ne s'agissait pas d'un problème de configuration technique que Bing leur avait expliqué.
- Il ne s'agit pas d'une violation de politique clairement communiquée.
- Il ne s'agit pas d'une chute de qualité due au spam de l'IA générative (Neocities affirme n'en avoir « quasiment pas »).
Ars Technica a rapporté que la situation a persisté malgré de multiples tentatives pour contacter le support de Bing, où Drake s'est heurté à plusieurs reprises à des boucles de support automatisées et à un chatbot d'IA plutôt qu'à un humain capable de diagnostiquer une décision d'indexation en masse.
Il ya ensuite la partie la plus alarmante : Drake a signalé avoir vu Bing classer unpage de copieRessemblant à la page d'accueil de Neocities, cette page pourrait éventuellement collecter les identifiants des utilisateurs. Même si elle n'était pas une tentative d'hameçonnage délibérée, la combinaison de (1) la suppression du site authentique et (2) le référencement de sites similaires est précisément ce qui trompe les utilisateurs.
Pourquoi un moteur de recherche pourrait-il déréférencer un million de sites d'un coup ?
Du point de vue d'un moteur de recherche, Neocities est un hébergeur unique avec un nombre considérable de sous-domaines. Cette architecture est courante pour les plateformes de sites web participatifs. Elle incite également à utiliser à une évaluation de confiance massive.
Les moteurs de recherche luttent contre les abus à l'échelle d'Internet. Le mécanisme de répression le plus simple consiste à appliquerclassificateurs à l'échelle du site ou de l'hôte:
- Si un nombre suffisant de sous-domaines hébergeant du spam ou des logiciels malveillants, l'hôte peut être signalé.
- Si les robots d'exploration détectent des schémas ressemblant à des pages de redirection ou à des fermes de liens, des groupes entiers sont déclassés.
- Si des critères d'évaluation de « faible qualité » sont avancés (pages minces, contenu copié, modèles agressifs), un domaine peut être considéré comme du spam.
Ce raisonnement peut se défendre en théorie. Mais il est fragile lorsque la mission de l'hôte est de permettre la liberté créative et l'originalité. De nombreuses pages Neocities légitimes sont :
- Minimaliste (quelques paragraphes et liens)
- Très stylisé (beaucoup de GIF, mises en page inhabituelles)
- Non mis à jour (anciennes pages « configurer et oublier »)
Ces caractéristiques ne signifient pas forcément qu'il s'agit de spam. Simplement, elles ne ressemblent pas à celles des sites commerciaux modernes.
La vérité qui dérange : les systèmes anti-spam sont désormais des systèmes anti-petits sites web
Les équipes chargées de la qualité du référencement subissent des pressions depuis des années : d’abord à cause du spam SEO traditionnel, puis à cause des fermes de contenu, et maintenant à cause de…« résidus » de l'IA générativequi peuvent produire une infinité de pages quasi identiques.
Face à ce genre d'adversaire, on finit par construire des systèmes qui récompensent :
- Signaux d'auteur clairs
- backlinks de réputation solides
- Engagement constant
- Fraîcheur et rythme de mise à jour
- Conformité aux données structurées et aux « meilleures pratiques »
Mais le web à petite échelle ne se concentre généralement pas sur cela. Il privilégie l'expression personnelle.
Le risque est donc que les systèmes anti-abus se comportent comme une couche de contrôle d'accès, excluant involontairement des communautés dont le contenu est humain, sincère et précieux, mais non « professionnalisé ».
Autrement dit : nous pouvons construire un web où les seuls écrits humains découvrables sont ceux qui ressemblent à ceux produits par un service marketing.
Pourquoi cela est-il important au-delà de la part de marché d'environ 4 à 5 % de Bing ?
Il est facile de hausser les épaules et de dire : « Utilisez Google. »
Mais l'influence de Bing dépasse largement son utilisation directe car :
- C'est le moteur de recherche par défaut dans de nombreux environnements Windows.
- Il alimente et fournit des résultats à d'autres produits et partenaires.
- D'autres services de recherche peuvent s'appuyer, et s'appuient effectivement, sur Bing pour les liens Web traditionnels.
DuckDuckGo, par exemple, affirme queen grande partieIl utilise Bing pour ses liens et images traditionnels, tout en y intégrant son propre robot d'exploration et d'autres sources.
Ainsi, une suppression au niveau de l'hôte dans Bing peut devenir unesuppression en avaldans certaines parties de l'écosystème de la recherche.
Le problème du support : quand tout passe par un chatbot
Même si le blocage de Bing a commencé par une erreur de classification automatique, l'histoire devient accablante lorsque la procédure d'appel ressemble à ceci :
- Votre trafic s'effondre.
- Vous déposez une demande d'assistance.
- Vous êtes redirigé vers un assistant automatisé.
- Vous recevez un texte de politique générale vague.
- On vous demande de « travailler directement avec Microsoft », sans interlocuteur humain clairement identifié.
C'est un échec de gouvernance. Les moteurs de recherche ne sont pas de simples sites web ; ce sont desutilitaires de découverteS’ils peuvent exclure silencieusement des communautés entières, il doit exister une voie de recours crédible, surtout lorsque la sécurité des utilisateurs est en jeu.
Les entreprises de recherche modernes adorent parler de transparence. Les communications de Bing destinées aux webmasters insistent sur l'évolution de l'indexation, de l'exploration et des réponses de l'IA, et sur la manière dont les propriétaires de sites peuvent s'adapter. Mais la transparence ne se limite pas aux directives ; elle concerne…débogabilitéQuand une plateforme ne peut pas vous le direce qui est faux(Quelles pages ? Quels modèles ? Quelle règle ?), vous ne pouvez pas le réparer.
L'aspect hameçonnage : supprimer l'élément authentique facilite l'usurpation d'identité.
L'avertissement de Drake concernant les imitateurs est important car il révèle une dynamique prévisible :
- Si les véritables pages Neocities sont supprimées, leur réputation et leur graphe de liens ne pourront pas les aider à se classer.
- Les domaines similaires peuvent cibler les requêtes de « marque » et capter les utilisateurs confus.
Même si Bing finit par déclasser un résultat suspect, la motivation sous-jacente demeure : une fois que vous bloquez l’hôte authentique, vous abaissez le seuil de tolérance pour les imposteurs.
Les moteurs de recherche justifient généralement leurs mesures anti-spam strictes en arguant qu'elles protègent les utilisateurs. Or, un blocage brutal peut avoir l'effet inverse, surtout lorsqu'il est appliqué à un hébergeur légitime auquel les utilisateurs font confiance.
Que peuvent faire Neocities (et d'autres petits hébergeurs) ensuite ?
Neocities ne peut pas contrôler entièrement la façon dont un moteur de recherche la classe. Cependant, il existe des mesures concrètes permettant de réduire les risques d'être considérée comme une plateforme de diffusion massive de contenu :
-
Renforcer le signalement des abus et la transparence
- Publier des politiques claires de lutte contre le phishing et les logiciels malveillants.
- Montrez à quelle vitesse les neutralisations se produisent.
-
Améliorer les signaux lisibles par machine
- Encouragez les utilisateurs à ajouter des métadonnées de base (titres, descriptions, URL canoniques le cas échéant).
- Mettez en place une stratégie de sitemap claire pour les sous-domaines.
-
Adoptez les protocoles de « bon citoyen »
- Des outils comme IndexNow (pris en charge par Bing et d'autres) existent pour faciliter les mises à jour et les suppressions par les robots d'exploration.
- Cela ne résoudra pas à lui seul le problème de l'évaluation de la confiance, mais cela peut réduire la confusion et les délais.
-
Sensibiliser les utilisateurs à l'usurpation d'identité
- Si Bing supprime de vraies pages, un simple avertissement du type « ne jamais saisir son mot de passe sur des domaines similaires » devient urgent.
-
Diversifier la découverte
- Si la recherche devient peu fiable, les communautés se tournent vers les flux RSS, les annuaires de sites web, les newsletters et les liens directs. Ce n'est pas de la nostalgie, c'est de la résilience.
Rien de tout cela ne saurait remplacer la correction du problème sous-jacent par Bing. Mais c'est réaliste : les petites communautés web survivent en misant sur la redondance.
Ce que Microsoft devrait faire (s'il se soucie de la qualité du web)
Si Bing veut se positionner comme un index de recherche sérieux à l'ère de l'IA, il doit mieux gérer les cas particuliers comme Neocities, et non moins bien.
Un plan d'action raisonnable comprendrait :
- Un canal de remontée d'informations humaines pour les déréférencements massifs affectant un grand nombre de sites légitimes.
- Exemples précis à fournir lors de la citation de violations de politique (même si ce n'est que via un portail sécurisé).
- Une gestion plus sûre des demandes de renseignements sur les marques lors des actions coercitives afin de réduire les risques d'usurpation d'identité.
- Une posture qui distingue « bizarre » de « malveillant ».
Si le web est voué à être inondé de contenu synthétique, il faut s'attendre à ce que les moteurs de recherche privilégient ce type de contenu.humainLa créativité. Neocities est précisément le genre d'endroit qui devrait bénéficier de cette évolution.
En résumé
L'épisode Neocities/Bing ne se résume pas à une simple lutte pour l'indexation. C'est un aperçu d'un internet où la découverte est contrôlée par quelques systèmes opaques et où les recours peuvent se retrouver piégés par l'automatisation.
Si nous voulons un web qui reste diversifié — riche en pages personnelles, en expertises de niche et en véritables bizarreries —, alors les moteurs de recherche ont besoin de mécanismes qui n'écrasent pas accidentellement le petit web en traquant les spams.