CE QUE J'AI APPRIS DE HACKER NEWS

Février 2009

Hacker News a fêté ses deux ans la semaine dernière. Au départ, il s'agissait d'un projet annexe : une application pour améliorer Arc et un lieu d'échange d'informations entre les fondateurs actuels et futurs de Y Combinator. Il a pris de l'ampleur et a pris plus de temps que prévu, mais je ne le regrette pas car j'ai beaucoup appris en y travaillant.

Croissance

Lorsque nous avons lancé notre site en février 2007, le trafic en semaine était d'environ 1 600 visiteurs uniques par jour. Il est depuis passé à environ 22 000. Ce taux de croissance est un peu plus élevé que ce que je souhaiterais. J'aimerais que le site se développe, car un site qui ne se développe pas au moins lentement est probablement mort. Mais je ne voudrais pas qu'il devienne aussi grand que Digg ou Reddit, principalement parce que cela diluerait le caractère du site, mais aussi parce que je ne veux pas passer tout mon temps à gérer la mise à l'échelle.

J'ai déjà assez de problèmes avec ça. Rappelez-vous, la motivation initiale de HN était de tester un nouveau langage de programmation, et de plus un qui se concentre sur l'expérimentation de la conception du langage, et non sur les performances. Chaque fois que le site devient lent, je me renforce en me rappelant la célèbre citation de McIlroy et Bentley

La clé de la performance réside dans l’élégance, et non dans des bataillons de cas particuliers.

et je cherche le goulot d'étranglement que je peux supprimer avec le moins de code possible. Jusqu'à présent, j'ai réussi à suivre le rythme, dans le sens où les performances sont restées constamment médiocres malgré une croissance de 14x. Je ne sais pas ce que je vais faire ensuite, mais je vais probablement penser à quelque chose.

C'est ainsi que je vois les choses. Hacker News est une expérience, et une expérience dans un domaine très jeune. Les sites de ce type n'ont que quelques années d'existence. Les conversations sur Internet n'ont généralement que quelques décennies d'existence. Nous n'avons donc probablement découvert qu'une fraction de ce que nous découvrirons un jour.

C'est pourquoi je suis si optimiste à propos de HN. Lorsqu'une technologie est aussi jeune, les solutions existantes sont généralement terribles ; ce qui signifie qu'il doit être possible de faire beaucoup mieux ; ce qui signifie que de nombreux problèmes qui semblent insolubles ne le sont pas. Y compris, je l'espère, le problème qui a affligé tant de communautés précédentes : être ruiné par la croissance.

Dilution

Les utilisateurs s'en inquiètent depuis que le site existe depuis quelques mois. Jusqu'à présent, ces alarmes se sont révélées fausses, mais elles ne le sont peut-être pas toujours. La dilution est un problème difficile, mais probablement soluble ; cela ne veut pas dire grand-chose que les conversations ouvertes aient « toujours » été détruites par la croissance lorsque « toujours » équivaut à 20 instances.

Mais il est important de se rappeler que nous essayons de résoudre un nouveau problème, car cela signifie que nous allons devoir essayer de nouvelles choses, dont la plupart ne fonctionneront probablement pas. Il y a quelques semaines, j'ai essayé d'afficher les noms des utilisateurs avec les notes moyennes de commentaires les plus élevées en orange. [ 1 ] C'était une erreur. Soudain, une culture qui était plus ou moins unie s'est divisée en riches et pauvres. Je n'avais pas réalisé à quel point cette culture était unie jusqu'à ce que je la voie divisée. C'était douloureux à regarder. [ 2 ]

Les noms d'utilisateur orange ne reviendront donc pas (désolé pour ça). Mais il y aura d'autres idées tout aussi défectueuses à l'avenir, et celles qui fonctionneront sembleront probablement tout aussi défectueuses que celles qui ne fonctionneront pas.

La chose la plus importante que j'ai apprise sur la dilution est probablement qu'elle se mesure davantage en termes de comportement que d'utilisateurs. C'est le mauvais comportement que vous voulez exclure plutôt que les mauvaises personnes. Le comportement des utilisateurs s'avère étonnamment malléable. Si l'on attend des gens qu'ils se comportent bien, ils ont tendance à le faire, et vice versa.

Bien sûr, interdire les mauvais comportements a tendance à éloigner les mauvaises personnes, car elles se sentent mal à l'aise dans un endroit où elles doivent bien se comporter. Mais cette façon de les tenir à l'écart est plus douce et probablement aussi plus efficace que des barrières visibles.

Il est désormais assez clair que la théorie des vitres brisées s’applique également aux sites communautaires. La théorie est que les formes mineures de mauvais comportement encouragent les pires : un quartier avec beaucoup de graffitis et de vitres brisées devient un quartier où les vols se produisent. Je vivais à New York lorsque Giuliani a introduit les réformes qui ont rendu célèbre la théorie des vitres brisées, et la transformation a été miraculeuse. Et j’étais un utilisateur de Reddit lorsque l’inverse s’est produit là-bas, et la transformation a été tout aussi spectaculaire.

Je ne critique pas Steve et Alexis. Ce qui est arrivé à Reddit n'est pas dû à la négligence. Dès le début, ils avaient pour politique de ne censurer que le spam. De plus, Reddit avait des objectifs différents de ceux de Hacker News. Reddit était une start-up, pas un projet annexe ; son objectif était de croître le plus vite possible. Combinez une croissance rapide et une censure zéro, et le résultat est un accès libre à tous. Mais je ne pense pas qu'ils feraient grand-chose différemment s'ils devaient recommencer. En termes de trafic, Reddit a beaucoup plus de succès que Hacker News.

Mais ce qui est arrivé à Reddit ne se produira pas forcément sur HN. Il existe plusieurs maxima locaux. Il peut y avoir des endroits où tout le monde est libre et des endroits où l'on est plus réfléchi, comme dans le monde réel ; et les gens se comporteront différemment selon l'endroit où ils se trouvent, comme ils le font dans le monde réel.

J'ai observé cela dans la nature. J'ai vu des gens publier des messages croisés sur Reddit et Hacker News qui ont pris la peine d'écrire deux versions, une flamme pour Reddit et une version plus modérée pour HN.

Soumissions

Il y a deux types de problèmes majeurs qu'un site comme Hacker News doit éviter : les mauvaises histoires et les mauvais commentaires. Jusqu'à présent, le danger des mauvaises histoires semble moindre. Les histoires qui apparaissent aujourd'hui sur la première page sont toujours à peu près celles qui étaient là au début de HN.

J'ai pensé un jour que je devrais pondérer les votes pour éviter que des bêtises ne se retrouvent sur la première page, mais je n'ai pas encore eu à le faire. Je n'aurais pas pu prédire que la première page résisterait aussi bien, et je ne sais pas vraiment pourquoi. Peut-être que seuls les utilisateurs les plus réfléchis se soucient suffisamment de soumettre et de voter pour les liens, de sorte que le coût marginal d'un nouvel utilisateur aléatoire approche zéro. Ou peut-être que la première page se protège elle-même, en annonçant le type de soumission attendue.

Le plus dangereux pour la page d'accueil, c'est le contenu trop facile à voter. Si quelqu'un prouve un nouveau théorème, le lecteur doit faire un effort pour décider s'il doit ou non voter pour lui. Une caricature amusante demande moins de temps. Un discours avec un cri de ralliement en guise de titre ne demande aucun vote, car les gens votent pour lui sans même le lire.

D'où ce que j'appelle le principe du fluff : sur un site d'actualités voté par les utilisateurs, les liens les plus faciles à juger prendront le dessus, à moins que vous ne preniez des mesures spécifiques pour l'empêcher.

Hacker News dispose de deux types de protections contre les liens superflus. Les types de liens superflus les plus courants sont interdits car hors sujet. Les photos de chatons, les diatribes politiques, etc. sont explicitement interdites. Cela permet d'éviter la plupart des liens superflus, mais pas tous. Certains liens sont à la fois superflus, dans le sens où ils sont très courts, et également sur le sujet.

Il n'y a pas de solution unique à cela. Si un lien n'est qu'un discours creux, les éditeurs le supprimeront parfois même s'il est pertinent au sens où il s'agit de piratage informatique, car il n'est pas pertinent selon la véritable norme, qui est de susciter la curiosité intellectuelle. Si les articles d'un site sont typiquement de ce type, je les bannis parfois, ce qui signifie que les nouveaux éléments à cette URL sont automatiquement supprimés. Si un article a un titre de type appât à liens, les éditeurs le reformulent parfois pour qu'il soit plus factuel. C'est particulièrement nécessaire avec les liens dont les titres sont des cris de ralliement, car sinon ils deviennent des articles implicites du type « votez pour si vous croyez tel ou tel », qui sont la forme la plus extrême de supercherie.

Les techniques de gestion des liens doivent évoluer, car les liens évoluent. L’existence des agrégateurs a déjà affecté ce qu’ils regroupent. Les auteurs écrivent désormais délibérément des choses pour attirer du trafic depuis les agrégateurs, parfois même depuis certains d’entre eux. (Non, l’ironie de cette déclaration ne m’échappe pas.) Il y a ensuite les mutations plus sinistres, comme le détournement de liens, qui consiste à publier une paraphrase de l’article de quelqu’un d’autre et à la soumettre à la place de l’original. Ces techniques peuvent obtenir beaucoup de votes positifs, car une grande partie de ce qui est bon dans un article survit souvent ; en effet, plus la paraphrase est proche du plagiat, plus elle survit. [ 3 ]

Je pense qu'il est important qu'un site qui supprime les soumissions fournisse un moyen aux utilisateurs de voir ce qui a été supprimé s'ils le souhaitent. Cela permet aux éditeurs de rester honnêtes et, tout aussi important, de rassurer les utilisateurs, car ils sauraient si les éditeurs cessaient d'être honnêtes. Les utilisateurs de HN peuvent le faire en appuyant sur un bouton appelé showdead dans leur profil. [ 4 ]

Commentaires

Les commentaires négatifs semblent être un problème plus grave que les commentaires négatifs. Si la qualité des liens sur la page d'accueil de HN n'a pas beaucoup changé, la qualité du commentaire moyen a peut-être quelque peu diminué.

Il existe deux principaux types de commentaires négatifs : la méchanceté et la stupidité. Ces deux types de commentaires se recoupent largement (les commentaires négatifs sont également susceptibles d'être stupides), mais les stratégies pour les gérer sont différentes. La méchanceté est plus facile à contrôler. Vous pouvez établir des règles interdisant d'être méchant, et si vous les appliquez, il semble possible de limiter la méchanceté.

Il est plus difficile de contenir la bêtise, peut-être parce qu'elle n'est pas si facile à distinguer. Les personnes méchantes sont plus susceptibles de savoir qu'elles sont méchantes que les personnes stupides de savoir qu'elles sont stupides.

La forme la plus dangereuse de commentaire stupide n'est pas l'argumentation longue mais erronée, mais la blague idiote. Les arguments longs mais erronés sont en fait assez rares. Il existe une forte corrélation entre la qualité et la longueur des commentaires ; si vous vouliez comparer la qualité des commentaires sur les sites communautaires, la longueur moyenne serait un bon indicateur. La cause est probablement la nature humaine plutôt que quelque chose de spécifique aux fils de commentaires. Il est probable que la stupidité se manifeste plus souvent par le fait d'avoir peu d'idées que par le fait d'avoir des idées fausses.

Quelle que soit la raison, les commentaires stupides ont tendance à être courts. Et comme il est difficile d'écrire un commentaire court qui se distingue par la quantité d'informations qu'il véhicule, les gens essaient plutôt de les distinguer en étant drôles. Le format le plus tentant pour les commentaires stupides est la critique soi-disant spirituelle, probablement parce que les critiques sont la forme d'humour la plus facile. [ 5 ] L'un des avantages de l'interdiction de la méchanceté est donc qu'elle permet également de la réduire.

Les mauvais commentaires sont comme le kudzu : ils prennent rapidement le dessus. Les commentaires ont beaucoup plus d'effet sur les nouveaux commentaires que les soumissions sur les nouvelles soumissions. Si quelqu'un soumet un article nul, les autres soumissions ne deviennent pas toutes nulles. Mais si quelqu'un poste un commentaire stupide sur un fil de discussion, cela donne le ton pour la région qui l'entoure. Les gens répondent aux blagues stupides par des blagues stupides.

La solution serait peut-être d'ajouter un délai avant que les gens puissent répondre à un commentaire, et de rendre la durée du délai inversement proportionnelle à une prédiction de sa qualité. Les fils de discussion stupides se développeraient alors plus lentement. [ 6 ]

Personnes

Je remarque que la plupart des techniques que j'ai décrites sont conservatrices : elles visent à préserver le caractère du site plutôt qu'à l'améliorer. Je ne pense pas que ce soit un parti pris de ma part. C'est dû à la forme du problème. Hacker News a eu la chance de bien démarrer, donc dans ce cas, c'est littéralement une question de préservation. Mais je pense que ce principe s'applique également à des sites d'origines différentes.

Les avantages d'un site communautaire proviennent davantage des personnes que de la technologie. C'est surtout dans la prévention des mauvaises choses que la technologie entre en jeu. La technologie peut certainement améliorer la discussion. Les commentaires imbriqués le font, par exemple. Mais je préfère utiliser un site avec des fonctionnalités primitives et des utilisateurs intelligents et sympathiques qu'un site plus avancé dont les utilisateurs sont des idiots ou des trolls .

La chose la plus importante qu'un site communautaire puisse faire est d'attirer le type de personnes qu'il souhaite. Un site qui essaie d'être aussi grand que possible veut attirer tout le monde. Mais un site qui vise un sous-ensemble particulier d'utilisateurs doit attirer uniquement ces personnes-là, et tout aussi important, repousser tous les autres. J'ai fait un effort conscient pour y parvenir sur HN. La conception graphique est aussi simple que possible et les règles du site découragent les titres de liens trop théâtraux. L'objectif est que la seule chose qui intéresse quelqu'un qui arrive sur HN pour la première fois soit les idées qui y sont exprimées.

L'inconvénient de personnaliser un site pour attirer certaines personnes est que, pour ces personnes, il peut être trop attrayant. Je suis tout à fait conscient de l'addiction que peut susciter Hacker News. Pour moi, comme pour de nombreux utilisateurs, c'est une sorte de place publique virtuelle. Lorsque je veux faire une pause dans mon travail, je me rends sur la place, comme je le ferais sur Harvard Square ou University Avenue dans le monde physique. [ 7 ] Mais une place virtuelle est plus dangereuse qu'une place physique. Si je passais la moitié de la journée à flâner sur University Avenue, je m'en apercevrais. Je dois marcher un kilomètre pour y arriver, et m'asseoir dans un café n'a rien à voir avec le travail. Mais visiter un forum en ligne ne prend qu'un clic et donne l'impression superficiellement de travailler. Vous perdez peut-être votre temps, mais vous n'êtes pas oisif. Quelqu'un a tort sur Internet, et vous corrigez le problème.

Hacker News est vraiment utile. J'ai beaucoup appris de ce que j'ai lu sur HN. J'ai écrit plusieurs essais qui ont commencé comme des commentaires sur ce site. Je ne voudrais donc pas que le site disparaisse. Mais j'aimerais être sûr que cela ne soit pas un frein à la productivité. Quel désastre ce serait d'attirer des milliers de personnes intelligentes sur un site qui leur ferait perdre beaucoup de temps. J'aimerais pouvoir être sûr à 100 % que ce n'est pas une description de HN.

J'ai l'impression que le caractère addictif des jeux et des applications sociales est un problème encore largement non résolu. La situation actuelle est la même que celle du crack dans les années 1980 : nous avons inventé de nouvelles choses terriblement addictives, et nous n'avons pas encore développé de moyens pour nous en protéger. Nous le ferons un jour, et c'est l'un des problèmes sur lesquels j'espère me concentrer prochainement.

Remarques

[ 1 ] J'ai essayé de classer les utilisateurs en fonction de la moyenne et de la médiane des notes de commentaires, et la moyenne (sans la note la plus élevée) semblait être le meilleur indicateur de qualité. La médiane peut cependant être le meilleur indicateur de qualité faible.

[ 2 ] Une autre chose que j'ai apprise de cette expérience est que si vous voulez faire la distinction entre les gens, il vaut mieux être sûr de le faire correctement. C'est un problème pour lequel le prototypage rapide ne fonctionne pas.

C'est là un argument intellectuellement honnête qui justifie de ne pas faire de distinction entre les différents types de personnes. La raison pour laquelle il ne faut pas le faire n'est pas que tout le monde est pareil, mais qu'il est mal de faire le mal et difficile de faire le bien.

[ 3 ] Lorsque je détecte des publications qui font l'objet d'un détournement de liens, je remplace l'URL par celle de ce qui a été copié. Les sites qui font régulièrement du détournement de liens sont bannis.

[ 4 ] Digg est connu pour son manque de transparence. Le problème n'est pas que les personnes qui dirigent Digg sont particulièrement sournoises, mais qu'elles utilisent le mauvais algorithme pour générer leur page d'accueil. Au lieu de remonter du bas au fur et à mesure qu'elles obtiennent plus de votes, comme sur Reddit, les histoires commencent du haut et sont poussées vers le bas par les nouvelles arrivées.

La raison de cette différence est que Digg est dérivé de Slashdot, tandis que Reddit est dérivé de Delicious/popular. Digg est Slashdot avec des votes au lieu d'éditeurs, et Reddit est Delicious/popular avec des votes au lieu de bookmarking. (Vous pouvez toujours voir des fossiles de leurs origines dans leur conception graphique.)

L'algorithme de Digg est très vulnérable aux manipulations, car tout article qui fait la une des journaux devient le nouveau sujet à la une. Ce qui oblige Digg à réagir avec des contre-mesures extrêmes. De nombreuses startups ont un secret sur les subterfuges auxquels elles ont dû recourir au début, et je soupçonne que celui de Digg est dû au fait que les articles à la une ont été de facto choisis par des rédacteurs humains.

[ 5 ] Le dialogue sur Beavis et Butthead était en grande partie composé de ces éléments, et lorsque je lis des commentaires sur des sites vraiment mauvais, je peux les entendre dans leurs voix.

[ 6 ] Je pense que la plupart des techniques pour décourager les commentaires stupides restent encore à découvrir. Xkcd en a implémenté une particulièrement astucieuse dans son canal IRC : ne pas autoriser la même chose deux fois. Une fois que quelqu'un a dit "fail", personne ne peut plus le dire. Cela pénaliserait particulièrement les commentaires courts, car ils ont moins de place pour éviter les collisions.

Une autre idée prometteuse est le filtre stupide , qui ressemble à un filtre anti-spam probabiliste, mais formé sur des corpus de commentaires stupides et non stupides.

Il n'est pas forcément nécessaire de supprimer les mauvais commentaires pour résoudre le problème. Les commentaires en bas d'un long fil de discussion sont rarement vus, il peut donc suffire d'intégrer une prédiction de qualité dans l'algorithme de tri des commentaires.

[ 7 ] Ce qui rend la plupart des banlieues si démoralisantes, c'est qu'il n'y a pas de centre où se rendre à pied.

Merci à Justin Kan, Jessica Livingston, Robert Morris, Alexis Ohanian, Emmet Shear et Fred Wilson pour avoir lu les brouillons de cet article.

Commentez cet essai.