LO QUE HE APRENDIDO DE HACKER NEWS

Febrero de 2009

La semana pasada, Hacker News cumplió dos años. En un principio, se suponía que iba a ser un proyecto secundario: una aplicación para mejorar Arc y un lugar para que los fundadores actuales y futuros de Y Combinator intercambiaran noticias. Ha crecido y me ha llevado más tiempo del que esperaba, pero no me arrepiento porque he aprendido mucho trabajando en ello.

Crecimiento

Cuando lanzamos el sitio en febrero de 2007, el tráfico diario era de alrededor de 1600 visitantes únicos. Desde entonces, ha crecido hasta alrededor de 22 000. Esta tasa de crecimiento es un poco más alta de lo que me gustaría. Me gustaría que el sitio creciera, ya que un sitio que no crece al menos lentamente probablemente esté muerto. Pero no me gustaría que creciera tanto como Digg o Reddit, principalmente porque eso diluiría el carácter del sitio, pero también porque no quiero pasar todo mi tiempo lidiando con la escalabilidad.

Ya tengo suficientes problemas con eso. Recuerden, la motivación original de HN era probar un nuevo lenguaje de programación, y además uno que se centra en experimentar con el diseño del lenguaje, no con el rendimiento. Cada vez que el sitio se vuelve lento, me fortalezco recordando la famosa cita de McIlroy y Bentley.

La clave del rendimiento es la elegancia, no batallones de casos especiales.

y buscar el cuello de botella que pueda eliminar con la menor cantidad de código. Hasta ahora he podido mantener el ritmo, en el sentido de que el rendimiento se ha mantenido consistentemente mediocre a pesar del crecimiento de 14x. No sé qué haré a continuación, pero probablemente se me ocurra algo.

Esta es mi actitud hacia el sitio en general. Hacker News es un experimento, y un experimento en un campo muy joven. Los sitios de este tipo tienen solo unos pocos años de antigüedad. Las conversaciones en Internet en general tienen solo unas pocas décadas de antigüedad. Por lo tanto, probablemente solo hayamos descubierto una fracción de lo que eventualmente descubriremos.

Por eso soy tan optimista respecto de HN. Cuando una tecnología es tan joven, las soluciones existentes suelen ser terribles, lo que significa que debe ser posible hacerlas mucho mejor, lo que significa que muchos problemas que parecen insolubles no lo son. Incluido, espero, el problema que ha afectado a tantas comunidades anteriores: verse arruinadas por el crecimiento.

Dilución

Los usuarios se han preocupado por eso desde que el sitio tenía unos meses de existencia. Hasta ahora, estas alarmas han sido falsas, pero puede que no siempre lo sean. La dilución es un problema difícil, pero probablemente solucionable; no significa mucho que las conversaciones abiertas "siempre" hayan sido destruidas por el crecimiento cuando "siempre" equivale a 20 instancias.

Pero es importante recordar que estamos tratando de resolver un nuevo problema, porque eso significa que vamos a tener que probar cosas nuevas, la mayoría de las cuales probablemente no funcionarán. Hace un par de semanas intenté mostrar los nombres de los usuarios con las puntuaciones medias más altas en comentarios en naranja. [ 1 ] Eso fue un error. De repente, una cultura que había estado más o menos unida se dividió entre los que tenían y los que no tenían. No me di cuenta de lo unida que había estado la cultura hasta que la vi dividida. Fue doloroso de ver. [ 2 ]

Así que los nombres de usuario de color naranja no volverán (lo siento), pero en el futuro habrá otras ideas que parezcan igualmente fallidas, y las que resulten funcionar probablemente parezcan tan fallidas como las que no.

Probablemente lo más importante que he aprendido sobre la dilución es que se mide más en el comportamiento que en los usuarios. Es el mal comportamiento el que se quiere mantener alejado más que a la gente mala. El comportamiento del usuario resulta ser sorprendentemente maleable. Si se espera que las personas se comporten bien, tienden a hacerlo; y viceversa.

Aunque, por supuesto, prohibir el mal comportamiento tiende a mantener alejadas a las personas malas, porque se sienten incómodamente limitadas en un lugar donde tienen que comportarse bien. Pero esta forma de mantenerlas alejadas es más suave y probablemente también más eficaz que las barreras abiertas.

Ahora está bastante claro que la teoría de las ventanas rotas se aplica también a los sitios comunitarios. La teoría es que las formas menores de mala conducta alientan otras peores: que un barrio con muchos grafitis y ventanas rotas se convierte en uno donde ocurren robos. Yo vivía en Nueva York cuando Giuliani introdujo las reformas que hicieron famosa la teoría de las ventanas rotas, y la transformación fue milagrosa. Y era un usuario de Reddit cuando allí ocurrió lo contrario, y la transformación fue igualmente dramática.

No estoy criticando a Steve y Alexis. Lo que le pasó a Reddit no fue por negligencia. Desde el principio tuvieron una política de censurar nada excepto el spam. Además, Reddit tenía objetivos diferentes a los de Hacker News. Reddit era una startup, no un proyecto secundario; su objetivo era crecer lo más rápido posible. Combina un crecimiento rápido con censura cero y el resultado es una batalla campal. Pero no creo que lo hicieran de manera muy diferente si lo hicieran de nuevo. Si lo medimos por el tráfico, Reddit tiene mucho más éxito que Hacker News.

Pero lo que le pasó a Reddit no le pasará inevitablemente a HN. Hay varios máximos locales. Puede haber lugares donde todos puedan valerse por sí mismos y lugares donde haya más reflexión, como los hay en el mundo real; y la gente se comportará de manera diferente según en qué lugar se encuentre, como lo hace en el mundo real.

He observado esto en la vida real. He visto a gente que publicaba en Reddit y Hacker News y que se tomaba la molestia de escribir dos versiones: una versión agresiva para Reddit y una versión más moderada para HN.

Envíos

Hay dos tipos principales de problemas que un sitio como Hacker News debe evitar: las malas noticias y los malos comentarios. Hasta ahora, el peligro de las malas noticias parece menor. Las noticias que aparecen en la portada ahora siguen siendo aproximadamente las mismas que habrían estado allí cuando HN comenzó.

En algún momento pensé que tendría que ponderar los votos para evitar que apareciera basura en la página principal, pero aún no lo he tenido que hacer. No habría predicho que la página principal se mantendría tan bien y no estoy seguro de por qué lo ha hecho. Tal vez solo los usuarios más reflexivos se preocupan lo suficiente como para enviar y votar enlaces, por lo que el costo marginal de un nuevo usuario aleatorio se acerca a cero. O tal vez la página principal se protege a sí misma, al anunciar qué tipo de envío se espera.

Lo más peligroso para la portada es el material que es demasiado fácil de votar a favor. Si alguien demuestra un nuevo teorema, el lector debe trabajar un poco para decidir si lo vota o no. Una caricatura divertida requiere menos esfuerzo. Una diatriba con un grito de guerra como título no requiere esfuerzo, porque la gente lo vota sin siquiera leerlo.

De ahí lo que yo llamo el principio Fluff: en un sitio de noticias votado por los usuarios, los enlaces que son más fáciles de juzgar tomarán el control a menos que se tomen medidas específicas para evitarlo.

Hacker News tiene dos tipos de protección contra el contenido superfluo. Los tipos más comunes de enlaces superfluos están prohibidos por no estar relacionados con el tema. Las imágenes de gatitos, las diatribas políticas, etc. están explícitamente prohibidas. Esto impide la entrada de la mayoría de los enlaces superfluos, pero no de todos. Algunos enlaces son superfluos, en el sentido de que son muy breves, y también están relacionados con el tema.

No hay una única solución para eso. Si un enlace es simplemente una diatriba vacía, los editores a veces lo eliminan incluso si está relacionado con el tema en el sentido de que trata sobre piratería informática, porque no está relacionado con el tema según el estándar real, que es despertar la curiosidad intelectual. Si las publicaciones en un sitio son típicamente de este tipo, a veces las prohíbo, lo que significa que el contenido nuevo en esa URL se elimina automáticamente. Si una publicación tiene un título cebo de enlaces, los editores a veces lo reformulan para que sea más realista. Esto es especialmente necesario con enlaces cuyos títulos son gritos de guerra, porque de lo contrario se convierten en publicaciones implícitas del tipo "vota a favor si crees en tal o cual cosa", que son la forma más extrema de tonterías.

Las técnicas para tratar con los enlaces tienen que evolucionar, porque los enlaces evolucionan. La existencia de agregadores ya ha afectado a lo que agregan. Los escritores ahora escriben deliberadamente cosas para atraer tráfico de los agregadores, a veces incluso de algunos específicos. (No, la ironía de esta afirmación no se me escapa). Luego están las mutaciones más siniestras, como el secuestro de enlaces: publicar una paráfrasis del artículo de otra persona y enviarla en lugar del original. Estas pueden obtener muchos votos positivos, porque mucho de lo bueno de un artículo suele sobrevivir; de hecho, cuanto más se acerca la paráfrasis al plagio, más sobrevive. [ 3 ]

Creo que es importante que un sitio que elimina publicaciones proporcione una forma para que los usuarios vean qué se eliminó si así lo desean. Eso mantiene a los editores honestos y, lo que es igual de importante, hace que los usuarios tengan la seguridad de que sabrían si los editores dejaran de ser honestos. Los usuarios de HN pueden hacer esto activando un interruptor llamado showdead en su perfil. [ 4 ]

Comentarios

Los comentarios negativos parecen ser un problema más grave que los envíos negativos. Si bien la calidad de los enlaces en la página principal de HN no ha cambiado mucho, la calidad del comentario promedio puede haber disminuido un poco.

Hay dos tipos principales de maldad en los comentarios: la maldad y la estupidez. Hay una gran superposición entre ambos (los comentarios malintencionados tienen una probabilidad desproporcionada de ser también tontos), pero las estrategias para lidiar con ellos son diferentes. La maldad es más fácil de controlar. Se pueden tener reglas que digan que uno no debe ser malo, y si se las hace cumplir parece posible mantener a raya la maldad.

Es más difícil mantener a raya la estupidez, tal vez porque no es tan fácil distinguirla. Es más probable que las personas malvadas sepan que están siendo malvadas que las personas estúpidas.

La forma más peligrosa de comentario estúpido no es el argumento largo pero equivocado, sino el chiste tonto. Los argumentos largos pero equivocados son en realidad bastante raros. Existe una fuerte correlación entre la calidad y la longitud de los comentarios; si quisieras comparar la calidad de los comentarios en los sitios de la comunidad, la longitud promedio sería un buen predictor. Probablemente la causa sea la naturaleza humana más que algo específico de los hilos de comentarios. Probablemente se deba simplemente a que la estupidez suele adoptar la forma de tener pocas ideas en lugar de ideas equivocadas.

Sea cual sea la causa, los comentarios estúpidos tienden a ser breves. Y como es difícil escribir un comentario breve que se distinga por la cantidad de información que transmite, la gente intenta distinguirlos siendo graciosos. El formato más tentador para los comentarios estúpidos es el comentario supuestamente ingenioso, probablemente porque los comentarios despectivos son la forma más fácil de humor. [ 5 ] Por lo tanto, una ventaja de prohibir la maldad es que también reduce este tipo de comentarios.

Los comentarios malos son como el kudzu: se apoderan rápidamente de todo. Los comentarios tienen mucho más efecto en los nuevos comentarios que los artículos enviados en los artículos enviados. Si alguien envía un artículo malo, no todos los demás artículos se vuelven malos. Pero si alguien publica un comentario estúpido en un hilo, eso marca el tono para la región que lo rodea. La gente responde a los chistes tontos con chistes tontos.

Tal vez la solución sea añadir un retraso antes de que la gente pueda responder a un comentario y hacer que la duración del retraso sea inversamente proporcional a alguna predicción sobre su calidad. De ese modo, los hilos tontos crecerían más lentamente. [ 6 ]

Gente

Me doy cuenta de que la mayoría de las técnicas que he descrito son conservadoras: están destinadas a preservar el carácter del sitio en lugar de mejorarlo. No creo que sea un sesgo mío. Se debe a la forma del problema. Hacker News tuvo la buena suerte de empezar bien, así que en este caso es literalmente una cuestión de preservación. Pero creo que este principio también se aplicaría a sitios con orígenes diferentes.

Las cosas buenas de un sitio comunitario provienen más de las personas que de la tecnología; la tecnología entra en juego principalmente en la prevención de cosas malas. La tecnología ciertamente puede mejorar la discusión. Los comentarios anidados lo hacen, por ejemplo. Pero prefiero usar un sitio con características primitivas y usuarios inteligentes y agradables que uno más avanzado cuyos usuarios sean idiotas o trolls .

Por lo tanto, lo más importante que puede hacer un sitio comunitario es atraer al tipo de personas que desea. Un sitio que intenta ser lo más grande posible quiere atraer a todo el mundo, pero un sitio que apunta a un subconjunto particular de usuarios tiene que atraer sólo a esos usuarios y, lo que es igual de importante, repeler a todos los demás. He hecho un esfuerzo consciente para hacer esto en HN. El diseño gráfico es lo más simple posible y las reglas del sitio desalientan los títulos de enlaces dramáticos. El objetivo es que lo único que interese a alguien que llega a HN por primera vez sean las ideas expresadas allí.

El inconveniente de ajustar un sitio para atraer a ciertas personas es que, para esas personas, puede resultar demasiado atractivo. Soy muy consciente de lo adictivo que puede llegar a ser Hacker News. Para mí, como para muchos usuarios, es una especie de plaza virtual. Cuando quiero tomarme un descanso del trabajo, entro en la plaza, igual que en Harvard Square o University Ave en el mundo físico. [ 7 ] Pero una plaza en línea es más peligrosa que una física. Si me pasara la mitad del día paseando por University Ave, lo notaría. Tengo que caminar una milla para llegar allí, y sentarse en un café es diferente a trabajar. Pero visitar un foro en línea requiere sólo un clic y, superficialmente, se parece mucho a trabajar. Puede que estés perdiendo el tiempo, pero no estás inactivo. Alguien está equivocado en Internet y tú estás solucionando el problema.

Hacker News es definitivamente útil. He aprendido mucho de las cosas que he leído en HN. He escrito varios ensayos que comenzaron como comentarios allí. Por eso no quisiera que el sitio desapareciera, pero me gustaría estar seguro de que no sea un lastre neto para la productividad. Sería un desastre atraer a miles de personas inteligentes a un sitio que les hiciera perder mucho tiempo. Ojalá pudiera estar 100% seguro de que esa no es una descripción de HN.

Siento que la adicción a los juegos y las aplicaciones sociales sigue siendo un problema en gran parte sin resolver. La situación actual es como la del crack en los años 80: hemos inventado cosas nuevas terriblemente adictivas y todavía no hemos desarrollado formas de protegernos de ellas. En algún momento lo haremos, y ese es uno de los problemas en los que espero centrarme a continuación.

Notas

[ 1 ] Intenté clasificar a los usuarios tanto por la puntuación media como por la mediana de los comentarios, y la media (sin tener en cuenta la puntuación alta) parecía ser el predictor más preciso de la alta calidad. Sin embargo, la mediana puede ser el predictor más preciso de la baja calidad.

[ 2 ] Otra cosa que aprendí de este experimento es que, si vas a distinguir entre personas, es mejor que te asegures de hacerlo bien. Este es un problema en el que el prototipado rápido no funciona.

De hecho, ese es el argumento intelectualmente honesto para no discriminar entre distintos tipos de personas. La razón para no hacerlo no es que todos sean iguales, sino que es malo hacer el mal y difícil hacer el bien.

[ 3 ] Cuando descubro publicaciones que han sido pirateadas de forma flagrante, reemplazo la URL con la del sitio que han copiado. Los sitios que piratean enlaces de forma habitual son bloqueados.

[ 4 ] Digg es conocido por su falta de transparencia. La raíz del problema no es que quienes lo gestionan sean especialmente astutos, sino que utilizan el algoritmo equivocado para generar su página principal. En lugar de surgir desde abajo a medida que obtienen más votos, como en Reddit, las historias comienzan en la parte superior y se van desplazando hacia abajo a medida que llegan más nuevos.

La razón de la diferencia es que Digg se deriva de Slashdot, mientras que Reddit se deriva de Delicious/popular. Digg es Slashdot con votación en lugar de editores, y Reddit es Delicious/popular con votación en lugar de marcadores. (Aún se pueden ver fósiles de sus orígenes en su diseño gráfico).

El algoritmo de Digg es muy vulnerable a las manipulaciones, porque cualquier noticia que llegue a la portada se convierte en la nueva noticia principal, lo que a su vez obliga a Digg a responder con contramedidas extremas. Muchas empresas emergentes tienen algún tipo de secreto sobre los subterfugios a los que tuvieron que recurrir en sus inicios, y sospecho que el secreto de Digg es hasta qué punto las noticias principales fueron elegidas de facto por editores humanos.

[ 5 ] El diálogo en Beavis y Butthead se componía en gran parte de estas cosas, y cuando leo comentarios en sitios realmente malos puedo oírlos en sus voces.

[ 6 ] Sospecho que la mayoría de las técnicas para desalentar los comentarios estúpidos aún no se han descubierto. Xkcd implementó una particularmente inteligente en su canal IRC: no permitir que se repita lo mismo dos veces. Una vez que alguien ha dicho "falla", nadie puede volver a decirlo. Esto penalizaría especialmente los comentarios cortos, porque tienen menos espacio para evitar colisiones.

Otra idea prometedora es el filtro estúpido , que es como un filtro de spam probabilístico, pero entrenado en corpus de comentarios estúpidos y no estúpidos.

Es posible que no sea necesario eliminar los comentarios negativos para resolver el problema. Los comentarios que aparecen al final de un hilo largo rara vez se ven, por lo que puede ser suficiente incorporar una predicción de calidad en el algoritmo de clasificación de comentarios.

[ 7 ] Lo que hace que la mayoría de los suburbios sean tan desmoralizantes es que no hay un centro al cual llegar caminando.

Gracias a Justin Kan, Jessica Livingston, Robert Morris, Alexis Ohanian, Emmet Shear y Fred Wilson por leer borradores de este libro.

Comente este ensayo.