从 HACKER NEWS 中学到的东西
Original2009 年 2 月
Hacker News 上周两岁了。最初它只是一个副项目——一个用来磨练 Arc 的应用,也是现任和未来 Y Combinator 创始人交流新闻的地方。它比我预期的发展得更大,也占用了更多时间,但我并不后悔,因为我在开发它的过程中学到了很多东西。
增长
我们在 2007 年 2 月推出时,工作日的日均独立访客约为 1600 人。此后,它增长到约 22,000 人。这个增长率比我想要的略高。我希望网站能增长,因为一个至少没有缓慢增长的网站可能已经死了。但我不想让它像 Digg 或 Reddit 那样大——主要是因为这会稀释网站的特色,而且我不想把所有时间都花在处理扩展问题上。
我已经遇到了很多这方面的问题。请记住,HN 的最初动机是测试一种新的编程语言,而且这种语言更侧重于语言设计方面的实验,而不是性能。每次网站变慢时,我都会通过回忆 McIlroy 和 Bentley 的著名引言来激励自己
性能的关键在于优雅,而不是大量的特殊情况。
并寻找我可以通过最少的代码来消除的瓶颈。到目前为止,我一直在努力跟上,从某种意义上说,尽管增长了 14 倍,但性能仍然保持着中等水平。我不知道下一步该怎么做,但我可能会想到一些办法。
这通常是我对网站的态度。Hacker News 是一项实验,而且是在一个非常年轻的领域进行的实验。这类网站只有几年的历史。互联网对话一般只有几十年的历史。所以我们可能只发现了最终会发现的一小部分。
这就是我对 HN 如此乐观的原因。当一项技术如此年轻时,现有的解决方案通常很糟糕;这意味着一定可以做得更好;这意味着许多看似无法解决的问题其实并非如此。包括,我希望,困扰着许多先前社区的问题:被增长所毁坏。
稀释
自网站成立几个月以来,用户一直担心这个问题。到目前为止,这些警报都是错误的,但它们可能并不总是错误的。稀释是一个难题。但可能是可以解决的;当“总是”等于 20 个实例时,开放式对话“总是”被增长所破坏并没有什么意义。
但重要的是要记住,我们正在尝试解决一个新问题,因为这意味着我们将不得不尝试新的方法,其中大多数可能行不通。几周前,我尝试用橙色显示平均评论得分最高的用户的姓名。[1] 这是一个错误。突然之间,一个原本或多或少团结的文化被分成了富人和穷人。直到我看到它被分裂,我才意识到这种文化是多么团结。看着它真是令人痛苦。 [2]
所以橙色的用户名不会再回来了。(对此表示歉意。)但未来还会有其他同样看似破损的想法,而那些最终行之有效的想法可能看起来和那些行不通的想法一样破损。
也许我从稀释中了解到的最重要的事情是,它更多地体现在行为上,而不是用户上。你想要排除的是不良行为,而不是坏人。用户行为事实证明是出奇地易于改变的。如果人们期望表现良好,他们往往会这样做;反之亦然。
当然,禁止不良行为确实会赶走坏人,因为他们在必须表现良好的地方会感到不舒服。但这种将他们赶走的方式更温和,而且可能也比公开的障碍更有效。
现在很清楚,破窗理论也适用于社区网站。该理论认为,轻微的不良行为会鼓励更严重的行为:一个有很多涂鸦和破窗的社区会变成一个发生抢劫的社区。我在朱利安尼实施使破窗理论闻名的改革时住在纽约,这场变革是奇迹般的。而我在 Reddit 上发生相反的事情时是 Reddit 的用户,这场变革同样引人注目。
我并不是在批评史蒂夫和亚历克西斯。Reddit 上发生的事情并非由于疏忽。从一开始,他们就有一项政策,即除了垃圾邮件之外,不审查任何内容。此外,Reddit 的目标与 Hacker News 不同。Reddit 是一家初创公司,而不是一个副项目;它的目标是尽可能快地增长。将快速增长和零审查结合起来,结果就是自由放任。但我认为,如果他们再做一次,他们不会做太多改变。从流量来看,Reddit 比 Hacker News 成功得多。
但 Reddit 上发生的事情并不一定会发生在 HN 上。存在几个局部最大值。就像现实世界一样,可以有自由放任的地方,也可以有更深思熟虑的地方;人们的行为会根据他们身处何处而有所不同,就像他们在现实世界中一样。
我在野外观察到了这一点。我看到人们在 Reddit 和 Hacker News 上交叉发布,他们实际上费心写了两个版本,一个用于 Reddit 的火焰,另一个用于 HN 的更温和的版本。
提交
像 Hacker News 这样的网站需要避免两种主要类型的问题:糟糕的故事和糟糕的评论。到目前为止,糟糕故事的危险似乎较小。现在首页上的故事仍然大致与 HN 启动时会出现的那些故事相同。
我曾经认为我必须对投票进行加权才能将垃圾从首页上清除,但我还没有这样做。我无法预测首页会如此坚挺,而且我不确定为什么它会这样。也许只有那些更有思想的用户才会关心提交和点赞链接,因此一个随机的新用户的边际成本接近于零。或者也许首页会自我保护,通过宣传预期提交的类型。
对首页最危险的是那些太容易点赞的东西。如果有人证明了一个新定理,读者需要花一些时间才能决定是否点赞。一个有趣的漫画需要更少的时间。一篇以号召性用语为标题的咆哮不需要任何时间,因为人们甚至没有阅读就点赞了。
因此,我称之为“废话原则”:在一个用户投票的新闻网站上,最容易判断的链接将接管,除非你采取具体措施来阻止它。
Hacker News 有两种防止废话的保护措施。最常见的废话链接类型被禁止为主题外。小猫的照片、政治演说等等都被明确禁止。这可以排除大多数废话,但并非全部。有些链接既是废话,因为它们很短,而且也是主题内的。
对此没有单一的解决方案。如果一个链接只是一个空洞的咆哮,编辑有时会将其删除,即使它在主题上是关于黑客的,因为它在真正的标准上不是主题内的,真正的标准是激发人们的智力好奇心。如果一个网站上的帖子通常是这种类型,我有时会禁止它,这意味着该 URL 上的新内容会被自动删除。如果一个帖子有一个标题党标题,编辑有时会将其改写为更客观。对于标题为号召性用语的链接,这一点尤其必要,因为否则它们会变成隐含的“如果你相信这样那样,就点赞”帖子,而这是最极端的废话形式。
处理链接的技术必须不断发展,因为链接也在不断发展。聚合器的存在已经影响了它们聚合的内容。现在,作家们故意写一些东西来吸引聚合器带来的流量——有时甚至是一些特定的聚合器。(不,这句话的讽刺意味并没有逃过我的注意。)然后是更阴险的变异,比如链接劫持——发布他人文章的改写版本,并提交它而不是原文。这些可以获得很多点赞,因为文章中很多好的东西通常都会保留下来;事实上,改写越接近剽窃,保留的就越多。 [3]
我认为,一个删除提交的网站应该为用户提供一种方法,让他们在需要时查看被删除的内容。这可以保证编辑的诚实,更重要的是,让用户相信他们会知道编辑是否不再诚实。HN 用户可以通过在他们的个人资料中切换一个名为 showdead 的开关来做到这一点。 [4]
评论
糟糕的评论似乎比糟糕的提交更难解决。虽然 HN 首页上链接的质量没有太大变化,但中位数评论的质量可能有所下降。
评论中有两种主要类型的糟糕:刻薄和愚蠢。两者之间有很多重叠——刻薄的评论更有可能也是愚蠢的——但处理它们的策略不同。刻薄更容易控制。你可以制定规则,说人不应该刻薄,如果你执行这些规则,似乎有可能控制住刻薄。
控制愚蠢更难,也许是因为愚蠢不容易区分。刻薄的人比愚蠢的人更有可能知道他们在刻薄,而愚蠢的人更有可能知道他们在愚蠢。
最危险的愚蠢评论形式不是长篇但错误的论点,而是愚蠢的笑话。长篇但错误的论点实际上很少见。评论质量和长度之间存在很强的相关性;如果你想比较社区网站上评论的质量,平均长度将是一个很好的预测指标。原因可能是人的本性,而不是评论线程的任何特定因素。可能是因为愚蠢更常表现为想法少,而不是想法错误。
无论原因是什么,愚蠢的评论往往很短。由于很难写出一篇短评论,使其因传达的信息量而脱颖而出,因此人们试图通过幽默来使其脱颖而出。对愚蠢评论来说,最诱人的格式是看似机智的贬低,可能是因为贬低是最容易的幽默形式。 [5] 所以禁止刻薄的一个好处是,它也减少了这些评论。
糟糕的评论就像葛藤:它们迅速蔓延。评论对新评论的影响远大于提交对新提交的影响。如果有人提交了一篇糟糕的文章,其他提交不会都变得糟糕。但如果有人在一个线程中发布了一条愚蠢的评论,就会为它周围的区域定下基调。人们用愚蠢的笑话来回复愚蠢的笑话。
也许解决方案是在人们可以回复评论之前添加一个延迟,并使延迟的长度与对评论质量的预测成反比。这样,愚蠢的线程就会增长得更慢。 [6]
人们
我注意到我描述的大多数技术都是保守的:它们旨在维护网站的特色,而不是增强它。我不认为这是我的偏见。这是由于问题的形状。Hacker News 有幸一开始就很好,所以在这种情况下,它实际上是维护问题。但我认为,这一原则也适用于具有不同起源的网站。
社区网站中的好东西来自人,而不是技术;技术主要是在防止坏事方面发挥作用。技术当然可以增强讨论。例如,嵌套评论就可以做到。但我宁愿使用一个功能原始但用户聪明友好的网站,而不是一个更先进但用户是白痴或喷子的网站。
因此,社区网站可以做的最重要的事情就是吸引它想要的那种人。一个试图变得尽可能大的网站想要吸引所有人。但一个针对特定用户群体的网站必须吸引那些人——同样重要的是,要排斥其他人。我在 HN 上有意识地努力做到这一点。图形设计尽可能简单,网站规则不鼓励戏剧性的链接标题。目标是,第一次来到 HN 的人唯一感兴趣的东西应该是那里表达的想法。
将网站调整为吸引特定人群的缺点是,对那些人来说,它可能太有吸引力了。我非常清楚 Hacker News 有多么令人上瘾。对我来说,就像对许多用户一样,它是一种虚拟的城镇广场。当我想要休息一下工作时,我会走进广场,就像我在现实世界中走进哈佛广场或大学大道一样。 [7] 但在线广场比实体广场更危险。如果我在大学大道上闲逛半天,我会注意到。我必须走一英里才能到达那里,坐在咖啡馆里感觉与工作不同。但访问一个在线论坛只需要点击一下,而且表面上感觉非常像工作。你可能在浪费时间,但你并不闲着。有人在互联网上犯错,而你在解决问题。
Hacker News 绝对有用。我从我在 HN 上读到的东西中学到了很多东西。我写了几篇以那里评论为开端的文章。所以我不想让网站消失。但我希望确保它不会对生产力造成负面影响。吸引成千上万的聪明人到一个让他们浪费大量时间的网站,那将是一场灾难。我希望我能 100% 确定 HN 不是这样的。
我觉得游戏和社交应用的成瘾性仍然是一个基本上没有解决的问题。现在的情况就像 20 世纪 80 年代的毒品一样:我们发明了非常令人上瘾的新事物,但还没有进化出保护自己免受它们伤害的方法。我们最终会做到,这也是我希望接下来关注的问题之一。
注释
[1] 我尝试过根据平均评论得分和中位数评论得分对用户进行排名,而平均得分(剔除最高得分)似乎是高质量的更准确预测指标。虽然中位数可能是低质量的更准确预测指标。
[2] 我从这个实验中学到的另一件事是,如果你要区分不同的人,你最好确保你做对了。这是一个快速原型设计行不通的问题。
事实上,这是不歧视不同类型人的理智论据。不这样做的原因不是每个人都一样,而是做错事很糟糕,而做对事很难。
[3] 当我发现极其明显的链接劫持帖子时,我会将 URL 替换为他们复制的 URL。习惯性链接劫持的网站会被禁止。
[4] Digg 因其缺乏透明度而臭名昭著。问题的根源不在于运营 Digg 的人特别狡猾,而在于他们使用错误的算法来生成他们的首页。故事不是像 Reddit 那样从底部冒泡上来,随着获得更多投票而上升,而是从顶部开始,被新来的故事向下推。
造成这种差异的原因是 Digg 源于 Slashdot,而 Reddit 源于 Delicious/popular。Digg 是带有投票功能的 Slashdot,而 Reddit 是带有投票功能的 Delicious/popular。(你仍然可以在他们的图形设计中看到他们起源的化石。)
Digg 的算法非常容易被利用,因为任何登上首页的故事都是新的头条新闻。这反过来又迫使 Digg 采取极端的应对措施。许多初创公司都有关于他们在早期不得不采取的阴谋诡计的秘密,我怀疑 Digg 的秘密是头条新闻实际上是由人工编辑选择的程度。
[5] 《瘪四与大头蛋》中的对话主要由这些组成,当我阅读非常糟糕的网站上的评论时,我能听到他们的声音。
[6] 我怀疑大多数阻止愚蠢评论的技术尚未被发现。Xkcd 在其 IRC 频道中实施了一个特别巧妙的技术:不允许出现相同的内容两次。一旦有人说了“失败”,就再也不能有人说它了。这将特别惩罚短评论,因为它们没有足够的空间来避免碰撞。
另一个有希望的想法是愚蠢过滤器,它就像一个概率垃圾邮件过滤器,但训练的是愚蠢和非愚蠢评论的语料库。
你可能不必删除糟糕的评论就能解决问题。长线程底部的评论很少被看到,因此在评论排序算法中加入质量预测可能就足够了。
[7] 大多数郊区之所以令人沮丧,是因为没有中心可以步行到达。
感谢 Justin Kan、Jessica Livingston、Robert Morris、Alexis Ohanian、Emmet Shear 和 Fred Wilson 阅读了本文的草稿。
评论这篇文章。