我从 HACKER NEWS 学到的东西
Original2009年2月
Hacker News 上周满两岁。最初它是一个副项目——一个用来磨练 Arc 的应用程序,以及一个供当前和未来的 Y Combinator 创始人交流新闻的地方。它的发展超出了我的预期,占用了更多的时间,但我并不后悔,因为我从中学到了很多。
增长
当我们在 2007 年 2 月推出时,工作日的流量大约是每天 1600 个独立用户。此后它已经增长到大约 22,000。这个增长率比我希望的要高一些。我希望网站能够增长,因为一个不慢慢增长的网站可能已经死了。但我不希望它增长到像 Digg 或 Reddit 那样大——主要是因为那会稀释网站的特性,也因为我不想花所有时间来处理扩展问题。
我已经有足够多的问题要处理。记住,HN 的最初动机是测试一种新的编程语言,而且更重要的是,这种语言专注于实验语言设计,而不是性能。每当网站变慢时,我就通过回忆 McIlroy 和 Bentley 的名言来增强自己的信心:
性能的关键是优雅,而不是成群的特例。
并寻找我可以用最少代码去除的瓶颈。到目前为止,我能够跟上,意味着尽管增长了 14 倍,性能仍然保持在中等水平。我不知道接下来会做什么,但我可能会想出一些办法。
这就是我对网站的总体态度。Hacker News 是一个实验,而且是在一个非常年轻的领域中的实验。这类网站只有几年的历史。互联网对话一般也只有几十年的历史。所以我们可能只发现了我们最终会发现的一小部分。
这就是我对 HN 感到如此乐观的原因。当一种技术如此年轻时,现有的解决方案通常是糟糕的;这意味着一定有可能做得更好;这意味着许多看似无法解决的问题其实并不是。包括我希望的,困扰许多先前社区的问题:被增长毁掉。
稀释
用户从网站刚上线几个月时就开始担心这个问题。到目前为止,这些警报都是错误的,但它们可能并不总是如此。稀释是一个棘手的问题。但可能是可以解决的;当“总是”仅等于 20 个实例时,开放对话“总是”被增长摧毁并没有太大意义。
但重要的是要记住,我们正在尝试解决一个新问题,因为这意味着我们将不得不尝试新事物,而大多数新事物可能不会奏效。几周前,我尝试将平均评论得分最高的用户的名字显示为橙色。[1]那是一个错误。突然间,一个曾经或多或少团结的文化被分裂成了有和没有。我没有意识到文化是多么团结,直到我看到它被分裂。看着这一切是痛苦的。[2]
所以橙色用户名不会再出现了。(对此我感到抱歉。)但未来会有其他看似同样破碎的想法,而那些最终奏效的想法可能看起来和那些不奏效的想法一样破碎。
我学到的关于稀释的最重要的事情是,它更多地以行为而不是用户来衡量。你想要排除的是坏行为,而不是坏人。用户行为出乎意料地可塑。如果人们被期望表现良好,他们往往会这样做;反之亦然。
当然,禁止坏行为确实倾向于排除坏人,因为他们在一个必须表现良好的地方会感到不舒服。但这种排除方式比明显的障碍更温和,也可能更有效。
现在很明显,破窗理论同样适用于社区网站。该理论认为,轻微的坏行为会鼓励更糟糕的行为:一个有很多涂鸦和破窗户的社区会变成一个发生抢劫的地方。当 Giuliani 引入使破窗理论出名的改革时,我正住在纽约,转变是奇迹般的。当 Reddit 发生相反的事情时,我也是 Reddit 的用户,转变同样戏剧性。
我并不是在批评 Steve 和 Alexis。发生在 Reddit 的事情并不是因为忽视。从一开始,他们就有一个不审查任何东西的政策,除了垃圾邮件。此外,Reddit 的目标与 Hacker News 不同。Reddit 是一家初创公司,而不是一个副项目;它的目标是尽可能快地增长。快速增长和零审查结合在一起,结果就是一个自由的混乱。但我认为如果他们再来一次,他们不会做太多不同的事情。按流量计算,Reddit 比 Hacker News 成功得多。
但发生在 Reddit 的事情并不一定会发生在 HN 上。存在几个局部极大值。可以有自由混乱的地方,也可以有更深思熟虑的地方,就像现实世界中一样;人们的行为会根据他们所处的环境而有所不同,就像他们在现实世界中一样。
我在现实中观察到了这一点。我看到有人在 Reddit 和 Hacker News 上交叉发布,实际上他们费心写了两个版本,一个是针对 Reddit 的火焰,一个是针对 HN 的更温和的版本。
提交
像 Hacker News 这样的网站需要避免两种主要类型的问题:糟糕的故事和糟糕的评论。到目前为止,糟糕故事的危险似乎较小。现在首页上的故事仍然大致是 HN 开始时会出现的故事。
我曾经认为我必须对投票进行加权,以保持垃圾内容不出现在首页,但我还没有必要。我本来不认为首页会保持得如此良好,我也不确定为什么会这样。也许只有更深思熟虑的用户才会足够关心去提交和点赞链接,因此一个随机新用户的边际成本接近于零。或者也许首页通过宣传期望的提交类型来保护自己。
首页上最危险的东西是那些太容易被点赞的内容。如果有人证明了一个新定理,读者需要花一些时间来决定是否点赞。一个有趣的卡通则需要的时间更少。一个以号召性口号为标题的咆哮则不需要,因为人们在甚至没有阅读的情况下就会投票支持它。
因此,我称之为“浮华原则”:在一个用户投票的新闻网站上,最容易判断的链接将占据主导地位,除非你采取特定措施来防止这种情况。
Hacker News 有两种防止浮华的保护措施。最常见的浮华链接类型被禁止为离题。小猫的图片、政治抨击等被明确禁止。这可以排除大部分浮华,但并不是全部。有些链接既是浮华的(因为它们非常简短),又是相关的。
对此没有单一的解决方案。如果一个链接只是空洞的咆哮,编辑有时会将其删除,即使它在黑客相关的意义上是相关的,因为它在真正的标准上并不相关,即激发人的智力好奇心。如果一个网站上的帖子通常是这种类型,我有时会禁止它,这意味着该 URL 上的新内容会被自动删除。如果一个帖子有一个吸引眼球的标题,编辑有时会将其重新表述为更客观的方式。这在标题是号召性口号的链接中尤其必要,因为否则它们会变成隐含的“如果你相信某某某就投票支持”的帖子,这些是浮华的最极端形式。
处理链接的技术必须不断演变,因为链接本身也在演变。聚合器的存在已经影响了它们聚合的内容。作家现在故意写东西以吸引聚合器的流量——有时甚至是特定的聚合器。(不,我并没有忽视这句话的讽刺。)然后还有更阴险的变种,比如链接劫持——发布某人文章的释义并提交,而不是原文。这些可以获得很多点赞,因为文章中很多好的内容往往会保留下来;实际上,释义越接近抄袭,保留下来的内容就越多。[3]
我认为,一个删除提交的网站提供一种方式让用户查看被删除的内容是很重要的,如果他们想的话。这可以保持编辑的诚实,更重要的是,让用户有信心知道如果编辑不诚实,他们会知道。HN 用户可以通过在个人资料中切换名为 showdead 的开关来做到这一点。[4]
评论
糟糕的评论似乎比糟糕的提交更难处理。虽然 HN 首页上的链接质量没有太大变化,但中位评论的质量可能有所下降。
评论中的坏行为主要有两种:刻薄和愚蠢。这两者之间有很多重叠——刻薄的评论往往也很愚蠢——但处理它们的策略是不同的。刻薄更容易控制。你可以有规则说不应该刻薄,如果你执行这些规则,似乎可以控制刻薄行为。
控制愚蠢行为则更难,可能是因为愚蠢行为不那么容易区分。刻薄的人更可能知道自己在刻薄,而愚蠢的人则不太可能知道自己在愚蠢。
最危险的愚蠢评论形式不是冗长但错误的论点,而是愚蠢的笑话。冗长但错误的论点实际上相当少见。评论质量与长度之间有很强的相关性;如果你想比较社区网站上评论的质量,平均长度将是一个很好的预测指标。可能原因是人性,而不是评论线程的特定因素。可能只是因为愚蠢更常以缺乏想法的形式出现,而不是错误的想法。
无论原因是什么,愚蠢评论往往很短。而且,由于很难写出一个在信息传达上有区别的短评论,人们往往试图通过搞笑来区分它们。愚蠢评论最诱人的格式是所谓的机智讽刺,可能是因为讽刺是最容易的幽默形式。[5]因此,禁止刻薄的一个好处是它也减少了这些。
糟糕的评论就像葛藤:它们迅速占据主导地位。评论对新评论的影响远大于提交对新提交的影响。如果有人提交了一篇糟糕的文章,其他提交并不会都变得糟糕。但如果有人在一个线程中发布了一个愚蠢的评论,那就为周围的区域定下了基调。人们用愚蠢的笑话回应愚蠢的笑话。
也许解决方案是增加人们对评论的回应延迟,并使延迟的长度与某种质量预测成反比。这样愚蠢的线程就会增长得更慢。[6]
人们
我注意到我描述的大多数技术都是保守的:它们旨在保持网站的特性,而不是增强它。我认为这并不是我的偏见。这是由于问题的性质。Hacker News 有幸一开始就很好,所以在这种情况下,确实是一个保护的问题。但我认为这个原则也适用于起源不同的网站。
社区网站中的好东西来自人而不是技术;主要是在防止坏东西的过程中,技术才发挥作用。技术当然可以增强讨论。例如,嵌套评论确实可以。但我宁愿使用一个功能原始、用户聪明友好的网站,而不是一个功能更先进但用户是白痴或喷子的网站。
因此,一个社区网站能做的最重要的事情就是吸引它想要的人。一个试图尽可能大的网站想要吸引每个人。但一个针对特定用户子集的网站必须只吸引那些人——同样重要的是,排斥其他所有人。我在 HN 上做了一个有意识的努力。图形设计尽可能简单,网站规则不鼓励戏剧性的链接标题。目标是让第一次访问 HN 的人唯一感兴趣的就是那里表达的想法。
将网站调优以吸引特定人群的缺点是,对那些人来说,它可能过于吸引人。我非常清楚 Hacker News 是多么上瘾。对我来说,就像对许多用户一样,它是一个虚拟的市政广场。当我想休息一下时,我就像走进哈佛广场或现实世界中的大学大道一样走进广场。[7]但在线广场比现实广场更危险。如果我在大学大道上闲逛半天,我会注意到。我必须走一英里才能到达那里,坐在咖啡馆里感觉与工作不同。但访问一个在线论坛只需点击一下,表面上感觉非常像工作。你可能在浪费时间,但你并没有闲着。有人在互联网上错了,而你正在解决这个问题。
Hacker News 绝对是有用的。我从 HN 上阅读的东西中学到了很多。我写了几篇以评论开始的文章。因此,我不希望这个网站消失。但我希望确保它不会对生产力造成负面影响。吸引成千上万聪明人到一个让他们浪费大量时间的网站,那将是多么灾难性的事情。我希望我能 100% 确定这不是 HN 的描述。
我觉得游戏和社交应用的上瘾性仍然是一个大多未解决的问题。现在的情况就像 1980 年代的毒品一样:我们发明了非常上瘾的新事物,而我们尚未进化出保护自己免受这些事物影响的方法。我们最终会做到这一点,这也是我希望下一个关注的问题之一。
备注
[1]我尝试通过平均和中位评论得分对用户进行排名,平均得分(去掉高分)似乎是高质量的更准确预测。然而,中位数可能是低质量的更准确预测。
[2]我从这个实验中学到的另一件事是,如果你要区分人群,你最好确保你做对了。这是一个快速原型无法解决的问题。
实际上,这就是不歧视各种类型人群的知识上诚实的论点。不这样做的原因不是因为每个人都是一样的,而是因为做错事是坏事,而做对事是困难的。
[3]当我抓到明显的链接劫持帖子时,我会用他们复制的 URL 替换原始 URL。习惯性链接劫持的网站会被禁止。
[4]Digg 以缺乏透明度而臭名昭著。问题的根源不是 Digg 的运营者特别狡猾,而是他们使用了错误的算法来生成首页。与 Reddit 不同,故事不是从底部开始随着投票增加而上升,而是从顶部开始,被新到达的内容推下去。
这种差异的原因是 Digg 源于 Slashdot,而 Reddit 源于 Delicious/popular。Digg 是用投票代替编辑的 Slashdot,而 Reddit 是用投票代替书签的 Delicious/popular。(你仍然可以在他们的图形设计中看到它们起源的化石。)
Digg 的算法非常容易被操控,因为任何进入首页的故事都是新的头条。这反过来又迫使 Digg 采取极端的反制措施。许多初创公司都有一些关于他们在早期阶段不得不采取的秘密手段,我怀疑 Digg 的秘密是头条故事在事实上是由人类编辑选择的程度。
[5]《比维斯与巴特海德》中的对话主要由这些组成,当我在真的糟糕的网站上阅读评论时,我能听到他们的声音。
[6]我怀疑大多数阻止愚蠢评论的技术尚未被发现。Xkcd 在其 IRC 频道中实施了一种特别聪明的技术:不允许同样的事情出现两次。一旦有人说了“失败”,就再也不能说了。这将特别惩罚短评论,因为它们在避免碰撞方面的空间更少。
另一个有前景的想法是愚蠢过滤器,它就像一个概率性垃圾邮件过滤器,但训练于愚蠢和非愚蠢评论的语料库。
你可能不需要删除糟糕的评论来解决这个问题。长线程底部的评论很少被看到,因此在评论排序算法中结合质量预测可能就足够了。
[7]大多数郊区让人感到沮丧的原因在于没有中心可供步行前往。
感谢 Justin Kan、Jessica Livingston、Robert Morris、Alexis Ohanian、Emmet Shear 和 Fred Wilson 阅读这篇文章的草稿。
评论这篇文章。