我从 HACKER NEWS 学到的东西
Original2009 年 2 月
上周,Hacker News 成立两周年了。最初,它只是一个副业项目——一个让 Arc 更上一层楼的应用程序,以及 Y Combinator 现任和未来创始人交流新闻的地方。它的发展比我预期的要大,占用的时间也更多,但我并不后悔,因为我从中学到了很多东西。
生长
当我们在 2007 年 2 月推出时,工作日流量约为 1600 个独立访客。此后,这一数字增长到了 22,000 个左右。这个增长率比我希望的要高一些。我希望网站能够发展壮大,因为一个发展速度不慢的网站很可能已经死了。但我不希望它发展到像 Digg 或 Reddit 那样大——主要是因为这会削弱网站的特色,也因为我不想把所有的时间都花在扩展上。
我已经遇到足够多的问题了。记住,HN 最初的动机是测试一种新的编程语言,而且这种语言专注于试验语言设计,而不是性能。每次网站变慢时,我都会想起 McIlroy 和 Bentley 的名言来激励自己
性能的关键在于优雅,而不是大量的特殊情况。
并寻找可以用最少代码消除的瓶颈。到目前为止,我能够跟上,尽管增长了 14 倍,但性能仍然保持平庸。我不知道下一步该做什么,但我可能会想到一些办法。
我对这个网站的态度大致如此。Hacker News 是一个实验,而且是一个非常年轻领域的实验。这种类型的网站只有几年的历史。互联网对话通常只有几十年的历史。所以我们可能只发现了我们最终会发现的东西的一小部分。
这就是我对 HN 如此乐观的原因。当一项技术如此年轻时,现有的解决方案通常很糟糕;这意味着一定有可能做得更好;这意味着许多看似无法解决的问题实际上并非如此。我希望包括困扰过许多以前社区的问题:被增长摧毁。
稀释
自从该网站上线几个月以来,用户就一直担心这个问题。到目前为止,这些警报都是假的,但可能并不总是如此。稀释是一个难题。但可能是可以解决的;当“总是”等于 20 个实例时,开放对话“总是”被增长破坏并不意味着什么。
但重要的是要记住,我们正在努力解决一个新问题,因为这意味着我们将不得不尝试新事物,而其中大多数可能行不通。几周前,我尝试用橙色显示平均评论分数最高的用户姓名。[ 1 ] 那是一个错误。突然间,一个或多或少团结的文化被分成了富人和穷人。直到我看到它分裂,我才意识到这个文化曾经多么团结。看着它真是令人痛苦。[ 2 ]
所以橙色用户名不会再出现了。(对此我深表歉意。)但未来还会出现其他同样不靠谱的想法,而那些最终行得通的想法可能看起来和那些行不通的想法一样不靠谱。
关于稀释,我学到的最重要的一点可能是,稀释更多的是以行为而非用户来衡量。你更想阻止的是不良行为,而不是坏人。用户行为出奇地容易改变。如果人们被期望表现良好,他们就会倾向于这样做;反之亦然。
当然,禁止不良行为确实会将坏人拒之门外,因为他们在必须表现良好的地方感到不舒服的约束。但这种阻止他们的方式比公开的障碍更温和,也可能更有效。
现在很明显,破窗理论也适用于社区场所。该理论认为,轻微的不良行为会引发更严重的不良行为:一个有大量涂鸦和破窗的社区会成为抢劫多发地。朱利安尼推出让破窗理论名声大噪的改革时,我住在纽约,这种转变是奇迹。而当我还是 Reddit 用户时,那里发生了相反的情况,这种转变同样引人注目。
我并不是在批评史蒂夫和亚历克西斯。Reddit 的遭遇并非出于疏忽。从一开始,他们就制定了除垃圾邮件之外不审查其他内容的政策。此外,Reddit 的目标与 Hacker News 不同。Reddit 是一家初创公司,而不是一个副业;它的目标是尽可能快地发展。快速发展和零审查相结合,其结果是人人自由。但我认为,如果他们再次这样做,他们不会做太多不同的事情。以流量来衡量,Reddit 比 Hacker News 成功得多。
但 Reddit 的遭遇不会必然发生在 HN 上。存在多个局部最大值。可能存在对所有人开放的地方,也可能存在更加体贴周到的地方,就像现实世界中一样;人们会根据所处的环境采取不同的行为,就像在现实世界中一样。
我在野外观察到了这种情况。我看到有人在 Reddit 和 Hacker News 上交叉发布帖子,他们实际上不辞辛劳写了两个版本,一个是 Reddit 的火焰版,另一个是 HN 的更温和的版本。
提交内容
像 Hacker News 这样的网站需要避免两类主要问题:糟糕的报道和糟糕的评论。到目前为止,糟糕的报道的危害似乎较小。现在首页上的故事大致与 HN 刚开始时一样。
我曾经想过,我必须对投票进行加权,以阻止垃圾内容出现在首页上,但目前为止我还没有这样做。我没想到首页会如此受欢迎,我也不确定它为什么会如此受欢迎。也许只有更体贴的用户才会关心并提交和点赞链接,因此一个随机新用户的边际成本接近于零。或者也许首页通过宣传需要提交什么类型的内容来保护自己。
对于头版来说,最危险的是那些太容易被点赞的内容。如果有人证明了一个新定理,读者需要花些功夫来决定是否点赞。一幅有趣的漫画需要的点赞较少。一篇以战斗口号为标题的长篇大论则得不到任何点赞,因为人们甚至没有阅读它就点赞了。
因此,我提出了所谓的 Fluff 原则:在用户投票的新闻网站上,最容易判断的链接将占据主导地位,除非你采取具体措施来阻止它。
Hacker News 有两种针对无用内容的保护措施。最常见的无用内容链接类型被禁止,因为它们与主题无关。小猫图片、政治长篇大论等内容被明确禁止。这可以阻止大多数无用内容,但不是全部。有些链接既是无用内容(非常短),又是主题相关的。
对此没有单一的解决方案。如果链接只是空洞的咆哮,编辑有时会删除它,即使它是关于黑客的,因为它不符合主题,即不符合真正的标准,即激发人们的求知欲。如果网站上的帖子通常属于这种类型,我有时会禁止它,这意味着该网址上的新内容会被自动删除。如果帖子的标题是链接诱饵,编辑有时会将其改写为更实事求是。这对于标题是战斗口号的链接尤其必要,因为否则它们会变成隐含的“如果你相信这样或那样的,就投票”帖子,这是最极端的废话形式。
处理链接的技术也必须不断演进,因为链接本身也在演进。聚合器的存在已经影响到了它们所聚合的内容。现在,作者会刻意写一些东西来吸引聚合器的流量——有时甚至是特定的聚合器。(不,我并不否认这句话的讽刺意味。)还有一些更险恶的变异,比如链接劫持——发布别人文章的释义,然后提交它来代替原文。这些可以得到很多点赞,因为文章中很多好的东西往往能保留下来;事实上,释义越接近抄袭,保留下来的就越多。[ 3 ]
我认为,一个删除投稿的网站应该为用户提供一种方式,让他们可以查看哪些投稿被删除。这可以保证编辑者的诚实,同样重要的是,可以让用户确信,如果编辑者不再诚实,他们就会知道。HN 用户可以通过在他们的个人资料中拨动一个名为 showdead 的开关来做到这一点。[ 4 ]
评论
不良评论似乎比不良投稿更难处理。虽然 HN 首页上的链接质量没有太大变化,但中位评论的质量可能有所下降。
评论中的不良内容主要有两种:卑鄙和愚蠢。两者之间有很多相似之处——卑鄙的评论往往也是愚蠢的——但处理它们的策略是不同的。卑鄙的评论更容易控制。你可以制定规则,规定人们不应该卑鄙,如果你执行这些规则,似乎可以遏制卑鄙的行为。
控制愚蠢更加困难,或许是因为愚蠢不是那么容易辨别的。卑鄙的人比愚蠢的人更可能知道自己卑鄙,而愚蠢的人则更可能知道自己愚蠢。
最危险的愚蠢评论不是长篇大论的错误论点,而是愚蠢的笑话。长篇大论的错误论点实际上相当罕见。评论质量和长度之间存在很强的相关性;如果你想比较社区网站上评论的质量,平均长度将是一个很好的预测指标。原因可能是人性,而不是评论主题的特定内容。可能只是愚蠢更多地表现为想法少而不是想法错误。
无论原因是什么,愚蠢的评论往往很短。由于很难写出一条信息量大、引人注目的简短评论,人们试图通过搞笑来区分它们。最诱人的愚蠢评论形式是所谓的诙谐的贬低,可能是因为贬低是最容易的幽默形式。[ 5 ] 因此,禁止卑鄙行为的一个好处是,它也会减少这些行为。
坏评论就像葛藤:它们会迅速占据主导地位。评论对新评论的影响远大于提交对新提交的影响。如果有人提交了一篇蹩脚的文章,其他提交的内容不会全部变得蹩脚。但如果有人在某个主题上发表了一条愚蠢的评论,那么这将为该主题周围的区域定下基调。人们会用愚蠢的笑话来回应愚蠢的笑话。
也许解决方案是在人们回复评论之前增加一个延迟,并使延迟的长度与对评论质量的预测成反比。这样,哑线程的增长速度就会变慢。[ 6 ]
人们
我注意到我描述的大多数技术都是保守的:它们旨在保留网站的特性而不是增强它。我不认为这是我的偏见。这是由于问题的形状。Hacker News 有幸一开始就很好,所以在这种情况下,这实际上是一个保存的问题。但我认为这个原则也适用于不同来源的网站。
社区网站的优点更多来自于人而非技术;技术主要在预防坏事方面发挥作用。技术当然可以促进讨论。例如,嵌套评论就是这样。但我宁愿使用功能简单、用户聪明友善的网站,而不是用户是白痴或恶意攻击者的更高级的网站。
因此,社区网站能做的最重要的事情就是吸引它想要的那种人。一个试图尽可能扩大规模的网站希望吸引所有人。但一个针对特定用户子集的网站必须只吸引那些人——同样重要的是,排斥其他所有人。我在 HN 上有意识地努力做到这一点。图形设计尽可能简单,网站规则不鼓励夸张的链接标题。目标是让第一次访问 HN 的人唯一感兴趣的应该是那里表达的想法。
为了吸引某些人而调整网站也有其弊端,那就是对那些人来说,它可能太有吸引力了。我非常清楚 Hacker News 有多么令人上瘾。对我以及许多用户来说,它是一种虚拟的城市广场。当我想从工作中休息一下时,我会走进广场,就像我在现实世界中走进哈佛广场或大学大道一样。[ 7 ] 但网上广场比实体广场更危险。如果我在大学大道上闲逛了半天,我就会注意到。我得走一英里才能到那里,而且坐在咖啡馆里的感觉与工作不同。但访问在线论坛只需单击一下,而且表面上感觉很像工作。你可能在浪费时间,但你并没有闲着。互联网上有人犯了错误,而你正在解决问题。
Hacker News 绝对有用。我从 HN 上读到的东西中学到了很多东西。我写了几篇文章,都是从那里的评论开始的。所以我不希望这个网站消失。但我想确保它不会对生产力造成净拖累。那将是多么大的灾难啊,吸引成千上万的聪明人来到一个让他们浪费大量时间的网站。我希望我能 100% 确定这不是对 HN 的描述。
我觉得游戏和社交应用的成瘾性仍然是一个尚未解决的问题。现在的情况就像 20 世纪 80 年代的毒品问题一样:我们发明了非常容易上瘾的新事物,但我们还没有找到保护自己免受其害的方法。我们最终会找到的,这也是我希望接下来关注的问题之一。
笔记
[ 1 ] 我尝试根据评论得分的平均值和中位数对用户进行排名,平均值(去掉高分)似乎更能准确预测高质量评论。但中位数可能更能准确预测低质量评论。
[ 2 ] 我从这个实验中学到的另一件事是,如果你要区分人,你最好确保你做得正确。这是快速原型无法解决的一个问题。
确实,这是不歧视不同类型人的理性诚实论据。不歧视的原因不是因为每个人都一样,而是因为做错事不好,做对事很难。
[ 3 ] 当我发现严重链接劫持的帖子时,我会用他们复制的 URL 替换 URL。经常劫持链接的网站会被禁止。
[ 4 ] Digg 因缺乏透明度而臭名昭著。问题的根源不在于运营 Digg 的人特别狡猾,而是他们使用错误的算法来生成首页。不像 Reddit 那样,随着获得更多投票,故事会从底部冒出来,而是从顶部开始,然后被新来者推到底部。
造成这种差异的原因在于 Digg 源自 Slashdot,而 Reddit 源自 Delicious/popular。Digg 是 Slashdot 的衍生版,但有投票功能而非编辑功能,而 Reddit 是 Delicious/popular 的衍生版,但有投票功能而非书签功能。(从它们的图形设计中,你仍可以看到它们的起源。)
Digg 的算法很容易受到欺骗,因为任何登上头版的新闻都会成为新的头条新闻。这反过来又迫使 Digg 采取极端的反制措施。许多初创公司都对早期不得不采取的诡计有所隐瞒,我怀疑 Digg 的诡计在于头条新闻实际上是由人类编辑选择的。
[ 5 ] 《瘪四与大头蛋》中的对话大部分都是由这些内容组成的,当我阅读一些非常糟糕的网站上的评论时,我可以从他们的语气中听到这些内容。
[ 6 ] 我怀疑阻止愚蠢评论的大多数技巧尚未被发现。Xkcd 在其 IRC 频道中实施了一个特别聪明的技巧:不允许重复相同的事情。一旦有人说“失败”,就没有人可以再说一遍。这尤其会惩罚短评论,因为它们没有太多空间来避免冲突。
另一个有前途的想法是愚蠢过滤器,它就像一个概率垃圾邮件过滤器,但是是在愚蠢和非愚蠢评论的语料库上进行训练的。
您可能不必删除不良评论来解决问题。长帖底部的评论很少见,因此在评论排序算法中加入质量预测可能就足够了。
[ 7 ] 大多数郊区令人沮丧的原因是,没有可以步行到达的中心。
感谢Justin Kan、Jessica Livingston、Robert Morris、Alexis Ohanian、Emmet Shear 和 Fred Wilson 阅读本文草稿。
对这篇文章作出评论。