ハッカーニュースから学んだこと
Original2009年2月
ハッカーニュースは先週で2周年を迎えました。当初は副業として - Arcを研ぐためのアプリケーションと、現在および将来のY Combinatorの創業者が情報を交換する場所として - 始まったものです。予想以上に大きくなり、より多くの時間を費やすことになりましたが、そこから多くのことを学べたので後悔はしていません。
成長
2007年2月にローンチした時は、平日の1日の訪問者数は約1,600人でした。それが成長し、現在は約22,000人になっています。この成長率はやや高すぎると思います。サイトが成長することは望ましいです。成長しないサイトはおそらく死んでいるでしょう。しかし、Diggやredditほど大きくなるのは望ましくありません。主な理由は、サイトの性格が薄れてしまうことと、スケーリングの問題に時間を取られたくないからです。
そういった問題はすでに抱えています。覚えておいてください、HNの本来の動機は新しいプログラミング言語をテストすることで、しかもそれは言語設計の実験に焦点を当てたものでパフォーマンスではありません。サイトが遅くなるたびに、McIlroyとBentleyの有名な言葉を思い出して自分を奮い立たせます。
「パフォーマンスの鍵は、特殊ケースの大軍ではなく、優雅さにある」
そして、最小限のコードで取り除くことができるボトルネックを探します。これまでのところ、14倍の成長にもかかわらず、パフォーマンスは一貫して中庸なままに保たれてきました。次はどうするかわかりませんが、何か考えつくはずです。
これがこのサイトに対する私の姿勢です。ハッカーニュースは実験であり、まだ若い分野における実験です。このタイプのサイトは数年しか存在していません。インターネットでの会話自体も数十年しか経っていません。したがって、最終的に発見されるものの一部しか発見されていないと思います。
そのため、HNについては非常に楽観的です。技術がこれほど若い場合、既存のソリューションはたいてい酷いものです。つまり、はるかに良いものができるはずだということです。そして、これまでのコミュニティを台無しにしてきた問題、つまり成長によって台無しになるという問題も解決できるはずです。
希薄化
ユーザーはサイトが数か月経った頃からそのことを心配していました。これまでのところ、その警告は的外れでしたが、これからも常に当たるとは限りません。希薄化は難しい問題です。しかし、おそらく解決可能です。オープンな会話が「常に」成長によって破壊されてきたというのは、「常に」が20件しかないからにすぎません。
しかし、新しい問題を解決しようとしていることを忘れないでください。つまり、新しいことを試さなければならず、ほとんどが機能しないということです。2週間前に、平均コメントスコアの高いユーザーの名前をオレンジ色で表示するのを試してみました。[1] それは間違いでした。これまでほぼ団結していた文化が、「持っている人」と「持っていない人」に分断されてしまいました。文化がどれほど団結していたかを、それが分断されるのを見て初めて気づきました。それを見るのは痛かったです。 [2]
なので、オレンジ色のユーザー名は復活しません。(申し訳ありません。)しかし、同じように壊れたように見える考えが将来出てくるでしょう。そして、うまくいくものは、うまくいかないものと同じくらい壊れたように見えるかもしれません。
希薄化について学んだ最も重要なことは、それはユーザー数よりも行動で測られるということです。悪い人を排除するよりも、悪い行動を排除することが大切です。ユーザーの行動は意外に変化しやすいものです。期待されれば良い行動をする傾向にあり、逆もまた然りです。
もちろん、悪い行動を禁止すれば、自分が制約されることに不快感を感じる悪い人も排除される傾向にあります。しかし、この方法は穏やかで、おそらく明示的な障壁よりも効果的です。
コミュニティサイトにも「窓ガラス割れ理論」が当てはまるのは明らかです。この理論は、軽微な悪い行動が悪質な行動を誘発するというものです。落書きや割れた窓ガラスが多い地域では、強盗が起きやすくなります。ギュリアーニ市長がこの理論に基づいた改革を行った際、ニューヨークの変貌ぶりは驚くべきものでした。そして、redditでまさに逆のことが起きたのを目の当たりにしました。その変化ぶりも同様に劇的でした。
私はSteve氏とAlexis氏を批判しているわけではありません。redditに起きたことは、放置されたからではありません。最初から、スパムを除いて何も検閲しないというポリシーがありました。そもそもredditとハッカーニュースの目的は異なります。redditは成長を最優先するスタートアップでしたが、ハッカーニュースは副業プロジェクトです。急成長と完全な検閲なしの組み合わせが、無秩序な状態を生み出したのです。しかし、もし同じことをやり直すとしても、彼らはあまり違うことはしないと思います。トラフィック数で測れば、redditはハッカーニュースよりはるかに成功しています。
しかし、redditに起きたことがHNにも必ず起きるわけではありません。ローカルな極大値は複数存在します。無秩序な場所と、より思慮深い場所が共存できるのと同じように、人々の行動も場所によって変わります。
私は野生の中でそれを観察してきました。redditとハッカーニュースに同時に投稿する人がいて、redditには煽情的なバージョン、HNには控えめなバージョンを書き分けていることを見たことがあります。
投稿
ハッカーニュースのようなサイトが避けるべき主な2つの問題は、悪質な記事と悪質なコメントです。これまでのところ、悪質な記事の危険性の方が小さいようです。現在のフロントページにある記事は、HN開設当初にあったものとほぼ同じです。
以前は、クソみたいなものがフロントページに上がらないよう投票に重みをつけなければならないと思っていました。しかし、それをする必要はまだありません。フロントページがこれほど健全に保たれるとは予想していませんでした。なぜそうなっているのかよくわかりません。おそらく、より思慮深いユーザーだけが熱心に投稿やアップボートをしているので、新規ユーザーの影響がほとんどないのかもしれません。あるいは、フロントページ自体が、期待される投稿の種類を示しているからかもしれません。
フロントページにとって最も危険なのは、投票しやすすぎるものです。新しい定理を証明した場合、読者がそれを評価するには労力が必要です。面白いカートゥーンはそれほど労力がかかりません。タイトルがスローガンのようなランティングは、読まずに投票されてしまいます。
これが私が「フラフ原則」と呼ぶものです。ユーザー投票型のニュースサイトでは、判断しやすいリンクが支配的になります。これを防ぐための対策が必要です。
Hacker Newsには2つの防御機構があります。フラフなリンクの多くはオフトピックとして禁止されています。子猫の写真や政治的な論説などです。これでほとんどのフラフは排除できますが、すべてではありません。トピックに関連していても短いリンクもフラフと見なされます。
これに対する単一の解決策はありません。単なる空虚なランティングの場合、知的好奇心を刺激しないため、トピックに関連していても削除されることがあります。サイトの投稿がこのタイプ特徴的な場合は、そのURLからの新規投稿を自動的に削除することもあります。リンクのタイトルがリンクベイトの場合、編集者が事実的な表現に書き換えることもあります。これは特に、「このような信念を持っていれば投票してください」というタイトルの場合に必要です。
リンクへの対処方法は進化し続ける必要があります。アグリゲーターの存在がすでに集約されるコンテンツに影響を与えています。ライターたちは今では意図的にアグリゲーターからのトラフィックを集めるようなものを書いています。さらに悪質なのが、リンクジャッキングと呼ばれる手法で、他人の記事を要約したものを投稿するというものです。これは多くの投票を集めることができます。記事の良い部分が残っているためです。
私は、投稿を削除するサイトでは、ユーザーが削除された投稿を見られるようにすることが重要だと考えています。これにより編集者の誠実性が保たれ、編集者が誠実でなくなった場合でもユーザーが知ることができます。Hacker Newsでは、ユーザープロフィールの「showdead」スイッチをオンにすることで、削除された投稿を確認できます。
コメント
悪質なコメントは、悪質な投稿よりも難しい問題のようです。Hacker Newsのフロントページのリンクの質は大きく変わっていませんが、平均的なコメントの質は低下しているかもしれません。
コメントの悪質さには2つの主な種類があります。攻撃性と愚かさです。この2つは重複することが多く、攻撃的なコメントは愚かなものになりやすいのですが、対処方法は異なります。攻撃性は比較的コントロールしやすいです。攻撃的であってはいけないという規則を設け、それを実施すれば抑えられるようです。
愚かさをコントロールするのは難しいかもしれません。攻撃的な人は自分が攻撃的であることをよく知っているのに対し、愚かな人は自分が愚かであることを知らないことが多いからです。
最も危険な形態の愚かなコメントは、長い間違った議論ではなく、愚かなジョークです。長い間違った議論はかなりまれです。コメントの質と長さには強い相関があり、コミュニティサイトのコメントの質を比較する場合、平均の長さが良い指標となります。これは人間の性質によるものであって、コメントスレッドに特有のものではないと思われます。愚かさは、間違った考えを持つよりも、考えが少ないことの方が多いのかもしれません。
何が原因であれ、愚かなコメントは短い傾向にあります。短いコメントで情報量の多さを示すのは難しいので、人々は代わりに面白さで区別しようとします。最も誘惑的な愚かなコメントのフォーマットは、いかにも賢いと思われる侮辱的なコメントです。これは最も簡単な形の humour だからです。
攻撃性を禁止することで、これらのコメントも減らすことができます。
悪質なコメントはクズのように急速に広がります。新しいコメントに対する既存のコメントの影響は、新しい投稿に対する既存の投稿の影響よりも大きいです。誰かが退屈な記事を投稿しても、他の投稿がそれに影響されることはありません。しかし、スレッドに愚かなコメントが投稿されると、その周辺の雰囲気が決まってしまいます。人々は愚かなジョークにさらに愚かなジョークで返信します。
解決策は、コメントに対する返信に遅延を設け、その遅延の長さをコメントの質の予測値に反比例させることかもしれません。そうすれば、愚かなスレッドの成長を抑えられるかもしれません。
人々
私が説明した手法のほとんどは保守的なものだと気づきました。サイトの性格を維持することを目的としたものであって、それを高めるものではありません。これは私の偏見ではなく、問題の性質によるものだと思います。Hacker Newsは幸運にも当初から良好な状態だったので、ここでは保存が問題なのです。しかし、この原則は他のサイトにも当てはまるでしょう。
コミュニティサイトの良いところは、テクノロジーよりも人々から生まれます。悪いものを防ぐためにテクノロジーが役立つのです。テクノロジーは確かに議論を促進することができます。ネストされたコメントなどがその例です。しかし、愚かなユーザーやトロールがいるサイトよりも、プリミティブな機能でも賢く良いユーザーがいるサイトの方が好ましいです。
したがって、コミュニティサイトにとって最も重要なのは、自分が求めるユーザーを集めることです。可能な限り多くのユーザーを集めたいサイトもありますが、特定のユーザー層を対象とするサイトは、ターゲットとするユーザーだけを集め、それ以外のユーザーを排除することが重要です。私はHacker Newsでこれを意識的に行っています。グラフィックデザインは極力シンプルで、サイトのルールはドラマティックなリンクタイトルを抑制しています。Hacker Newsに初めて訪れた人が興味を持つべきなのは、そこで表現されているアイデアだけです。
特定の人々を引き付けるようにサイトをチューニングするデメリットは、それらの人々にとってあまりにも魅力的になることです。私はHacker Newsがどれほど中毒性があるかよくわかっています。私にとっても、多くのユーザーにとっても、それは一種の仮想広場のようなものです。仕事から休憩を取りたいときは、まるで実際のHarvard SquareやUniversity Aveに行くように、その広場に入っていきます。
しかし、オンラインの広場は実際の広場よりも危険です。University Aveで1日の半分を徘徊していたら、それに気づくでしょう。そこまで行くには1マイル歩かなければならず、カフェに座っているのは仕事とは違う感覚があります。しかし、オンラインのフォーラムにアクセスするのはたった1クリックで、表面的には仕事しているようにも感じられます。時間を無駄にしているかもしれませんが、何もしていないわけではありません。インターネット上で誰かが間違っているのを直しているのです。
Hacker Newsは確かに有用です。HNで読んだことから多くのことを学びました。HNのコメントから始まった数本のエッセイも書きました。だからHNがなくなってほしくはありません。ただし、生産性に対するマイナスにならないよう、確実にしたいと思います。多くの優秀な人々を引き付けるサイトが、彼らの時間を無駄にさせてしまうのは、まさに災害だと言えるでしょう。HNがそのような状況にないことを100%確信したいです。
ゲームやソーシャルアプリの中毒性は、まだ解決されていない問題だと感じています。現在の状況は1980年代のクラックコカインのようなものです。私たちは恐ろしく中毒性の高い新しいものを発明してしまい、それから身を守る方法をまだ進化させていないのです。やがては対処法が見つかるでしょうが、それが私が次に取り組みたい問題の1つです。
注記
[1] ユーザーを平均スコアと中央値スコアの両方で順位付けしてみましたが、外れ値を除いた平均スコアのほうが高品質を予測するのにより正確でした。一方、中央値スコアのほうが低品質を予測するのにより正確かもしれません。
[2] この実験から学んだもう1つのことは、人々を区別するなら、それを確実に正しくやらなければならないということです。これは迅速なプロトタイピングでは機能しない問題です。
確かに、様々な人々を区別しないという知的に正直な議論があります。それをしないのは、皆が同じだからではなく、間違えるのが悪く、正しくやるのが難しいからです。
[3] 露骨なリンクジャッキングを見つけたら、コピーされたものへのリンクに置き換えます。習慣的にリンクジャッキングするサイトは禁止します。
[4] Diggは透明性の欠如で有名です。問題の根源は、Diggを運営する人々が特に抜け目ないからではなく、フロントページを生成するアルゴリズムが適切ではないからです。Redditのように下から上に浮上するのではなく、Diggでは新着記事に押し下げられていきます。
この違いは、DiggがSlashdotから派生し、Redditが Delicious/popularから派生しているためです。Diggはエディターの代わりに投票を使ったSlashdotで、Redditは ブックマークの代わりに投票を使ったDelicious/popularです。(その起源の化石は、彼らのグラフィックデザインにまだ見られます)
Diggのアルゴリズムはゲーミングに非常に脆弱です。フロントページに載った記事は新しい最上位記事になるためです。これがまたDiggに極端な対抗措置を取らせる原因になっています。多くのスタートアップには、初期の日々に頼らざるを得なかった策略に関する秘密があり、Diggの秘密はトップ記事が事実上エディターによって選ばれていたことだと思います。
[5] Beavis and Butthead のダイアログはこれらで大部分を構成されており、本当に悪いサイトのコメントを読むと、その声が聞こえてきます。
[6] 愚かなコメントを阻止する手法のほとんどはまだ発見されていないと思います。Xkcdのチャンネルでは特に賢明な手法を実装していました。同じことを2回言わせないのです。誰かが「fail」と言ったら、二度と誰も言えません。これは短いコメントほど罰が重くなるでしょう。衝突を避ける余地が少ないからです。
別の有望なアイデアはstupid filterです。これは単なる確率的なスパムフィルターですが、愚かなコメントと非愚かなコメントのコーパスでトレーニングされています。
悪いコメントを完全に排除する必要はないかもしれません。長いスレッドの下の方のコメントはほとんど見られないので、コメントの並べ替えアルゴリズムに品質の予測を組み込むだけで十分かもしれません。
[7] ほとんどの郊外が憂鬱なのは、歩いて行ける中心がないからです。
Justin Kan、Jessica Livingston、Robert Morris、Alexis Ohanian、Emmet Shear、Fred Wilsonの各氏に、このエッセイの草稿を読んでいただきありがとうございます。
Comment on this essay.