シルバーエッグ・テクノロジー CEO トム・フォーリーの語る、レコメンドサービスの歴史

Netflix Update: Try This at Home – Thomas Foley

シルバーエッグ・テクノロジー株式会社

代表取締役社長 & CEO

トーマス・アクイナス・フォーリー

21世紀に入り20年近くが経ったいま、私たちがお気に入りのショッピングサイトを訪れると、「あなたにおすすめの商品」が表示されるのは当たり前のことになっています。

しかし、個人ごとに内容がカスタマイズされた、つまりパーソナライズされたレコメンドサービスが登場したのは、それほど昔のことではありません。事実、ゼロ年代後半でも、オンラインでのレコメンデーション・システムは革命的な新機能だと思われていたのです。

機械学習技術の代表的な活用例として知られるレコメンドサービスを理解するため、その歴史を簡単に振り返ってみましょう。

「おすすめ」機能のはじまり

インターネットの黎明期、コンピューターシステムがユーザーひとりひとりにカスタマイズされたレスポンスを行うためには、複雑なプログラムを書くか、「エキスパートシステム」を利用するぐらいしかありませんでした。これらの手法は概して実用的といえるものではなく、インターネットユーザーの「何かを見つけたい」というニーズに対しては、検索エンジンが解決策の役割を担うこととなりました。

しかし、検索とはユーザーからのコマンドを受けて作動する受動的な機能です。「おすすめ」という本質的に能動的な提案を実現するために、初期のレコメンドサービスは、検索されたキーワードに紐づく複数のアイテムを並べて表示するといった工夫をしていました。残念ながらこういった「コンテンツベース」のレコメンデーション・システムは、あまり便利と言える物ではありませんでした。

1990年代後半、とあるオンライン書店が「協調フィルタリング」に基づく新しい種類のレコメンデーション・システムを開発し、提供し始めます。このシステムによって、それまでよりはるかに簡単に、楽しく、欲しい本を見つけられるようになりました。レコメンドサービスの持つ高い競争力によって、この書店、Amazon.comは、瞬く間にオンライン書店市場を席捲していきました。その後、Amazonがどうなったかは語るまでもありません。

協調フィルタリング技術の普及

機械学習手法の一つとして数えられる「協調フィルタリング」は、ゼロックス・パロ＝アルト研究所の“タペストリー”(Tapestry)プロジェクトの産物です。研究者たちは、複数のユーザーが持つ情報を自動的に参照しあって働くシステムを研究していました。例えば、人々が「バイアグラ」のようなキーワードを含むメールをどう処理したかを学習し、Eメールのフィルタリング条件を自動でセットするようなシステムです。

こうしたアイデアは、ミネソタ大学の研究者によって拡張され、映画の評価システムに用いられるようになりました。彼らの “Movie Lens”プロジェクトは、同じような映画の評価をおこなうユーザー傾向から、あるユーザーが好む映画を推測することができました。

あるアイテムに関心を持つ人々は、それに類似したアイテムも好む可能性が高い――この基本的なアイデアが、Amazonの強大なアドバンテージとなりました。Amazonは「好み」の指標として、「星の数」で示されるような明示的レーティングに頼るのではなく、ユーザーが何を閲覧し、何を購入したかという黙示的なレーティング情報を用いることにしました。これが、現代的な商用レコメンデーション・システムの始まりです。

さらにもう1社、レコメンデーション技術を持つ有力な企業が登場します。Netflixです。

2006年、Netflixは自社のレコメンデーション・システムを改善したチームに100万ドルの賞金を与えるというコンテストを始めました。当時、Netflixは映画のDVDを郵送して貸し出すというビジネスを行っており、在庫になりがちな「ロングテール」のアイテムをより多くの顧客が借りるようになれば、大規模な収益向上が実現できると考えていたのです。

賞金につられた研究者たちが続々と現れ、レースが始まりました。そのさなか、ハンドルネームSimon Funkと名乗る人物が、取得できないレビューの値を行列分解によって補完する手法を示しました。この行列分解は、レコメンデーションの主要技術のひとつとなっていきました。

より高度なレコメンドを目指して

Netflixのコンテストが始まった翌年の2007年から、最先端のレコメンデーション技術を披露しその進歩を確かめるために、ACM RECSYSと呼ばれる世界中の研究者が一堂に集うイベントが毎年開催されるようになりました。レコメンデーションとは本質的にシンプルな問題ですが、だからこそ、多岐にわたる興味深い研究の結節点として、いまも議論が深められています。行列分解はニューラルネットワークや深層学習（ディープラーニング）だけでなく、グラフのランダムウォーク現象やネットワーク理論などにも、密接に関係しています。

「購買」や「閲覧」のような行動のシグナルは、顧客の嗜好を予測するうえで最も信頼性の高い情報ですが、いま、研究者はふたたび「サイド情報(side-information)」の活用に注目しています。例えば、コンテンツの類似性やソーシャルネットワーク上の情報などです。これらをどう適切に組み合わせ、レコメンデーション・システムの予測精度を向上できるかが研究されています。

まとめ

レコメンデーション・システムは、短くとも密度の濃い発展の歴史をたどってきました。そしてこれからも、さまざまな研究がなされてゆくでしょう。ただ、つぎのことだけははっきりと言うことができます。Amazonが示したとおり、人々の好みを予測しそれを見つける手助けをすることが、オンラインビジネスの成功の鍵なのです。そしてこれは、オンラインビジネスとオフラインビジネスの境界が薄れゆく今後も、変わらないでしょう。