AIに「温故知新」ができないとき – ビジネスの現場における、コールドスタート問題の解決策


紀元前6世紀に孔子が語った「温故知新」ということばは、2,500年の年を経て新たな価値を得ました。昔の事をたずね求め(=温)て、そこから新しい知識・見解を導く(*)というこの熟語は、人間の生き方を指し示すだけでなく、現在実用化されている多くのAI(機械学習)アプリケーションの基本原理も説明しています。つまり、データの学習に基づく新しい事象への対応です。

しかし、AIアプリケーションは人類とは違い、世代を超えて連綿と知識をつないでいるわけではありません。あくまでプログラムですから、1つ1つが個別に、ある日突然稼働して、ゼロからデータを学習していきます。このため、データの学習が十分にできていない稼働初期には、望まれる成果を出せない「コールドスタート」とよばれる問題を引き起こします。

コールドスタートは機械学習に関する技術的な課題ですが、今回はビジネスの立場から、レコメンドエンジンを例にコールドスタート問題とは何かを考え、回避策をご紹介ていきたいと思います。

 

ビジネス環境で起こるコールドスタート問題

例えば、あらかじめ「ネコ」や「イヌ」とラベルが張られた画像を学習し、未知の写真でもそれが何かを推測する画像判別システム。例えば、ユーザーの行動情報を学習し、ユーザーの次のニーズを推測するレコメンドエンジン。AI搭載と呼ばれるアプリケーションやサービスは様々ですが、大半が、与えられたデータを学習して未知の事象に対応できるように設計されています。データがなければ、結果を出すことはできません。

画像判別システムの場合、事前にデータセット(例えば動物画像集のようなもの)で学習させてからリリースすることもできるでしょう。しかし、レコメンドエンジン(より広義には、パーソナライゼーションシステム)のように企業が自社のECサイトなどで利用するAIアプリケーションの場合、十分な学習ができていないコールドスタート状態のままリリースせざるを得ない場合が多々あります。

 

 

まず、レコメンドエンジンが事業者が運営するサイト(或いはアプリ)に導入された時点で、AIはそのサイトにアクセスするユーザーの情報も、サイトが提供する商材(アイテム)の情報も持っていません。

導入前に残されていたデータ、例えば過去のPOS情報などを使って事前学習させることもできますが、最新のビジネス状況が反映されていなかったり、正しく整備されていないデータでは、十分かつ高速な学習(=レコメンド精度向上)は困難です。

もうひとつ、事前に他の類似ビジネスで生成されたデータ(つまり、他社の販売履歴データ)から学習できるかというと、それは技術以前に法と倫理が許しません。また、仮にできたとしてもサイトごとにアイテムやユーザーは異なり、データの傾向もまた異なりますから、単純に他から転用すれば精度が出るというものでもありません。

 

では、コールドスタートの状態で導入したレコメンドエンジンを使って、ユーザーに何をおすすめすればいいのでしょうか? もちろん、当初はアイテムの表示枠を隠し、予測精度が上がるまで学習のみを行わせることもできます。しかし、学習はインタラクション(アイテムの提示とクリック)が多ければ早まりますし、導入した以上コストがかかっているのですから、何もレコメンドしないのは、“もったいない”です。

 

 

コールドスタートを軽減する方法

シルバーエッグ・テクノロジーは、自社のAI搭載レコメンドサービス『アイジェント・レコメンダー』の運用を通して、このコールドスタート問題に長く取り組んできました。現在、問題を軽減する多くの方法論が生み出され、機能として実装されています。その例を紹介しましょう。

 

商品カテゴリー情報などの活用

アイジェント・レコメンダーは、協調フィルタリングというアルゴリズムをベースに、複数の機械学習技術を組み合わせて構成されています。基本的には、多くのユーザーの行動情報(どのアイテムページを見て、コンバージョンしたか)が蓄積されればされるほど、予測精度は上がってゆきます。

ただ、それほど情報が蓄積されていない段階では、まずざっくりと「商品カテゴリー」の枠で推測を行うこともできます。「このカテゴリーの商品を見ているのだから、同じカテゴリー内で別の商品を掲示してみよう」というやりかたです。これは比較的シンプルなレコメンドの方法論で、人間にも直感的に分かりやすいものです。精度的には、行動情報分析に劣る場合がほとんどですが、初期はこれによって顧客に一定水準のサービスを提供し、同時にデータの蓄積でAIを学習させることができます。

 

このほか、アイジェント・レコメンダーには、ユーザーの閲覧情報と、サイト内で検索された用語の相関関係から予測を行うアルゴリズムも搭載されています。こちらも、導入初期の補填的なアルゴリズムとして有効な場合があります。

 

画像認識・文章意味解析技術の活用

アイジェント・レコメンダーには、「画像認識レコメンド」「トピックレコメンド」と呼ばれる、副次的なAIレコメンド機能が実装されています。前者はニューラルネット技術で似た画像を推測する機能です。後者は「トピックモデル」と呼ばれる、文章に含まれる単語群の背景にあるトピック(話題・テーマ)を分析し、文章全体の意味や傾向を高精度で推測するテキスト分析機能です。

この2つの手法では、カテゴリーの枠を飛び越えて「見た目が似ている商品」「テイストの似ている商品」をレコメンドすることができます。しかし、いずれもコンテンツの情報に頼る手法であって、ユーザーに関する深い分析はありません。

 

レコメンドエンジンの方法論としては、行動情報ベースの機械学習が最も実用的で高精度であると、私たちは考えています。しかし、このような別の機械学習技術を用いたコンテンツベースのレコメンドを組み合わせることで、コールドスタートの状況であっても十分実用的なレコメンドが可能になります。

 

リアルタイム購買ランキング

アイジェント・レコメンダーは、リアルタイムでユーザーの行動情報を収集し、学習しますが、この仕組みを使っていま何が売れているかをリアルタイム集計することもできます。このリアルタイム販売ランキングの上位商品をレコメンドの枠に表示させ、コールドスタート問題を緩和させることができます。

要は「いま人気の商品」をお勧めしているわけで、これは機械学習でもなんでもないと言われてしまうかもしれません。でも、この“リアルタイムで”という点が、大きなインパクトを持っています。

 

「いまテレビで芸能人が着ていた服が欲しい」「きょう発売の雑誌で出た小物が気になる」「Twitterでリツイートされている漫画が読みたい」……こういった突発的なマイクロブームによって、消費者の行動は大きく左右され、突然予測もしなかったアイテムが売れ始めます。でも、その結果を翌日になって集計し、「おすすめ品」と出しても、さほど売れないでしょう。いまこの瞬間に、多くのユーザーが関心を持っているものをさっと目の前に出すことができれば、高い確度で購買行動を促すことができます。

単なる売上ランキングではなく、リアルタイムのランキングであるからこそ、この機能はコールドスタート問題の緩和策として高い効果を発揮します。

 

 

以上、レコメンドエンジンのコールドスタート問題に対する、主要な対策方法を紹介しました。今回紹介した対策は、用途によってはそれ単体でも価値のあるサービスになっており、シルバーエッグではニーズに応じて機能を提供しています。

コールドスタートとは、ある種の機械学習アルゴリズムに起因する普遍的な問題ですが、ビジネスレベルでは、その解決方法はアルゴリズム以外の部分にあります。ビジネスの目的や環境に応じて、まったく別のアルゴリズムを持ってくることもあれば、機械学習ですらない機能を使うこともあります。その判断は、技術とビジネス、両方に精通した人間が行わなければなりません。

 

アイジェント・レコメンダーは、独自の高精度AI技術に加え、実戦的なビジネスの場で試された様々な要素技術をコンサルタントが適切な提案を行うことで、ビジネスサービスとしての総合的な品質を担保しています。その総合力の高さを、ぜひ試してみてください。

 

 


*Oxford Languagesより



シルバーエッグ・テクノロジーの最新のニュースや導入事例等は、メールマガジンでもご紹介しております。

メールマガジンの配信をご希望の方は、下記お問合せフォームよりご連絡下さい。

また、製品に関するお問合せや導入のご相談は、下記お問合せフォームおよびお電話にて承っております。

お問合せはこちらから

おすすめコンテンツ

 

ブログ一覧へ

このページの先頭へ