デザインテクノロジーの最前線 - 桐山孝司

m.c.t.ホーム > エクスペリエンスマガジン > デザインテクノロジーの最前線 - 桐山孝司 > 視覚要素からの検索技術

2006.12.15視覚要素からの検索技術

最近、画像認識技術を利用した検索サービスLike.comが試験的に公開された。このサービスでは、自分が注目している商品の写っている写真を入力すると、それに似た商品をオンラインショッピングのサイトから自動的に探してくれる。例えばトム・クルーズの写真を選んで彼のはいている靴を指示すると、それと同じような色と形の靴がアマゾン・ドットコムなどで検索されて一覧表になって返ってくる。現在のところ検索できるのはシャツ、宝石、靴、ハンドバッグに限定されており、検索の元となる画像もLike.comのサイトに置かれているデモ用のものだけしか選べないが、近くユーザがアップロードした画像も検索に使える予定である。

このLike.comが画期的なのは、テキストによらない検索であることだ。これまでにもGoogleのイメージ検索のように検索結果として画像を返すものはあった。しかしこれはあくまで画像の周辺にあるテキストを見て、入力したキーワードと画像が関連あると判断しているだけで、画像に実際に何が写っているか見ているわけではない。そのためGoogleイメージでは、テキスト検索に比べて画像検索の精度は低い。同じくテキストによらない検索の例としては、iTunesなどにCDから楽曲を読み込んだときに、曲名を検索して表示するGracenoteが有名である。Gracenoteは音楽の波形データから特徴を抽出しているが、Like.comの画像検索はピクセルデータから特徴を抽出しているわけだ。しかもLike.comの検索は似ている画像まで探すという点で、Gracenoteのように完全に一致する楽曲の検索よりも高度である。

実はLike.comは画像認識技術を開発しているRiya(リヤ)社の新ブランドという位置づけだ。Riyaは現在、すでに顔認識を使った写真共有サービスを提供している。ユーザが自分のパソコンにある写真をRiyaにアップロードすると、その過程でRiyaが写真に写っている人の顔を認識してマークする。そして最初にいくつかの写真について、写っている人の顔と名前を対応させておく。すると残りの写真から特定した人物の顔が自動的に認識され、名前を入れるだけでその人の写真が検索できるようになる。精度は決して完全ではないが、顔の向きや光の当たり方が違っても同じ人物と特定できたり、一つの写真に写っている複数の顔を区別できたりするなど、かなり高度な認識をすることができる。

Riyaで使われている技術は、教師つき学習というパタン認識の方法である。パタン認識では、画像からどのような特徴を抽出するかが決め手になる。しかし同じ物でも写し方によって様々なピクセルの並びになってしまうため、具体的にどのような特徴を取り出せばよいかを細部まで人間が考えてプログラム化することは不可能である。そこで大まかな方針を立てたあとは実際に画像認識をさせて、正しい結果を出す確率が高くなるように抽出する特徴やその組み合わせ方を学習させていくことになる。このとき検索に関係する特徴が多ければ、それだけ正しく認識できる可能性も高くなるが、同時に計算も大変になる。Like.comでは一つの画像から10キロバイトにもなる特徴量データを抽出している。そのような写真が何万枚もある中から似ているものを探す検索をリアルタイムで行うには相当の計算能力が必要である。ちなみにLike.comはインテルの4コアCPUのサーバ250台を使って運用しているそうである。そのため理論的には画像検索が可能なことが分かっていても、ようやく最近になって実用レベルで実行できるようになったのである。その意味では、コンピュータの進歩によって不可能が可能になったことの一例といっても良いだろう。

Riya社のCEOであるMunjal Shahは、技術系情報を流しているPodTech.netのインタビューに対して、エステティック分野のオンライン販売はすでに6億ドルの市場になっているが、この分野では探している商品の色や形を言葉にするのが難しく、従来のテキストによる検索では機能しないと指摘している。その問題を解決しようとするLike.comでは、現在対象としているシャツ、宝石、靴、ハンドバッグ以外にも、今後ガーデニングやランドスケープなどに検索を広げる予定とのことだ。また携帯で撮影した画像から商品を検索するなどの使い方も想定しているとしている。

今後もビデオなども含めて従来の検索の枠組を変えるようなサービスが出てくるだろう。Googleが席巻したために成熟したかのように見える検索技術も、実はまだまだ未開拓な分野なのである。

 search_by_appearance