2015年08月19日

ビッグデータとAIは新しい消費市場を作りつつある

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の19回目です。


ビッグデータとAIは新しい消費市場を作りつつある

人工知能ブーム再燃の真実(その4)


 前回、「人類が生み出した超知能(神)が次の宇宙を生み出す??」など、究極のぶっ飛んだお話を書きました。今回は企業が保有するビッグデータの流通の話題などに大きくシフトしようかとも思いましたが、私自身、人工知能に再び取り組んでおり、健全に活用するスタンスの取り方が確定しきっていないので、引き続き現在の人工知能ブームに対して、様々な角度から冷静な目線を向けてみたいと思います。

20年前に予言されていた? ビッグデータによるシンギュラリティ

 昨今、急激に脚光を浴びている「超知能が全人類知を凌駕する」シンギュラリティに似た議論(その後見つけた例)は、30年位前にもありました。当時、自律的、自発的に学習する本格的な人工知能がなかなかできそうにないため、片端から機械に知識を詰め込んでやれば、いつか詰め込んだ以上の知識を類推などで学習できるようになるのでは、という意味での「臨界点」を目指す動きがありました。

 2つ前の連載の2ページ目「大規模知識ベースという副産物を生んだ当時の研究」でご紹介した、常識・知識ベース解プロジェクトの1つ、Cyc のDouglas B. Lenat教授は、(知識)量の違いが質の違いを生むと主張していました。FGCS第五世代コンピュータ国際会議の1つで、 Lenat教授は講演の最初に、「いつ機械は学習し始めるか?」(“When will machine learn?”)と大きく板書。その後、数10分、Cycプロジェクトの内容を紹介した後、当時のタイムスケジュール、ロードマップを聴衆が期待し始めたタイミングを狙って、

「199x年y月z日」と板書しました。

 すみません、確か、1994年12月あたりだったかと思うのですが、記憶、記録が定かでないので変数のままとさせてください。ポイントは、それがCycプロジェクトの(当時の)完了予定日であり、その日こそ、新規に人手で追加投入した知識量以上に機械が学び始める臨界点(割と堅実なシンギュラリティの定義と言えるでしょう)だ、とLenat教授が主張したところにあります。

 確かに、多様で膨大な常識・知識のストックがないと、新たに投入された記述から知識、情報(事実や意見)を取り込むことはできません。例えば次の例文を考えてみましょう:

例:彼は吠えて飛びかかってきた動物と向き合わざるを得なかった。

 「彼」は通常は人間の男性のことであり、人間は通常「吠えない」という知識を使って初めて、上記例文の中で「吠えた」のは「彼」でなく「動物だ」と判断できます。この知識がなければ、彼が吠えて、その後で、動物と向き合ったのかもしれないという可能性を排除できません。この曖昧さは、構文解析という、文の構造解析の結果に含まれる曖昧さなのですが、構文解析を正しく遂行するだけでも、膨大な量の常識知識を適切に表現して、正しく活用する必要がありそうです。また、それがかなり膨大になりそうであり、人間だからといっていつも正しく適切に知識をコンピュータに教えられるとは限らない。

 当時から、機械が常識を獲得できるようになるには何か大きなブレークスルーが必要だ、と感じていたのをお察しいただけるかと思います。もちろん、主に手動による知識のコーディングとその洗練、一定ボリュームになるまで歯を食いしばって実行する必要性を、天才人工知能研究者の名をほしいままにしたLenat教授らが確信していた事実は尊重されてよいでしょう。また、実際どの程度の量の知識を集めればよいのかをもっと研究すべしとか、人間の学習を真似るにはどの程度、人間と同様の脳の仕組みを真似る(=“強いAI”の発展)必要があったかとか、もっと執拗に追究すべきなのかもしれません。大規模知識ベース開発と並行して。

なぜ今、人工知能や高度な分析力がブームに? 〜ビジネス現場のニーズから考える

 現在なぜ、人工知能に関心と期待が集まっているのでしょうか? 前回までは、データ量や計算機の能力が何桁も増大したこと、また雌伏20年、当時の若手研究者が研究指導者になって、怖いもの知らずの若者に「取りあえず計算量のことは気にしなくてもいいから多層(4層以上)のニューラルネットで画像認識をやってみてくれ」などと示唆したなどのせいでブレークスルーが達成できてしまった、という事情もあるでしょう。

 しかし、全体としては「必要は発明の母」、ニーズの高まりが技術開発を促した側面が大きいように感じます。最大のポイントはやはり、ビッグデータ。昨年前半くらいまでに、大量データの収集とその“お掃除”、データの形式や網羅性の追求整備が進んだけれど、まだそれをあまり活かせていない。活かすためには、人手でも機械でも分析ができればよいのですが、本当にビッグデータなので、やはり全部は見きれない。目視できた範囲でも、それだけでは経営戦略に重大な影響を与える「何かを発見しろ!」「アイディアを出せ」と言われても何も出てこない。

 そこで、様々な角度で解析し、絞り込み、クロス集計などをかけるという統計的手法などを駆使してみたりします。しかし、次の場合は、人工知能的でない手法ではなかなか自動化が進みませんでした:

  • 元データが数値データではなくテキストや画像、音声などの不定形データの場合
    →人に代わって文章を代読したり、画像や動画中の物体や動きを認識する能力が必要
  • 数万〜数千万の生データを走査して、潜在するパターンや法則を発見する
  • どんなデータであるか皆目分からない大量データを自動分類し何らかの傾向、意味付けを与える

などなど。

 一方、マーケティング上、重要な役割を担うようになってきたソーシャルメディアを眺めてみたとき、例えばフェイスブックがその利便性、(企業にとっての)付加価値を高めるために、高精度な顔画像の自動認識を備えているのも重要です。これなどは、手動で友達をひもづけるインタフェースの上に、デフォルト(既定値)として自動認識結果が補完されかけているようにした、なかなか巧みな仕組みです。かつては人間にしかできなかった顔認識を自動化することで、友人、人間を「奴隷」のように機械に奉仕させることを回避できている、といえます。

 ゲーム中毒や個人情報の悪用問題など、IT自身の生み出した負の側面への対抗策にも、もはや人力では無理であり、ITをもってITを制するしかないのは、AIの懐疑派も認めるところではないでしょうか? まだまだ、出てきたばかりの新しい機能群のもたらす負の側面をコントロールしきるところまではいきません。しかし、このようなネガティブな気持ちになる作業を人が膨大な時間をつかって奴隷のように働くわけにはまいりません。やはり、人間の代行がある程度可能なAI的なITによって対応する、いわば、毒をもって毒を制する、というとになるでしょう。こんな表現ならば、IT懐疑派には歓迎されそうな気もいたします。

生活現場の興味・好奇心がロボットや人工知能に向かう

 モノは溢れかえり、サービスも、消費者のアテンションや時間、ひいてはお金を奪おうと手ぐすね引いてくれる。ウェブ検索を毎日行って情報や知識にアクセスする人々は必ずしも多数派ではなく、ソーシャルメディアの「友人」や、アマゾンをはじめとするECのソーシャルフィルタリングやレコメンデーションに従って、あまり考えずに買い物をして楽チンがしたい。でも時に、時間を節約しすぎて意図せざる商品が届き、失敗を悔やむ。

 こんな生活を続けていると、「あーあ、もっと自分の意図を賢く察してくれる忠実な召使いはいないものか? できればフレンドリーで、忍耐強く、優しくて、面白い奴が良いな!」と考えると、以前ご紹介したアマゾン製の円筒のようなロボットや、流行り始めたソフトバンクのPepperのパーソナル版が出てこないか、などの期待が募ってくることでしょう。

 TVからネットへ、という流れは、消費者、一般大衆が常に能動的に情報にアクセスしコントロールする方向へシフトしていることを必ずしも意味しません。周りの人もネットのサービスで連絡や相談をするようになったから、と引きずられて、何となく自然にネットを使うようになったユーザーも千万人単位でいるわけです。そんなユーザーは、少なくとも疲れている時、寛ぎたい時くらいは受け身でネットと接したいことでしょう。

 普段シビアにネットを使いこなしているヘビーユーザーだって同じかもしれません。TV時代のように、受け身で楽チンに接するあり方がそのままネットに移行するためには、現在のPCや、検索エンジンのインタフェースでは受け止めにくいわけで、そこに音声認識や対話型のスマホの新しいインタフェースが大発展する素地があります。そして、先ほどのロボットのような専用デバイスが大市場を築く可能性も大いにあります。

 先の連載の「クリックなしのネットショッピングをロボットが実現」 でご紹介した米アマゾンのEchoは、そのあたりのニーズの本命をずばり捕えている可能性があります。珍奇だからといって敬遠する理由はないでしょう。

マーケティングとしての「強いAI」

 私は一貫して「弱いAI」すなわち、人間の能力を拡大したり、人間と協力し合って互いの得意な能力を出し合って対話的に問題を解決するという人工知能を推進するという立場をとってきました。ところが、先のロボットでも、さりげなくアシストしてくれて楽チン、というのではなく、いかに人間らしく振る舞うかとか、人間の子供がするようなことが出来たり、わがままやジョークを言ったり、ということにも人々の多大な興味が集まります。

 これなどは、「見世物としてのAI」、「娯楽のためのAI」と呼ぶべきかもしれません。しかし、市場としてバカにできない大きさになる可能性があります。ゲームの裏側にAI的なプログラムがいるのも、ある意味自然です。一人だけで麻雀はできないので、他の3人のプレーヤーを用意してくれるプログラムは20年前からありました。プレーヤーに個性を持たせ、互いに喧嘩させることで「裏で3人が通じ合って八百長などしていない」ことを演出しているかのような麻雀ソフトもあったように思います。

 本物の人間並みのバリエーションで対話したり、本物の感情を持つには至らない対話ロボットであっても特定の個性的なキャラを持たせて、複数参加させることで時に予期せぬ(事前にプログラミングしきれない)対話の展開を生じさせることがあり得ます。直接のご利益や有用性はなかなか得られないかもしれませんが、少なくとも見ていて楽しい、3人以上の対話に参加して楽しい、という人間にとってのメリットは考えられるでしょう。

 翻って、NHKの「ネクストワールド」のような番組が高い視聴率をとって話題になるのも、1つには強いAI、人間みたいな知性を感じさせる技術、設計、デザインそのものに視聴者が大きな興味を持つからでしょう。この意味で、「強いAI」という、もともと科学技術、研究開発の方向性の哲学だったものがマーケティングの有望な概念としても機能していることが分かります。

 人工知能ブーム再燃の真実、まだ続きます。本稿末尾の負の側面として、「メタファの暴走」の話や、AIとは思われてこなかった機械学習の話、また、AI的な手法を用いながら全然そのように見えない、見せない問題解決の局面などご紹介してまいりたいと思います。



posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic