2015年08月19日

ビッグデータとAIは新しい消費市場を作りつつある

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の19回目です。


ビッグデータとAIは新しい消費市場を作りつつある

人工知能ブーム再燃の真実(その4)


 前回、「人類が生み出した超知能(神)が次の宇宙を生み出す??」など、究極のぶっ飛んだお話を書きました。今回は企業が保有するビッグデータの流通の話題などに大きくシフトしようかとも思いましたが、私自身、人工知能に再び取り組んでおり、健全に活用するスタンスの取り方が確定しきっていないので、引き続き現在の人工知能ブームに対して、様々な角度から冷静な目線を向けてみたいと思います。

20年前に予言されていた? ビッグデータによるシンギュラリティ

 昨今、急激に脚光を浴びている「超知能が全人類知を凌駕する」シンギュラリティに似た議論(その後見つけた例)は、30年位前にもありました。当時、自律的、自発的に学習する本格的な人工知能がなかなかできそうにないため、片端から機械に知識を詰め込んでやれば、いつか詰め込んだ以上の知識を類推などで学習できるようになるのでは、という意味での「臨界点」を目指す動きがありました。

 2つ前の連載の2ページ目「大規模知識ベースという副産物を生んだ当時の研究」でご紹介した、常識・知識ベース解プロジェクトの1つ、Cyc のDouglas B. Lenat教授は、(知識)量の違いが質の違いを生むと主張していました。FGCS第五世代コンピュータ国際会議の1つで、 Lenat教授は講演の最初に、「いつ機械は学習し始めるか?」(“When will machine learn?”)と大きく板書。その後、数10分、Cycプロジェクトの内容を紹介した後、当時のタイムスケジュール、ロードマップを聴衆が期待し始めたタイミングを狙って、

「199x年y月z日」と板書しました。

 すみません、確か、1994年12月あたりだったかと思うのですが、記憶、記録が定かでないので変数のままとさせてください。ポイントは、それがCycプロジェクトの(当時の)完了予定日であり、その日こそ、新規に人手で追加投入した知識量以上に機械が学び始める臨界点(割と堅実なシンギュラリティの定義と言えるでしょう)だ、とLenat教授が主張したところにあります。

 確かに、多様で膨大な常識・知識のストックがないと、新たに投入された記述から知識、情報(事実や意見)を取り込むことはできません。例えば次の例文を考えてみましょう:

例:彼は吠えて飛びかかってきた動物と向き合わざるを得なかった。

 「彼」は通常は人間の男性のことであり、人間は通常「吠えない」という知識を使って初めて、上記例文の中で「吠えた」のは「彼」でなく「動物だ」と判断できます。この知識がなければ、彼が吠えて、その後で、動物と向き合ったのかもしれないという可能性を排除できません。この曖昧さは、構文解析という、文の構造解析の結果に含まれる曖昧さなのですが、構文解析を正しく遂行するだけでも、膨大な量の常識知識を適切に表現して、正しく活用する必要がありそうです。また、それがかなり膨大になりそうであり、人間だからといっていつも正しく適切に知識をコンピュータに教えられるとは限らない。

 当時から、機械が常識を獲得できるようになるには何か大きなブレークスルーが必要だ、と感じていたのをお察しいただけるかと思います。もちろん、主に手動による知識のコーディングとその洗練、一定ボリュームになるまで歯を食いしばって実行する必要性を、天才人工知能研究者の名をほしいままにしたLenat教授らが確信していた事実は尊重されてよいでしょう。また、実際どの程度の量の知識を集めればよいのかをもっと研究すべしとか、人間の学習を真似るにはどの程度、人間と同様の脳の仕組みを真似る(=“強いAI”の発展)必要があったかとか、もっと執拗に追究すべきなのかもしれません。大規模知識ベース開発と並行して。

なぜ今、人工知能や高度な分析力がブームに? 〜ビジネス現場のニーズから考える

 現在なぜ、人工知能に関心と期待が集まっているのでしょうか? 前回までは、データ量や計算機の能力が何桁も増大したこと、また雌伏20年、当時の若手研究者が研究指導者になって、怖いもの知らずの若者に「取りあえず計算量のことは気にしなくてもいいから多層(4層以上)のニューラルネットで画像認識をやってみてくれ」などと示唆したなどのせいでブレークスルーが達成できてしまった、という事情もあるでしょう。

 しかし、全体としては「必要は発明の母」、ニーズの高まりが技術開発を促した側面が大きいように感じます。最大のポイントはやはり、ビッグデータ。昨年前半くらいまでに、大量データの収集とその“お掃除”、データの形式や網羅性の追求整備が進んだけれど、まだそれをあまり活かせていない。活かすためには、人手でも機械でも分析ができればよいのですが、本当にビッグデータなので、やはり全部は見きれない。目視できた範囲でも、それだけでは経営戦略に重大な影響を与える「何かを発見しろ!」「アイディアを出せ」と言われても何も出てこない。

 そこで、様々な角度で解析し、絞り込み、クロス集計などをかけるという統計的手法などを駆使してみたりします。しかし、次の場合は、人工知能的でない手法ではなかなか自動化が進みませんでした:

  • 元データが数値データではなくテキストや画像、音声などの不定形データの場合
    →人に代わって文章を代読したり、画像や動画中の物体や動きを認識する能力が必要
  • 数万〜数千万の生データを走査して、潜在するパターンや法則を発見する
  • どんなデータであるか皆目分からない大量データを自動分類し何らかの傾向、意味付けを与える

などなど。

 一方、マーケティング上、重要な役割を担うようになってきたソーシャルメディアを眺めてみたとき、例えばフェイスブックがその利便性、(企業にとっての)付加価値を高めるために、高精度な顔画像の自動認識を備えているのも重要です。これなどは、手動で友達をひもづけるインタフェースの上に、デフォルト(既定値)として自動認識結果が補完されかけているようにした、なかなか巧みな仕組みです。かつては人間にしかできなかった顔認識を自動化することで、友人、人間を「奴隷」のように機械に奉仕させることを回避できている、といえます。

 ゲーム中毒や個人情報の悪用問題など、IT自身の生み出した負の側面への対抗策にも、もはや人力では無理であり、ITをもってITを制するしかないのは、AIの懐疑派も認めるところではないでしょうか? まだまだ、出てきたばかりの新しい機能群のもたらす負の側面をコントロールしきるところまではいきません。しかし、このようなネガティブな気持ちになる作業を人が膨大な時間をつかって奴隷のように働くわけにはまいりません。やはり、人間の代行がある程度可能なAI的なITによって対応する、いわば、毒をもって毒を制する、というとになるでしょう。こんな表現ならば、IT懐疑派には歓迎されそうな気もいたします。

生活現場の興味・好奇心がロボットや人工知能に向かう

 モノは溢れかえり、サービスも、消費者のアテンションや時間、ひいてはお金を奪おうと手ぐすね引いてくれる。ウェブ検索を毎日行って情報や知識にアクセスする人々は必ずしも多数派ではなく、ソーシャルメディアの「友人」や、アマゾンをはじめとするECのソーシャルフィルタリングやレコメンデーションに従って、あまり考えずに買い物をして楽チンがしたい。でも時に、時間を節約しすぎて意図せざる商品が届き、失敗を悔やむ。

 こんな生活を続けていると、「あーあ、もっと自分の意図を賢く察してくれる忠実な召使いはいないものか? できればフレンドリーで、忍耐強く、優しくて、面白い奴が良いな!」と考えると、以前ご紹介したアマゾン製の円筒のようなロボットや、流行り始めたソフトバンクのPepperのパーソナル版が出てこないか、などの期待が募ってくることでしょう。

 TVからネットへ、という流れは、消費者、一般大衆が常に能動的に情報にアクセスしコントロールする方向へシフトしていることを必ずしも意味しません。周りの人もネットのサービスで連絡や相談をするようになったから、と引きずられて、何となく自然にネットを使うようになったユーザーも千万人単位でいるわけです。そんなユーザーは、少なくとも疲れている時、寛ぎたい時くらいは受け身でネットと接したいことでしょう。

 普段シビアにネットを使いこなしているヘビーユーザーだって同じかもしれません。TV時代のように、受け身で楽チンに接するあり方がそのままネットに移行するためには、現在のPCや、検索エンジンのインタフェースでは受け止めにくいわけで、そこに音声認識や対話型のスマホの新しいインタフェースが大発展する素地があります。そして、先ほどのロボットのような専用デバイスが大市場を築く可能性も大いにあります。

 先の連載の「クリックなしのネットショッピングをロボットが実現」 でご紹介した米アマゾンのEchoは、そのあたりのニーズの本命をずばり捕えている可能性があります。珍奇だからといって敬遠する理由はないでしょう。

マーケティングとしての「強いAI」

 私は一貫して「弱いAI」すなわち、人間の能力を拡大したり、人間と協力し合って互いの得意な能力を出し合って対話的に問題を解決するという人工知能を推進するという立場をとってきました。ところが、先のロボットでも、さりげなくアシストしてくれて楽チン、というのではなく、いかに人間らしく振る舞うかとか、人間の子供がするようなことが出来たり、わがままやジョークを言ったり、ということにも人々の多大な興味が集まります。

 これなどは、「見世物としてのAI」、「娯楽のためのAI」と呼ぶべきかもしれません。しかし、市場としてバカにできない大きさになる可能性があります。ゲームの裏側にAI的なプログラムがいるのも、ある意味自然です。一人だけで麻雀はできないので、他の3人のプレーヤーを用意してくれるプログラムは20年前からありました。プレーヤーに個性を持たせ、互いに喧嘩させることで「裏で3人が通じ合って八百長などしていない」ことを演出しているかのような麻雀ソフトもあったように思います。

 本物の人間並みのバリエーションで対話したり、本物の感情を持つには至らない対話ロボットであっても特定の個性的なキャラを持たせて、複数参加させることで時に予期せぬ(事前にプログラミングしきれない)対話の展開を生じさせることがあり得ます。直接のご利益や有用性はなかなか得られないかもしれませんが、少なくとも見ていて楽しい、3人以上の対話に参加して楽しい、という人間にとってのメリットは考えられるでしょう。

 翻って、NHKの「ネクストワールド」のような番組が高い視聴率をとって話題になるのも、1つには強いAI、人間みたいな知性を感じさせる技術、設計、デザインそのものに視聴者が大きな興味を持つからでしょう。この意味で、「強いAI」という、もともと科学技術、研究開発の方向性の哲学だったものがマーケティングの有望な概念としても機能していることが分かります。

 人工知能ブーム再燃の真実、まだ続きます。本稿末尾の負の側面として、「メタファの暴走」の話や、AIとは思われてこなかった機械学習の話、また、AI的な手法を用いながら全然そのように見えない、見せない問題解決の局面などご紹介してまいりたいと思います。



posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic

2015年08月05日

2045年、人工知能は人間を追い越す?

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の18回目です。


「2045年、人工知能は人間を追い越す?」

人工知能ブーム再燃の真実(その3)


 今回は、人工知能の進化をめぐる楽観論と悲観論について取り上げてみたいと思います。

 技術的な楽観が、人類にとっての悲観となることがあります。人工知能が人間の知能を追い越して進化するという設定で映画「ターミネーター」では未来世界で機械が人類を抹殺しようとしていました。また、最近の映画「トランセンデンス」では、アップロードされた人格が機械やITインフラを駆使して人間を支配しようとする。つまり、技術的には楽観的になることで人類にとって悲観的な未来を描く向きもあります。天才物理学者のホーキング博士まで、最近、そんな発言をしています。

 もっとも、実際に人工知能の研究開発や応用で苦労してきて、現場の最前線の技術を具体的に知悉している人はどちらかというと正反対の見方、すなわち、人間の素晴らしい能力はそんなに簡単には超えられないから心配には及ばない、と考えてきた人が多いように思います。

 ところが、20年近い沈黙を破って、人工知能研究者自身が超楽観的なストーリーとして、2045年に人工知能の知の総体が人類のそれを追い越し、自らを進化させ、超知能となっていく、といった発言が見られるようになってきました(例えば松尾豊氏の「シンギュラリティを超えないと言うのは、もはや難しいだろう」)。

 これは、検証不能の疑似科学かもしれません。しかし前回の人工知能ブームでも、「10年後の1998年には、人間と同じやり方で自ら学べる機械が出現する」などの予言が一部の書籍に見られたことを思い起こすと、人工知能の「ブーム」が本格化しつつあることの1つの証拠なのかもしれません。

シンギュラリティ問題:2045年に人工知能が人間を追い越す?

 情報処理学会の会員向け月刊誌「情報処理」2015年新年号の特集は、「人類とICTの未来:シンギュラリティまで30年?」というものでした。古くは、シュワルツェネッガー主演の映画「ターミネーター」で想定されたように、人工知能が何らかの本当の学習能力をいったん備えてしまえば、急速に自己進化を遂げてあっという間に人間の知能を超え、独自の(非)倫理観をもって、邪魔で非効率な人類の排除に乗り出すという臨界点も「シンギュラリティ」の1つのあり方です。

 一般には「特異点」ということで、人工知能の進化で何らかの後戻りできないポイントを通過すること。人間がコンピュータに教え込む知識量以上の知識をコンピュータが自ら獲得できるまでに学習能力が高まり、勝手に知識ベースを増大させられるようになることを指すでしょう。おそらくその次の段階で、知識の獲得、創造の仕方自体を自ら改善し進化させてしまうことが想定できますが、世間でのシンギュラリティ談義では、そのあたりが混同されているようにも見えます。

 この2つの特異点は区別したいです。ただ、実際に、コンピュータが本当に自ら知識を獲得したというのはどういうプロセス、状態なのか定義、判定するのは難しいでしょう。現在のGoogleさんの検索エンジンは、精度向上の仕事の相当部分が自動化されているはずですが、研究者が考案したアルゴリズム(計算手順)とデータ構造に基本的には依存しており、研究者のセンスを超えて気の利いた手法をコンピュータが勝手に「考え」たりはしていないはず。でも、その延長で、いつどのように「あれ、適合型の意味構造認識のアルゴリズム入れたけど、自分(研究者)の想定以上に賢くふるまっている」と判定できるのか、判断が難しいと思われるからです。

 2つ目の「(知識獲得・創造の仕組み自体を改変して)自らを進化させる」という特異点に至っては、お手本たるべき地球上の生物でさえ、自らの意思で自らを改造してきたわけではないので、さらに大きな疑問符が付きます。生物進化については、ダーウィンの自然淘汰説が主流なわけですから「機械が自らの意思で進化してしまうのはおかしいのではないか。少なくとも『強いAI』の立場で、とことん生物、人間をお手本に機械が進化する限りは」という説もあります。

 いずれにせよ、現時点で反証可能な仮説とは言い難く、個人的には、熱気とブームは認めますが、量子コンピュータや量子情報科学、そしてディープラーニングという名の古くからある多層ニューラルネットの原理や能力の解明がもっと進まないと、科学的な議論とならないように感じています。

SFとの境界線が消えた欧米のAIビッグプロジェクト

 「情報処理」2015年新年号では、さらに詳細に、シンギュラリティの肯定派、懐疑派(SF作家など)による詳細な議論のまとめと各国のプロジェクトなどが紹介されていますので、ご興味の向きは是非ご参照ください。京大の物理学博士(1970年)で神戸大学名誉教授の松田卓也さんによる「来たるべきシンギュラリティと超知能の驚異と脅威」には、様々な「超知能の作り方」が紹介されています。

  • 生物学的超人類:「高い知能を持つ男女を掛け合わせて…」あるいは遺伝子工学で
  • 知能増強:脳にチップを埋め込んだり赤血球大のコンピュータを脳内血管に常駐
  • 集合知能:「みんなの意見は案外(なぜか)正しい」の延長
  • 人工脳による集合知能:脳だけの人間を作り出して結合
  • 全脳エミュレーション:死んだ人の脳をガラス化して薄くスライスし、ニューロンとシナプスの3Dマップを作って機械上に再現してスイッチを入れたら故人の精神・魂が蘇るのではないかという研究プロジェクト。問題は、死の直前の、惚けた脳のコピーになること。
  • マインドアップローディング:よりソフトウエア的に、生きている人の意識からあらゆる脳内記憶、脳の活動をコンピュータに転送し、人を肉体から解放。
  • 機械人工知能:コンピュータでヒトの脳の働きをシミュレートする、古典的な、強いAIが目指してきた方向。現在のノイマン型コンピュータを前提とするEUのヒューマン・ブレインプロジェクトや、全く違うニューロモルフィックチップを開発して、従来型コンピュータの苦手な感性や感覚を担当させる。IBMがDARPA(米国防高等研究計画局)の協力下で遂行中のシナプス計画の手法。

 いかがでしょうか? SFと紙一重というか、SF的な予言、目標が10年後には実現しかねないくらい境界があいまいになってきている印象を受けないでしょうか? 

 EUのヒューマンブレイン計画は、2013年からの10年で12億ユーロほどの予算を90の研究機関に投じて脳を解明しようというものです。10万個のニューロンからなる新皮質コラム中で起こる現象を化学反応のあり方までコピーしてシミュレートするという、ブルーブレイン計画(2005年〜)は既に成功し、ネズミの知能は実現済といいます。その延長で、ネコの知能、サルの知能をクリアし、2023年頃に人間程度の知能を実現するとしているとのこと。いわゆる論理的思考だけでなく感情、感覚、そして、いまひとつ正体が分からない意識や自我まで、勝手に出現するだろうと当事者は予測します。

 この他の様々なプロジェクトが紹介された後、超知能は核兵器同然のものであり、人類を滅ぼすのでは、という心配が指摘されます。民間企業に任せていては倫理基準が働かないので、先のホーキング博士の心配が正夢になってしまうのではないか、しかし超知能の開発はかつての核軍拡競争に取って代わり、世界覇権を狙う各国がしのぎを削っているので誰にも止められないだろう、と。

 最後に、豪州出身のAI研究者 Hugo de Garisが、今世紀後半に、人類の知能の1兆倍の1兆倍の知能をもつ機械“Artilect”(超知性)ができると主張した話題が取り上げられます。de Garisは、圧倒的に愚鈍で足手まといの人類はその時点で滅ぼされると主張します。だから、そのような機械を作って良いかどうか賛成派と反対派が武力衝突を起こして超知性戦争という名の世界大戦が起き、どちらが勝つか分からない。さらに、“Artilect”(超知性)が誕生して人類が滅亡した後は、“Artilect”(超知性)が真空の揺らぎから新しい宇宙を作り出し、その中でまた100億年後くらいに人類のような知的生命体を生み出す、と。

 つまり、神が人間のような知的生命体を作ったのではなく、それは逆で、何らかの知的生命体が神(のような機械)を作り出し、その神(のような機械)が今の宇宙を作ったのではないか、と主張しているようです。半世紀後にも新しい神を人類が作り出して、その神に滅ぼされる。ここまでいくと、誇大妄想狂と言われても仕方なさそうです。

温故知新で30年後を予想

 ここで、中年以上の方には今や古典となったロバート・ゼメキス監督の映画「バック・トゥ・ザ・フューチャー」(1985年)を思い出していただきたいと思います。

 「バック・トゥ・ザ・フューチャー2」で舞台となった30年後の未来とはいつか? そう今年、2015年です。当時の予測、空飛ぶ自動車、空飛ぶスケートボード、しゃべる服(あれは当時から自然な音声合成を実現していたDEC Talkという発声エンジンを使って撮影されました)などは実現していません。必要もなかったからと言えるでしょうか。様々な本人認証システムなどは、銀行ATMでの掌紋認証や、網膜パターン認識による制限エリアへの入場許可、そしてノートPCに当たり前に指紋認証が付いてきたなど、より着実に幅広く浸透したといえるので、見事に予測が的中した、と言ってもいいでしょう。

 1985年当時は考えられもしなかった機器やサービスが現実世界に出現した例もあります。スマホアプリがクラウドと連携して便利なサービスを利用できる状況はごく当たり前になり、中高生達は、ごく最近出現したLINEのサービスがなければ生活が成り立たないくらいにさえなっています。

 とはいえ、たったの30年間ではこの程度の進化だったか、という印象が強いのではないでしょうか?

 シンギュラリティ論者は、2045年までの30年はこれまでと違ったすさまじい勢いで進化が加速するのだと言うでしょう。ただしそれには、1960年代から知られていたニューラルネットという手法が、1980年代に3層が実験されて数10の要素で表現できるモデルの学習は何とか実用化し、計算量がより多く結果も発散しそうと敬遠された多層ニューラルネット(実際には計算量が減る例もあることが最近示されたことを知って私はディープラーニングに肯定的に転じました)によるパターン認識や自動分類の精度向上という半世紀にわたる地道な進化の歴史を振り返ると、ブームやニーズに火がついて加速するとしても、シンギュラリティ論者の主張する進化の加速はにわかには信じがたいものがあります。

 思い出すのは、大変僭越ながら米MITの元“同僚”で、1993〜94年当時、よく音楽や自然言語の謎について議論した人工知能の父マービン・ミンスキーの名著『心の社会』です。これは同じ認知科学の巨人で現代言語学の父ノーム・チョムスキーに言わせれば反証可能性がなく、科学の産物ではない、とされましたが、重要な示唆に富んでいたと私は評価いたしました。『心の社会』出版記念シンポジウムに相当する「ミンスキー・シンポジウム」がマサチューセッツ州ケンブリッジ市のMITキャンパス内Cresgi Auditoriumで開催された際、彼のスピーチで鮮明に覚えているくだりがあります。

 「類人猿から決別して現生人類へ向けて確実な進化が始まった400万年前から、1万年に1種類ずつくらい、全く新しい、認知、理解、様々な知識、判断、行動の意思決定など(感情は猫にもあるのでもっと古いだろう)を司る新しいアーキテクチャ、脳内のサブ・システムの情報処理の仕組み、ハードウエアやソフトウエアの構造が誕生し、時に不整合なまま追加されていったのではないだろうか? 」

 自然言語の誕生は4万年ほど前と言われます。それ以後に4種類。400万年で、400種類もの異なる仕組みがヒトの脳に付け加わって、うまく機能した系統だけが生き残ってきたとするならば、多層とはいえ、単純で画一的な神経回路網上の結合度が教師データで変化するだけのニューラルネットですべての脳機能が表現できる、とする論法には無理があるように感じます。もちろん、違う仕組みのコンピュータ上で同じ機能が再現できる可能性は否定しきれないですが、その効率、実現可能性は必ずしも高いとはいえないと思います。

 というわけで、今後10年、20年、30年で、人工知能の匂いのする知的なソフトウエアやロボットは着実に普及するものの、2045年に機械の知性が人類を追い越すという第一のシンギュラリティは訪れないだろう、という予測に私は賭けます。生きていれば83歳ですので、掛け金を払うかもらうか、いずれにせよ、結果を確認できる確率は五分五分くらいかなと思いつつ(祖父が99歳、父が68歳に亡くなっているので自分はちょうど中間の83.5歳まで生きるつもりでいます)、楽しみにしています。

 そういえば、治療型のナノボットなど、医学の進歩によって、2045年の平均寿命が100歳になるという主張もあるようですね。その時点で生まれる赤ん坊についてのことであり、現在の国際紛争、テロや貧困が撲滅されていれば有り得ないことではない、というくらいに期待したいと思います。

posted by メタデータ at 00:00| Comment(1) | TrackBack(0) | semantic