2015年11月28日

ビッグデータ、人工知能を活用したビジネス、生活の今後 (その2)

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の26回目、最終回です。



 ビッグデータに後押しされるように台頭してきた今回の人工知能ブームが健全に開花し、過去2回のブーム(1950〜60年代、1980年代)のように期待外れのあまりにバブルがはじけて終わったりしないことを願いつつ、人間と機械の役割分担などについて引き続き具体化し、産業的な付加価値を追求してまいりたいと思う今日この頃です。現時点での方向性を探りながら、いくつか、これまで触れ足りなかった話題を取り上げます。

ビッグデータとAIが相互に不可欠な技術として発展

 最近の記事「ビッグデータの国内市場『年率27%で成長も課題山積』」によれば、ビッグデータの分析に使われる情報システムなどのインフラの国内市場は2014年時点の444億円から、年平均成長率27%のペースで拡大を続け、2019年に1469億円に上る見通しとのことです。いわゆるインテリジェント・ストレージや、検索・配信などの「上流工程」への投資が大半なのか、それとも、徐々に中流の分析や、経営判断への活用を支援するツール(例えば弊社のVoC分析AIサーバによるポジショニングマップ作成)の割合が増えていく見込みなのかは不明です。しかし、取りあえず、データという「事実」を踏まえた経営を日本企業が指向し、後戻りなく導入していく傾向、流れを読み取って、大変結構なことととらえたいと思います。

 本連載の初回「ビッグデータが経営判断に使えない本当の理由」で図示したように、ビッグデータ活用において中流・下流の、頭脳を使った「分析」がボトルネックになっているのを解決するために、人工知能が求められている状況もますます切実になっていくことでしょう。特に人工知能と意識されていなくとも、大量データの様々な機械学習手法や、マッチング、最適化の手法が今後ますます必要とされ、データやメタデータの構造化、交通整理と活用に必須のものとなっていくことでしょう。

 人工知能の側、特に、ニューラルネット(ディープラーニング)は、ビッグデータのおかげで実用性が確認、認識され、復活したともいえます。ビッグデータと人工知能が相互に必要不可欠のものとして、互いの発展の手段として機能し、一種の共振現象を起こしているともいえます。そのあたり、ウェブやソーシャルメディアで、それぞれ地球最大と言えそうな超巨大なビッグデータを押さえているGoogleやFacebookが人工知能関連の研究開発や応用を主導するのも必然と言えるでしょう。彼らは、ハッタリや浮わついたところなく、実データを現場で解析して付加価値を引き出すべく、機械翻訳や顔画像認識の精度向上でさりげなく(時に秘密裏に)、人工知能を適用しています。

 例の悲観論をはじめ、妙な挑発などせずに(もっとも「シンギュラリティ論」の教祖格であるレイ・カーツワイル氏は比較的最近Googleに入社したようですが)、自然体でニューラルネットを説明している、FacebookのAI研究所長、Yann LeCun氏の弁には好感が持てます。ディープラーニングを生データコンピューティング(end-to-end computing)と適切に形容した次のインタビュー記事は、実に適切に、新しいテクノロジーとそのビジネス応用への取り組み方を説明していると思います。

 「Yann LeCun氏は、Deep Learningについて「脳のように機能する」と表現することを嫌う。Deep Learningは実際の脳の機能からは、はるかに遠い。そのように表現することは誇大広告となり危険である。」

 「…新しいテクノロジーをビジネスに取り入れる際は、そのテクノロジーで実現できること・できないことを正しく理解する必要があります。現状のビジネス利用では「教師あり学習」が現実的であるなどの示唆があります。

 Yann LeCun氏がFacebookでの取り組みや今後の展望で述べている通り、Deep Learningの応用はさらに発展を遂げ、ビジネスでの利用が広がるでしょう。」

エージェント技術の復活と応用に期待

 前回の記事でご紹介した星新一のショート・ショート「肩の上の秘書(インコ)」では、相手に伝えたいことをぼそっとつぶやけば、ロボットのインコがそれを丁寧な、長い、非の打ちどころのないメッセージにして相手に向けて喋ってくれました。そして、同じように相手の(インコの)長い台詞を簡潔に要約し、冗長な台詞を聞いていなくとも要点を伝えてくれます。

 このインコが、もしごく簡単な(概括的な)指示を与えると「飛び立って」行き、具体的な目的地、交渉相手、情報入手先を自分で調べ、時に考えて探し、目的を達成して戻ってくるとしたら如何でしょうか? これは、細かく指図しなくとも“よきに計らう エージェント”、それも自分の領域外に出張して仕事を片付けてくれるタイプのモバイル・エージェントのイメージそのものといえます。

 「ザ・エージェント」といえば、トム・クルーズが演ずる、プロスポーツ選手の代理人が主役の映画です。選手本人に代わって契約内容を交渉するだけでなく、全米を飛び回って試合する選手に随行し、本人の様々な不平不満、悩み事を聞いて解決したりします。所属企業の本社に飛んで行って本人が詳細を見切れない条件交渉、法務書類の作成と締結なども行います。

 IT、ネットワーク上のソフトウエア技術としての「エージェント」も、似たものだといえます。エージェントの様々な定義や興味深い分類がこちらにあります。どれくらいの個体数が互いに対話をして協調作業を進めるかで分ける「社会的分類」や、どんな言語(専用言語か視覚言語か日本語などの自然言語か、表情を伴うか等)でコミュニケーションするか、あるいは、ネットワーク上を移動し、違うコンピュータに「お邪魔」するモバイル・エージェントかどうかの違いで分けた「機能的分類」があります。

 1980年代の第二次人工知能ブーム末期あたりにも、モバイル・エージェントの商用規格が流行りかけました。有名だったのは、ウェブの規格など使わない(という評価は後年ならではなのですが)、Telescript言語という独自規格。こちらの解説にあるように、ネットワーク上のエージェント(Agent)達の「出会い(Meeting)」「その場所(Place)」「移動(Travel)」「Connection(互いに異なる場所から呼び合う)」、そして、物理世界、リアルワールドにおけるご主人様から与えられる「権限(Authority)」「許可(Permit)」などを記述して制御する、ジェネラル・マジックが1990年にリリースした商用言語でした。

 これは本格的なエージェント指向でしたが、基盤技術として、Windows, Mac, Linuxなどのプラットフォームを選ばずに動作するJava言語が1995年に出て少し事情が変わりました。すなわち、もともとポータビリティとモビリティが高いJavaで書いたプログラムなら、モバイル・エージェントを非常に実装しやすいだろう、と目をつけられたわけです。さらに、様々なネットワーク上のデータのやりとりについては、HTTP(Hyper Text Transfer Protocol) すなわち、ウェブの規格でオブジェクトをやり取りすれば、さらに低コストで、幅広く普及するエージェントが作れるだろうということで、前世紀末にAglets(IBM)、Voyager(ObjectSpace)などが登場しました。

 個人的には、孤立した、自律型のヒューマノイド・ロボット1体よりも、多数のロボットが独自の「言葉」で猛スピードで効率よくコミュニケーションし、協調して働いてくれた方が嬉しい気がします。もちろん、その大半は、身体を持たないモバイル・エージェントです。物質(atom)から自由なビット列、デジタルデータであればコストゼロで瞬時に世界中を移動できます。身体が必要になったら、必要に応じてヒューマノイド・ロボットやドローン、小型潜水艇、地底探査機、ロケット、はやぶさ2のような人工惑星などに潜りこめば良いでしょう。3Dプリンターは、「身体」構造と素材データを授受しますが、その上に乗るソフトウエアも、自在に世界中を巡って問題解決をし、人間たちに奉仕するのです。

 アシモフが「はだかの太陽」で描いた、2万体のロボットが1人のご主人様の意図をくみ取って互いに協調して動く世界だって、実現できそうな気がするではありませんか!

 規格の標準化と差別化競争をうまく両立させないと産業的成功が難しいということはあるでしょう。また、エージェントを送り出す側はともかく、受け入れ側にとっては、送り手側の意図に沿って勝手な動きをする(もちろん受け入れ側の完全な許可とリソースの割り当てが必要ですが)という意味で、ウイルスのような存在に似ているので、サイバー空間の法秩序みたいなものも整備されていく必要があるでしょう。

人間は多数のエージェントを使って「楽」に

 エージェントの最大の特徴は、細かく指図しなくとも、時にはこちらの意図を察して“よきに計らってくれる”ところです。

 自分で調べずに何でも細かく質問する人のことを「教えて君」と呼び、「教えて君」がSNSのグループやコミュニティに登場したら「ググれカス!」(「ウェブ検索すればすぐ分かるようなことを公の場で質問して他人の時間を無為に奪うな、この馬鹿野郎!」という意味)と言えば良いのだ、というコンセンサスがとれているオンライン・コミュニティもあります。確かに今後は、あるカテゴリの知識の存在を大雑把に教えてもらったら、自分でその都度(オン・デマンドで)調べて行動できない人は疎んじられていくでしょう。さもないと、上記のようなソフトウエア・エージェントに負けてしまいます。

 いや、だからこそ、人間は楽ができるように、多数の専門家エージェントを使いこなすべきなのかもしれません。考えるのをサボりすぎてスポイルされないように、時々猛烈に考えさせてくれたり、創造性を刺激してくれる役割を果たす「きまぐれエージェント(星新一「きまぐれロボット」へのオマージュ)」のお世話にもなりながら。

 エージェントが自らの経験を参考に賢く行動し、感情を持ったりユーモアを解したように対話するプログラムも今後生まれてくるでしょう。弊社・メタデータ社でも数年前に、ウェブ超ロボ・不二子クラウディアと称して、短い依頼の言葉を解釈し、それに必要な、詳細な実行方法、実現手段は自分で調べて(知っておいて)、指示した人が詳細を知らないままでもキチンと仕事が片付くコンセプト・ロボ(ソフトウエア)のプロトタイプを作りました。

 最初は、大手クラウド・ベンダーの競争や囲い込み戦略のために、アマゾンのAWS、グーグルのGAE、マイクロソフトのAzureを全部覚えてクラウド対応ソフト作るなんてウザい! だから、仕様だけ指示すればこの3つのクラウドに対応したSaaS(ソフトウエア・アズ・ア・サービス)を自動生成してくれるエージェントが欲しかったのですが、これではあまりに専用用途に過ぎると考え、路線変更しました。

 マッシュアップ・アワードに出す作品だったこともあり、

  • 「APIの利用登録、API Key取得をお任せ」してしまえる。
     (何百、何千のAPIごとに利用規約も実際の登録方法も、API Keyの取得方法も違っててウザいから)
  • 「「ツンデレのおふざけ会話をしながら同窓会を一緒に企画し、電話、メール、LINE、Twitter、Facebookなどの様々なインスタント・メッセージなどの様々なメディアを適切に使い分けて連絡しなければならない元同級生への連絡を適切にやってくれる」
     (「みんな、自分ひとりくらい特別な手段で連絡してくれてもいいじゃないって、我儘なんだからぁ!」と愚痴りながら)

 リクルートホールディングズ社のメディア・テクノロジ・ラボで行った講演はこちらです。

 みなさんも、面倒な雑用を自分に代わってやってくれるエージェントが欲しくないですか? ウェブ上で抽選の行列に並んでみたり、ある裁量の範囲内で市場に売買注文を出してみたり、オークションの出品や落札をして、結果をメールやインスタントメッセージでちゃんと報告してくれたりするソフトウエアロボットです。元のシステムがそこそこ使い難いものじゃないと意味がないという説もあるので、具体例を出すのはちょっと憚られる面もありますが。

情報連携で「気の利く」エージェントがさらに増殖

 日経ビジネスオンラインのこちらの記事のインタビューで言及している、ひさじゅさん作の「シャチクノミカタ(社畜の味方)」も、社員の代理で上司の書き込みに「いいね!」してくれていた、という意味でエージェントだったと言えるでしょう。メタデータ社の高精度ネガポジ判定APIが実際の代読を行い、−1以上とか、+2以上とか、一定以上ポジティブな上司書き込みにのみ「いいね!」を自動で付与することで「うむ。こやつ(部下)は上司の言うことでも是是非非で評価する。なかなか見どころのあるやつだ!」と思わせ、あわよくば出世の助けになるかもしれない、というものでした。どの書き込みに「いいね!」したかがメール通知されてアリバイもばっちりだし、色々と完成度も高く、3万人以上のユーザーを集めてラジオやテレビ出演も果たされましたが、Facebook社のお気に召さなかったようで、惜しくも退場してしまいました。

 もぎゃさん作の「メイドめーる」も、Web受付嬢と同様に、メタデータ社の5W1H APIを用いて、秘書エージェントさんへの返信メールから日付(「明日」、「来週」などの相対的な表現も年月日に変換)を抽出してGoogle カレンダーに予定を自動登録したり、「昨日の会議の参加者へ資料送っといてね!」と依頼しただけで、資料を添付したメールを期日までに送っておいてくれたりするポテンシャルがあります。昨日の会議が複数あったとか、資料の候補が2つあったなど、あいまいな点があれば、依頼者に訊き返せば良い。このあたりの「気が利いている」度合いでも、鈍い人間を追い越してしまう可能性はあります。

 Web受付嬢は誕生以来、個人情報をお預かりして、PDF資料を添付して送信し続けています。内外のWebAPIを用いてオープンな環境で仕事をすることができるのも特徴です。ずばり、通常の対話ロボットと違って、知らないことを訊かれても、ネット上でWikipediaなどで知識検索をして、その結果を要約して教えてくれます。

 かように、ここ10年間で普及したAPIと、それらを束ねるマッシュアップの手法が、オン・デマンドで様々な仕事をこなすエージェント達の基盤として、非常に重要な役割を果たせるよう進化し、増殖してきました。API間の連携、APIとアプリ、ビッグデータの連携の鍵が「つなぐメタデータ」です。

 下図は、2010年に執筆した学術誌「情報の科学と技術」特集:メタデータの現在から、拙稿「ソーシャルメディアの時代に産業上の重要さを増すメタデータ自動抽出技術」において、図1「マッシュアップを支える軸足メタデータ」を引用したものです。

 右下の写真、車のダッシュボード上に置いたSony GPS-1が刻々と記録するタイムスタンプと緯度経度の組み合わせデータを、タイムスタンプを軸足メタデータとして、GPS機能なしのデジカメで撮った写真のExifメタデータに緯度・経度がパソコン上のソフトウエアで流し込まれます。反時計回りに左上に回って、今度は緯度経度が軸足メタデータとなって、WebAPIで自動取得したサムネイル画像をGoogle Maps上に、走行コースに沿ってプロットするマッシュアップが簡単に実行できます。

 このように、メタデータで動作するAPI群による情報連携はとてもシンプルですが、気が利いているということができるでしょう。そして、データや知識、プログラムなどを集めて適切に組み合わせて問題解決をせんとするエージェントにとって、実に扱いやすい仕組みになっているのです。

 ビッグデータと第3次人工知能ブームの時代。新世代のエージェント応用が開花する機は熟している、と言えるのではないでしょうか。

AIとエージェントが描く、IoTとIndustrie4.0の可能性

 前回、ビール・サーバーに接続して1滴単位で量や頻度、温度等を測定してインターネット経由でサーバーに通知するIoTデバイスについて書きました。これは、ERPパッケージで名高いドイツ企業SAPによるものでした。

 ドイツでは数年前から「Industrie4.0」と称して、ひたひたと(あまり英語で情報発信せずに)、インターネットを介して全産業におけるモノが緊密に結びつき、部品在庫削減による低コスト化と受注生産などが両立できる仕組みと、その標準化を準備してきました。素材や部品の工場と組み立て工場。そして、物流、販売店、さらに販売した後の製品までをインターネットでつなぐことで、「効率的な生産」、さらに「新たな需要の開拓」につなげようという取り組みです。日本では、「第4次産業革命」とも呼ぶようになってきているようです。

 NHKの今井純子解説委員によるこのページの真ん中あたりの絵、「第4次産業革命」のイメージが非常に分かりやすいので、是非ご覧ください。この凝縮された「時事公論」の番組の前半では、日本企業が過去最高益の更新、というニュースを眺めつつ、技術革新などによる本当の成長のための投資がなされているか(成長戦略)、このドイツで始まった取組みと対比してチェックする、というスタンスをとっています。

 (ビッグ)データの時代らしく、組み立て工場の中では、生産ライン上を(柔軟に)流れる半完成品にICタグが付いていて、「自分の完成には、あとこれとこれの部品や仕上げ剤が必要だけど、3時間以内に出荷するためには、あの部品の在庫がなくなる確率が50%あるのでそろそろ発注してほしい」などと「訴える」ことができます。このような状態の検出、判定、「訴え」はすべてIoTによって機械間で行われ、部品や素材工場や倉庫に自動的に通知がなされ、最適なタイミングで補充がなされるというわけです。

 このような仕組みがあれば、個別化少量生産、頻繁な仕様の変更を受け付けて競争力を向上させながら、在庫削減等でコストダウンが実現します。上記ページのさらに後半、「第4次産業革命(つながる工場)」から引用しましょう:

 さらに、ネットワークは、工場の外にもつながります。



  • ▼ 例えば、販売店とつながることで、注文の情報がすぐに工場に伝わり、納期を短縮できますし、
  • ▼ 部品が不足してくると、すぐに納入できそうな部品工場を自動的に探して、発注することで、在庫を減らし、コストを減らすことができます。
  • ▼ さらに、これまでのように、製品を納めておしまいではありません。製品ともインターネットを通じてつながって、稼働状況などを把握することで、保守サービスといった新たな事業につなげていくこともできる。こうした様々な可能性につながる取り組み…

 従来から日独共通の強みであった製造業にフォーカスすることに加え、標準化が重要なことから、ドイツ、欧州主導の研究・規格化で、米大手IT企業を寄せ付けないという意欲を読み取ることができます。とは言え、オープンな規格、競争原理の尊重、かつ低コスト志向で、多くのプレイヤーの参加を募っています。俊敏に、急な変更をも歓迎しつつ同時に在庫を削減するためには、ビッグデータをリアルタイムで高速に、かつ賢く解析する必要も生じるでしょう。人工知能的なリアルタイム計算、予測ができるソフトウエアがIoTの裏側で縦横無尽に動作し、モノとモノ、ヒトとモノとの最適なマッチングを実現していく。

 昭和時代のように自動化が画一化につながることなく、知的なIoTによってむしろ個別化、個性化しつつ、低コストが実現していく。中小企業や身近なサービス業も例外ではありません。ビッグデータと人工知能・エージェント的な要素が産業界に浸透することで描かれるIndustrie4.0は、なかなかワクワクするビジョンではないでしょうか。

おわりに 〜我々の働き方、再論

 「アルゴリズムが世界を支配する」という本があります。ここで「支配」というのは従属関係でもなんでもなく、宇宙の基本原理たる物理法則に「支配」されているというのと同様のニュアンスです。数学的に確かなモデルは普遍性を持ち、多くの現象、事例に「当てはまる」と言い換えても大差ありません。ですので、またぞろシンギュラリティで人間が機械に駆逐されるかのような悲観論に傾く必要はありません。

 人と機械が協調して、人々を幸福にしていくインフラは着々と整備されつつあります。Industrie4.0におけるIoTデバイス間のコミュニケーションや協調もしかり、ヒトの意思を代行するソフトウエア・エージェントもしかりです。きわめて多くのプレイヤー(大半が機械やソフトウエアになっていく)が参加するゲームで全体最適を実現する数学の法則(例えば2部グラフの最大マッチング)を恐れる必要は全くなく、積極的に活用し、それが高速に動作することを大いに喜べばよいと思います。

 このような人工知能的なソフトウエアにより、大量データの恩恵を受けて、気の利いた示唆を機械が与えてくれたり業務を進めてくれれば、人間はどんどん楽になります。しかし、「結局、AIに負ける心配がない職業とは?」で示唆した通り、「なぜだろう?」と考える人間には、意志や美意識をもってシステムを改良する、重要な役割があり続けます。

 最近の連載を読んで、中央官庁、大企業研究所、国立大、私立大などから、取材・インタビュー、講演依頼を次々といただきました。中には、人々の働き方に関するあまりの超楽観主義に、呆れてものも言えなくなったかに見える方もおられました。もちろん私だって、創造性のない仕事や生活を送っている人については大いに心配しています。過度なリテラシー指向、職業訓練指向のせいか(この方向の大学改革には反対です!)、他人や自分自身を、出来そこないの機械のように仕立てて働かせている人を見ると、「近い将来、人工知能に淘汰されちゃうよ!」と涙を流しそうになることもあります。

 10数年前だったか、厚労省の試算で、日本のホワイトカラーの生産性が北米の4割、西欧の6割にとどまるとするのを見て愕然したことを昨日のように思い出します。今にして思えば、欧米に比べて、日本の事務職の現場には、人工知能に淘汰されやすいような仕事の仕方をしている人が多かった、と言えるのではないでしょうか。

 私自身は、引き続き、人の能力を拡大するソフトウエアや、ビッグデータ分析手法の研究開発に邁進してまいります。テキスト(記号列)、画像、音声、動画等、入出力データの種類を問わずに生データを学習できるディープラーニングも手掛けるし、人間が苦手な、大量候補の全体最適解を求めてマッチングする手法を高速化し改良するなどの研究開発はますます面白くなります。

 と同時に、サービス科学を大学院生、MBA候補生らに教えつつ自ら応用したり、マーケティング、営業に苦心しながら経営者として10年近く、世のため人のため、付加価値の創成に努めてきたのをあと20年は続けていくつもりです。この過程で、皆様に考えを問わせていただく機会(執筆や講演等、Facebookなどのソーシャルメディアでも)など多々あると存じます。本連載は今回で終了しますが、今後ともどうぞよろしくお願いいたします。



posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年11月14日

ビッグデータとAIが変える仕事と生活(その1)

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の25回目です。


ラスト2回となりました。そこで、ビッグデータの活用と、そのための人工知能と人間の頭脳の役割分担などについて、徒然なるままに綴ってまいりたいと思います。

IoT機器にもっともっとビッグデータを生成させよう

 4月下旬、東京ミッドタウンで開催された日経ビッグデータカンファレンスで、国立情報学研究所長の喜連川優教授が最近のビッグデータ関連の研究成果、動向について基調講演をされました。彼は経産省系の情報大公開プロジェクトのリーダーとして、また文科省の「情報爆発時代に向けた新しいIT(情報技術)基盤技術の研究」において、一貫して「情報爆発という一大事に対抗する技術の開発をすべし」との危機感を前提に実用技術の開発を主導してこられた印象があります。

 途中でどんなに、Googleはじめ米国の巨大ベンチャーにうっちゃりをかけられようが不屈の精神で立ち直って、日本独自の強みを見出し、育てるべく、いったんボロボロになっても何度でも立ち直る。そのために、海外動向についても張り詰めた緊張感で、本質的な変化を鋭いアンテナでとらえる。内外から見て優勢とはいえない日本のIT、ICTを活性化する、リーダーの鑑のような存在、というイメージでした。

 それが、日経ビッグデータカンファレンス2015 Springでは、うってかわって、IoT(Internet of Things)を楽しみ、IoTデバイスにもっともっと大量のデータを生成させて、「情報爆発に拍車をかけろ!」と高らかに宣言したかに聞こえました。何だか、歌って踊れる明るいビッグデータの時代が来たみたいに感じた人もいることでしょう。

 個人的には、この豹変は大歓迎、大好きです。ビッグデータを始末に負えない難物として危機感を煽ったり、人々の仕事がなくなる、の類の悲観論を唱えるよりも「踊る阿呆に、見る阿呆。同じ阿呆なりゃ踊らにゃ損、損」の阿波踊りの精神で、自ら楽しんでいろいろやってみたほうが良いでしょう。ビッグデータの産業構造へのインパクト、ビジネス応用といえども、ユーモアのセンスさえ漂う、ノリノリの楽しそうな実験プロジェクトをどんどん起こし、その成果を宣伝したら良い。ビッグデータ、生情報、事実に基づく様々な新ビジネス施策がどんどん試みられるのを歓迎したいと思います。例えば、こんなのです:

「冷やし中華関連のビッグデータでエネルギー節減」

 いかが思われますか?

 小さな、安価なIoT機器が生産と消費を直結する象徴的事例をSAPさんが紹介してくれました。生ビールをお客さんに注ぐ口と、ビール・サーバの間のチューブに小さな中継器を入れてネットにつなぐだけで、注がれたビールを1滴単位で、リアルタイムで分量を測定。いつ、どこで、どんな品質(温度等)で、どれだけが客に提供され、消費されたかの完全なデータをメーカー等にフィードバックすることができる。やってみれば「これぞ、Missing linkだった!」と思えるような1つの小さな部品の付加が、デマンド・サイドから、リアルタイムで生産調整、品質管理を実現してしまえる痛快さ。既存のネットインフラ、できたばかりのビッグデータ解析システムのポテンシャルを最大限に引き出せるような、とても分かりやすいIoTデバイスでした。

“気の利いた” AIシステムが仕事や生活を支える

 生ビールを1滴単位で測定してくれるようなIoTデバイスが身の回りにあふれるだけで仕事や生活が便利になるか、といえば、なかなかそのようにはまいりません。仕事や生活に必要であり、充実させるメディアには、視覚や音声、言語で物事を理解し、時に学習し、その結果、自分の欲求や意思を、必要な相手(を見つけて彼ら)に伝えるという、人間ならではのコミュニケーションが必要だからです。

 以前、「パターン認識」は人工知能の目や耳と題した記事で、人間のコミュニケーションを支える認識、理解や学習、そしてメッセージを生成して伝えることも狭義の人工知能=「脳を模した情報処理」に準じて重要なことを記しました。

 文字認識や、錠剤の形状が合格品かどうか判定するのに特化したあまりAIっぽくない単機能、専用用途のシステムも、苦労して業務化し、実用レベルの精度が低コストで実現できたときにはIT屋は大喜びします。古き良き昭和時代の製造業の技術者よろしく、社会の裏方(名を残さぬ捨て石!?)として人々の便利生活を支える満足感とともに現役を引退する。こんなエンジニアが続出すれば、ユーザーの射幸心を最大限煽るゲームAIやら扇情的B級ニュースのレコメンドで競争するよりも、世界に貢献できるIT産業として光る存在になれるでしょう。

 人工知能の仕組みとしては、とくに超最先端、高度なものでなくとも、さりげない気の利いたデータ連携で、実に便利な情報ライフが実現することがあります。「‘つなぐ’メタデータを介した情報連携 」の図1「マッシュアップを支える軸足メタデータ」では、まず、ソニー社のGPS-1という単機能デバイスが日付時刻とともにひたすら現在位置の緯度・経度を吐き出し、それを介して、GPS由来の位置情報無しのJPEG画像のExifメタデータに緯度・経度を補完します。次に、この位置情報を用いることで、車でドライブした経路上にサムネイル画像をプロット。それらをクリックしたら大きな元画像を、旅程の順に眺めることができるマッシュアップの例を紹介しています。

 上記は、今から5年前に、学術雑誌「情報の科学と技術」の依頼で寄稿した論文からの引用です。この論文では、この他にも、Google Appsなどのクラウドアプリに、自然言語メールでメイドさん(に摸したAppsのアバター)宛てに送った文章から、予定追加の日付時刻、内容を読み取って自動でカレンダーにスケジュール登録する2008年のマッシュアップ・アプリ「メイドめーる」なども紹介しています。

 文章中から“5W1Hメタデータ”を自動で読み取って (デモはこちら)、カレンダーやグループウエア、SNSのタイムラインの当該個所に自動投稿させる。また、同じ出来事(5W1Hは“出来事=event”のメタデータです) に言及した記事を自動的に検索・収集して、串刺しで要約し、誰がどんな異なる意見を言っているのかを自動で箇条書きにする。これら、2008年の「メイドめーる」が垣間見せてくれた世界は7年経った現時点でもまだまだ本格的な実用期、広範な利用フェーズに入っていません。クラウドサービス上のコンテンツ間を、自然言語解析技術が自動抽出した5W1H =イベント・メタデータで結びつける。この便利さを実感するには、2008年の段階では、まだまだ皆様、情報洪水に溺れそうという段階には至っていなかったのかもしれません。

 今後、自分のSNSへの今日の書き込みから、人工知能が「ご主人様」に必要な情報を推定、ランキングして、取捨選択して、時には恐る恐る、時には自信たっぷりに対話しながらレコメンドしてくれる。

◆ユーザー=ご主人:「あ、それ大事だからカレンダーに入れといてくれ!」
◇アバター=メイド:「もう入れときましたよ〜 15分前になったら、腕時計が震えて気が付きますので」

 などと最小限のやり取りで、大事な予定を逃さないようになる日も近いのではないでしょうか? 2020年頃までには、ありふれた便利機能になっているように予想します。

「肩の上のインコ(星新一)」は人間関係をスムーズにしてくれるAI?

 星新一のショートショート「肩の上の秘書」をご記憶でしょうか。スパムメールと似ている、との指摘とともにあらすじを書いたこのブログを読むと、「発生から消滅まで一度も人間の意識を通過していない」文章が、メールボックスに溢れ始め、人によってはすでに90%以上が、一度も一瞥もしない未開封メールのままで終わる、という時代になってきました。

 こんな未開封メールの集まりの中にも、実は取引先の偉いさんのセミナー講演情報が入っていたりして、それを知らないまま本人に対面して気まずい思いをする、ということも起こるでしょう。いや、相手だけが不愉快に感じて、自分はしくじったこと自体気づかぬまま、みすみすビジネスチャンスを逃すほうが痛い、といえるでしょう。

 先の“5W1Hメタデータ自動抽出API”を組み込んでおけば、システムが黙々と未開封メールを「代読」し、検出した会社名、人名等を、営業履歴データベースやクラウド名刺サービスと照合します。この結果、「もしかしてVIPとの絶好のコンタクト機会?」などのダイアログ・メッセージとともに、遠慮がちにご主人様の気づきをうながし、ビジネスチャンスをものにして、事なきを得ることもあるでしょう。重要度や関連度のランキングや、セミナーに実際に行ける可能性を、同時に抽出した日付時刻(When)、場所情報(Where)からランキングし、カレンダーに仮登録することも可能です。

 メールの代読、過去、社員の誰かが交流した会社名、担当者名を網羅的に記録した営業DBや名刺情報クラウドへの問い合わせ、マッチした時の対策ミーティングの召集をセールスフォースのアプリ機能で実現したSalestractrという作品も2008年に、上記APIを活用したマッシュアップ・アプリとして誕生しています(紹介記事はこちら)。

 「肩の上の秘書」はもともと、コミュニケーション支援AIは単にお飾りの冗長な言葉に長々と展開するだけの無駄ではないか? そのような未来社会は不毛ではないか? とのアイロニーたっぷりの作品だったかと思います。でも、本当にそうでしょうか? 意味内容は同一でも、言い方が気に入らない、表現の配慮が足らないときに、そんな相手の言い方に怒った経験は絶無でしょうか?

 いくら論理的に会話、行動、判断しているつもりの人でも、始終、無礼な言い方をしてくる人と話をするのはうんざりでしょう。非の打ちどころのないほど丁寧で、その場の状況、相手の立場や考え方、価値観や気に入る表現などに配慮した「肩のオウム」が、コミュニケーション、人間関係を円滑にしてくれる、という効果は期待できないでしょうか?

 ショートショート「肩の上の秘書」の末尾も、バーのマダムの肩の上のインコのトークに癒やされる、で終わっているように、楽しく癒やされる効果を示唆しています。また、肩の上のインコは、相手の冗長な言い回しを簡潔明瞭な一言に要約してくれる働きもしてくれますので、イライラしなくて済むように配慮されていました。時間が無駄になるのだけが欠点かもしれません。この点をうまく解決できれば、近未来に「肩の上の秘書」なり、「腕時計や眼鏡の中の秘書」が実現してもおかしくないでしょう。

 前回記事の引用中に、AIが代替しにくい仕事として、フィジカルなおもてなしの例などがあがっていました。これがもっぱら言葉によるおもてなしであれば、その能力が最高クラスの人間の対話シナリオ、対話ノウハウをとことんコピーして作りこんだAIに、大多数の人間のおもてなし能力が及ばなくなってしまう、という事態は十分に考えられます。そんな羽目にならないよう、人間側は、機械的にマニュアルに従うのでなく、即興性、創造性をその場で発揮して、相手が最高に喜ぶおもてなしをその場で作り出せるくらいに鋭い感性、論理、想像力を駆使する必要があります。

 でも、それ以外の大部分の「安い」おもてなしは、早晩AIに取って代わられる可能性が高いし、そうなったとき、以前のとげとげしい言葉の針が飛び交う社会よりは、多くの人にとって心安らかに暮らせる社会になるかもしれない。

 次回、最終回となります。今回の続きとして1つ、「肩に止まったオウム」にごく簡単な指示を与えると「飛び立って」行き、具体的な目的地、交渉相手、情報入手先を自分で考えて探し、目的を達して戻ってくるイメージを語ってみたいと思います。これは、細かく指図しなくとも「よきに計らうエージェント」、それも自分の領域外に出張して仕事を片付けてくれるタイプのモバイル・エージェントのイメージです。20年以上前の前回のAIブームで一時脚光を浴びたのですが、クラウド、高性能端末、ディープラーニングが実用化される頃には一体どのようになっているでしょうか。その他、近未来予測のダイジェスト、ハイライトをいくつか書いてみたいと思います。



posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年10月30日

結局、AIに負ける心配がない職業とは?

Dr.ノムランのビッグデータ活用のサイエンス」連載(初出:日経ビジネスOnline)の24回目です。

人工知能ブーム再燃の真実(その9)

2015年10月30日 野村 直之

 これまで一貫して、人と機械が各々得意な能力を組み合わせて豊かな生産、生活が実現するという楽観論を展開してまいりました。膨大なデータに基づくランキング、判断や、超高速に力ずくですべての可能性を計算できる能力では、機械はほぼヒトを凌駕してしまうことでしょう。しかし、前回記事で触れたフレーム問題や、将棋で王手をかけられたら回避すべしといった基本原理の理解不足の類により、人がまだまだ優位な点が向こう数十年は残ると思います。

 将来、量子コンピュータなどの仕組み(アーキテクチャ)が飛躍的に進化するまでは、人間が未知の事態等に世界知識・教養を駆使して対応し、「適当に」計算を打ち切って妥当な判断を下す能力によって、高速に大量のデータ、パターンと照合するという力技では解決でき難い問題を解く役割が続く、ということであります。

 最適化の計算や、チェスや将棋の如き知的、論理的判断、シミュレーションのような課題ですら人間の優位性があるのなら、ましてや、倫理観に由来する価値判断や感覚、感性、感情、美意識を必要とする世界では、ここ当面、人間の圧倒的優位が続くでしょう。ただし、人間が生み出した「作品」のコピーと微修正、カスタマイズで済むケースでは、機械に分がある、という事態は早晩訪れるでしょう。その場合でも、クライアントが気に入らずに却下し、少しずつ新味を取り入れて再合成する、という時に人間による判断が機械を補助する方が効率は良くなりそうです。

 経済的指標、評価尺度で評価されたい向きには「人間が行った方がはるかに効率良く、何千倍も低コストで迅速にこなせる業務(やその断片)は、少なくとも数十年以上の未来まで存在し続ける」、と冷たい表現をした方が好まれるかもしれません。

「AIを教育する」弁護士と「AIに指示される」弁護士に二極化

 2015年初めの1カ月ほどで全5回放映された、NHKスペシャル「NEXT WORLD 私たちの未来」をご覧になった方も多いと思います。50年後の近未来を描いたドラマも印象的でしたが、それ以上に、2014年に取材された今日の現実の方が衝撃的でした。

 第1回の公式ページには掲載されていませんが、未来予測をテーマにしたこの回には、米国の最先端の弁護士事務所が登場しました。ここでは、判例検索・引用やその適用法のコツをモデル化して「人工知能」(AI) に教え込むことができる一握りの超エリート弁護士と、人工知能の指示通りに動いて実世界を這い回る大多数の下級弁護士に二極分解しています。このAIが公判用の文章をほぼ自動生成し、下級弁護士はそれを一応チェックはするものの、基本的には、膨大な知識や可能性がある中で、AIの指示した範囲を出ないで作業するとのこと。彼らの年収は300万〜400万円程度に落ち着く可能性があります。

 ここで、わざわざカッコ書きに括って「人工知能」としたのは、自らモデル化して学習していないという意味で人工知能以前の通常のエキスパートシステム(知識処理を担う専門家システム)のように思われたからです。これが進化して一種のシンギュラリティ超え、すなわち対象世界のモデル化や知識のモデル化においても人間の能力を上回る、より本物らしい人工知能となれば、最初にそれを設計した超優秀エリート弁護士すら、将来は不要な存在になってしまうかもしれません。

 膨大な過去の症例から目の前の患者に適合するものを選び出す能力においても、米国TVドラマDr. Houseの主人公たちが扱うようなハイエンドの難しいケース以外のほとんどは、AIが素早く低コストで診断をしていくようになるかもしれません。

 以上は、法律、医療という伝統的に社会的地位が高く、高収入とされていた専門家集団の仕事がAIの台頭によって大きく様変わりする可能性を示唆してくれました。

オックスフォード大『あと10年で「消える職業」「なくなる仕事」』

 英オックスフォード大学が702業種を徹底調査して判明したというリストによれば、現在、主にホワイトカラー業務・事務作業とされている仕事や、いわゆる職人的な仕事の約半数が機械にとって代わられる、との見通しが立てられています。その確率は90%以上とのこと。

 下記は、オックスフォード大でAI関連研究に携わるマイケル・A・オズボーン准教授、カール・ベネディクト・フライ研究員の著した論文『雇用の未来――コンピュータ化によって仕事は失われるのか』の中で、コンピューターに代わられる確率の高い仕事・職業で挙げられたものの一部です。

  • 電話販売員 0.99Telemarketers
  • 文書管理・サーチャー 0.99 Title Examiners, Abstractors, and Searchers
  • 仕立屋(手縫い) 0.99 Sewers, Hand
  • 計算オペレータ 0.99 Mathematical Technicians
  • 保険の裏書担当者 0.99  Insurance Underwriters
  • 時計修理 0.99 Watch Repairers
  • 集荷/運送エージェント 0.99 Cargo and Freight Agents
  • 税務申告書代行者 0.99 Tax Preparers
  • DPE,写真焼き増し 0.99 Photographic Process Workers and Processing Machine Operator
  • 口座開設担当員 0.99 New Accounts Clerks
  • 図書館の補助技官 0.99 Library Technicians
  • データ入力作業員 0.99 Data Entry Keyers

 以上が99%の確率で計算機に主な仕事を奪われる職種とされています。これらTop10を含む702の職種の中で、98% の確率でコンピューター化されるという仕事の上位11〜20位は、以下の通りです。

  • 時間計測器の組み立て・調整係 0.98 Timing Device Assemblers and Adjusters
  • 保険申請と契約処理担当員 0.98 Insurance Claims and Policy Processing Clerks
  • ブローカー補佐データ処理役 0.98 Brokerage Clerks
  • オーダリング処理担当者 0.98 Order Clerks
  • 融資スペシャリスト 0.98 Loan Officers
  • 保険の審査担当者 0.98 Insurance Appraisers, Auto Damage
  • スポーツの審判、審査担当員 0.98 Umpires, Referees, and Other Sports Officials
  • 金融機関窓口担当者 0.98 Tellers
  • 彫金師 0.98 Etchers and Engravers
  • 包装・梱包機器オペレータ 0.98 Packaging and Filling Machine Operators and Tenders
  • 購買担当者 0.98 Procurement Clerks
  • 出入荷・物流管理者 0.98 Shipping, Receiving, and Traffic Clerks
  • 平削り機械セッター、オペレータ(金属とプラスチック) 0.98 Milling and Planing Machine Setters, Operators, and Tenders, Metal and Plastic
  • 銀行等の与信分析担当 0.98 Credit Analysts
  • 部品のセールスマン 0.98 Parts Salespersons
  • 申請類の調整・審査者 0.98 Claims Adjusters, Examiners, and Investigators
  • 運転手や販売労働者 0.98 Driver/Sales Workers
  • 無線通信技師 0.98 Radio Operators
  • 法務秘書・パラリーガル 0.98 Legal Secretaries
  • 予約受付、会計・ Bookkeeping, Accounting, and Auditing Clerks
  • 検査官、テスター、並べ替え機、サンプル検査、計量の担当者 0.98 Inspectors, Testers, Sorters, Samplers, and Weighers
  • モデル業 0.98 Models

 以下、コンピューター化される確率が低い702位までのランキングが並んでいます。確率90%以上が171職種、確率80〜89%が93職種、確率70〜79%が51職種、確率60〜69%が56職種、確率50〜59%が32職種となっています。逆に、確率が1%未満のものは49職種あり、創造的な思考による問題解決を行うエンジニア、ソーシャルワーカー、キャリア(人生)教育をする先生や、分子生物学者などの研究者、結婚カウンセラーや、看護師、リハビリ療法士(確率0.28%)、緊急事態指揮官などが、彼らのモデリング手法による計算結果として挙げられています。いかにも、という職種が上下に多い中、一部の職人芸で「そんなに簡単にコンピューター化できるのかいな?」と思わされるものもあります。

 個人的に印象的だったのは、金融関係の業務担当者が多いこと。彼らの専門性、個別対応能力(裁量権と表裏一体)が意外に小さく、比較的容易にIT画面や対話ロボットに取って代わられると2013年時点で評価されていたことです。これを受けて、みずほ銀行、三菱東京UFJ銀行などのトップ銀行さん達が、近未来の大幅人員削減に向けて、ロボットや「人工知能」(具体的にはIBMワトソンなどの大量知識に基づく対話システム)の導入に一斉に走っているかに見えるのは思い違いでしょうか?

未来の職業の頂点に立つのは芸術家?

 さて、コンピューターによるビッグデータ解析の中間結果と対話しながら、人間ならではの高度な知的・論理的な洞察力と、結論を推論する能力により、機械以上に高度な判断がくだせる人々は生き残ります。特に、VoC分析AIサーバー のような強力な「弱いAI」を使いこなす意思のある人ならば(VoC分析AIサーバーは、問題解決への意思があり現場感覚を備えた人なら誰でも使いこなせるように設計されています)。

 このような知性のぶつかり合い、機械と人間の協調で最高の生産性、最適化を達成する業務ばかりが生き残るのではありません。上記702には、人間のメンタル、生理面へのサービスや、極端に複雑な緊急事態への対応など、合理的、論理的とは言い難い業務がコンピューター化されにくいものとして、低確率の数値とともにリストアップされています。

 加えて、前述のように、「倫理観に由来する価値判断や感覚、感性、感情、美意識」を生かした職業は、まだまだコンピューターを寄せ付けない能力、高い価値を人間が生み出し続けることでしょう。

 先日、某室内オーケストラの合宿にて芸術大学出身のプロ奏者の方と食事しながら会話したのですが、最近、ビジネス界、特にITや製造業のデザイン現場から、芸術系学部出身者(特に美術、デザイン)が引っ張りだこになっているという話を聞きます。人を惹きつけるウェブサービス、感性に訴えるデザインがロジック以上に高い価値を持つことは、ITの最前線に携わる人なら日々実感していることでしょう。

 米アップルを創業した故スティーブ・ジョブズの数々の業績にも、美的要素、感性、デザインが大きくかかわっていることを否定する人は少ないでしょう。かつて、iMacを見たビル・ゲイツが、色が豊富なだけで何の新しさもない無意味な製品だと言ったという噂(嘘かもしれません)を聞いたことがありますが、もしそれが本当なら、アップルのみならず、一般消費者がこぞってその発言を購買行動によって否定した事実が歴史に残ることでしょう。

 古き良き昭和時代、大企業サラリーマンになるのが「正しい男子の夢」とされていた時代に育った私は、父親から「芸術系学部にだけは行ってはいけない。"河原乞食"になるぞ!」と脅された記憶があります。母方の叔父の1人が東京芸大のチェロ科を出て、経済的にはあまり恵まれない生活をしていたのを横目で見たことから、父の言葉には一定の説得力がありました。30年以上前の大学生時代にも、所属する音楽部管弦楽団を指導する弦トレーナー(故人、奇しくも件の叔父と芸大で同期でした)T先生も「プロにだけはなるなよ。心の底から音楽を楽しんでいるだけでよい。今の君たちアマチュアの素晴らしさを捨てることになるのだから」と説諭され、複雑な気持ちになったのを今でも覚えています。

 しかし、今や、その芸術家こそが、最も人工知能に追いつかれにくい、ひょっとしたら永遠に機械を振り切ることのできる、ユニークでオリジナルな表現、付加価値をもたらす最高の職業として、そのプレゼンスを日々、高め続けているのかもしれません。

 もっとも、先の合宿での雑談の結論は「美校(美術学部)はいいですよね。企業から熱い注目浴びてもてはやされて。でも音校(音楽学部)は相変わらずですよね(笑)」というものでした。ですので、同じ芸術でも分かりやすい応用のあるジャンル・対象と、深く新しいビジネスモデル等を考えてIT専門家などと丁々発止のコラボ、ブレストなどをしないとなかなか価値が示しにくい専門もあるかもしれません。

 ただ、「音楽」の名誉のために付言するなら、J.S.バッハの知能指数や数学的能力が非常に高かった、と推定されているように、音楽と数学の能力には高い相関があることが知られています。畏れ多い元同僚のマービン・ミンスキー博士もバッハ演奏で素晴らしい能力を披露していたように、知性を反映した芸術的能力で商品・サービスを差別化する必要が生じるまで、デザイン競争が先鋭化してくれば、音楽性と称される人間の謎の能力が引っ張りだこになる日もそう遠くないのかもしれません。これはクラシック音楽のみならず、実は、即興でアレンジ、作曲した新鮮な価値をリアルタイムで生み出し続けるジャズの世界から、産業的価値が生み出される胎動を、ライブハウスなどで最近感じているのであります。

「なぜ?」を問い続ければ機械と差別化できる

 NHKで毎週放映されているスーパープレゼンテーションこと、TED talkには、たまに指揮者など芸術系のスピーカーが登壇します。

 指揮者についてのこの講演などは、ビジネスリーダー、プロジェクトリーダーはどうあるべきかについての深淵な示唆を与えてくれるのみならず、なぜこの演奏はこう生き生きしているのだろう、という疑問へのヒントも与えてくれます。

 そうです。この「なぜ」という問いかけこそ、自意識や価値観、世界観、人生観を当面は持てないでいる人工知能が最も苦手とする部分なのです。「なぜ」の答えには、具体的回答から、禅問答のように抽象的なレベルまで、様々な飛躍したレイヤーの回答があり得ます。そのどのあたりが相手にとって適切なのか、常識や、相手の反応に応じて絶妙に切り替えるような人工知能ができるにはまだまだ、見通せないくらい遥か遠い道のりがあります。

 「なぜ」という問いかけは、物心ついた小さな子どもが両親を悩ませるがごとく、シンプルに誰でも、どんな対象についても発することができます。しかし、回答は難しい。ファストフード店のアルバイトの身分から、この「なぜ」を自問自答し、ときに周囲に発し続けた結果として、その国のファストフード・チェーンの社長CEOまで上り詰めた例がある、と聞きます。「なぜ?」という問いをきっかけに目に見えない要因を突き止め、それを基に、様々なビッグデータ解析ツール、ツールを使い分けるなどして未来を予測し、抜本的な問題解決に至る斬新なアイデアを発案することは当面、人間にしかできないでしょう。

 この意味で、先の702の業務の生き残り確率にはとらわれず、どんな職業のどんなポジションにおいても「なぜ?」という問いを発し続けることで、人間らしい問題解決、機械には追従できない新発見を成し遂げ続けることは可能でしょう。こう考えれば、オックスフォード大学の論文など怖くない、といえるのではないでしょうか。

 そもそも、ラッダイト運動に始まる機械脅威論、ロボット脅威論には、マクロ経済的な視点を欠く面があります。すなわち、単純労働、辛い労働(かつては肉体労働)を機械が代行してくれるなら、人間は、根本的に「楽ができる」ようになるわけです。よほど、政財界トップが確信を持って低所得層を不幸にしよう、彼らに所得を分配するのはやめよう、とでも考えない限り(そうならない保障はありませんが)、機械が単純労働、辛い労働を担ってくれることで、人間はより創造的で楽しい業務に専念できるようになるはずです。

 単純事務からも解放されて、いわゆるベーシック・インカムで、最低限の生活なら「遊んで暮らせる」生活が訪れてもおかしくはありません。このマクロ的な予測を恐れ悲観する理由などどこにもない、というのが、AIやロボットによる人類の未来への悲観論に対する大きな反論です。

 AIの現場にいる人ほど、邪悪な意思を持つAIの開発などがいかに困難であるか、よく分かっています。彼らが今日(こんにち)恐れるのは、ソフトウエアのバグで人に危害を与えることです。勝手に人類を邪魔者、敵とみなすことのないような制御回路を先回りして設けることなど、人間が、量子コンピューターの数百種類の斬新なアーキテクチャを考える際に、十分余地があるでしょう。

 人工知能にまつわるつまらない悲観論はやめましょう。今現在、1度きりの人生をどう充実して、創造的に生き抜くのか考えることこそが、先の702種の仕事の機械化確率を提示された時に取るべきリアクションではないでしょうか。「自分はこのジャンルでこんな夢を実現したい。なぜなら、こんなビジョンが現実になれば、人々がこのように幸福になれるからだ」と一歩踏み出してみましょう(ちなみに人工知能は希望や夢をいつ抱けるようになるのでしょう?)。そうすれば、そのためにはどうしたら良いかの "How to" は、いくらでも人工知能的な賢いサービスが教えてくれるようになることでしょう。  人工知能たちが世界中のビッグデータ、オープンデータを解析して夢の実現のための手掛かりを見つけて提示してくれる素晴らしい時代が目の前に開けている。この連載の読者の皆様がこのように感じてくれたとすると、望外の幸福であります。

posted by メタデータ at 00:00| Comment(2) | TrackBack(0) | business

2015年06月25日

ソーシャル要素を取り入れてビッグデータのアプリは魅力的になる 〜健康増進、ドライブの友、犯罪捜査支援にも

 前回、ビッグデータをフル活用したアプリとして、Mashup Award 10で最優秀賞を受賞した「無人IoTラジオ Requestone (リクエストーン)」や、「intempo」をご紹介しました。ビッグな音楽メタデータ「グレースノート」を活用して、演奏時間をはじめとする様々な条件、キーワードの合致等を見て選曲するところがミソでした。

 メタデータ賞を受賞した「Steky Memory」は、クラウド上で写真を、自分の感動の言葉付きでアルバムとして管理できる点が「今日(こんにち)的」な特色の1つでした。これをもう1歩進めて、登録ユーザーみんなが投稿・記録ができて、自分自身の目標管理や進捗管理が可能なばかりか、友人・仲間と一部データを共有して互いに励みになる、というソーシャル要素を入れたアプリも受賞作の中にあります。

首都大学東京・渡邉研究室の作品群

 Mashup Awardに実力勝負で殴り込みをかける大学の先生や大学院生は数少ないですが、その中で、首都大学東京・ネットワークデザイン研究科の渡邉英徳先生とその研究室は例年上位に入り、様々な賞を受賞されています。

 前回記事では、一昨年のMA8で優秀賞(準優勝)に輝いた 「コトバノモリ」の感情解析応用ポイントなどをご紹介しました。制作者の原田さんは、今回のMA10ではご自身の体験を生かして、駅における妊産婦さんの声と一般ユーザーの声をマッチングさせる「Babeem」を作り、Geek Girls部門賞を受賞。全体ランキングの中でも FINAL進出の栄誉に輝きました。

 渡邉先生自身も主力で加わった作品としては、コトバノモリの前年MA7に「東日本大震災アーカイブ」を出品して優秀賞を獲得(準優勝)。「マッシュアップ技術を活用することで、社会に対して何ができるのか提示した、これまでの Mashup Awards の金字塔的な作品」とまで高く評価されました。

 MA8では「東日本大震災マスメディア・カバレッジ・マップ」で、震災直後にマスメディア報道が伝えた情報と,現実の被災状況や支援を必要としていた地域など,インターネット・ユーザーによってボトムアップで提供された情報を,デジタル・アース上に統合して可視化。その結果をもとに,非常時にマスメディアとオウンメディアを相補的に活用するためのシステムとインターフェイスのデザイン手法を提案されました。災害直後の混乱の中、マスメディアとソーシャルメディアを立体地図、航空写真上で統合してより適切な判断を支援するという、国民の命を守る社会的意義の大きなアプリだ、といえるでしょう。

 これらの開発技法、ノウハウを広める意味で、共著で、書籍『Google Earthアプリケーション開発ガイド』(KADOKAWA/アスキー・メディアワークス)も出しておられます。もう1冊、一般向けにデジタルアーカイブを紹介し、その意義を説いた本として『データを紡いで社会につなぐ デジタルアーカイブのつくり方』(講談社現代新書)があります。

 渡邉研究室の様々な作品は、そのデータ作りに協力した地元の人をはじめ、様々な人々に使われ、時には研究室メンバーが積極的にインタビューに出向いたりして作品にフィードバックしているところが一味違います。作品と社会とのつながりに常に気を配り、ビッグデータやオープンデータを単に即物的に扱うのではなく、データの提供者、利用者にどう貢献し、引いてはより良い社会の実現にどう寄与するかを考えている様子、その背景が上記の新書本から伝わってきます。

公式気象情報の空白を埋める台風ウォッチアプリ

 今年のMA10では、「台風リアルタイム・ウォッチャー」がCivic Tech部門賞(by Code for Japan)を受賞しました。Code for Japan Summitで行われたCivic Tech部門賞決勝で最優秀賞に選ばれた作品です。

 公式情報としては、既に整理、構造化された国立情報学研究所の「デジタル台風:台風画像と台風情報」を用い、非公式情報としてはウェザーニューズの会員が提供する「減災リポート」を用いています。その名の通りの作品ですが、何よりパソコンで実際に使ってみることをお勧めいたします。概要紹介パネル原稿で概要を、GIGAZINEによる解説記事で使い方を、ハフィントン・ポスト記事にて制作者自身による解説、評価内容をご参照ください。

 「減災リポート」のデータは、前々回の記事で解説した「東日本大震災マスメディア・カバレッジ・マップ」と同様、地面から鉛直方向に時間軸を設定し、時空間的なビジュアライゼーションを施しています。これによって、各地における災害の推移がわかります。

 その一例として、沖縄の様子を以下に示します。下から上に向けて時間が経過しています。台風通過前後で、アイコンの色が「緑(災害に対する備え)」→「赤(強風被害)」→「青(水害)」と変化していることがわかります。


 「TV、ネットの公式サイト(気象庁など)ではこう言っているが実際どれくらい酷くなりそうなんだろう? 一足先に暴風圏内に入った隣町の人は予想以上だったと言っているかなぁ?」などの疑問に、ビジュアルで一瞥できるように答えてくれる仕組みは、斬新といえるでしょう。Google Earthという立体地理情報ビッグデータの基盤の上に、分量が多すぎて人間が読み切れない非公式情報を公式情報と併せてマッシュアップしたことで、命が救われるということも出てくることでしょう。

 首都大学東京の理事長は川淵三郎・日本サッカー協会会長(1964年東京五輪代表選手)です。2020年東京五輪に向けて、お膝元の大学としてますます社会的意義、インパクトの大きな斬新なビッグデータ活用アプリを作っていかれることと思います。

車の通行情報データの応用例:犯罪捜査支援や車内娯楽

 災害ばかりでなく事故への対応や、犯罪の捜査支援にもビッグデータが活用できることを示してくれたマッシュアップ作品があります。MA10の「目撃車 by METY」 がその例です。

目撃車とは:
事件や事故(当て逃げなど)があった時、目撃者探しが急務ですよね。
目撃車サポーターに登録している車のオーナーは、いつ、どこを走っていたかを、目撃者捜しに協力するために提供しています(トヨタITC クルマ情報API利用)。目撃車とは、事件や事故があったその当時、その場所を走っていた車のオーナーをデータベースから検索し、電話やメールで目撃情報を問い合わせることができるサービスです。

 ネガティブな事態からのリカバリだけでなく、楽しさを増す方向でクルマ情報APIを活用したアプリもありました。昨年のMA9の優秀賞作品「Quiz Drive」です。

 みんなでドライブした時、渋滞などを自動検知して、アプリがクイズを出してきます。仲間でドライブする時の新たな楽しさを創造した作品といえます。間違った回答をした時の罰ゲームまで用意されている周到さ。ビッグデータの1つといえるカーナビ相当の情報に大きく頼りつつ、場所情報(緯度と経度)だけで決まるのではない点など飽きが来ず、実際に使い続けていってほしいという実用化への思いが感じられました。動画もご覧ください。

公式動画:こちら
利用シーンの実写動画:こちら

 交通関係で実用化志向のアプリといえば、同じくMA9で優秀賞とCivic Hack賞を受賞したスマホアプリ「バスをさがす福岡」(画像はこちら)に言及しないわけにはいきません。

 バス交通が非常に発達した福岡では、あまりの路線の充実のため、最適な解を選ぶのが難しかった。そこへ、最新の渋滞情報も含めてどのバスに乗ればいいか、乗ったら何時に着くかなどをマッシュアップ。

 「バスをさがす 福岡」は、今から乗るバスを知りたい時、出発地点と目的地のバス停を指定することで「どの路線番号のバスに乗ればいいか」「目的地に何時に着くのか」「運賃はいくらか」「待っているバスは、今どの辺りか」「バスがどのバス停に止まるのか」を素早く確認することができます。

 この動画の開発者の言葉から、利用者の不安を取り除くことを徹底的に追求したことが伝わってきます。開発の経緯を聞くと、オープンデータはどうあるべきか(更新頻度)などの問題意識も伝わってきます。

 このマッシュアップ・アプリがいかに実用的だと評価されたか。何よりの証明は、今からちょうど1年前のこのプレスリリース「『バスをさがす 福岡』が生まれ変わって、『にしてつバスナビ』へ!」にとどめを刺すでしょう。

 元々、超小さくて若い会社であるからくりものが「勝手に」開発・リリースしたアプリでしたが、西鉄公式アプリのベースとして採用されたという経緯は非常に珍しく、地元福岡でも驚きを持って迎えられました。

 最初に西鉄へご挨拶に伺った際、まるで職員室に向かう学生のように「あー絶対怒られる」と思っていた我々を暖かく迎えていただき、まさかの公式化へ導いてくださった西鉄自動車事業本部や西鉄情報システムの皆様、また、出会いのチャンスを設けていただいた皆様にも大変感謝しております!

 Mashup Awardへの出品作品の多くがアイデア先行だったり、実用というにはデータ量も機能の整理もまだまだで、早期プロトタイプとしか言いようのない作品が主流です。そんな中、商用サービスにほぼそのまま採用された稀有な例として、歴史に残ることと思います。

みんなで記録するライフログも集まればビッグデータ

 健康管理やダイエット系のアプリで、自分の食べたものや運動の記録、そして、体重をはじめとする健康情報を入力すると、グラフや助言、励ましの声が得られるようなサービスが人気を集めています。たとえば「あすけん」はよくある発想としてソーシャル化し、各人がOKした範囲の情報がほかの会員に公開され、参考に供されたりしています。もちろん、大人数の大量の生データを解析して、助言が有効だったか等、フィードバックしてシステムを日々改良していることと思われます。

 MA9 の優秀作品の中でこのタイプの代表格として目を引いたのが「毎朝体操」です。コンテンツとして、「スマホを持ってラジオ体操」してもらい、それを採点し、視覚化するというなかなかユニークな発想をした点だけでも高評価に値すると思いますが、加えて実にきめ細かな作りこみに感心させられます。


 自ら体操して使い込んで改良するとともに、多数のユーザーの声を聞いて改善してきた痕跡が随所に認められます。体操着で発表を行い、最後に「やりますよね!?」といって会場全体を巻き込んでラジオ体操させたプレゼンの手腕も見事でした。

 この「毎朝体操」が蓄積したデータを解析すると、いったいどんな分析結果が得られるのでしょうか。運動しているのにちっとも痩せないとこぼす人が実はカロリー消費の少ないサボった動きをしていることが順当に判明するのか、あるいは逆に意外な方法で楽に短時間体操するだけでダイエットできるコツを示唆してくれるようになるのか。まずは、楽しさと、ついついやってしまう“習慣性”を備えたアプリの開発に期待しましょう。測定が先か、効果が先かの問題はマネタイズに苦労するベンチャーに任せて、と一般ユーザーは気楽に構えていても良いのかもしれません。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年06月11日

これはユニーク! ビッグデータが支える秀逸アプリ 〜感動するとスマホが勝手に写真を撮る

11月は毎年恒例、リクルートさん主催のマッシュアップ・アワードの表彰式を兼ねたファイナル・バトル、懇親パーティがあります。

 マッシュアップ・アワードは、「既にそこにあるビッグデータとの対話(その1)〜破壊的に安く、早くアプリを作る」でご紹介したように、APIを用いたプログラミング・コンテストです。今年は10周年記念大会ということで、全国各地でのハッカソン(24時間とか1泊2日でお題や素材に合わせたアプリをその場で考案して作っちゃうイベント)やアイディアソン(ハッカソンの前半、企画・アイデアまとめまでのイベント)を、1年がかりで開催し続けるという長丁場の最終ステージとなりました。

マッシュアップ・アワードと当社の関わり

 マッシュアップ・アワードを創始したのは八木一平さん(当時リクルート メディアテクノロジラボ、現・大阪ガス)と藤井彰人さん(当時サン・マイクロシステムズ、現・KDDI) 。草創期、私も八木さんに相談されて「Web APIという、完成度が高く利用しやすいプログラミング部品を使って、エンジニアの発想や、高速に作りながら考えることを支援する」といったコンセプトを固めていくのに微力ながら貢献させていただきました。

 第3回では当社としてのマッシュアップ作り支援のため、Web APIを様々に検索し、組み合わせを検討しながら選べるカタログサービス「API比較・マッチングサービス」 を、これ自体をマッシュアップ作品として開発し、部門賞を獲得しました。第4回以降は一貫して、5W1H個人情報検出APIを提供。ほかにもネガポジAPI、感情解析API、願望検索(したいこと検索)APIなど、人工知能的なテキスト解析APIを提供してまいりました。これらのリンク先に、応用作品のリストがあります。

 その後も歴代の事務局さん、ほかのAPIを提供される他社さん、そしてAPIを利用したマッシュアップ作品を作られるエンジニアさんたちと深く長くお付き合いしてきたこともあり、昨年の第9回 MA9では事務局からの挨拶の時間にスピーチをさせていただきました(写真下)。

「きれいやな〜」とつぶやくとスマホが風景をパチリ

 第4回以降、部門賞、協賛企業賞、APIパートナー賞など名前は変わっていますが一貫して、当社提供のAPIを利用した最優秀作品に「メタデータ賞」を授与してまいりました。今回の受賞作品は「Steky Memory」という名のスマホ向けアプリです。

 作者は明石高等専門学校在籍で来年大学院進学予定の松田裕貴さん。本人による作品紹介文を引用します:

美しい景色や美味しい料理…ステキなものに出逢った時、写真に記録を残したい。
でも、画面越しに見るのはもったいないと思いませんか?
Steky Memoryは、あなたの「すごい!」や「美味しい!」といった言葉をトリガーに、写真を自動撮影してくれます。
また、撮影した写真を時系列で振り返ることもでき、クラウド上(OneDrive)で写真をアルバムとして管理することもできます。

 こちらの専用ウェブサイトのリンクから、アンドロイド携帯やタブレットでダウンロードして使ってみることができます。友だちと街を散策している時などの自分の会話を常時音声認識させ、それを感情解析APIで解析し続け、言葉に感動や感情の動きが含まれていることを検出した瞬間、自動でシャッターを切ります。

 リアルの発話に含まれた感情を検出してカメラのシャッターを切らせる、という自由な発想に驚きました。標準で写真と言葉をクラウドに保存していくので、ライフログから感動シーンだけを切り取った「感動シーン・ログ」ともいえる仕組みである、と評価できるでしょう。

 全APIパートナー賞のページから、授賞理由、コメントを引用します:

サーバーサイド・テキスト解析系API利用としては珍しいスマホアプリでした。 美しいデザイン、仕上げ、完成度もさることながら、音声認識を経て感動の類の言葉が発せられたことを感情解析APIで判定し、そのときだけ、その瞬間シャッターが切られるという斬新かつシンプルなインタフェースに驚きました。 写真、認識結果、日付時刻などのメタデータ一式をクラウドに即保存というのも今日的であり、ユーザの手間をかけさせまいとする配慮も素晴らしいです。 日々の気持ちの動き、感動の体験をすべて記録する、「幸福なライフログ」という印象を持ちました。

 当社の松田圭子取締役が松田裕貴さんに贈呈したメタデータ賞(写真上)の中身ですが、ラズベリーパイという名の超小型コンピュータ・キットに、Bluetoothでスマホのシャッターを切る装置が一脚、そして、スマホカメラのレンズに取り付ける魚眼・広角の各アダプタとクローズアップレンズ、という盛り合わせです。彼のプロフィールやフェイスブックでの活動内容を拝読し、今後もユニークな作品、それもハードウエア込みの面白い作品を作り続けていってほしい、との願いを込めての選択でした。

 感情解析APIの利用作品には毎年ユニークで素敵な作品が多いのです。ご紹介すると、今回惜しくも賞を逃したソーシャル安否確認、恋文、さらに昨年の作品群はこちらです。

 そして一昨年は、首都大学東京・ネットワークデザイン研究科・渡邉英徳研究室の大学院生・原田真喜子さんによる コトバノモリが全作品中の準優勝に相当する優秀賞を受賞。この作品は、ツイッター上で、商品やブランド名の評判がどのような感情的評価で分布しているかを一目で把握できた感じになれるということで、マーケティングやマーケットリサーチ関係者にも大変好評です。学会等でも受賞しており、詳細は、査読付きの学術論文“特徴語抽出と感情メタデータ付与によるウェブ上の語彙の概念の視覚化”(原田真喜子,渡邉英徳,映像情報メディア学会誌第68巻第2号,page J78-J86)で説明されています。なお、この年に感情解析APIを活用したマッシュアップ作品の一覧はこちらです。

音楽ビッグデータを活用して、人工知能がDJに

 さて、10年前の草創期から、マッシュアップ作品の多くがGoogle Maps APIを使っていました。先の連載の通り、構造化されたビッグデータを背後に備えたAPIを使うだけで、ビッグデータ応用システムになるという次第です。

 今回の最優秀作品は、音楽ビッグデータを活用した作品です。
  ●「無人IoTラジオ Requestone (リクエストーン)」

 メールやツイッターなどでBGMのリクエストを受け付け、あたかもDJのようにリクエスト内容を機械が読み、YouTubeAPIから取得してきた曲のタイトルを音声で読み上げ、音楽を流すという無人のラジオ・リクエスト放送サービスです。

 曲のリクエストだけでなく、例えばイベントの感想などをRequestone宛に送ると、メール文面の雰囲気を言語解析し、その雰囲気に合わせた口調で読み上げ(VoiceTextAPIを利用、音声垂れ流し)、さらに雰囲気に合わせた曲をGracenoteAPIのムード情報から選曲して曲をかけることもできるとのこと。上記の作品紹介ページから作者自身のコメントを引用します:

目玉の機能は、放送に対する”リクエスト”。
あなたの面白エピソードや、ちょっと人には言えない相談、今聴きたい曲や気分など、昔懐かしの“ハガキ職人”な気分になって、Requestoneにメールを送ってみてください。
VoiceText DJ.Edi が、あなたのメールを読み上げて放送をお届けしてくれ、ピッタリの曲を推薦してくれますよ。
また、IoTであることを活かして、ハードウェア連携機能を搭載。
放送中に「いいね!」を届けることが出来るボタンや、センサーから周辺情報を取得し、災害放送などの緊急連絡もサポートします。

 テキスト解析して様々な単語を抽出したものを、Gracenoteの音楽メタデータAPIに投げると、各楽曲についてジャンル、アーティストの活躍年代・地域や経歴、ムードなどの属性情報と照合してくれます。この中から適合度の高かった楽曲を曲目推薦してくれる、と思われます。Gracenoteとは初耳の方もいらっしゃるかもしれません。音楽CDをパソコンにセットするとあーら不思議、どこからともなくアルバム情報やトラック情報が補われて便利ですが、あの背後で動いている仕組みです。

 Gracenoteのことを巨大な音楽ビッグデータと呼んだりもしますが、正確には音楽そのものではないので、全世界の音楽メタデータを収集したデータべースを持ち、ネットを介して情報提供しているサービス、と言えるでしょう。比較的最近、その仕組みをAPIとして、ソフトウエアや機械から呼び出して使えるように公開し始めたということになります。

 再生して流すべき音楽データそのものは、次の2つのAPIから取得します。YouTubeAPI、melocyAPI  また、音声合成(テキストをしゃべる)APIを介して読み上げるべき関連文章を取得するのに、朝日新聞記事APIを使っています。

 これらも、データ収集の方法こそそれぞれ違いますが、ビッグデータを構造化して提供しているAPIにほかなりません。10年前の、単純に地図上に何でもかんでも置いていく類のマッシュアップ・アプリと比べて、なかなか賢そうなひねったアイデアでビッグデータを活用している、と言えるのではないでしょうか。

 今回のマッシュアップ・アワード(MA10)では、ほかにも巨大な音楽メタデータの力を借りた面白いアイデアの作品があります。たとえば、これ: intempo

      ■使い方

  1. 出発駅と目的駅を入力し、自動的に表示される候補から乗りたい電車を選択します。
  2. しばらく歩くと、アプリが一定距離内での歩幅や歩数を自動計算します。
  3. 流れる音楽のテンポで歩けば、出発時刻に間に合うようにちょうどよく駅につきます。

 詳細は、上記リンク先におまかせするとして、音楽のリズム、テンポ(速度)という属性を活用し、それに合わせて歩いていくと、ぴったりの時間に駅に到着、というアイデアがナイスだと思います。少し似たアイデアに、MA5の優秀作品、キャストオーブンというのがあります。

 電子レンジの温め時間の長さにピッタリの動画を、YouTubeから探してきて自動で再生してくれる、ということで、探索の手がかりとなるデータが秒数だけというあたり、まだまだシンプルだったといえるでしょう。

 次回は、ユーザーが毎日のように使ってせっせとデータをサーバーに送ると、その結果、次第にビッグデータが出来上がっていくタイプの作品を紹介したいと思います。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年05月13日

「狭告」の効果が激増するクリエイティブの条件とは? 〜既にそこにあるビッグデータとの対話(その5)

機械の進化で、人はますます“クリエイティブ” に専念

 上の見出しは普通に読めば、機械が雑用、単純な事務処理、情報処理を代行してくれることで人間は人間にしかできない人間らしい創造性(クリエイティビティ)溢れる活動に集中できるようになる、と解釈されるでしょう。情報爆発が進行する中、人が読み切れない大量の受信メールやウェブ記事をソフトウエアが代読してくれ、わずかに含まれていた有用そうな情報(例えばアドレス帳や営業データベースに含まれる姓名と一致した人物の講演案内)だけをピックアップして提示してくれる機能など、2020年頃には当たり前に使われるようになっているのではないでしょうか?

 日経ビジネスオンラインに以前、私がインタビューされた記事「やる気が出て仕事が楽しくなり、出世の手伝いもしてくれるソフトとは?」では、このように機械が膨大な単純読解作業などを代行してくれて、「人はますます“クリエイティブ”に」シフトする未来ビジョンが描かれています。

 一方、広告の世界で「クリエイティブ」と言えば、広告コピーと呼ばれる耳目を集める短文や、画像(静止画、動画)をもっぱら指します。昭和時代には「いい日旅立ち」のような国民的名コピーが少数作られ、享受されていた感がありますが、デジタル化の進行により、検索連動広告に付与する10数文字のコピーなど、1企業でも同時に大量に投入され、効果次第で頻繁に書き換えられるようにもなりました。

 フェイスブックのソーシャル広告に代表される「狭告」では、クリックされるか否かは画像次第(画像によってクリック率が7〜8割も左右される)とも言われます。目を引きさえすれば良い、と割り切ってしまったのか、社会人向け講習会の広告画像が女性の水着写真になっているのも見たことがありますが、これは行き過ぎ。クリックした後で「騙された!」と思われては逆効果でしょう。

 正攻法、すなわちソーシャル広告の目的や、「こんな人たちにクリックしてほしい」というターゲットを前回記事のように綿密に考え、ターゲットの目線で興味を引きつつ商品、コンセプトに関連ある画像を選んで調整していく、という作業はクリエイティブです。商品知識に精通した人が必ずしも画像選び、作画デザインを得意とするわけではありません。そこで最近では、後者をクラウドソーシングする「ReFUEL4」というサービスが立ち上がり、注目を集めているようです。「作画デザインをする人」と「画像を選ぶ人」を分けることでソーシャル広告作成の効率化を図る、という狙いから生み出されたサービスであると言えます。

地域の健康増進を支援する調剤薬局のクリエイティブ

 前回記事「実践! 下町商店街の活性化に「狭告」を活用  〜 既にそこにあるビッグデータとの対話(その4)」から、課題2を再掲いたします:

課題2 そこで採用した広告クリエイティブ(画像と文章)を提示し、それらを見たら、思わず、自分の潜在顧客がクリックしたくなる理由を述べてください。また、クリックしてフェイスブックページに移動したときに、納得、満足していただくには、ページにどんなコンテンツや機能(アプリ)が求められるか、2,3挙げてください。

 今回の記事で最初に登場するのは、法政大学大学院イノベーションマネジメント研究科・今年度『ソーシャルメディア論』受講生の新田慶子さんです。

 彼女のビジネス定義、事業ドメインはこうなっています:

* ビジネス定義

地域の健康を見守る機能を持った調剤薬局を開局する

 そして、調剤薬局業界の事業環境を、独自の問題意識を通して簡潔に展望した上で、上記事業ドメインを踏まえた差別化ポイントを次のように訴求し、ソーシャルメディア活用のスタンス、目的を明確にしています:

* 将来のビジネスについて

 全国の調剤薬局は5万店舗を超えているが、上位5社のシェアは7%という極めて細分化された市場となっている。また、究極の立地産業と言われており、顧客のほとんどは立地だけで調剤薬局を選択している。そして最近は、規制緩和によるドラッグストアやコンビニなど、異業種からの調剤参入が競争を激化させている。

 現在の調剤薬局は立地の良さや、買い物ついでに行けるなど、利便性追求の方向に進んでいるが、本来の薬局は地域に根ざし、地域の人々の健康を見守る機能を果たすべきである。その本来の機能を備えた、治療ではなく、健康になれる薬局を造り、拡げていくためにソーシャルメディアを活用する。

 そのためにはまず、構築するフェイスブックページに、該当する地域の住民から「いいね!」をたくさん獲得すること。次に、彼らにリピーターになっていただくべく良質なコンテンツを充実させていく、という基本方針を描きます。

 初めてこの調剤薬局のフェイスブックページを目にする、日頃から健康に特段の関心があったり将来の健康不安を抱えている人々に「おや、何だろう? これは私の健康増進のヒントを与えてくれるページではないかな?」と思わせるクリエイティブが期待されます。そして、一度「いいね!」してくれた人々のタイムラインにも、クリックして再訪してくれそうな興味深い、アイ・キャッチできる画像を定期的に供給していく必要があります。

「元気」「安心」感性に訴えるイメージを提示

 ターゲットの属性については開業予定地域、自分の身体・健康に特に関心を持ちやすい年齢に絞るなどして広告の費用対効果を上げることなどが考察されました。問題の「趣味・関心」については試行錯誤、すなわち、推定リーチ(ターゲット属性の人数の総和)とにらめっこしながら調整した結果、次のような初期セットとなりました。

*広告ページのターゲットについて

 - - - 中略 - - -

 ターゲット層の趣味、関心は医療、看護、科学、農業など、広くヘルスケアに関連する分野と、ヘルスケア関連以外に新聞、本、雑誌、漫画または電子書籍など、情報に興味を持つ層も含めた。また、トライアスロンやボディビルなど長期間に身体を作ることに関心がある層は、最適な栄養の摂り方や身体のメンテナンス等の情報を必要としているため設定した。以上のようなターゲット層に薬局が健康をサポートする機能を担うところであると認知してもらい、立地以外の条件で調剤薬局を選択し、かかりつけ薬局を持つ ことを促したい。

 既存薬局との差別化では、「立地以外の条件で調剤薬局を選択」というのがポイントです。すなわち、病院のすぐ近くに立地すれば安泰という既存の調剤薬局のスタンスから大きく差別化し、地域住民の健康を見守るというミッションを果たす新概念の薬局を目指すと明確に示すことが、「課題2」に答える主眼となります。

 リアル店舗の看板に取って代わる広告クリエイティブや、ページのバナー画像としてどんな画像を用意したら良いでしょうか。このあたり、論理と感性が見事に調和した画像作り、画像選びを行う必要があります。新田さんはどのように選択を進めたでしょうか。

*画像  元気になれる、心地良い、安心できるイメージの画像を(複数)選択した。

・元気がでるイメージ

ビビッドカラーの錠剤で目を引く、元気なイメージ。薬剤情報以外に、何か元気になれる要素がありそうに感じさせる。


 最初は、赤系統の多い、血色の良い元気なイメージで、アイキャッチと目標イメージ(“To Be”image。抽象的ですが)を狙う、ということのようです。目標イメージ重視であれば、

ジョギングして楽しそうにしている人の笑顔など、「自分が元気になったらこうなりたい」という目標自己イメージを未来の鏡のように見せてあげるテもありますね。

と講評しました。

 次は、薬のイメージから日常生活に視点をシフトします:

 カプセルの中の新鮮な果物が健康で元気なイメージ。薬の専門家というだけでなく、健康全般に良いヒントをもらえると思わせる。


 感性に訴える効果は十分認められそうです。そこで、論理で補完しました:

一般向け、40歳代以下向けには結構と思います。50代以上や、糖尿の家系ならもう少し若い層でも、流行りの糖質制限食を実行している人もいるので、彼らにとってのフレッシュで健康的なもの、例えば糖質のごく少ない野菜や、新鮮なイワシ(DHA!)を並べたバージョンもあると良いでしょう。

店舗やスタッフの好イメージを訴求する

 次は、店舗や店舗のスタッフのイメージを提示して、安心して健康相談できそう、と意識してもらう画像。スタッフと客、スタッフのみ(客視点)、の2点です。

・安心できるイメージ

 何でも相談できる薬局のイメージ。普段は聞きにくいと思っていることを気軽に相談できる薬局を思わせる。



安心して相談してくださいというイメージ。この薬局は頼れると感じさせる。

 これについては、やや辛口の講評を添えました:

安心のイメージは人によって随分違う、難しい課題と思います。多くの試行錯誤が必要となるでしょう。

 スタッフの視線から見て、心からリラックスした笑顔で安心して相談している自分の姿が映っている画像も良さそうです。動画だけでなく静止画も、誰の目線なのか、どの登場人物に自分を重ねて感情移入するかという観点で、ある程度論理的に、感性的な効果を予想できることを踏まえた講評です。

 最後は、「心地良さ」を訴求する2点です。

・心地良さのイメージ

 人工的な薬ではなく、自然の感じが心地良さを表現しているイメージ。

[画像クリックで拡大表示]

グリーンと白の錠剤が安心と心地よさをイメージ。

 生薬、天然成分のイメージ、そして、1点目とは対照的な中間色、自然な色合いで身体に良さそう、と感じてもらえそうな写真の選択。心地良さはどちらかというと内服するものよりも、自分を取り巻く環境、英語でambience という言葉が示すあらゆる外部要因のイメージを取り込んだ方が良いかもしれません。

 実店舗では、話し声が心地よく響くような音響設計、ノイズさえも心地良く、静かすぎないことでプライバシーは守られる感じ、匂いも心地良いものを目指すべきでしょう。店舗の快適さをイメージさせる画像には多くのバリエーションが有り得るので、薬局に限らず国内外の様々な優れた快適店舗の画像を参考に、実店舗と乖離し過ぎない良い画像を選択すること。これは多種多彩な商材を扱う店舗全般にも通用する、クリエイティブ画像選択のコツの1つになるでしょう。

期待されるコンテンツはヘルスケア情報

 課題2の後半、「いいね!」してくれたアクセス者が満足し、継続的に訪問し、新規投稿にも「いいね!」やコメント、シェアしてくるようなコンテンツはどんなものが期待されるか、新田さんはどのように調査分析、考察したでしょうか。

*広告をクリックして納得、満足していただくための、コンテンツや機能(アプリ)

 参考のため、他の調剤薬局のフェイスブックページを確認したが、ほとんどが薬局内でのイベント(飲み会関係)の写真などで占められ、ヘルスケアに関する情報がタイムラインになかった。最も多くフェイスブックページにいいね!を獲得している調剤薬局(グローバル薬局、フェイスブックページのいいね!は8147件)は、タイムラインにヘルスケア情報を掲載していた。

 地域住民の健康をケアする調剤薬局のフェイスブックページにはヘルスケア情報が欠かせない。タイムラインには季節ごとのヘルスケア情報などをタイムリーに掲載し、Q&Aのアプリなどで探したい情報が検索できるようにする。また、日々の食事内容を入力すると、不足している栄養を表示し、何を食べると良いか、また効果的なサプリは何かを表示できるようなアプリがあると良い。

 以下が私のコメントです。

反応を見ながら、日々さらなるアイデアを出し、工夫をしていってください。コンテンツの蓄積は大変な財産になります。リピート客の確保には、「今日は何の日」などの様々な蘊蓄系の蓄積や、時事ネタなどをコンスタントに効率よく提供していく方策にも思いを巡らしてみてください。

 以上の抜粋以外にも様々な考察、企画、実習などを経て、新田さんは薬局神無月というフェイスブックページを、実店舗の開局に先立ってオープンしました。上記レポートの提出後も、昨今急速に関心の高まっている低糖質食についての重要な情報、健康上気になる情報をコンスタントに投稿されているようです。その記事内容にふさわしく、美しく興味深い写真を添えて、思わず目を向けたくなる記事が並んでいます。

商店街フェイスブックページの人気コンテンツ

 前回登場した、北村咲子さんたちが運営する、東十条銀座商店街フェイスブックページのクリエイティブは、どうなっているでしょうか。せっかくですので新田さんとは棲み分けて、広告クリエイティブでなくオーガニック、すなわち、フェイスブックページのタイムラインに掲載され、購読者(ページ全体に「いいね!」した人)に流れる記事の写真をご紹介します。

 複数のスタッフで対応しているだけに、全体の統一感を意識して出すべく、シンボル・キャラクター犬、ラブちゃんのイメージをバックボーンに持たせているのが大きな特徴です。特に着ぐるみ制作プロジェクトについて、前回記事に掲載した設計図面から、制作中の工場の様子、そして、完成品の写真が掲載されています。 ずーっと追っかけていた人は、お披露目の日、『12/7(日)』と『12/21(日)』午後に商店街をラブちゃんと歩き、ラブちゃんと握手して記念撮影したくなってしまうことでしょう。

 ラブちゃん以外は、アーケードなし商店街のメリットなどの蘊蓄的な記事を除けば各店舗の主力商品、目玉商品や名物(店主?)をフィーチャーした画像、紹介文で記事をまとめています。例えば、初期(「いいね!」数がまだ50未満)の段階で、広告なしで242人にリーチしたコンテンツは神谷珈琲のものでした。下記のように考えて投稿した結果が「吉」と出たか否かは、インサイトと呼ばれる、リーチした人数、本投稿への「いいね!」数、コメント数、シェア数により、評価されます。

◆4回目の投稿 9/7(日) 商店街店舗アンケートを実施し、より良い商店街になるための努力をしていることをお知らせした。個別の店舗が登場しておらず、森を見て木を見ていない印象を読み手に持たれぬよう、商店街の店舗を初めて登場させた。商店街アンケートにてFacebook掲載に積極的にOKの店舗を発見できたということがこの企画の源である。記事の珈琲店は、我々が広告を行った層を含む30代〜50代のお客様の獲得に力を入れているとのことだった。コーヒーというのは、普段は商店街を利用しない男性をはじめ多くの方に響きやすいということで、トップバッターには最適であったと考える。
図 9/7(日) 実施4回目投稿の内容とインサイト(9/8 10:00 現在)

 11/10夜の時点でインサイトを見てもらったところ、神谷珈琲の投稿のエンゲージメント(読者によるアクションの全体)は次のようになっています。

  • いいね!    57件
  • コメント     5件
  • シェア      0件

 なお、私の友人で、フェイスブックはまだやっていないけれど、Google検索だかで上記の記事を見て、割と近所なので行ってみた、ログインできていれば「いいね!」した、という人もいました。神谷珈琲については後日、2杯目は半額、という印象的な写真入りの記事でフォローアップし、「2度びっくり、2度美味しい」ことで記憶に刻まれるような配慮がなされています。人は、3度接して好感が続いていれば実際にその商品・サービスの入手に動く、と言われます。適度な間隔を置いて、店員さんやお店の雰囲気に絡めるなど、また一ひねりした内容の3度目の投稿をすることで、商店街の必須アイテムとして神谷珈琲の認知を得ることができるようになるでしょう。

 個々の商店、商品の投稿記事をもう1つだけ。投稿後ほどなく多くの人にシェアされたおかげで、多数にリーチした記事を紹介します。伊勢屋さんのたい焼きの記事です。


 この記事が、広告なしで、ほかの個別商品紹介の投稿の数倍も多くシェアされ、数倍も多くの人にリーチした理由、原因は何でしょうか? 率直な評価としてこれは、たい焼きを大切そうに両手で持った、店主さんの最高の笑顔のおかげではないでしょうか。このように、売り手側のポジティブな気持ちをストレートに表現する画像というのが、存外、ポジティブな反応「美味しそう! 自分のタイムラインにも載せたいな(友達にも見せたいな)」を引き出せるということは覚えておいて良いと思います。

 後日、実際に支援スタッフがお店に足を運んでインタビューしたところ、このフェイスブック記事を見て買いに来ました、と申告してきたお客さんはさすがにいなかったようです。しかし、いつもお客さんの流れ、顔を見ている店主さんから、見たことのない新顔のお客さんの比率は明らかに増えたようだとのコメントは得られました。

 今後、手軽にソーシャル経由の訪問数の目安を得つつ、何より訪問を増やすためには、個別店舗ごとのチェックイン・スポット登録を行うこと、そして、チェックインを増やすためにスタンプラリーの電子版・オンライン版としてのチェックイン・ラリーを企画したり、もれなく適用される割引サービスをチェックイン・クーポンで実現する、などの施策が活用可能です。

競合他社との常時比較が可能に

 フェイスブックページの管理者になると、上記「インサイト」の数字が見えるようになります。そればかりでなく、競合企業のページやレファレンスとしたいページを複数登録して、ページへの「いいね!」数(ファン数)、その週単位の増減、今週の投稿、今週のエンゲージメント(いいね!、コメント、シェアの合計)を常に比較表示することができます。

 自社フェイスブックページが登録している競合ページの一覧を公開してくれる会社はほとんどありませんので、貴重な事例として、東十条銀座商店街のレファレンス・ページ一覧をお預かりしてきましたので、参考までにご紹介いたします:


 ここ数回、生データやユーザーの反応(インサイト)と対話しながら、ビッグデータを間接的に活用する話題を取り上げました。まだしばらくは、ソーシャル・リスニングや投稿を中心とした新しいマーケティング手法の話題を続けようと思います。特に、「いいね!」した人のみに見せるページやアプリの特典、ポイント等をインセンティブとすることが11月5日以降、禁止されたこともあって、良記事や魅力的な写真を載せるという正攻法がますます重要になっています。

 そのため、投稿されたテキストを解析する潜在ニーズも増大していると感じます。そこで次回以降、人間に代わって投稿を読んで何らかの判断をするサービスの先駆的な事例(例:シャチクノミカタ)などをご紹介してまいりたいと思います。


タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年04月30日

実践! 下町商店街の活性化に「狭告」を活用 〜既にそこにあるビッグデータとの対話(その4)

前回の記事「有望な『潜在顧客』から順に“狭告”を見せる! 〜既にそこにあるビッグデータとの対話(その3)」では、膨大な個人属性、興味・関心プロフィールが顕在層と共通する潜在層にだけ広告を見せるSocialAd99というサービスが開拓した可能性を示しました。

 今回は、前々回記事「超絶ピンポイント! もはや広告ではなく“狭告”だ」で解説したフェイスブック広告出稿の基本を踏まえて、他のアンケート調査結果から得た仮説を併用し、実際にローカルビジネスのフェイスブックページ活性化を行った「東十条銀座商店街」の事例を紹介します。

 実行したのは北村咲子さん。彼女は、法政大学大学院イノベーションマネジメント研究科の私の講座『ソーシャルメディア論』の今年度受講生です。

 講座の前半には、悩める企業ソーシャル担当者さん中心に7万2000人以上が購読するソーシャルメディアマーケティングラボ(Social Media Marketing Lab.)の編集長・藤田和重さんが特任講師として登壇。企業ソーシャル運用の実際を豊富な事例とともに紹介してくれました。

 以後、私の講義の過程で、自身のフェイスブックページを立てて、広告出稿を行い、それについてのショート・プレゼンを受講生全員にやってもらいながら、講評、アイデア付加などを行いながら進めるという実践的な講義。本番さながら、というよりも本番そのものの真剣勝負です。

コピペでは絶対に対応できないレポート課題

 2週間半の夏期集中講義(火木土の午前2コマずつ)が終盤に差し掛かった頃、成績を付ける必要もあって、次の2つのレポート課題を出しました。

課題1 自分の将来ビジネスの顧客を想定し、広告作成ページと「対話」しながらターゲットを精密化し、なぜそのように設定したかを論述してください。

課題2 そこで採用した広告クリエイティブ(画像と文章)を提示し、それらを見たら、自分の潜在顧客が思わずクリックしたくなる理由を述べてください。また、クリックしてフェイスブックページに移動した時に、納得、満足していただくには、ページにどんなコンテンツや機能(アプリ)が求められるか、2、3挙げてください。


 近年、特に今年になって、大学院のレポート課題や、あろうことか修士論文や博士論文をコピペで出す学生がいる問題が騒がれるようになりました(教育現場は戦々恐々としていますね)。

 数年前までは、知識を問う課題も出していたのですが、その際にも具体的な事例を探してもらう課題では「AやBやCなどの特徴を【持たない】Xについての事例を示し、コメントせよ。」という出題とし、通常ならざるサービス商品についての理解を問うなど工夫をしました。お察しのように、見事に正反対の「AやBやCなどの特徴を【持った】Xについての事例」をウェブ検索で引っ張ってきて、そのページにあった考察らしき文章をそのままコピペしてきた例が過去に1つだけあり、落第点を付けたのを覚えています。

まずは、事業ドメインと「思い」を定義する

 オリジナルな素材と論考が求められる上記2課題では、たとえ一部であろうと、コピペでレポートを作成するのは不可能です。身体を張って、実体験を語り、真剣勝負で議論する講義に対しては、院生側も同じように全力でボールを打ち返してもらわねばなりません。北村さんはどのように答えてきたでしょうか。

 まず、「課題1 自分の将来ビジネスの顧客を想定」のところで、経営者、事業責任者の視点で、事業ドメインと事業への「思い」を記します:

将来のビジネスについて

 私の将来のビジネスは、地域活性化支援と跡取り女性支援との2本柱である。地域活性化の仕事とともに、跡取り女性(事業承継した女性)を対象とした経営者教育のコンサルティングを行う予定である。事業承継した女性は地方に残された女性であることが多い。息子は都会に出たり父親に反発したりすることが多い中、昔であれば「娘婿」に白羽の矢が立つところ、近年は娘自らが事業承継している例が増えている。女性は男性と比べて社会貢献や地域貢献活動に巻き込まれることが多い。それ故に、跡取り女性へのコンサルティングの中には、地域との付き合い方や地域活性化の内容が一部含まれる。別の角度から見れば、地域活性化の中で、跡取り女性支援ということもありうるだろう。

 互いに重なり、シナジーのある2つの柱を明確化した上で、ネガティブととらえられがちな点(地域活動に時間を奪われる)を、ポジティブな活性化の端緒と捉え直すという着眼、発想があります。その上で、その具体的な解決手段を以下のレポート中に記すことが示唆されている、優れたイントロとなっています。

 今回のフェイスブックページの作成は、「東十条銀座商店街」にさせていただいた。それは、後進育成に熱意のある東京都中小企業診断士協会の朝倉久男城北支部長の掛け声に若手診断士総勢10名が集まり、東十条銀座商店街を支援しているからだ。私は平成27年に診断士登録の予定ではあるが、法政大学経営大学院の教育は診断士業界で信頼が厚く評判が良いため、前倒しで参加が認められた。フェイスブックページは、我が商店街にとって時期尚早感もあったが、いいね!などの数字を示すことが商店街店主へのモチベーションにつながると考える。

 大学院に来る前から手がけていたプロジェクトで、診断士の資格取得前に活動を認めさせ、さらに、フェイスブックページの作成とソーシャル広告出稿を今回の『ソーシャルメディア論』講義の中で着手しました。その実績を先行させつつ、情報公開により地域住民と商店街の結束を高めるという戦略を考え、北村さんは本番そのもののフェイスブックページ「東十条銀座商店街」を作りました。

商店街のファンを増やす「オーガニック」な試み

 商店街のファンを増やす方法はウェブサイトへの誘導と同様、「オーガニック」な方法と、広告を活用した方法があります。

 オーガニックは、画像、テキストともに「クリエイティブ」と呼べるような優れたコンテンツを提供し、閲覧した人が思わず友人にも見せたくなるようなバイラル(viral)性を目指すことで、広告を作らずにフェイスブックページへのアクセス数(個々の記事の閲覧数や「いいね!」の数)や、ファン(ページ全体に「いいね!」した購読者)を増やすやり方です。

 商店街ですので、定番の人気商品や名物店主さん(?)、オブジェ、キャラクターなどを巡回して紹介するのが正攻法と思われます。その通りに実施している様子が「東十条銀座商店街」で見て取れます。加えて、頻繁に現場に足を運んで、天候に言及したり、一人称の視点で目に映るものを描写することで、あたかも商店街を歩いているかのような臨場感、現場感を出しています。一方、少し引いた視点で、アンケートによればこんな人々がいらしていた、など居住地に言及する場面もあります。

「川を越えた足立区新田、埼京線十条駅に近い中十条の方々も来てくださっていることが分かりました( ´ ▽ ` )ノ 予想より商圏が広かったです。今後は、みなさまに分かりやすいイラストMAPを作る予定です!」

 この記事を読んだ人が思わず、一緒になって東十条銀座商店街に人を呼び込みたい、という気にさせるような、「内幕披露」のテクニック発揮に、期せずして成功していると思います。「いいね!」数の増加状況を語り、嬉しさを吐露するのも自然体で、読者を同じ側に立たせてしまっている感じがします。しかし、相手の反応を想像し、慮りながら情報の提示の仕方、タイミング、情報量についてしっかりと計算して、満を持して、東十条銀座商店街のウェブサイトを紹介しています。チームによるフェイスブックページの運用事例として、なかなか深いレベルで連携できているように見えます。

 さらに、私の助言もあって(笑)、リサイクルショップで発見した掘り出し物の楽器、100年の歴史がある和菓子屋の饅頭の意外な中身など、蘊蓄系のコンテンツを取り上げたり、食べ物にしてもファッションにしても旬な季節ネタを提示して、足を運んでいただくための一貫した工夫があります。加えて1つユニークなのは、「ラブちゃん」という商店街の犬のキャラクターによる、現在進行形のキャンペーンの進捗報告です。

 フェイスブックページのアイコンがこのわんちゃんなのですが、だいぶ以前から「いる」にもかかわらず、いま一つ認知されていませんでした。そこで、様々なアピールを試みる中で、限られた予算から着ぐるみを制作して、商店街に登場し、面白いポーズや動きをしてみせよう、という企画を自ら率先して定期的にリークしていく旨、宣言してしまいました。

 恐らく、書いている本人が着ぐるみに入って汗をかきかき、商店街を訪れる子供達と握手したりするのではないか。こう想像したのは私だけではないでしょう。それほどまでに、あっけらかんとした、明るい書き手のキャラクターが記事投稿によく表れているからです。

 先日の日曜日、現地を実際に案内してもらいました。神谷コーヒー店で2杯目半額のお替わりをしたり、壁の洒落た洋風のデザイン画が犬を描いたものだ、と発見したりしてきました。各店にも挨拶し、以前変わったオブジェを購入したりした旨、お話をさせていただきました(徒歩圏内に住んでいたのです)。思わず釣り込まれて和菓子、餃子、靴、球根なども購入しかけましたが、電車で移動することを考えて、プレゼント用の購入は和菓子のみにしました。でも超大玉トマト4つで280円とか秋刀魚90円とかの誘惑には勝てず、いろいろ買い足して地下鉄王子神谷駅に向かいました。

アンケートから広告ターゲティングの初期仮説を抽出

 ビッグデータとの対話について書かなくてはいけません。前々回、前回と、フェイスブック広告による興味関心のターゲティング、その画面操作についてなど詳述しましたので、デモグラフィック・データや興味関心によるターゲット絞り込みの一般論については、そちらをご参照ください。

 特に思い出していただきたいのは、初期仮説に基づいてターゲットを絞った後で、広告のクリック率などでその効果を測定し、はかばかしくなければそれを変更、修正して改善を試みるという点です。そのプロセスを加速したければ、違うターゲット向けに同時に2つ以上に分けて広告を出稿し、クリック率等の違いを見るというやり方が可能です。

 偶然性を排除しきれないので、なぜそうなるのか考察したり、実際に「いいね」してくれた人にオンライン・インタビューをしてみるなど、数字だけを頼りにしないことも大切です。

 北村さんをはじめとする支援メンバーは、より良い商店街を目指してアンケート調査を行っていました。

ターゲット設定とその理由

 今回、やってみて分かることがあると思いFacebook広告セットを作成し、実際に広告を出した。ターゲットは、今年3月に実施した商店街交通量調査・来街者調査(同時開催)により、“北区在住、男女両方、35〜44歳、エンターテイメント、スポーツ、趣味、健康、食に対していいね!をしている人”とした。詳細は下記である。

◆調査日
平成26年3月7日(金)、10:00〜18:30、天候 晴れのち曇り
平成26年3月9日(日)、10:00〜18:30、天候 晴れ
7日(金)は午後一時雲が厚くなったが、概ね天候は良好で人通りは多かったものと推測される。

◆調査地点
東十条駅方面のA地点、コモディイイダ近辺のB地点、王子神谷方面のC地点の合計3か所で調査を実施した。



 来街者調査(n=201)では、自宅から来られた方が93%、その他、「病院」「美容室」など他の用事の途中が2.5%、職場からが2.5%となった。アンケート回答者のお住まいは、47.1%(王子神谷1丁目:29.4%、王子5丁目:11.3%、東十条3丁目:6.4%)が商店街近隣に集中していた。また、8位に川を渡った足立区新田が入ったものの、北区の方がほとんどであった。そのため、“北区在住の方”のみを今回の広告ターゲットにした。

 結果的にはシンプルな「北区在住」となりましたが、事前にこれほど綿密に調査した上で広告を見せる対象を決めるケースは少ないのではないでしょうか。上記の意思決定の際に、必ずしも意識化されなかったかもしれない論理を添えて、レポートには次のように講評を入れました:

 「まずコアとなる顧客層を取り込む、という戦略ですね。特に搦め手(豊島区など全くの新規層を開拓すべき特別な理由がない限り)を使うべき必然性がなければ順当と思います。コア層をある程度取り込んだ後は、足立区新田地域の既存顧客の周辺住民が「草刈り場」に近く、大幅顧客増ひいては売上増の鍵を握っている可能性があるということで、ちょっと意外な良さ、バリューや、北区のイメージなどを品良くアピールするような作戦を立て、実施しても良いでしょう。」

 まずは魅力的であること、次に、意外に安い掘り出し物があるということ、ショッピングの散策自体が楽しいこと、自転車があればあまり時間がかからず移動できること、の順に、少数派だった足立区民にアピールする。何ならこれらのイメージを語る広告を、足立区民向け限定で順繰りに掲載していくことで、仮説を検証しつつ商店街への誘導を図っても良いのではないでしょうか。

男女比、年齢構成比をどうとらえるか

 通行量調査によれば、来街者の男女比は平日は女性が58.0%と構成率が高くなっているものの、平日・休日を合わせた商店街全体の来街者性別は女性が全体の53.7%でほぼ男女半数ずつに近くなっている。平日の7038人に対し、休日は9039人(128.4%)と来街者が増加したが、特に男性は平日の153.9%と大きく来街者が増え、休日はほぼ男女同数になっている。

通行量調査「男女比率」

 来街者の年代については、60代以上の高年齢者が31.8%、高校生以下が11.6%の構成率となった。幅広い客層を持ち、ファミリー層も多く来街していると言える。商店街というと高年齢者のイメージが強いかもしれないが、通行量調査では平日・休日とも30代〜50代の購買力のある年代が来街者のメインになっている。通り過ぎるだけで買い物をしないという人へのアプローチを強化すれば、商店街は売り上げの成長余地が多分にあると思われる。そのため、30代〜50代の中からFacebookで検証しやすい“35〜44歳”“45〜54歳”が広告ターゲットの候補に上がった。さらに、ゆるキャラ「ラブちゃん」を今後推してゆくことが決め手となり、小さな子供がいる確率が高い“35〜44歳”をターゲットにした。

通行量調査「年代別来街者数」

 以上に対する私のコメントは、授業中の口頭での報告内容を覚えていたため、次のようになりました:

 「口頭では、この年齢層の、特に女性が、オンラインでないリアルのクチコミのパワーが大きい、というのも理由に挙げていましたね。こちらは実測に基づくものではなく、純粋な仮説ではありますが、せっかくですので、漏らさず、レポートに盛り込みましょう。」

 「実測調査については、その結果が予想通りだったのか、意外だったのか(どう予測と違っていたか)、商店主側にも尋ねておくと良いでしょう。それによって、彼らの認識が改まり、個々の戦略、戦術が改善される可能性があります。」

商店街に対する興味・関心とは

 商店街というと、主に毎日の生活必需品を求めて来街するわけですので、特定の趣味に分化している消費者を細かくセグメント分けをするイメージはありませんでした。今後は、よりきめ細かいターゲティング、隣接商店街との差別化にあたって、趣味性に訴えるべく、特定の趣味を持つ顧客へ特別なメッセージを込める可能性はあるでしょう。しかし、当初は商店の種類、構成、そして下記のアンケート結果から、北村さんは、素直に「食への関心」の高い人を重点ターゲットに選びました。


 東十条銀座商店街は、日常生活に必要な「食」を扱う店舗が多い。商店街の品種構成では、よく買うものとして「鮮魚」「野菜・果物類」「和・洋菓子、パン」が多かった。そのため、「食にいいね!をしている人」をまずはターゲットにした。

 「実際によく買うものだけではなく、「食材調達に便利な商店街」とか「ここへ来るとなんか美味しい感じ」などのイメージ、認知がされているかどうかを調査、推理する。さらに、その現状の強みをさらに強化するのか、弱みを補うターゲティングをするのか、なども具体的に書き下し、意識して広告キャンペーン等を張ることで、今後の様々な施策が有機的に一貫したものとなることでしょう。」

 長くなりましたので、効果測定や、課題2のクリエイティブとその評価については、また次回に続けたいと思います。


タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年04月16日

有望な「潜在顧客」から順に“狭告”を見せる! 〜既にそこにあるビッグデータとの対話(その3)

 前回記事「超絶ピンポイント! もはや広告ではなく“狭告”だ  〜 既にそこにあるビッグデータとの対話(その2)」の中で、フェイスブック広告がターゲットを1才刻みの年齢、市区町村単位の居住地、出身校、所属企業・団体などで絞り込み、きめ細かく設定できることを書きました。

 ターゲットの興味・関心は、おそらくは「いいね!」したページの種類や、場合によっては記事の属性をフェイスブック社のビッグデータ解析技術で分析、数万〜数十万種類に分類した結果を活用して設定することができます。利用者(広告出稿者)側としては、全世界10数億人・日本人2000万人の個人データ、個人の興味・関心や活動についてのビッグデータを元にしたターゲティングを、まずは信頼することになります。そして、試行錯誤によってクリック率や新規「いいね!」数の改善を図りながら、より効果的なターゲット層をとらえるべくシフトを目指し、きめ細かくチューニングしていく。

 この広告の費用対効果ですが、数年前の時点でGoogle Adwords広告の60倍良い、という参考数値が米国で出されたように記憶しています。既存のファンの友達を対象にする/はずす、などソーシャルならではの効果のおかげなのか、当初は現在以上に安かったと言われる閲覧単価・クリック単価でピンポイントに狭告できたせいなのか、はたまた、誘導先のフェイスブックページやイベントページ等の作りが良く、内容が充実していたためなのか。個別の評価はなかなか困難です。

 しかし、1日100円から出稿でき、自社フェイスブックページに発信する情報を毎日受信してくれるファン(ページ全体へ「いいね!」した人々)を増やす広告を最短1分ほどで手軽に作成、実施できる媒体として既に確固たる地位を築いたと言えるでしょう。

 将来、仮にフェイスブック社自身が調子悪くなったとしても、既に企業が知ってしまった「狭告」の概念を継承して発展させ、効果や利便性をより高めたシステムが必ず代替するようになるでしょう。現に、元々ツイッターのクローンとして出発した中国の「微博」(weibo.com)では、音楽配信等の独自機能の開発と並んで効果的なフェイスブックの機能を改善して採用する流れで、昨年夏頃からフェイスブック広告と類似した微博フィード広告をフェイスブック同様、安価に出稿できるようになっています。

 ピンポイントにターゲットを選定し、効果測定を繰り返して少しずつ最適な顧客層を探り当てたり、異なる顧客層へ少しずつ巡回しながら展開するキャンペーン(例えば1週間以内に誕生日を迎える***な人々、と指定)を実施可能な「狭告」は、ますます隆盛を誇るようになり、決して廃れることはないでしょう。

顕在層と興味・関心を共有する「潜在層」を見つける!

 さて、前回記事の末尾にこう書きました。

 かつては、個々のフェイスブックページ単位で、それらのページに「いいね!」している人を対象に広告(いや、もはや、「狭告」と呼ぶべきでしょうか)を打てることを知り、驚きのあまりSocialAd99という広告ターゲティングのためのSaaS(ソフトウエア・サービス)まで開発してしまいました。

 SocialAd99は、2011年4月に発表した、フェイスブック上の興味・関心の推定を行う「狭告」ターゲティング・ツールです。フェイスブック社がページの分類カテゴリを未整備だった当時、可能だった次の2つの機能を活かして実現しました。

  1. フリーワードによる公開クチコミ検索
  2. 個々のフェイスブックページを指定した広告出稿

 アイデアをざっくり書いてみます。まず、ブランド名、商品名、キャンペーン用のキーワードなどをいくつか指定して、フリーワードによる公開クチコミ検索(ウェブ検索エンジン経由)を行います。その結果、数千、数万の公開クチコミが見つかり、その投稿者の基本データのページ情報についても公開されている限りアクセスできるようになります。当人の興味・関心は、どのフェイスブックページに「いいね!」したかでかなり具体的に知ることができます。

 2011年初頭、このような仮説を立てました:
【仮説】同様のフェイスブック・ページ群に「いいね!」している人は同様の興味・関心を持っている可能性が高い。特定のブランド名、商品名、キャンペーン用のキーワードなどを既に知っている「顕在層」と同様の興味・関心を持っている人々は、同様のフェイスブックページ群に「いいね!」している。

 この仮説に基づいて、ブランド名、商品名、キャンペーン用のキーワードなどをまだ知らないながらも、知れば興味・関心を持ってくれる可能性の高い「潜在層」を、同様のフェイスブックページ群に「いいね!」している人々の中に多く見い出すことができます。下の図はこれを表したものです。


 上の例では、当時のauのAndroid搭載スマートフォンの画期的な新製品、IS03というキーワードを記した顕在層を、「氷山の一角」という意味で三角形の頂点に位置づけています。この顕在層が「いいね!」しているフェイスブックページについては、「いいね!」している総人数が分かります。そして、総人数の何%が顕在層として「IS03」を含むクチコミを発信しているかの比率が分かります。この比率の高い順に、広告を見せる対象にしていくのです!

 IS03をまだ知らない、あるいは友人やコミュニティに発言をするほどにはIS03が気になっていないと思われる「潜在層」(上図の赤い点)が含まれる濃度・確率が高い、すなわち、広告に反応してくれる可能性が高い、と推定されるからです。

総人数を決め、高反応率ターゲットに広告を見せる

 下の図は、当時SaaSとして提供していたアプリ「SocialAd99」のメイン画面です。

 「IS03」というワードを含むクチコミ発信者の比率が大きい順に、上からフェイスブックページを並べています。

 最上位の会社は、新型スマホを活用したビジネスを行っているのか、ただの偶然か分かりませんが、わずか56人しか「いいね!」していないページであるにもかかわらず、3人も「IS03」と発言していたことがわかります。断トツで高い比率です。

 2位のKDDIのページは、いかにも関係者であり、高比率になるのは分かります。以下、新型スマホのニュース発信ページなど、なるほどと納得できる、多人数が購読するページや、一見関係なさそうなページが下へと続きます。


 このメイン画面の操作ポイントはただ一つ。フォームに、ターゲットとする人数を入力するだけです。ここでは1万人と指定し、それに近い9691人が広告ターゲットとなったことを示しています。この際、原則として上位から、すなわち顕在層の比率が大きいページから順番に、その「いいね!」数を加算していきます。1万人に近い数字になったところ、ボーダーラインで急に大人数になってしまった場合は、そのページを飛び越えて比較的少人数の下位のページを採用し、指定人数に近づけます。

 これは肉屋さんで、購入したい量が「500g」ならそれに近づくように肉片を取捨選択し、正確なグラム数489gとその金額、バーコードを印字したシールを貼り付けるような感じでしたので、「お肉屋さんアルゴリズム」と呼んでいました。

 その後は、基本的にこの画面の指示通りに広告出稿します。CVRというのは、出稿した場合に実際に反応のあった率をフィードバックする欄で、この結果に応じてランキングを再調整する準備をしていました。

「既存の広告ビジネスモデルの破壊」というアキレス腱

 SocialAd99は2011年4月15日の発表時、OEM供給先のサイバーエージェントのプレスリリース「意味解析型広告ターゲティングツール」が株式情報系メディアに大きく取り上げられ、株価が上昇した主因として記載されました。


 そして2011年夏、幕張で開催されたInterep2011に出展し、見事、ベンチャー部門のグランプリを獲得しました。この写真は、審査委員長の村口和孝さん(日本テクノロジーベンチャーパートナーズ(NTVP)代表)から、副賞のガラスの盾を私が授与されている様子を撮影した記念写真です。ちなみに村口さんは、あのディー・エヌ・エー(DeNA)が開発に数十億円を費やし、さらに追加投資を必要とした時に、ただ一人それに応じて巨額のキャピタルゲインを得た伝説の投資家です。

 しかしながらその後、SocialAd99は事業としてうまく離陸させることができませんでした。後半工程の、広告出稿自体を自動化するためのAd APIの利用が当時、米国の数社にしか許諾されておらず、米国フェイスブック副社長がシンガポールから来日した機会などに折衝するも、どうものらりくらりといった感じで、日本の小さなベンチャーのアイデアを評価して利用許諾という快挙を勝ち取ることはできませんでした。

 出稿作業自体は全体の作業量、計算量に比べれば微々たるものなのに、という忸怩たる思いを抱えつつ営業を続けましたが1年少々で断念。振り返ってみると、より本質的な理由は、ソーシャル広告が手間をかければかけるほど広告出稿代行手数料(20%が相場)が下がってしまう、という点にありました。

 すなわち、広告代理業の伝統的な手数料ビジネスモデル自体を否定・破壊し、それに取って代わるビジネスモデルを同時に打ち立てなければ成功が覚束ない事業だったということであります。

 10年ほど前に、松島克守東京大学教授・ビジネスモデル学会長が「技術革新とビジネスモデル革新は2年おきとか、せいぜい交互に挑戦すべきであって同時に達成するのは至難」と研究発表していたのを思い出します。もちろん資本力など体力をつけ、政治的にもフェイスブック米国本社に日参する勢いで立ち回り(アイデアだけ食べられてしまうリスクもあったわけですが)、「広告」を「狭告」にして費用対効果を向上させた対価を納得ずくで喜んでお支払いいただくビジネスモデルを浸透させる力があれば、成功した可能性はあると思います。

 とは言え、プラットフォームビジネスの常として、SocialAd99が依拠していた2大機能、

  1. フリーワードによる公開クチコミ検索
  2. 個々のフェイスブックページを指定した広告出稿

 これらがなくなってしまえばSaaSが成立しなくなる、というアキレス腱は引き続き存在していました。結果から見れば、さらに事業を大きくして大型投資した直後に前提が消滅するような経緯に至らず、良かったのかもしれません。でも、ベンチャー企業としてはそのようなリスクを計算しつつも全く新しい付加価値、事業の創成に果敢に挑戦し続けるべきであることは言うまでもありません。

 SocialAd99の貴重な経験を活かして、新世代のプラットフォームにおいて「狭告」の付加価値を高める挑戦、とくにクチコミ文章の意味解析という得意技を活かしていく所存です。提携相手、クライアント企業ともWin-win-winの関係を構築する仕組みを見極めた上で、人と人、人と商品サービスのマッチングを最適化して人々の幸福増大に貢献できるよう邁進してまいりたいと思います。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年04月02日

超絶ピンポイント! もはや広告ではなく“狭告”だ 〜既にそこにあるビッグデータとの対話(その2)

今回取り上げるのは、単一システムの存在自体がビッグデータ、と言えるフェイスブックです。「単一システム」というのは、あまりに巨大過ぎてバックアップが作れず、保守、検証、実験、改修、機能追加など、ほぼいきなり本番システムで素早く実行しているからで、実際、地球上に分散しつつも唯一無二の存在ということです。

 フェイスブックのシステムは実に巨大です。10数億人の個人会員全員が、任意の25MB(メガバイト)のファイルや1GB(ギガバイト)までの動画を無制限にいくつでも即座にアップロードできつつ、あの高速レスポンスを実現しているのですから、データ・ストレージ容量だけをとってみても想像を絶するものがあります。

 現時点(米国時間2014年9月26日)までに更新のあった数字を、こちらから、いくつか拾ってみましょう。

 企業などが発信するフェイスブック・ページ(旧称ファン・ページ)の総数は5000万。フェイスブック・ページは「第二のホームページ」と言われ、さまざまなアプリを組み込んで、豪華なサイトを作り、多数の一般ユーザーに「いいね!」して会員(購読者)になってもらうものです。大企業の場合はブランドごとにフェイスブック・ページを作ったりするので、重複や未登録(日本産のモノの大多数はまだ未登録ではないでしょうか)による過不足を考えて、ブランド数と商品名の総数が5000万種類というのは結構妥当な数字かもしれません。

 ちなみに、「いいね!」数最大のページは、レディ・ガガの6735万件超かと思ったら、もう1ケタ上がありました。Facebook for Every Phoneというフェイスブック・ページで、なんと、「いいね!」数が、5億776万件超です。

 各フェイスブック・ページには月平均36回の投稿がなされている、ということから、大規模であるだけでなく、ミクシィなどほかのメディアの企業ページよりもアクティブに使われている状況が見てとれます。平日に1日平均1、2回の更新なら十分に潜在顧客、ファンの関心をつなぎとめ続けることができます。この何倍も多く投稿してしまうと、うるさがられて「いいね!」を解除されてしまう危険性がありますから、ビジネス上妥当な投稿頻度であると言えるでしょう。

 いくら反響が大きくとも、それが売り上げにつながらなければ意味がない、という意見もあるでしょう。これに対しては、フェイスブック・ページから自社サイトに誘導された1クリックあたりの平均売上が、1ドル24セントという数字があります。

出典:Social Intelligence Report, ADOBE DIGITAL INDEX, Q1 2014

 「第二のホームページ」でありながら、投稿の25%が顧客からの質問で占められることから、ケタ外れに双方向的であることが分かります。企業側からの投稿に対する何らかの反応(いいね!、コメント、シェア)の75%は投稿から5時間以内になされており、本家ウェブサイトに比べてはるかに反応が早く、リアルタイム性に富んでいることが分かります。

 このほか、少ない文字数の投稿の方が好評だと示すデータ、飲食店や小売店などのローカルビジネスの顧客の反応の数字、42%のユーザーが具体的な取引・購買に結びつくようなページ体験を希望している等等、フェイスブック・ページについての統計がこちらに豊富に載っています。世界平均や米国の事情と、日本の数字、比率とでは違いもありましょうが、大いに参考にすることはできるでしょう。

 フェイスブック・ページに投稿した記事は、ページに「いいね!」してくれたファン全体の数%から10数%の目に触れることが多いようです。写真や動画、記事の質が高く、ウケが良くて、結果として個別記事に「いいね!」を多く稼げれば、さらに多くのファンのタイムラインにサマリー配信されるという仕組みになっているため、正攻法で優れた投稿を継続すべし、というインセンティブとなります。こうした投稿による反響を得る努力は、商品ページ等に誘導するためウェブにおける検索順位を上げる努力と相似しているため、「オーガニック(organic)」な効果と呼んでいます。

 オーガニックと対比されるのは、広告です。ウェブ検索における検索連動広告は、何らかの目的を持ったウェブページへの誘導を行うものですが、フェイスブック広告の場合、

  • フェイスブック・ページ自体への誘導
  • フェイスブック・ページ内の特定記事(キャンペーン情報ほか)への誘導
  • イベントページへの誘導
  • 一般ウェブページへの誘導…

 このほか「広告を作成」の緑のボタンを押すと、図1の画面が出てきて、アプリのインストールや、クーポンの利用、動画の再生を促す、などの直接アクションを起こさせるためのフェイスブック広告のバリエーションがあることが分かります。

広告ターゲットを詳細に絞り込む

 広告作成の詳細はスキップして、どんなフェイスブック・ユーザーをターゲットとして広告を見せていくか、という核心部分を見てみましょう。フェイスブック・ユーザーの膨大な個人属性データ、人間関係データ、興味関心データ、行動データを押さえているがゆえに、膨大なターゲティング、潜在顧客属性の絞り込みの可能性があることはお察しいただけると思います。

 取りあえず私の会社、メタデータ株式会社のフェイスブック・ページ、“リアルタイムCRM by メタデータ株式会社”全体への「いいね!」を増やすことを目的として、下の画面の状態とし、広告出稿の操作を進めてみます。


 この画面の下方には、オーディエンス(広告の視聴者)というセクションがあり、どんな人に広告を見せるかについて、詳細に指定し、絞り込めるようになっています。

 一番上から、地域(居住地)、年齢、性別、言語、その他のユーザー層、とあり、基本ユーザー属性を複合的に指定することが可能です。これらは「国勢調査的なデータ」という意味でデモグラフィック・データ、略してデモグラフィック (demographic) と呼ぶことがあります。

 日本の場合、地域は市区町村の単位まで指定が可能。米国では郵便番号による、さらに詳細な指定が可能です。市区町村指定時の注意は、ローマ字でないと受け付けてくれないことが多い点です。

 年齢は、フェイスブック利用者の下限である13歳から64歳の間の任意の範囲を1歳刻みで、もしくは上限なしを指定できます。性別、言語(日本語、英語(イギリス)、英語(米国)等)、は素直にそのまま指定します。

他属性や投稿から“推定”した属性も

 「その他ユーザー層」をクリックし、プルダウンすると、現時点で「交際」、「学歴」、「職歴」、「ファイナンス」、「住宅」、「民族」、「世代」、「子供がいる人」、「政治(米国)」、「ライフイベント」というユーザー属性の種類が出てまいります。

 例えば「交際」を選ぶと、「恋愛対象」と「交際ステータス」が出てきます。「恋愛対象」は男性のみか、女性のみか、女性と男性の両方を指定している人を対象とするか、不明としている人を対象とするか、を選ぶことができます。恋愛対象が例えば女性であっても、そのユーザーの性別は男性かもしれないし、女性かもしれないということですね。

 「交際ステータス」には、「独身」、「交際中」、「既婚」、「婚約中」、「不明」、「シビルユニオン」、「ドメスティックパートナー」、「オープンな関係」、「複雑な関係」、「別居中」、「離婚」、「配偶者と死別」があります。これらの中には、何らかの意図を持って、属性登録や表示を正直にはしていないユーザーもいますので、そこは割り引いてターゲティングを考える必要があります。

 「学歴」中の「学歴(大卒、修士、博士号、他)」、「専攻」は、予想通りというか順当な指定と思われるでしょう。少々、瞠目に値しそうなのが、「学歴」中の「学校」、「大学の在籍期間」という属性です。特定の大学名をいくつか指定して、何々大学と何々大学の卒業生にのみ広告を見せる、という指定が可能なのです。さらにその中で、いつ在籍していたかの年次の指定まで可能。これが、「何々大学出身の貴方へ!」という広告が結構頻繁に表示されるゆえんであります。

 学歴とくれば「職歴」。勤務先の会社名、役職、業界を指定することができます。「ファイナンス」は「収入」と「純資産」の指定が可能ですが、なんと、さまざまなほかの属性や、行動、発言(?)から推定する機能だそうです。現時点では米国のみでの機能、ということですが、普及してきたらちょっと物議を醸すことになる予感がします。同様に「住宅」についても、「住宅タイプ」、「住宅の所有」、「住宅の市場価値」、「家族構成」とあり、これらでターゲットにされた、外れた、と万一ユーザーに知られたりしたら炎上の可能性がありそうです。

 「ライフイベント」は言葉だけでは意味不明ですが、下記の選択肢を見ればなるほど、と思われます。

 「出身地から離れている」、「婚約中(1年未満)」、「婚約中 (3カ月未満)」、「婚約中 (6カ月未満)」、「家族から離れている」、「就職・転職」、「新しい交際関係」、「新婚 (3カ月未満)」、「新婚(6カ月未満)」、「新婚(1年未満)」、「最近転居した」、「近日誕生日」、「遠距離恋愛」

 例えば「近日誕生日」という人に絞り、自分へのプレゼントを選んでいそうな人に広告を見せるというのは、年中ターゲットが順繰りに交代、巡回していくこともあり、商品・サービスによっては非常に効果的でしょう。自分へのプレゼント以外にも、その広告で見た商品をアマゾンのウィッシュリストに載せ、家族、近親者、友達 にプレゼントしてもらおう、という発想と行動を促せるかもしれません。

 下図のように、ここまで丹念にきめ細かくユーザー属性を絞り込んできましたが、肝心の「趣味・関心」のところまで差し掛かって紙数が尽きました。


 かつては、個々のフェイスブック・ページ単位で、それらのページに「いいね!」している人を対象に広告(いや、もはや「狭告」と呼ぶべきでしょうか)を打てることを知り、驚きのあまりSocialAd99という広告ターゲティングのためのSaaS(ソフトウエア・サービス)まで開発してしまいました。次回はその経緯も含めて、現在はどのように、どの程度の興味・関心まで絞り込めるのかなど試行錯誤しながら紹介してまいりたいと存じます。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年03月18日

既にそこにあるビッグデータとの対話(その1) 〜破壊的に安く、早くアプリを作る

 前回、既存知識がほとんど無料になった時代の象徴として、米マサチューセッツ工科大学(MIT)が最初に無償公開を始めたOCW(オープンコースウェア)と、米スタンフォード大学のコーセラ(Coursera)の話題を取り上げました。OCWが元祖で老舗ながらも、文脈からはeラーニングとしては古臭いかのような印象を与えたかもしれず、最新の取り組みの方もご紹介しておかないとフェアじゃないな、と思っていたちょうど良いタイミングで、友人である宮川繁教授(MIT および東大)が寄稿した記事が日本経済新聞に掲載されました。
『東大、米大学とネット提供 講義公開で「知の革命」 宮川繁 マサチューセッツ工科大学教授(東京大学特任教授) MIT、月に140万人 思考も国境越える』2014/9/15付 日本経済新聞 朝刊

 スタンフォード発のコーセラの刺激は当然あったと思いますが、固有名詞としてのコーセラを包含する普遍的なシステムであるムーク(MOOC:Massive Open Online Course=大規模公開オンライン講座)の立ち上げにMITとハーバードというボストンの2校、それに宮川教授が兼務で取り持つ東京大学が加わって、知の世界の体験を大規模に地球上に広めようとしています。

 私は、OCWを提案した検討委員会の当初メンバーで、数年間OCW教員諮問委員会議長を務めたが、なぜMITは全教材の無償公開を始めたのかとよく聞かれた。
 その時いつも紹介したのは「お金は分けると減るが、知識は分けると増える」という、MITのチャールズ・ベスト前学長のことばだ。オープン・エデュケーションの理念はここに尽くされる。ムークやOCWなどを通じてオープン・エデュケーションを行うことは、実は大学のミッションを具体的な形で実行することであり、だからこそこれだけの支持を集めたのだ。― Prof. Shigeru Miyagawa(MIT & Univ. of Tokyo)

 私が1993年から94年にかけてMITにお世話になっていたときの学長がベスト教授でした。「お金は分けると減るが、知識は分けると増える」という言葉は懐かしさとともに、さもありなん、という気がいたします。これまでの連載でも触れましたが、知識を囲い込んで(実は公開されている情報に過ぎないのに売り込み相手にだけは隠して)“チラ見せ体験”を割引販売する情報商材のようなビジネスが、いかに不自然でゆがんだものであるかまで言い尽くしていると思います。

 与えよ、さらば、与えられん。

 お金を頂戴できるのは、個別の問題解決にまで踏み込んだり、そのためのツール、整備済みのデータを提供して初めてその対価が発生する、と考えて良いように思います。

整備済みのビッグデータを背景に持つGoogle Maps

 さて、ビッグデータなんて日ごろ縁がない、見たことも聞いたこともないとおっしゃる人も、知らず知らずのうちにビッグプレーヤーたちが提供するビッグデータのお世話になっている、と言われたら驚かれるでしょうか。

 ウェブで何かの施設の場所や、企業の地図を調べたことがある人なら1度は使ったことがあるGoogle Maps。と言えば「なーんだ!」という反応の方がほとんどと思います。

 ふと、「日経 野村直之 Google Maps」の3語で検索してみたところ、8年前に執筆したこんなページが見つかりました。
「Google Maps for Enterpriseに見るGoogleらしさ」

 2005年のこと、対話的で消費者が発信するウェブといわれたWeb2.0が企業情報システムにも浸透すると予言したら、不謹慎極まりない!とお叱りを受けましたが、12月に世界で初めて、メタデータ社の当時のウェブサイトに“Web2.0 for Enterprise”という言葉を載せました。それから半年ばかり後に書いた上記の記事は、私の予想通り“Google Maps for Enterprise”が登場したけれども、ビジネスモデルは労働集約型のサポートサービスとなり、到底Adwordsのような高収益のマネタイズは難しいだろうと示唆したものです。

 あれから8年も経ちますが、有料アプリとしてのGoogleAppsが広告事業にとって代わり得るようになったようには見えず、Microsoft Officeを脅かしつつも消耗戦になっているだけではないか、というようにも見えます。であれば「Googleらしさ」を失ってでもソフトウエア(SaaS、クラウドサービス)の利用から直接収益を上げる方向へ舵を切れば良いのに、などと思ったりします。

 「破壊者Googleへの恐怖」を語る切り口で言えば、従来のシステム・インテグレーションを、エンタープライズ・マッシュアップによって大幅に簡便化し、価格破壊を起こしつつある、と言うこともできます。このようにみれば、決して小さな出来事ではなく、IT業界(特に日本のIT業界)の体質転換を迫る歴史的事件、とさえ言えるかもしれません。

 しかし、この体質転換は、IT業界にとっても良いことであり、もちろん、ユーザー企業にとっても歓迎すべきことである、と考えています。次回以降、この観点で、今後の企業情報システムのあり方について考察してまいります。――野村直之(2006年8月)

 「価格破壊」については、当時ベストセラーになった梅田望夫さんの「ウェブ進化論」のエピソードが印象的でした。彼が社外取締役を務めていたNECの役員会で、Google Mapsに桜前線をオーバーラップさせたウェブアプリのデモ版を見せ、開発費用を他の役員さんたちに当てさせた時のことです。ある役員が「5億円!」と言ったのに対して、梅田さんは「一人のマッシュアップ技術者の3日分の人件費と機材使用料入れて13万円位」と答えたという趣旨の話が紹介されていました。

 マッシュアップとは、既に世の中にあるプログラミング素材であるAPIを使うことで、数行のコードを書くだけで容易にアプリケーションを作れる、一種の破壊的なプログラミングの流儀です。マッシュアップ・プログラミングのコンテストも10回目。メタデータ社の関わりも10年目で、8回連続でプログラミング素材としてのAPIを提供しています。

 ちなみに今年は10月24日の締め切りまで十分時間がありますので、皆様ぜひ「願望検索(したいこと検索)」、「ネガポジAPI」、「感情解析API」、「5W1H抽出API」などのテキスト解析APIを使って、お手持ちのデータを解析して引き出した価値にアイデアをまぶし、面白くも有用なアプリを開発してみてください!企画専門、アイデアソンへのご参加も歓迎です。


 Google Mapsのマッシュアップはまぎれもなく、背後に備わった整備済みのビッグデータを素早く、極めて低コストで活用する手法として、この8年間ですっかり定着したと言えるでしょう。世界最大のAPI情報ポータルであるProgrammable Webには、2014年9月15日現在で2550のマッシュアップ・アプリが登録されています。さまざまな応用事例、アイデアのバリエーションを辿ってみることができます。

 2006年初め、ITベンチャーを起業した直後の私は20、30とビジネスプランの草稿を書いても、どれもグーグルが物量にモノを言わせた無料サービスで蹴散らしてきそうで、夜中に恐怖で冷や汗かいて飛び起きるような日々でした。そんな中、知人が1000人以上いる企業情報システムの世界で、いち早くGoogle Maps/Appsを足掛かりに健全な価格破壊と利便性の提供、短期間、低コストでシステムを入れ替えられる体質にすべしと書いて発表したのは、自分のことを棚に上げていたようで赤面ものですが、少々早過ぎたこの提言は大きくは間違っていなかったのではないでしょうか。

既存のカーナビを優に駆逐しつつあるGoogle Maps

 ビジネス的なコメントは以上にして、Google Mapsの中身を見ると、ついに日本独自のハードウエア一体型ITの雄だったカーナビを滅ぼしかねないほどにまで成長しました。

 週末にレンタカーを借りましたが、オプションのカーナビは付けずに、その位置にNexus5を立てかけて、Google Mapsによるナビをずっと起動させておきました。

Nexus5で動かした、Google Mapsのカーナビ機能

 1度使えば分かりますが、これで十分です。視力にハンディのある人ならば、無線ルーターと、7インチから9インチ位のAndroid Padを持ち込めば良いでしょう。

 以前所有していた(文字通りの炎上で壊れた)10万円ほどの専用カーナビと比べて、恐ろしいほどきめ細かく高精度です。5メートルも狂うことなく、実に正確に現在位置をトレースしてきます。Quad Core 2.26GHz、メモリ2GBというパワーにも助けられていますが、何よりもクラウド側に、専用カーナビのDVD1枚程度の容量では到底太刀打ちできない膨大なデータが常に最新の状況に合わせて更新されているのだから、勝負にならないことは最初から―――そう、よーく考えていれば、8年前から分かっていたのではないでしょうか。

 今回からは「データと対話」の延長として、それをAPIやウェブアプリという形で使いやすくされたものを低廉に誰もが活用できる、というスタンスに移りました。ウェブアプリといえば、膨大な個人属性や企業情報等を擁するフェイスブックの広告出稿画面を使って、従来では考えられなかった精緻なマーケティングを実施できるようになったことに触れなければなりません。次回以降、生データ、ビッグデータと対話しながら、自分の事業のターゲットを絞り込み、より精緻にシフトするというのはどういうことか、具体例を通じて示してまいりたいと思います。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年03月04日

なぜ「データと対話」しなければならないか(その4) 「オリオン」はビールか星座か

 私は現在、法政大学専門職大学院イノベーションマネジメント研究科で、「ソーシャルメディア論」の講義をしています。ちょうど「データと対話」を実習してもらう機会があり、さりげないブランド名や商標について、取りこぼしが少なく(高再現率R)、勇み足・エラーが少ない(高適合率P)外部データの収集がいかに難しいか、体感していただきました。その中で、単位のためでなく授業を取ってくれている山本千誉さん(石垣島出身。故郷で中小企業診断士を開業すべく奮闘中)が真っ先に挙げてくれたお題「オリオンビール!」がとても良い例題だったので、机上でデータと対話しながら、質の高いクチコミの収集を試みてみます。

 意思決定や次期施策をまとめるために、欲しいクチコミだけを必要なだけ集めたい、という課題を共有してみてください。

 前々回、「ジョージア」を例に、「結果を見るまでは、どんな検索式が適切か分からない」と主張いたしましたが、どうもこの具体例がいま一つ特殊ではないか、とのコメントをいただきました。急に涼しくはなりましたが、まだまだ仕事帰りの生ビールが美味しい季節ですので、身近な例として、ビールの名前に言及しているツイートを集めてみることにしましょう。新たな目標は、“本音メディア”であるツイッター上で、“オリオン” ビールのクチコミを集めることです。

 国内で販売されているビール類(エール=aleや発泡酒、いわゆる第三のビールを含む)は、数え方にもよりますが千数百種程度も存在しています。その中には、ほとんど正式名称で呼んでもらえなかったり、「生中!」などとブランドを指定してもらえず、記事の後のほうでやっと銘柄がかすかに推察できるようなケースもあります。「水曜日のネコ」のように固有名詞と言い難いようなブランド名や、地名の通称ではないかと思われるもの(“Coedo”=小江戸:埼玉県川越市の通称)も存在します。

 「一番搾り」くらいになってしまえば、もはや普通名詞として使われる(醤油、麦芽等の一番搾り)ケースのほうが無視できるくらい稀なので逆に心配いりません。ユニークな一意に定まる略称であれば大きな問題はありませんが、多種多様な文脈に出現する固有名詞はなかなかやっかいです。

 このように、いろんなジャンルの固有名詞が存在する代表例が「オリオン」でした。まず、シンプルに、オリオン とだけツイッターの検索フォームに入れてみましょう。検索対象は「すべて」です。

オリオンビールのクチコミ集めは、大変!

 9月1日朝の時点では、こんな結果が出ています。

  • 「ごめんオリオンならとっくに潰してるんだ」
  • 「9/14の15時から宇都宮市オリオンスクエアで宇都宮カクテルクラブの33店舗のバーが本格カクテルをお出しします」
  • 【交換希望】AGF AMNESIA(アムネシア) ジェネオン 缶バッジの交換して下さる方を探してます。《譲》オリオン(300円+送料で譲渡可能です。)《求》シン、トーマ、ケント 宜しくお願いします。
    http://twitpic.com/dntbny
  • オリオン現る Orion Appears
    http://blog.polaris-hokkaido.com/2014/08/orion-appears-6.html
  • 【ラバーグッズ譲渡】ブラコン,アムネシア,薄桜鬼,P4,WORKING,日常、右京,光,梓,弥,絵麻,ケント,ウキョウ,オリオン,土方,りせ,ぽぷら,麻衣
  • 【ライブ情報】『RESTORATION』出演決定 9月15日(月・祝) OPEN 15:00
    ※PrizmaXのライブは18:30〜スタート予定です(終演後、特典会あり)
    ■場所 沖縄・ホテル オリオン モトブ リゾート&スパ
  • オリオン
  • 本日のC-1プロレス、19時開始予定です!はい!私も出るのはこれです!時間間違えてたー!良かったら皆様見に来てください!オリオンスクエアでやってます!
  • 今年オリオン座が無くなるらしい。爆発するのはベテルギウス。

(・・・途中、かなり省略・・・)

  • 「君がオリオン 1」 後藤みさき | ためし読みはこちら=> | フラワーコミックス
  • 【キーンランドC】武豊復帰!好調オリオンでVだ(サンケイスポーツ)
  • 桐生オリオン座.....懐かしい
  • 調理完了!今宵はマヨネーズを使わない自家製ポテトサラダ、昨夜の角打ち再現春雨サラダ!ポークソテーにいい浸かり具合の鮪ヅケ!オリオンゼロでスタート!
  • オリオン通のお化け屋敷、27日まで延長!
  • オリオンツアー、スターエクスプレスなどの格安で乗れる高速バスの予約がインターネットでできて便利
  • オリオンジャズで、市ジャズの演奏をききに。 @ オリオン通りイベントスペースにタッチ!
  • うへえくそかわ…オリオンなぞる
  • 今日のスタンドを発現ッ! スタンド名「オートツイート・ナムコ・シコ」! オリオンを加速する能力! セリフ「キモいッ! キモいッ!」
  • 日本語だけで国際交流ができちゃうんです。そう、オリオンならね。 #opu #大阪府立大学 http://ameblo.jp/orion-fudai/
  • マーモット MARMOT オリオン パンツ テクニカルアルパインパンツとして作られたオリオンパ...
  • オリオンの生ビールお安くします!ぜひ遊びに来てください(・`д´・)
  • アサヒ の アサヒ オリオン夏いちばん 350ml缶 (沖縄県限定のビール) 350ML × 24缶 を Amazon でチェック!

 最後の2つだけがオリオンビールのことを言っていると思われます。なかなか出てこなくて大変でした。検索するタイミングにもよりますが、多くの場合、「オリオン」だけではビールのことは1割も出てこないのではないでしょうか。

 「オリオン座」を排除するために、「座」という字を含むツイートを除外しても、

  • 冬はオリオンで決まりってことで。当たったらなんかしてくれそうだよね?
  • 【初音ミク】夏の夜のオリオン【オリジナル曲】(5:03)
  • 〈譲〉画像参照(トーマ/ウキョウ/ケント/イッキ/オリオン)
     〈求〉シングッズ(画像優先)/薄桜鬼 斎藤関連(アムネ優先)
  • オリオンをなぞる
  •  ・・・

 という調子です。冬のオリオンが星座で、夏のオリオンならビールかと思いきや、そうでもありません。

 世の中、本当にいろんな「オリオン」がいますね。芸名、架空のキャラクタ、星座、星座に似たホクロ、競走馬、ぬいぐるみ、宇宙船、広場や商店街、道路名、映画館etc. 何のことを言ってるか、よく分からないものも散見されます。

 写真がなければ、どれが星座で、どれがアニキャラかもわからないものがあります。一言、「オリオン」とあるだけの場合、その前後の対話、本人のつぶやきの文脈や趣味、嗜好を知らないと曖昧なまま。ひょっとするとビールのことを言っている可能性もあるかもしれませんが、どうも上の例ではオリオンビールに言及したツイートは一つもないようです。

  • オリオン、うめーなぁ!
  • オリオンはコクがあるのに爽快なのど越し!

 ならばかなりの確率でビールのことを言っていると思われます。

 しかしながら、「うめー」が、アニキャラの定番の特技のことかもしれませんし、

  • オリオン、キレが良いな

 であってもビールの「コクとキレ」のことではなく、立ち居振る舞い、演武の腰のキレが良い、とほめている可能性があります。競走馬のコンディションが良いことを言っているかもしれません。

 さすがに、オリオンとビールの両方を含むツイートだけを検索すれば、ノイズは激減します。

 しかし、これでは、適合率Pは高められても、

  • やはりゴーヤチャンプルー食べながら飲むのはオリオンしかないよな

 みたいな、明示的に「ビール」という3文字を含まないツイートは全部落ちてしまい、再現率Rはかなり下がってしまうことになります。

 このほか、 botという文字列を含むユーザー名による発言は一律に落とす/採用する、とか、小売店の売り込みのつぶやきは消費者の声ではないのでお店のユーザーIDを丹念に収集(そのためにはプロフィールやつぶやき内容を読まねばなりません)・参照し、リストを作る、などの準備が必要です。

知識発見の前処理としてノイズ除去は重要

 昨年の物理学の大きな話題は、重力の源となるヒッグス粒子(場)の発見でした。そのためには、何兆回もの実験でデータを取り、ほとんどがノイズであるものを重ね合わせて差分から意味を読み取っていく、そのためのコンピュータプログラムを何百本と、何年もかけて作成してはデータを加工し、とことん自分を疑いつつ、どうしてもヒッグス粒子の振る舞いとしか説明できない現象(=シグナル)を何年もかけて浮かび上がらせる、という作業を大変優秀な物理学者たちが数百人がかりで取り組んだと聞きます。

 もっと身近な業務知識、未知のビジネス法則の発見のためにも、データを適切なツールによって眺めて絞り込み、構造化、再編成し、再び、不足データ、関連データを補充してから絞り込む、といったデータとの対話が必須です。すなわち、データと対話することが、インテリジェンスの発見、新知識の創造プロセスの勘所、本質であり、極めて重要なのであります。

 “目的志向、問題解決志向で、データ収集の上流段階から、その吟味、加工、構造化、見える化、そして、人の頭脳による分析に至るまで、「データと対話」し、「洞察」→「仮説発見(着想)」→「検証」→・・・というサイクルを繰り返し、必要に応じて前工程へとフィードバックをかける。これなくしては、無駄に大量データを購入させられたり、見当違いのデータをモニタリングし続けることになり、いくら洞察を得たくとも、その低品質なデータのままでは「無い袖は振れない」状態にとどまってしまいます。”

 この好循環サイクルに入る前に、「ノイズの除去」としか言いようのない、有用なデータの候補(のみ)に絞り込むという、前工程での地道な作業があることを今回、かなり実感していただけたのではないかと思います。この作業経験豊富な職人の技には大きな価値があり、本来無料のデータであっても、適合率P、再現率Rともに高レベルでかつ客観的、中立的に、消費者の本音を正しいネガポジ比率で集めるという専門的な作業には大きな価値があります。

タダになる知識…超一流大学の教材も今や無償公開

 さて前回、検索すれば誰でもアクセスできるようになった既存知識よりも、今後の経営判断を左右する新しい知見、新知識の素を含んでいるかもしれない生データの方が価値が高くなってきた、と書きました。

 「知識が安くなった」ことの象徴的なエピソードを補足しておきましょう。高度な知識の代表例として、大学や大学院の講義資料、教材を挙げるのに異論のある方は少なかろうと思います。私にとっては大変懐かしい米マサチューセッツ工科大学(MIT)が2001年に始めたOCW(オープンコースウェア)は、大学等で正規に提供された講義とその関連情報(教材)を、全世界の教員・学生・自学習者が自由に利用できるようにインターネット上で無償公開する活動です。「知」の分野での社会貢献を目的とするとともに、世界中に当該コースを提供する大学の評判を高め、質の高い学生を集める一助となる期待もあったことでしょう。

 MIT版の元祖OCWのデータフォーマットが公開され、日本でも10を超える数の有名大学で採用され、JOCWのような組織もできています。MITでOCWの広報担当を務めてこられた宮川繁教授(MIT Linguistics & Language; 2013年より東京大学教授を兼務)によれば、教材類の公開に先立ってビジネスモデルを散々検討・シミュレーションしたところ、コスト負担のためには寄付を募り、徐々に公開対象を広げて、いずれは全教材を無償公開へと持っていくのが最も財政的に好ましい、という結論になったそうです。

 日本の大学からのOCW提供コンテンツ数は2005年の153から拡大の一途をたどり、2013年初の段階で、3061となっています(JOCWのサイトより)。ただ、8割以上が日本語によるもので、英語版は489 (16%)。今後、英語コンテンツを量、質ともに充実させていくことによって、日本の大学を志す世界の学生が増え、国際競争力を増すことにつながるのではないでしょうか。

 本家MITのOCWを使って、貧しいアジア、アフリカ諸国の優秀で意欲的な若者が独力で極めて高度な知識を身に着けた例も多いと聞きます。いわゆる100ドルPCの類が人類に最も貢献するためのインフラ、コンテンツの1つが、OCWと言ってよいのではないでしょうか。

 OCWで公開されているのは、いわゆる主教材の資料だけではありません。試験問題やレポート課題、最近では、当初は対象外だった講義風景のビデオまで公開されるケースがあります。ここまで無償にして良いのか、年間4万ドルを超える授業料を払う学生が馬鹿を見るのではないかという心配に対しては、実際に生の授業で丁々発止の質疑応答に参加し、あたかも医者に「個別診断と処方箋」を受けるような体験ができること(MITでは90分で50回以上の質問が学生から出る光景や、世界的な研究者でもある教授がその場で答えに詰まって次回までの宿題にさせてもらう場面を目撃したことがあります)、そしてもちろん学位が得られることに授業料に見合う価値がある、とプライドを持っているように見受けられました。

 試験問題(とその解答)まで公開してしまうと、2度と同じ問題を使えないということにもなり、いきおい教員が毎年緊張して最新最適の課題を与える、という副次効果があったといいます。

 10年近く前、ブログが世に出て間もないころに慶応大学の國領二郎先生が、1つのブログのタイムラインに、教師も教室内の学生も、なぜか教室にいない学生も寄ってたかって書き込んで討論のような授業を進める様子を、当時私が主宰していたビジネスモデル学会ナレッジマネジメント研究会にて紹介してくれました。創発的な2度と再現できないような体験を共有することで活きた知識を摂取し、また知識創造に参加することで知識を生み出し操るための「メタ知識」を授けることに相当程度、成功していたように拝察しました。

スタンフォード発のコーセラは受講管理まで行う

 高等教育の歴史に大きな足跡を刻み、ブレイクスルーとなったOCWですが、2012年に西の米スタンフォード大学から営利団体として生まれたコーセラ(英名:Coursera)のe-ラーニングが最近、急速に勢力を増しています。世界中の多くの大学と協力し、それらの大学のコースのいくつかを無償でオンライン上に提供するところはOCWと共通していますが、オンライン受講管理・試験・修了までの仕組みが前面に出ています。無料お試し期間の後は、少額ながら「学費」を支払わねばならない点もOCWと違います。有償の分、ちゃんとテストを受けて採点してもらえたり、修了証をもらうことができます。

 コーセラは、発足して半年余りの2012年11月の時点で196カ国から190万人もの生徒が一つ以上の授業に登録。修了率は6〜7%とのことでした。現在(2014年8月31日時点)、907万人の受講生がいて、110の大学等から提供された744の講座の1つ以上を学んでいます。

 ためしに、本連載のテーマである“big data”と入れて、コースを選んでみましょう。日本の大学ではなかなか講座名自体にビッグデータを含む講義にはお目にかかれなさそうですが、4つのコースがヒットしました。

 米国コロンビア大、ワシントン大、インドのデリー工科大、そして、上海の復旦大から、次の講座が提供されています。

[画像クリックで拡大表示]

 検索にはヒットしませんでしたが、コース説明に“Big Data”が出てくる講座は、他にもありました。たとえば、ジョンズ・ホプキンズ大学の「データ解析」です。

 これらのコースの教材を検索して、「データと対話」すべきことが語られているか、私も教師のはしくれとして精査したい欲求にかられます。ビッグデータの名を借りつつ、伝統的な統計学やデータベース理論を教育しているらしき大学もあれば、コロンビア大のように、知識発見のためのツールやモデルを活用して知識や推論についての教育にビッグデータを活用する、という実践的、自己説明的な講座もあるようです。

 「データと対話」、すなわち、データの中身を吟味するという試行錯誤から、分析方法、モデル化の方針にさえも影響を与え、軌道修正するようにフィードバックすべき、というあたりまで、コロンビア大のコースには含まれているかもしれません。もっとも、私が本連載で述べてきたようなデータとの対話については、現場でビッグデータの海に溺れそうになり、泥まみれになって格闘し、そこから叡智を昇華させようと呻吟したことのある人でないと、なかなか語れないだろう、と思います。ともあれ、どなたか、上記講座を受講してみて、このあたり、フィードバックしてくださるとうれしいです。

 講師のサイン入り修了証以上に、知識習得、実践の過程で得られた知見を社会で共有するという、いわば「ソーシャル・ラーニング」という仕組みにまで発展すれば、素晴らしいと思います。一方向的な授業になかった面白さを味わう「生徒」間の連帯が世界中に広がり、相互の対話を通じて、文字通り「生きた」教材がますます成長し続けていくだろう、と予想するのは楽観的に過ぎるでしょうか。

 以上、かつては何万ドルの支出と、一定以上の年限が必要だった高等教育の教材が無料、もしくは格安で提供され、誰でもその気になれば、簡単にアクセスでき、修了できるようになった、というお話でした。

 次回以降は「データとの対話」において、収集対象自体が事前に定義できず、少しずつ移ろいゆく場合にどのような試行錯誤や、検索のユーザーインタフェース(検索・絞り込みのパラダイム)が必要とされるかについて考えてみたいと思います。

posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2015年01月10日

ビッグデータから「仮説」を掘り出す方法 〜スモールデータの手法も駆使し「発見」への仕組みを作る

前々回、前回と、2014 FIFA サッカーW杯の“ビッグデータ時代”らしさをテーマに書きました。日本が決勝トーナメントに進み、あわよくばベスト4にでも勝ち残っていれば、今回もサッカーの話題となったかもしれません。しかし平均的日本人より相当サッカー好きと思われる私でも、週に1、2度ダイジェストを見て『ドイツのゴールキーパー、ノイヤー すげーっ!』『コスタリカGKのナバスも同じ位すごい!』と血が騒ぐ程度で、世間はすっかり落ち着いてしまったかに見えます。

 そこでサッカー関係の落穂拾い的記事は適宜、Facebookページ「リアルタイムCRM」(2010年に開設したメタデータ社のページ)に掲載するとして、今回のこの前文を最後に、通常連載に戻りたいと思います。

・サッカー関係の落穂拾い的記事
「ツイッター社自身によるハッシュタグ #ワールドカップ のまとめページ」
「応援するチームの国旗を選んで選手や監督をフォローして盛り上がるサービス」

※一気に100人近くフォローしてしまい、W杯終了後「困ったな…」と密かに思われたとき頼れるツール、justunfollowなども紹介しています。よろしければ、“リアルタイムCRM”に「いいね」してやってください。リンク付きのサマリーは、ツイッターアカウント @metadata_inc でも読むことができます。

 ドイツ、ブラジル、オランダ、アルゼンチンのベスト4決定時点で、ハッシュタグ#WorldCupを含むツイートで印象的だったのは下記の集計です。今回の戦績に見られるように、現在のサッカーは欧州と南米の2大陸が強く、特にプロのクラブチームではドイツ、イギリス、スペイン、イタリアをはじめとする欧州が圧倒的に強い選手を抱えていることを如実に物語っていると言えるでしょう。こんな集計も生データの迫力・説得力の一種と言ってよいのではないでしょうか。
@knottystop W杯ベスト4に残った国の所属クラブ別人数
<9名>バイエルン(独)
<5名>フェイエノールト(蘭)、チェルシー(英)
<4名>バルセロナ(西)、マンチェスターシティ(英)、ドルトムント(独)、インテル(伊)
<3名>アーセナル(英)、レアルマドリード(西)、パリ・サンジェルマン(PSG・仏)、シャルケ(独)、ナポリ(伊)、アヤックス(蘭)

有意な仮説の着想と検証に「統計学」では限界

 前回記事・「生データを踏まえた記事の迫力」、前々回記事・「大量の生データから意外な事実が分かった件」
に象徴されるように、生データの迫力や、発見を誘発する力はどこから生まれるのでしょうか?

 特に、少々乱暴な感覚的な結論(「前半、終始押されていた“感じ”」など)や、どうしても検証したい・証拠を見たいと思っていた仮説について、従来よりケタ違いに大きな生データを集計したものが検証を可能にしてくれれば、まさに非常に強力な説得力を持つでしょう。現場の人が何となく感じていた「予断」のようなものでさえ、それらが証明されること、あるいは覆されるのを待っているわけです。

 パラメーターが多数に上り、その値も数百、数千、数万のバリエーションを持っていると、その組み合わせを総当たりすればあっという間に数百万、数億以上の仮説の元が出てきます。それらを統計処理でしらみつぶしにするのも良いですが、果たしてそれが優れた分析に結びつくでしょうか? No(否)と思います。それはいくらビッグデータといっても、本当に99.9%の有意性で結論づけられるほどの網羅性は通常望めないからです。

 例えば、口コミに出てくるトピックやテーマの出現頻度について何か結論を出すことを考えてみましょう。思い切り単純化し、2つの言葉の組み合わせでテーマが語られるとして、10数万の基本語彙、そして数百万、数千万は使われている固有名詞、複合語の類を組み合わせただけで軽く数億〜数10億種類の組み合わせが出てきます。それらが十分多数回出現して、使用頻度に差が出てくるグラフを描くには、高頻度の言葉の組み合わせが数億回出てくる水準までデータ量を「超ビッグ」にして、やっと正しい、揺れないデータが取れるのかなと思います。これがやや悲観的にせよ、まだまだ楽観的にせよ、天文学的スケールを超えたデータ量になります。

 数10億×数億といえば10の18乗という数。新聞1年分が10万記事程度で、1記事が平均10文とすればわずか100万文ですから、新聞記事なら10の12乗(1兆)年分が必要です。このような収集は事実上不可能。集めている間に、数百年程度で言葉の使い方が大幅に変化していってしまうどころか、残り50億年という太陽系の寿命をも遥かに超えてしまいます。もっとも、1億人が毎日書き、話す日本語をすべて取得できればもっと早いし、使用頻度のデータとしては文字通り十分ではあるわけですが。

 ただし、仮にすべての日本語をリアルタイムで収集、分析できても(ちょっと嫌な社会ですね)、昨日今日以前の過去のデータに過ぎません。明日以降はどんな出来事が起きて、どんな言葉の組み合わせが多く(少なく)語られるかという予測には不十分とも言えます。

 このように、有限の装置、材料(単語など)によって無限の発話のバリエーションを生み出せる「言語」を相手に、統計学が全自動で仮説を抽出、発見してくれるものでしょうか? 無理でしょう。

 何の構造モデルも持たず、結論に近い仮説も持ち合わせていなければ、有意な仮説の検証をすることはできません。何か言葉で表現するしかない対象については、少なくとも当面は人間が、鋭い洞察力を駆使して仮説立案と検証をしていくことになるでしょう(脳内の知識の構造は非常に洗練され、かつ2単語の組み合わせに留まらない膨大な使用パターンの情報を持っています)。

 あらかじめ有意差が生まれるパターンの情報があり、その検証方法について仮説を立ててから解析、分析に取り組むことで、有用な発見・検証にたどり着くものと思われます。これは、単純なデータの集計とは著しく違います。

 前々回、前回、そして上述の「単なる集計だけで興味深い」対象を選んだ際にも、どの分類軸で、どんなデータをどう集計したら面白い発見があるか(あるいは現場の感覚を定量的に検証できるか)の予想があったからこそ、首尾よく面白い結果を出せるのではないでしょうか。

何でも「ビッグデータ用ツール」でなくてもいい

 少し視点を変えて、従来のスモールデータの運用、すなわち厳選された社内データを規格・仕様通りにきれいにデータベースシステムに収納し、検索、参照、管理する世界と、ビッグデータ的なツール・手法を対比してみましょう。

 スモールデータ用のツール・手法の具体例については、データウェアハウス(DWH)や、最近ではマスター・データ・マネジメント(MDM)などのキーワードでたくさんの商用製品やサービスがヒットしますので、そちらをご照会ください。

 ここでは様々なツールや手法があるとして、そのすべてがビッグデータ用に使えるのか、そして、使うべきかを考えてみます。下の図のように、多種多数の七徳ナイフやコンパスを駆使し、組み合わせて、データ整備と分析の流れをスモールデータの世界で組んでいたとしましょう。

 HadoopやMapreduceなどのビッグデータ解析向けの専用ツールは確かに、汎用のデータベースシステム、逐次処理のデータ処理プログラムほどの汎用性は持ちません。並列処理をスムーズに行って、どこかでうまく合流させるために様々な制約があります。また、道具の世界で必ずしも「大は小を兼ねない」ように、小規模のきれいなデータを扱うことはかえって苦手だったりもします。

「ビッグ」を解析した後で「スモール」を分析すればOK?

 以前お話ししたかと思いますが、「これこれ以上のデータ量ならビッグデータ」という客観的定義は通常、存在しません。私が好きな定義は、「(その状況、条件で)人間の手に負えないデータ量ならビッグデータ」というものです。

 では、現場には両者が存在するとして、ビッグデータ用のツール・手法と、スモールデータ用のツール・手法をどう組み合わせて使ったらよいでしょうか? 

 素直に考えれば、ビッグデータの集計、解析の結果「スモール」になったデータを、スモールデータ用のツールで精緻に分析すれば良いじゃないか、となるでしょう。

 それを描いてみたのが上の図です。大きな漏斗がビッグデータ用で、その下の小さな漏斗がスモールデータ用。小さな漏斗の上に「i」とあるのは、厳選、吟味され、組織の死命を制するような情報「intelligence」の頭文字とでも解釈ください。

 でも、これでは少し単純化し過ぎのようにも思えてきます。1つ前の図と説明をご覧になると、「あれ? そもそもビッグデータ用のツールでは、全部の生データを処理しきれなかったんじゃなかったっけ?」と思い出します。

 その点を描き加えてみたのが上の図です。下方には5種類の漏斗があって、いろんな種類のデータを各々処理し、違う形で吐き出したり、集約したり、通知したり、配信したりしているイメージ図となっています。入口も、必ずしもビッグデータ解析用の漏斗から出てきたデータだけを扱っているわけではありません。人手でコントロールした別種のデータや、もともとスモールデータだったものも一緒に加えることで、現場の業務フローにおけるデータの流れのモデルを作っています。

 このようなイメージをあらかじめ持っておけば、最新のビッグデータ用ツール群ですべての種類のデータを一様に1つのシステムで扱わねばならないのではないか、とか、その方が効率や費用対効果が高いのではという不安を拭い去ることができるでしょう。

 極論するなら、紙と鉛筆による考察さえもツール群に混ぜておくべきです。実際、ブルーオーシャンを見つけるための経営ツールであるポジショニングマップや、発想のツールであるマインドマップなどについては手書きが奨励されていることをお聞き及びの方も多いかと存じます。

「発見」までのあと一歩を支援するシステム

 ダベンポート教授は、ビッグデータ活用のゴールを「発見」と「業務化」に分類しました。前節の図は、「業務化」をイメージしたものと捉えていただいて結構です。「発見」については、本稿では「発見」と「仮説の(定量的)検証」とに分けて、どちらも等しく重要としています。

 これらのどちらがより難しいかといえば、言葉面の印象通り「発見」の方だろう、という主張に反論する人は少ないかと思います。単に難しいというより、属人性が高い。すなわち分析担当者によってできたりできなかったり、目の前にあるものをそのまま述べた月並みで陳腐な程度に留まったり、天才的な洞察による業界初の大発見ができたり、といったように差が大きくなるものと言えるでしょう。

 では、この属人性を軽減し、誰でもほぼ必ず一定水準以上の面白い発見を得られるようにするために、システムはどのような支援が出来るでしょうか?

 ここで、前々回ご説明したなでしこジャパンのロンドン五輪の試合中のつぶやきを感情解析したグラフを再掲します。


 小鳥のアイコンの右に記したツイート群を感情解析した折れ線グラフが、4本中央に描かれています。さらに、オレンジ色と青色の吹き出しの中には試合中の出来事、事実が淡々と記入されています。この時は、パッケージ製品ではなく、個別リサーチ用に特別に用意したシステムでしたが、今後この吹き出し内容のような外部データ、異種コンテンツと解析結果を並べ、重ね合わせ表示する機能を標準装備する作業を進めています。なぜなら、時間軸という共通軸を用いて、同じ出来事を眺めている人々のつぶやきと、その出来事の内容、属性には本来、因果関係が存在するものであるからです。

 人工知能ではないので、「なぜそうなったのか?」を推論する機能が汎用的に使えるのはまだまだ先のこと。でも、この最後の「なぜ?」という因果関係に気づくという高級な役割こそ、分析官という人に任せれば良いではないですか。そして、何もないところから何かを発想できるような能力には確かに個人差が大きいでしょうが、このように、因果関係が本来含まれていてしかるべき異種データを、時間軸上に結びつけて見せるだけで新鮮な景観が見えてくる。あと一歩考えを進めるだけで、発見が生まれます。

 例えば、右下部分を見て、「ぎゃぁぁ!」「あああ、やられた!」「いやー、やられた!」などのつぶやきのすぐ近くに、「【後半10分】カナダにシュートを決められる」とあった時に、その因果関係を読み取れない人はほとんどいないでしょう。しかし、グラフに目を移して、その際の感情の動きがネガティブに振れるだけでなく、一部の感情がポジティブに振れた(怒り・怖れの類のネガティブが減った)、ということまで素直に読み取れば、それは「発見」です。相手にゴールを決められても、自国選手を罵る、嘲る、といった発言は出てこないという、ある意味、意外な分析を行うことができます。

 このあたり、100%誰でも発見ができるとまでは保証できなくとも、99%の発見率に近づけるような分析マニュアルを作ることは十分可能でしょう。※実はメタデータ社では、そのような分析マニュアルを既に創造し保有しています。

 以上、やや抽象化した議論となったため、イメージ図を多用したりしました。また最後に具体例を追求した結果、再びサッカーの試合を分析した例に戻ってきてしまいました。なかなか最先端の分析論、今後あるべきツールの要求仕様を語るのは難しい、ということで、今後も時々サッカーの話を出すかもしれませんが、引き続きご容赦、ご笑覧いただけたら幸いです。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business

2014年12月26日

W杯で楽しむデータ分析の妙味

本稿は、6/20(金)の日本対ギリシャ戦が終わった直後にまとめ、第3試合の対コロンビア戦が終わった時点で、この前文のみ書き直しています。下記本文をお読みになった上で、
「日本 対 コロンビア」
を眺めてみてください。

 いったんは冷静に敗戦を受け止めたサポーターも、「なぜ、こんなに日本が攻撃的サッカーで優勢に試合を進めていたのに大敗したのだ!?」と驚くような数字とグラフが目に飛び込んでまいります。この乖離を徹底分析することで、今後の勝利につながる活路が見えてくるのではないでしょうか。

 以下、ビッグデータ時代のW杯ならではのデータ分析を楽しめるウェブサイトなど、いくつかの興味深く新しい試みを眺めてみたいと思います。ビッグデータが単なる話題から、日常生活にビジネスに浸透しつつある様子を感じとれるのではないでしょうか。

勝敗要因分析もビッグデータ時代の流儀で

 前回2010年のW杯時点では存在しなかったメディア、サービスに、ハフィントンポスト日本版(2013年5月〜)があります。2014年2月にブラジル版を出し、現地取材で詳細な生データを取ることが可能になったせいか、試合中のデータを集計した結果を淡々と掲載しています。それらのページのタイトルは実にシンプル。対戦した2国名を並べているだけです。

「コートジボワール 対 日本」

「日本 対 ギリシャ」

 一番上に、支配率、シュート、クロス、コーナーキック、ファウルの数が対比され、大きい数字が太字になっています。対コートジボワール戦は支配率58%、シュート21、クロス23、コーナーキック8。ファウルのみ日本が1つ多い13。対ギリシャ戦では、日本が支配率なんと81%、シュート18、クロス25、コーナーキック5 (ギリシャ7)、ファウル23と苦闘ぶりが要約されています。続く「試合経過」には、パス成功本数、シュート失敗、得点、カード(イエロー、レッド)、選手交代が時系列上にプロットされています。

 驚いたのは「プレイヤーポジション」(下の図)。試合中の各選手の「平均位置」がサッカー場の上にプロットされ、その各2選手間を結ぶ線分の太さで、パス成功本数を図解しています。日本の初戦では、日本がコートジボワールに押されていたことが一目瞭然です。


 コートジボワールがフォワードの選手を中心に相手側コートに踏み込んでいるのに対し、日本選手はコート中央付近でせき止められています。

 日本を示すグラフは、ザックジャパンが目指した攻撃型サッカーではなく、伝統的な侍ジャパンの、守備を固めて少ないチャンスを狙うサッカーではないか、と見えます。すべての生データを処理したこの図が、試合の勝敗要因を如実に表しているとさえ言えましょう。

 ちなみに、対ギリシャ戦のプレイヤーポジションはこうなっています。


 81%もの時間、ボールを支配していた日本が押している様子(平均位置が敵陣の選手が8人。ギリシャは4人)が分かります。

 さらに、シュート(失敗/得点)の位置をプロットした図、各選手の位置と動き、パス成功率、セーブ数、ハイボールキャッチ数、タックル、インターセプト回数、ドリブル数、カード(イエロー/レッド)、についてはリンク先をご参照ください。勝利に貢献した選手、敗因となった選手の動きが集約されています。これによって、人間の主観による総合的印象や各選手の評価が検証されたり、逆に権威ある解説者の勝敗要因分析が覆ることもあるかもしれません。

 これはわがままな要望ですが、上記の図上の点や線の上をクリックしたら、当該場面のショートビデオ画面がポップアップして再生されてほしいと思いました。異なる角度、拡大率の動画を全パスから、ボールに関わっていない選手の動きまで全部とらえたら数万、数10万本のショートビデオを正確にリンクすることになり、手動では到底コスト的に見合わないでしょう。自動認識結果を保存して、関連コンテンツへの紐づけにすべて反映されるような“賢い”システムを構築することが今後求められていくでしょう。

生データを踏まえた記事の迫力

 生データを忠実に集約した結果を基に試合を総括し、意見を述べている記事もいくつも出ています。

「ワールドカップ日本代表の敗因は何か? データで浮かび上がる「コートジボワールの秘策」

 おそらくハフィントンポストから、部分集計結果などより詳細なデータの提供を受けているのでしょう。前半15分までのコートジボワール選手の平均位置とパス回しを図解して、次のように事実を踏まえて“慎重なゲーム運び”とコメントしています。

 “コートジボワールはジェルビーニョが前に残る形。ボランチとセンターバックが回し合う形で、コートジボワールもまた慎重にゲームに入っている。”

 日本先制後15分〜30分の間の日本選手の平均位置とパス回しを示し、この時間帯こそが日本らしい試合運びをできていたことを、図を根拠に示します。

 “先制後、日本にエンジンがかかる。吉田麻也を起点に香川、長友、本田らがパス回しに加わる。長谷部、山口はやはり慎重な位置取り。日本がもっとも「らしかった」時間帯。”


 説得力がありますね。ビッグデータの解析結果、集計結果を引用しつつ、短く的確に分析レポートを執筆する際の参考にしたいような文章です。以下、ピンチやチャンス、「ドログバ投入以降から逆転まで」何が変わったかを見事に視覚化してくれます。生データ集計結果が圧倒的に雄弁であることを思い知らされます。

ヒトが「なぜ(Why)」を考える、さらに深い分析

 さらに踏み込んだ深い分析は、さすがにその道の専門家、サッカー取材のプロによるものに求めることができました。

「日本 初戦で逆転負けの要因は」

 「なぜ(Why)」にまで踏み込んだ分析には、いったん生データから離れ、集計結果から全体を俯瞰した上で、価値判断、重要性の評価により個々の要因の重み付けから選択、切り捨てを行う必要があります。こうして得られた仮説をインタビュー等によって検証し、その証拠付きで提示する必要もあります:

 “左サイドバックの長友選手は、「ボールを回されてかなり体力を消耗してしまった。コートジボワールはフィジカルだけではなく技術があるし、組織のレベルも高かった」と振り返りました。”

 これらができるのは、少なくとも当面は人間の専門家だけでありましょう。このように、比較的事実に忠実なレポートと、「なぜ(Why)」にまで踏み込んだレポートを対比し、参考にすることで、企業が自社ブランドのマーケティングの反響から分析するプロセスの確立に役立てることもできそうです。たかがサッカー記事、と侮ってはいけません。

ソーシャルメディアの大量コメントを楽しむ

 一方、エンタテインメントに徹して、ソーシャルメディアにあふれる独断と偏見による意見をあれこれ読む、というのも楽しいものです。

 「監督の猫の目采配が悪い」といった伝統的な解説記事を長々読まされるとストレスを感じることがあります。ツイッターの書き込みのように、著名人や知人の独断と偏見を簡潔に、かつ大量に読めると、それはそれで多面的な価値観や多彩な表現力に感心し、彼らの心象風景を追体験できる上質なエンタテインメントとして味わうことができます。同じ時間で、より大量に、多彩な情報を受け取れないと脳が不満を示すようになったのかもしれません。「ビッグデータ×ソーシャル」の時代ならではの変化と言えそうです。

「ワールドカップ日本代表、専門家はギリシャ戦をどう見たか Twitterまとめ【第2戦0−0】」

予測はどうなったか?

 前回引用したBloombergによるW杯直前の予想では、決勝選がブラジル対スペインとなっていました。予選リーグのポイント獲得予測が、コロンビア 5.5→7.0、 コートジボアール4.2→4.1 、ギリシャ3.2→3.1 日本 3.5→2.0 と変化しています。


 敗退したスペインに代わって、アルゼンチンが決勝選でブラジルの対戦相手となり、準優勝との予想。

 これら、ポイント算出のアルゴリズム(計算手順)を是非見てみたいと思います。探しても見つからなかったので、ご存じの方は是非ご教示ください。どこかで人間の専門家による修正過程が入っていても結構。そのルールも含めて、企業におけるビッグデータ分析、その結果の解釈と、意思決定に活かすプロセスの設計のために非常に参考になる気がします。

データの視覚化にはこんな用例も

 東北大学工学部情報知能システム総合学科で自然言語処理を担当する乾健太郎教授の研究室のネガポジ判定APIを使った、朝日新聞のつぶやきリアルタイム分析グラフのページが頑張っています:

 1分間を1秒に加速して、その間のツイート(ツイッターのつぶやき)のネガポジ比率を円グラフに表現したゴージャスなアニメです。

 「日本、よくボール回る」の瞬間のポジティブ比率も高いですが、「惜しくもシュートはずれる」の類の時にも、有意にポジティブ比率が高くなっています。一昨年、メタデータ社が、なでしこジャパンの試合のデータ分析で発見した知見の正しさが、ここでも裏付けられました。

 大量テキストから面白い集計結果が得られるのは、ソーシャルのデータばかりではありません。国内のほとんどのTV番組の情報を書き起こしているエム・データさんが、W杯開幕前1カ月間にTVに登場した選手の登場回数ランキングをFacebookページで発表してくれています:

「もっと見る」のリンクを押すと、下記がでてきます

******

【W杯】大会前報道回数ランキング

■日本代表編
1位 本田圭佑 (479回)
2位 香川真司 (385回)
3位 大久保嘉人 (348回)
・・・

 エム・データさんは、こんな名前の団体の会長企業であり、TVメタデータを軸にしたコンテンツ連携の付加価値を梃子にビジネスをされているユニークな企業です。

第5回 NPO法人日本メタデータ協議会主催 カンファレンス
 『テレビ発。メタデータサービスの現状と未来』

 エム・データでは30人ほどのスタッフが常駐し、分担してTVを見て、画面に映った物体の名称から何から、メタデータとして役立ち得るものを片っぱしから入力しまくっている、と聞きます。ちょっと目からウロコの発想。デジタルTVのコンテンツ制作で、複雑にからむ権利関係を解きほぐし、上流のデジタル・メタデータが下流に素直に流れてきてくれたとしても、それですべてのTVメタデータがカバーできるわけではありません。

 例えば、画面の背景左にスカイツリーが美しくぼやけて映っている、などのデジタル・テキストデータは制作現場には元々存在していないはずです。このようなデータが書き起こされることで、関連コンテンツの自動検索や、必要部署への自動配信が可能となり、ますます大きな価値をもたらしてくれるようになるでしょう。

 エム・データさんのTVメタデータ活用といえば、「ミスター・デジタルアーカイブ」、「ミスター・ビッグデータ」、「ミスター3D視覚化」、などなどの称号が相応しい、首都大学東京・ネットワークデザイン研究科の渡邊英徳先生の研究室が、素晴らしいビッグデータ可視化アプリを先日発表しています。


 「続:マスメディア報道の空白域をビッグデータで可視化する」


 このハフィントン・ポスト記事の中で、弊メタデータ社のAPIに触れています。TVメタデータから地名を抽出しているのが、弊社の「5W1H抽出API」だからです。各局ごとの報道地域の図示や、減災リポートと重ねて表示することにより、傾向を一目で把握する一助となっています。目に美しく意味の把握しやすい、文字ビッグデータ可視化の最先端の姿。


 首都大学東京ネットワークデザイン研究科渡邊研究室では、3、4年前から、弊メタデータ社のネガポジ・感情解析APIを使って、優秀論文賞、マッシュアップアワード準優勝などを獲得しておられます。コトバノキが有名ですが、他にも、歌詞の感情解析の結果から、明るい、暗いメロディーを自動作曲するなど、SF的なアプリ作品も誕生しています。

ソーシャルでは「半構造データ」が激増中

 ツイッター、Facebook以外にも、写真共有のInstagramや、ビデオアートのVimeoなど、様々な専用メディアがソーシャルの仕組みで隆盛を誇っています。


 この画面は、FIFA公式のInstagramページです。Instagramはもともと、スマホなどで気楽に撮影した写真をアート調、セピア調などに大胆にその場で加工して投稿し共有するためのサービスでしたが、気軽に作って味わえるお洒落さが、品位を維持・向上したいFIFAのお眼鏡にかなったということでしょうか。

 いずれにせよ、前回2010年のW杯の時点では存在すらしていなかったInstagramのような仕組みを使って、マスメディア経由と比べてケタ違いに大量のコンテンツを提供し、それを介してファンとの国際的な交流をFIFAが図るようになったのは注目に値する動きでしょう。

 画像や動画に限定し、自動編集されることを前提に一定のお作法で書きこまれたキャプション(説明テキスト)などの「半構造データ」が激増し、これまたビッグデータを形成しています。これらコンテンツは、時にTVメタデータを介して、またはテキストからの5W1H(イベントのメタデータ)抽出を介して、健全にビジネスに応用され、消費者やアプリ・ユーザーの娯楽、ひいては幸福増大に貢献できる日を待ちわびているように思えてなりません。

 チャンスは目の前にたくさん転がっています。今後も、時にスポーツ関係のビッグデータ活用にならって、コンテンツの権利関係や個人情報保護に留意しつつ、ビジネスへの応用を鋭意考えていきたいと思います。そして日本発のビジネスモデルの存在感を世界に示していけたらと考えます。

タグ:ビジネス
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | business