2010年01月29日

2010年はソーシャルを支えるセマンティックか

 

学会研究会もソーシャル花盛り

 本日は、情報処理学会の自然言語処理研究会&情報学基礎研究会の合同研に久々に出席しました。オフィスから徒歩圏内で助かりましたが、内容は1年前よりずっと充実している印象。ソーシャルメディアの解析が大きなセッションとなっていました。学会研究会の大きなテーマ、潮流を形成したくらい、多くの領域にソーシャルが影響を与えています。
  ソーシャルメディア研究の1つの流れが、人間のQ&Aや対話の研究、そしてその裏返しとも応用ともいえる、対話ロボット作りとその評価の研究です。後者は最近は「ボット」、少し以前ならEliza以来の「人工無能」といえば思い出される人が多いでしょうか。
 季節柄、院生さんの発表が多かったですが、中でも北大の荒木先生の研究室の人による、優れた(気の利いた、心のこもった、、)対話のできるボット作りの研究がおもしろかった。
 まず、人間なら有り得ない発話も含めて応答候補を、複数の方式(対話継続を目的としたEliza型や相手の発話を引用してコメントする受容/共感型、Webを知識源として面白い回答返す、など)で複数生成しておく。そしてそれらが過去の人間による対話、発話例のどれかとどれだけ似ているかを評価。良く似たものは自然な対話例に近いからそれを選んで発話して返す。このようなハイブリッド方式(演繹と帰納の融合)で、少しでも人間らしい対話ができるように、ということでナイス。敬意を表して「複数の方式による返答が混在すると人格が複数、交代してるみたいにならないか?」と質問したところ、今後、表現レベルや内容レベルで「スムージング」して解決したいとのこと。ともあれ、退出の際には、古巣の研究会が良い活動してて嬉しい、とTwitterにつぶやきました。
 

Twitter で俄然注目度が高まった"ボット"

 Twitterといえば、企業発Twitterで、担当者のTwitter疲れを回避するのにボット併用は十分有効と考えられます。それどころか、退屈な人間を超える珍回答でウケたりもできるでしょう。「Webを知識源として面白い回答返す」かわりに、「社内知識、商品/サービスについての網羅的な知識を張り合わせて回答返す」というまじめなボットなら、不勉強な人間を超えたパフォーマンスを発揮できる可能性すらあります。「燃え尽き症候群」の回避から、より気の利いた会話、手慣れた対話の知識(有限状態機械)を埋め込むことで、担当者のパーソナリティ、属人性に依存しがちなのを少しでもカバーできるかもしれません。
  そう、特徴的な属性をもった言葉を相手の言葉やWebから見つけてきてタイムリーに返答する、などは、やはりセマンティック技術なのです(どうかんがえてもシンタックス、形式的処理ではないですね)。優秀なボットに、企業発Twitterを「手伝わせる」というのは、 「ソーシャルを支えるセマンティック」の一構図であります。1年前は、両者を対置して、相互に補う構図を描きました。しかし、ここ1年のソーシャルの発展(日本では半年ちょっと前まではソーシャルアプリは無きに等しかった)、特にリアルタイムメディアの凄まじい隆盛に押されました。表に出て大ヒットするセマンティックサービスが今後は出現するかもしれませんが(弊社も挑戦します)、しばらくはソーシャルの勢いがとまりそうにありません。
 現在、Twitterには、数百くらいボットが生息していると推測されます.容易には人間かボットが区別のつかない、人間やボットもいます。 本日も、@NHK_PRさんが次のように書いてました。
@NHK_PR 修造さんがボットだと教えて下さった皆様、ありがとうございました。ずっとお話ししてしまうところでした・・・・orz 
 これが反響を呼びました:
  1. google000 本日のお前が言うな  QT @kamijou_touma: 修造bot絶対中に人がいるだろ!! RT @shuzo_matsuoka @NHK_PR 昔から「勝ってガットを張り直せ」というだろう!!駄目駄目駄目!油断禁物!勝負はおうちに帰るまで!遠足を忘れるな!! RT @NHK 
  2. yen_town @NHK_PR え、@nhk_prもbotでしょ?
  3. tkrdk @NHK_PR NHK広報さん可愛い…
  4. mutaguchi . @shuzo_matsuoka@NHK_PR のやり取りウケるw
  私はこのshuzo_matsuokaさんという超元気な「気合い入れ」ボットについて、昨日次のように書きました:
@nomuran #KM11 #twitterJP 課題:属人性の低減:ボットの活用 というサブテーマの詳細事例です: @shuzo_matsuoka さんというボットにフォローされました! おそらく手動だと思いますが、きっと定期的に自動的にフォロー返ししているボットも出てきているかと思います。
  一方、人間というふれこみ(現職の自民党議員さんが敬語使って話しかけていた。これが冗談だったら相当ギャフンだ)のハマコーさんは、私は実はボットではないか、と疑ったのですが、はぐらかされました:
@555hamako 「ニセモノかホンモノかが大事なのではなく、そこに本当の、ホンモノの「魂」が入っているかどうかが問題なのである!」
@nomuran  ↑なんて格言をシャッフルして出しているボットみたい。でも、元気出そうなので、生身でもどっちでも良いや! これからフォローしますね。わくわく。。( 6:00 PM Jan 28th  555hamako宛)
 

ソーシャルを支えるセマンティックアプリの実用化

 続いて、Evri というセマンティックサービスのエージェント機能みたいなEvriBotのこととか、LinkedIn会員の旅行計画をたてやすくした、TripItというセマンティックサービスのソーシャルアプリ版のことも書きたかったのですが長くなりすぎました:
ご参考:TripIt! は5W1Hを元に旅程を最適化、提案してくれるサービス 
 個人情報や有害情報をチェックするのもセマンティック技術です。続きは、有料で恐縮ながら、2/3 のPAGE2010コンファレンス「Webはどこまで賢くなれるか」でお話します。 事後に感想を交えて一部の図版をこちらにも書かせていただくかと思います。
 

Twitterで #KM11 に来れ! 

 この日は、上記に先立って午後イチに、BM学会KM研究会も開催いたします。
 2010/2/3 第11回KM研究会「リアルタイムCRM!」 Twitter中継!
この研究会のTwitterハッシュタグは、#KM11 です。
 敢えてUST中継はやらず、会場にいるひとがとことんつぶやきまくって、主な内容はほとんどTwitterでオンライン、リアルタイムで把握できるようにさせていただく予定です。2/3 13:00-15:30 は、 http://twitter.com/nomuran から #KM11 をクリックしていただきたく、どうぞよろしくお願いします。事前にも事後にも書き込み大歓迎です。すでに相当、リアルタイムCRMについてのメッセージがたまっています。
http://twitter.com/#search?q=%23KM11
例; パネリストの日本IBM根本さんからのメッセージを引用して:
  1. 114101_2928994_normal nomuran #KM11 日本IBM根本さん曰く:「最近はTwitterアカウントをいくつか使用してマーケティングしております。段々アカウント数が増えてきて、今は10アカウントくらい同時に動かしており、運営もけっこう自動化しております。」凄い!#kaishanohoshi #twitterJP 
 
  オフラインの定員は36名ですが、オンラインは無制限。10倍超のご参加を期待いたしております。どうぞよろしくお願いもうしあげます。
 
ps 上記で、記号の類や、Twitterの用語でご不明な点、3月のセミナー等で承りたいと存じます。適宜、Twitterでコメントしたり絡んでいただけるとさらに喜びます。どうぞよろしくお願いいたします。
 
 
 
by nomuran こと メタデータ 野村直之
 
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic

2010年01月21日

同義語検索はシンプルなセマンティック検索

Switch on → スイッチオン 
 20日午後、慶大の坪田知巳教授がオフィスに来られ、メタデータとセマンティック技術が拓く、「編集」の新次元について、大変有益な議論ができました。それについては、おいおい、進捗に合わせて公表してまいるとして、このとき、編集者のスキルを養成する「スイッチオン・プロジェクト」が話題となりました。
 カタカナが正式名称らしいですが、 Switch onプロジェクト でGoogle検索。ヒット結果の要約文の中で、「スイッチオン」  などと太字で表示されました。英単語の和訳というか、ローマ字化した単語が検索語として上位にひっかっかったわけであります。
 

Google、検索結果の概要で同義語も強調表示に

  http://www.itmedia.co.jp/enterprise/articles/1001/20/news082.html
Googleは1月19日、そうした結果の概要部分(スニペット)で同義語を強調表示し始めたことを明らかにした
 例として、 「photo(写真)」を検索すると「photos」「photograph」のように、スペルが近い言葉のみならず、「picture(写真)」もヒットさせていく、とのこと。ノイズ、勇み足もしばらくは増えるでしょうが、従来路線の延長で、もっともらしいランクを出そうとする中で、同義語によるヒット結果を高ランクにしていく路線を決定した、ということでしょう。
 
 以上は、紛れもなく、セマンティック検索です。
Bingに統合されたPowersetは、単語の語義を区別して、余計なヒットを抑止するという「適合率向上」 を主眼としていました。しかし、本来ヒットすべき、意味的に類似の文書(しかし一致文字列は皆無!)を上位に出せるという「再現率向上」を主眼としたセマンティック検索にGoogleは乗り出した、ということであります。
 下記の関連記事のうち、リアルタイム検索以外は、全部セマンティック検索と呼んで良いように思います。

関連記事

 
 昨年12月の怒濤の発表と違い、Googleも2010年は、いよいよセマンティック技術の本格応用、サービスインをメインにすることにした、という感じを受けます。
 
 
 
 
 
by nomuran こと メタデータ 野村直之
 
 
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic

2010年01月10日

「10大 セマンティック製品 2009」

 少々遅まきながら、昨年末、ReadWriteWebから発表された「10大 セマンティック製品 2009」を概観します。
 
 、、と思ったら、SBI HGさんが、たんたんと和訳してくださってました。感謝です!
 
by nomuran こと メタデータ 野村直之
 
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic