2010年01月21日

同義語検索はシンプルなセマンティック検索

Switch on → スイッチオン 
 20日午後、慶大の坪田知巳教授がオフィスに来られ、メタデータとセマンティック技術が拓く、「編集」の新次元について、大変有益な議論ができました。それについては、おいおい、進捗に合わせて公表してまいるとして、このとき、編集者のスキルを養成する「スイッチオン・プロジェクト」が話題となりました。
 カタカナが正式名称らしいですが、 Switch onプロジェクト でGoogle検索。ヒット結果の要約文の中で、「スイッチオン」  などと太字で表示されました。英単語の和訳というか、ローマ字化した単語が検索語として上位にひっかっかったわけであります。
 

Google、検索結果の概要で同義語も強調表示に

  http://www.itmedia.co.jp/enterprise/articles/1001/20/news082.html
Googleは1月19日、そうした結果の概要部分(スニペット)で同義語を強調表示し始めたことを明らかにした
 例として、 「photo(写真)」を検索すると「photos」「photograph」のように、スペルが近い言葉のみならず、「picture(写真)」もヒットさせていく、とのこと。ノイズ、勇み足もしばらくは増えるでしょうが、従来路線の延長で、もっともらしいランクを出そうとする中で、同義語によるヒット結果を高ランクにしていく路線を決定した、ということでしょう。
 
 以上は、紛れもなく、セマンティック検索です。
Bingに統合されたPowersetは、単語の語義を区別して、余計なヒットを抑止するという「適合率向上」 を主眼としていました。しかし、本来ヒットすべき、意味的に類似の文書(しかし一致文字列は皆無!)を上位に出せるという「再現率向上」を主眼としたセマンティック検索にGoogleは乗り出した、ということであります。
 下記の関連記事のうち、リアルタイム検索以外は、全部セマンティック検索と呼んで良いように思います。

関連記事

 
 昨年12月の怒濤の発表と違い、Googleも2010年は、いよいよセマンティック技術の本格応用、サービスインをメインにすることにした、という感じを受けます。
 
 
 
 
 
by nomuran こと メタデータ 野村直之
 
 
posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic