2009年10月05日

"APIマッチ"のセマンティック技術

 標記の"APIマッチ"とは、"WebAPI比較・マッチングサービス" のことです。

”本WebAPI検索サービスをWebAPI経由でマッシュアップアプリに組込みたい方はこちら→ ... 検索結果一覧で、 のついているAPIはMA5協賛企業の提供するAPIです。 Summary文のDrag&Dropに加えWebAPI詳細を参照する矢印ボタン を付けました。”
 前回の日記「セマンティックAPI 4種、MA5に提供」でご紹介させていただいたせいか、実際にMashup Award応募予定者さんのニーズが高まっているせいか、 最近、"WebAPI"で検索してベスト10に返り咲きました。
 この他の辿り着き方ですが、検索エンジンに "dnavi" と入れてみて下さい。国会図書館オンラインの「データベースのデータベース」Dnaviをクリックし、フォームに、WebAPI (or Web API) と入れると唯一ヒットするのが、"WebAPI比較・マッチングサービス" です。
※Dnavに"Web"と入れても上位3つくらいにヒットすると思います。
 

"APIマッチ"のドメイン名の変遷

  "APIマッチ"のために最初に取得したドメイン名は、gimu-kenri.netでした。2007年8月のことです。MA3にチャレンジャーとして、マッシュアップ作品を作ってdeployし応募するために取得しました。
 「義務と演技」、、もとい、「義務と権利」。別にCGMサイトじゃありません。WebAPIのライセンス文章を自動解析し、ある文が、誰かの義務について記述していれば「」、権利なら「緑」、禁止なら「」で表示するようにしました。通常「誰か」とは、甲か乙、ここでは、WebAPIの提供者vs利用者となります。そこで、利用者視点を優先し、利用者の関する、義務、権利、禁止ならば、上記の色分けに加えて、太字で表示するようにしました。最初から、英語と日本語の両ライセンス文に対応しました。

 

  応募の直前になって、「いずれ海外の利用者にも、日本発の優れたAPIをどんどんスピーディに検索して、出自を問わずに使ってもらいたいし、、」と考え、ドメイン名を変更。2つの主なユース・ケースとして、【比較】と、【マッチング】を想定しました:
【比較】2つの似たAPIの基本プロフィールを見比べて片方ずつ落としていき、残ったものを採用。
【マッチング】マッシュアップに両方とも使いたいAPIを見比べて繋がるかどうか、内容の整合性がとれるかをチェック。
  両者の英単語をとって、compare & matching。さらに、できるだけ短く、安い(.com/.netなら安い)ものにしよう、と考えて順序を入れ替え、api-match.comを最有力候補としました。実際にこのドメイン名が空いていることを確認し、応募の直前に入れ替えた次第です。
  実はその後も半年以上は、gimu-kenri.netでもアクセスできる状態でした。でも、その後、バイリンガル化を推し進め、何回か検索して検索履歴がたまった状態でもその状態のまま 日→英、英→日、と移行できる国旗ボタンを付けたあたりで、もはやgimu-kenri.netは不要、と判断。リクルートの事務局さんも、"APIマッチ"と呼んで覚えてくださるようになっていたので、「ドメイン名さん、ご苦労様でした」とばかり、更新せずに終了させました。
 

"APIマッチ"のセマンティック技術

 でも、 gimu-kenri.netという名は無くなっても、義務なら「」、権利なら「緑」、禁止なら「」という色分け機能は残っています。これが、メタデータ株式会社が初めて世間に公開したセマンティック技術です。形式言語のセマンティクスや論理学のModal Logic (様相論理→命題をくるみその外側に確からしさや信念・価値判断に関する述語を規定したもの) に相当する自然言語表現を自動抽出し、文の役割(筆者による位置づけ) を判定して色分けするものです。
 1980年代の人工知能ブームで一時流行りましたが、機械翻訳の高精度化以外に、シンプルな応用用途を見つけられていなかったような微かな記憶があります。 今回の解析対象は、WebAPIのライセンス文(Terms of Service)です。
 日本では法律関係の人材があまりに稀少で、かつ多くの場合、「ご説明はよくわかりました。で、ソースコードって何ですか?」という質問を、背景説明を2時間した後に訊いてこられるようなことになります。その上にXMLや、APIの概念、そのWeb版に必要な免責規定や利用者の権利と義務を正当に理解していただくのは相当な難事業になります。
 結論としては、「WebAPIを使うエンジニア(か企画担当でよ〜く出来た人)」がライセンス文を読みこなすしかありません。これは辛い作業です。本物の法律文に近ければ近いほど、ちんぷんかんぷんで眠くなるか頭が痛くなることでしょう。これは、英語ネイティブが英語のライセンス文を読む場合も同じです。
 一方、 "APIマッチ"君は、ライセンス文が本物の法律文に近ければ近いほど、高い精度で、義務「」、権利「緑」、禁止「」の色分けができます。要点をながし読みしたいとき、重要な禁止事情だけ急いで再チェックしたいときなど、とても助かります。(私自身助かっています)
  こんなささやかな、ナイーブな用途にも、セマンティック技術をどんどん応用していくことで、少しでもWebが介在する世の中が便利で、ユーザも提供者も幸福になれると良い。誰にも作業を押しつけないでやろうとするならば、やはり大部分、機械が自動で作業するのが良いのではないか。
 マルクス経済学で提唱された「労働の疎外」 をテクノロジーの力で追放したい!と、経済学を専攻していた父の書斎で35年前に痛切に願った思いが心中でまだ生きているようです。そのせいで、どちらかといえば、、自分でやるなら、ソーシャルよりセマンティック、と考えるのだな、と改めて自省しました。
 
 
 ↑これがユニークな、デュアル詳細画面の表示です。
 恣意的に、ばらばらに書かれたAPIドキュメントのサイトを読み込む苦痛から、マッシュアップエンジニアを解放するため、基本的なメタデータが一目で表形式でならべて参照できるようにしました。
 ざっと眺めたら、上方のsummary行(APIの名前や見出し)から、次に詳細画面で眺めたいAPIを選び、マウスでつまんで左右どちらかにDrag&Dropしてください。
 あるいは、 のボタンを押してください。
 振り返りたくなったら、「閲覧履歴」のタブで、一度参照したAPIの一覧を見ることができます。つなぎたい順番にクリックすると、マッシュアップ企画書のドラフトができます。電車の中で、アイディアの続きを練ってください。
 MA5の〆切は、30日後の11月4日です。
 
ps 他のAPI のうち、特に、5W1H Mextractrについて hatena日記に書きました。
   APIというより、アプリ、IE8アクセラレータ版についての最近のマイコミジャーナルの紹介記事の補足のようなものです。
 

 テゴリー: Mextractr, business, semantic

Good!獲得数: 112

アクセス: 1348

posted by メタデータ at 00:00| Comment(0) | TrackBack(0) | semantic