読者です 読者をやめる 読者になる 読者になる

ワラワラフォトの種明かし

Webサービス

 Baidu.jp不自然言語処理コンテストの表彰式が終わったので、ワラワラフォトの種明かしをします。
 実はワラワラフォトでやっているのは、「w」と「twitpic」をTwitterの日本語検索に投げているだけなのです。

言葉にならない気持ちを言葉にする

 Baiduの言う不自然言語を自分が使うシチュエーションはどういう時か? というところから考えて見ますと、単純に言葉だけではつたわらない空気や感覚、ニュアンスといったものをテキストベースであるウェブ上で伝えようとする時です。つまり不自然言語は言語にできないものの言語化なので、うまく使えば言葉にできないものをインデックス化し、検索できる、ということです。
 例えば、よく使われる不自然言語と適当な対象を絞り込むキーワードを組み合わせ日本語検索になげれば感情があふれている「何か」を検索できます。

顔文字を試して見る

 そこで、最初は顔文字に注目しました。顔文字というのはパターン化しやすくて大部分は「(^^)」というように「()」ではさまれたパーツがあります。しかも感情表記としてはある程度パターン化されていますので、単純に顔文字で分類すればそれだけで感情に基づいた分類になります
 ならば「( )」あたりで検索するとおもしろい結果が出てくるかなー? と思ったのですが、簡単に試したところで「出てこない」どころかForbiddonだったので断念しました。
 ちみなに、後で調べたところGoogle Buzzでは顔文字を検索クエリとするとエラー再試行の無限ループに突入します(^^;)

じゃあ草を生やそう

 次に試したのが「草をはやす」という習慣です。「これはひどいw」という感じで、ネタがあれば「w」をつける習慣は広くあるわけです。これと組み合わせれば…と思ったところ、見事に成功しました。

 つまり、日本語検索に限れば、wと何か適当な対象を絞るだけで簡単にネタっぽいものが手に入るわけです。
 今回はとりあえず簡単にtwipicだけでやりましたが、色々と応用が効きそうなので、もうちょっと本格的にサービス化してみてもいいかも? とか考えていますw