Yahoo! Pipesで形態素解析+日英翻訳 その2
9 月 11th, 2008
今日、弄ってたらなんとかできました。
試しに「庭には二羽ニワトリがいる。」という文章を入力すると、名詞だけが抽出されてそれぞれ英語に翻訳されます。(上の画像)
あとはWordPressのプラグインからこのYahoo!Pipesを呼び出すだけです。
ちなみにソースはこんな感じになりました。
今日、弄ってたらなんとかできました。
試しに「庭には二羽ニワトリがいる。」という文章を入力すると、名詞だけが抽出されてそれぞれ英語に翻訳されます。(上の画像)
あとはWordPressのプラグインからこのYahoo!Pipesを呼び出すだけです。
ちなみにソースはこんな感じになりました。
Yahoo! Pipesで形態素解析+日英翻訳ができたらいいなーと思ってやってみた。
結果的にできてないんだけどっw
目的は昨日書いた投稿スラッグを自動生成するためで、日本語を形態素解析して単語に分解したあと必要なものだけ英語に翻訳して繋げようという試みです。
・形態素解析はYahoo!デベロッパーネットワーク - テキスト解析 - 日本語形態素解析を使う。
・形態素解析ができたら、とりあえず名詞だけ抜き出して英語に翻訳。
・翻訳した単語のリストを返却。
この一連の流れをYahoo!Pipesでやってみたのですが、Yahoo!の日本語形態素解析の結果が文字化けするのです。
xmlのエンコーディングはutf-8になっているのですが、Yahoo!PipesはそこじゃなくてHTTPヘッダのcharsetを見ている様子。
形態素解析の結果は、
Content-Type: text/xml
となっているみたいで、charsetは送出されてないのか…
キャラクタセットはiso 8859-1かなんかに勘違いされて処理されてるのが原因ぽい。
んー。どうしたもんか。
最近のコメント