日本語処理

Google日本語入力が誤用を指摘するようになりました

ATOK2012とGoogle日本語入力の使い分けをしている、渡辺(@konnec_kollect)です。

6/22にリリースされたGoogle日本語入力の最新版で、変換時に、誤用を指摘するようになりました。

Google Japanのブログより
Google 日本語入力の安定版をアップデートしました (1.5.1109.x)

「ふいんき→雰囲気」のような、一般に幅広く知られている誤読を「もしかして」の形で提示する機能を追加しました。

「雰囲気」に変換するために、読みを「ふいんき」と入れて、変換した場合は
「<もしかして:ふんいき>」と表示されます。

続きを読む

誰が何と言おうと、ATOKキーワードExpressがいいのだ!

ATOK2012からの新サービス、「ATOKキーワードExpress」は、

話題になっている新しいキーワードを収集して配信し、自動的にあなたのATOKに反映するクラウドサービス

FacebookやTwitterをはじめとする、SNSなどで、今話題の単語を入力するときの利便性を向上してくれます。
省入力候補として表示されるので、単語の読みの入力途中で候補として表示されるので、入力スピードがアップします。
続きを読む

ATOK2012の候補ウィンドウを春の装いにカスタマイズ

新年度、新学期となり、心機一転ということで、ハードディスクの中を整理したり、PCの環境を変えたりしたという方もいらっしゃると思います。

春本番となってきましたので、私のデスクトップ周りも春色に装いを変えていっています。

私も、毎日お世話になっている、日本語入力システムATOK2012変えてみました。

続きを読む

日本語の正しさにおけるIMEの役割についての一考察(ATOKとGoogle 日本語入力の違い)

頭ん中の増永 玲さんのエントリーで
これが Google IME の恐いところ

私のアンテナにひっかかりました。おっしゃられていること、「言葉をたいせつに」ということ響きました。

「ふいんき」と入力して変換すると、

ATOKでは、「ふんいき」が正しい読みですよと誤りを指摘してくれるけど、Google 日本語入力では、そのまま何も表示されず「雰囲気」とすんなり変換できてしまうこと。

続きを読む

連続した人名入力にはATOK2011の新機能複合語への自動切り替えが有効

2011年の11月から、月300円の定額でWindows/Mac/AndroidのATOKが利用できる「ATOK Passport」を使っています。
http://www.justsystems.com/jp/products/atok_passport/

使い込んで、手になじんできたので、気づいたこと書いていきます。
年末の年賀状の作成時に、住所録を編集していたのですが、氏名を入力しているのに
なんだかさくさくと変換できている気が。
ATOK2011からの新機能、「複合語変換への自動切り替え」が助けてくれていたのでした。
続きを読む

Google日本語入力で「おみくじ」「ふくわらい」を変換すると・・・

2012年初投稿はお正月にちなんだネタから。

Google日本語入力の開発者小松弘幸さんがツイートされていたので、試してみました。

「おみくじ」「ふくわらい」を変換すると楽しいことがあります。

「おみくじ」で変換すると

変換候補の中に「吉 今日の運勢」が表示されます。
お正月は、「大吉」が多めなんだそうです。
※画面1/3のスクリーンショットで、残念ながら「吉」でした。

「ふくわらい」で変換すると

変換候補の中に顔文字がランダムで表示されます。
上記では、「( ;∀;) イイハナシダナー」

Googleのイースター・エッグ、クリスマスの時には、検索画面に雪を降らせたりと、
こういった遊び心、うれしいですね。

さくらインターネットでMeCab+PHPを使う

形態素解析エンジンMeCab、さくらインターネットの共有サーバーでは、インストール済みです。

%mecab -v
mecab of 0.97

2008-02-03リリースのバージョン0.97です。
MeCab extension(php_mcab)をゲットし、解凍→Makefileの編集へ

wget http://www.opendogs.org/pub/php_mecab-0.3.0.tgz
ln -s /usr/local/php/5.2.17/bin/phpize phpize
tar xvfz php_mecab-0.3.0.tgz
phpize
./configure –with-mecab=$HOME/local/bin/mecab-config
–with-php-config=/usr/local/php/5.2.17/bin/php-config
–prefix=$HOME/local
make
vi Makefile

mecab.soファイルのディレクトリ指定

#EXTENSION_DIR = /usr/local/php-5.2.17/lib/php/extensions/no-debug-non-zts-20060613
EXTENSION_DIR = $(HOME)/local/lib/php/extensions/no-debug-non-zts-20060613

インストール

make install
cd $HOME/local/lib/php/extensions/
mv no-debug-non-zts-20060613/mecab.so ./

/wwwへ移動し、
php.iniを設定します。viで開き、

vi $HOME/www/php.ini

以下を入力します。

extension_dir=”/home/さくらのID/local/lib/php/extensions”
extension=mecab.so

保存します。

Chinseiさん/juiceeeeeさんのブログを参考にさせていただき、ほとんどそのままでインストールできました。有用な情報ありがとうございます。
Chinseiさんのサイト
juiceeeeeさんのサイト

IME2003,2007からIME2010へ無料アップデート-その1-

マイクロソフトの日本語変換ソフトの最新版、IME 2010 は、
Microsoft Office の正規ライセンス (Office XP、Office 2003、Office 2007、Office 2010) を利用していれば、
無料でダウンロード、アップデートして使用できます。

http://www.microsoft.com/japan/office/2010/ime/default.mspx

アピールポイントとして次の点が挙げられています。

「パフォーマンスの向上」

Microsoft Office 2007 Service Pack 2 と比較すると、文字変換速度が 2 倍以上に高速化。

「変換精度の向上」

文字の変換精度が大きく向上。また、直前に入力した文字が変換候補の 1 番目に出てくるなど、学習機能が大きく強化されています。

それでは、まずは、ダウンロードですね。

IME2003,2007からIME2010へ無料アップデート-その2-

へつづく