日本語の正しさにおけるIMEの役割についての一考察(ATOKとGoogle 日本語入力の違い)

スポンサー

※当サイトではアフィリエイトプログラムを利用して商品を紹介しています。

頭ん中の増永 玲さんのエントリーで
これが Google IME の恐いところ

私のアンテナにひっかかりました。おっしゃられていること、「言葉をたいせつに」ということ響きました。

「ふいんき」と入力して変換すると、

ATOKでは、「ふんいき」が正しい読みですよと誤りを指摘してくれるけど、Google 日本語入力では、そのまま何も表示されず「雰囲気」とすんなり変換できてしまうこと。

Google 日本語入力とATOK、それぞれのプロダクトのなりたちや経緯、開発手法から見ていくといいのでは?と思います。

以下、かつてATOK、Yahoo!サーチエンジンの開発に携わった私の個人的な一考察ですので、それこそ誤りありましたら、ご指摘ください。

Google日本語入力について

少し古いですが、ITmediaさんの
「Google日本語入力」開発者が語る、その狙い
の記事などからの情報で

・無料である
・基本的なスタンスとして「Webのありのまま」を反映している→なので、新語、流行語、省略語、そして場合によっては、誤用も含まれる
・検索クエリやWebのテキストコーパスからの語彙収集
・統計的な手法(単語が登場する頻度の情報をデータベース化し、ランキング化することで変換精度を高めるというアプローチを取っている。辞書もクロールしたデータから機械的に生成する)
・Googleも誤用の問題の件に関しては認識しており、「IMEが誤用を出すのは問題だと思っているが、何を持って誤用とするのか考えが出せないでいる」とのこと。

ITmediaさんも
「Webは生きた言葉の最前線だ。IMEが“言葉の裁判官”を買って出るべきなのか、ここは思想の問題と言えそうだ。」
とコメントしている。

誤用も含めて、今の日本語と付き合っていくというスタンス。

ATOKについて

ATOK監修委員会の高本條治先生へのインタビューなどからの情報で

・有料のアプリケーション(ビジネスソフト)
・Webのテキストのない時代から開発してきたソフトで、語彙の収集は紙の文書(=間違いの少ない情報)から変換辞書を作ってきている。
・統計的手法も導入してきてはいるが、ユーザーからのフィードバック、ヒューリスティックスの蓄積の部分や人力による改善にコストをかけてる
・監修委員会、辞書チームによる人の目のチェックを経てきているものである
・ユーザーの思考を邪魔することなく、ユーザーの意向をくみ取って、適切で的確な日本語入力をサポートすることを目的としている
 (変換候補の順位など、統計的な結果が出ているものでも、この目的に照らし合わせて変えているものもある?)
・ターゲットとして、官公庁、学校、企業の文書作成にも使われることを想定
・そのため、不快語、差別語などは収録されていないし、誤用については、指摘し修正を促す

高本先生のインタビューの中の言葉

現代を生きる私たちは必ずしも単一の「語彙空間」だけで十分とは言えません。ビジネスシーンとプライベートシーンでは異なった「語彙空間」が必要になることも多いはずです。

ここの部分がまさに、Google日本語入力とATOKの立ち位置の違いで、Googleはどちらかというとプライベート寄り、ATOKはビジネス寄りの現状で、どちらももう一方の語彙空間も網羅していきたいと改良を重ねていると思います。

こういったことを踏まえて、日本語変換システム、日本語入力ソフトを使っていくと、言葉をたいせつにしながら、なおかつ、ストレスなくスムーズに入力作業を行えると思います。

私個人は、報告書やビジネスメールなど、文書作成の場面で使う場合は必ずATOKを使うようにしています。

コメント

タイトルとURLをコピーしました