![]() ![]() ![]() ![]() 沖電気、翻訳ポータルサイト「訳してねっと」を公開この記事のURLhttp://japan.internet.com/busnews/20040929/4.html
著者:japan.internet.com 編集部
国内internet.com発の記事
沖電気工業株式会社は2004年9月29日、ネットユーザーが辞書データを登録することにより翻訳精度を向上させることができる Web サイト型の機械翻訳システム「訳してねっと」の無料一般公開を開始した。同システムは、文書中の専門用語を自動的に抽出して辞書登録時間を半減する「専門用語抽出機能」を搭載している。
同サイトでは、辞書の作成・管理を、翻訳する分野単位に行い、その分野に精通したユーザーが辞書データを登録することで、それぞれの分野において精度の高い辞書作成を可能にした。また、統計的な手法を用いて、専門用語など辞書登録すべき単語や熟語などを文書中から自動的に検出する技術を開発し、専門用語抽出機能として搭載した。ユーザーが指定した Web ページから訳語を入力するだけで簡単に辞書登録できるため、ユーザーは効率的に辞書データ登録ができる。 事前に抽出機能を使った辞書登録の評価実験を行った結果、抽出された単語や熟語などの中で、辞書登録すると翻訳精度が向上するものが全体の約3割あり、登録すべき単語や熟語などのうち約5割をカバーしていることがわかった。また、この機能を使った場合には、使わなかった場合に比べて、同じ量の辞書データが半分の時間で登録できることもわかった。 従来の Web 上の機械翻訳サービスでは、翻訳サービス会社やユーザー個人が辞書の増強・管理を行っているため、管理できる分野には限界があり、きめ細かい辞書作成サービスが行えないのが現状だった。 今後も同社では、訳してねっとを翻訳ポータルサイトとして、機械翻訳や情報抽出などの自然言語処理技術を使った商品開発を目指す。 |