Webテクノロジー 2007年4月24日 17:50

日立、隣り合う人が同時に話す音声を聞き分けられる音声処理技術を開発

著者: japan.internet.com 編集部
2007年4月24日 17:50 付の記事
□国内internet.com発の記事

日立製作所は20日、隣り合う人が同時に話す音声を、誰が話したかを明確に聞き分けることが可能な音声処理技術を開発した。

この技術は、複数のマイクロホン(マイク)素子を使って、音の発生位置を瞬時に高い精度をもって測定する技術と、特定の方向からの音声だけを抽出できる技術の開発によって実現したもの。

この技術を用いると、マイクから1〜2メートル離れた複数の人の音声を聞き分けることや、周辺の雑音を取り除き特定の音声だけを抽出することが可能になる。これにより、テレビ会議や電話会議において、外部からの雑音を取り除くことをはじめ、雑音の多い環境下で音声認識の精度を向上させたり、複数のマイクで録音したビデオ映像の中から、特定の人の音声だけを抽出したりすることが可能。

今回、日立が開発した技術の特長は以下のとおり。

・一瞬で高精度に音源位置を測定できる「近接音源定位技術」

複数のマイク素子を、間隔を変えながらアレイ状に配置し、間隔の異なるマイクペアで測定されたデータを組み合せることで、音源の位置を推定する性能の高精度化を実現し、音声の全周波数成分を使って処理を行うことで、短時間での測定が可能になった。

・突発的な雑音を選択的に除去する「空間音声フィルタリング技術」

音源位置の推定結果から、雑音領域内に音源が存在した場合、その方向に物理的に音声の死角を生成する。これによって、雑音領域内で発生した音声を抑制する。

今回開発した近接音源定位技術の性能を、日立が実験で確認したところ、一般的なオフィス環境で、音源がマイクから1〜2メートル程度の場所にある場合、水平・垂直方向とも、10度の間隔の音源位置を識別して測定できることが確認できたという。また、水平方向が20度の間隔で2人が同時に発声した場合、各個人の発声内容だけを抽出できることが確認できたとのことだ。

トップページ | 画面トップ

Copyright 2008 Jupitermedia Corporation All Rights Reserved. http://www.internet.com/