平成徒然草

映像・音声を話題ごとに分割する技術?

2010/12/28

話題の変わり目をとらえる、というのは人間にも難しいことだと思うのだが、それがIT技術で可能になったのだという。

Stream NOWが伝えるところによると、

 日本電気株式会社(以下NEC、本社:東京都港区、代表:矢野薫)は、映像/音声コンテンツに含まれる音声から話題(トピック)の変化を検出し、映像/音声コンテンツを話題毎に分割する「トピック分割技術」を開発/発表した。

 トピック分割技術とは、自然な話し言葉を業界最高レベルの精度でテキストに変換する音声認識技術と、テキストを意味のあるまとまりに切り分けるテキスト分割技術により実現したもの。話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治・芸能・スポーツなど話題の具体的内容に影響されることなく分割可能なほか、一連の話題の移り変わりを数理的なモデルで表現。話題の変化点をコンテンツ全体から総合的に判断することで話題が変わる頻度に関わらず安定した高い性能を保つのが特徴。

どれくらいの精度で話題の変わり目が検出できるのかなあ。
複数の人間が、それぞれ勝手なことをしゃべっている時はどう判断するんだろう?

-平成徒然草
-