大相撲の字幕放送

たまたま、テレビで大相撲の実況中継の始まる時間だった。
取り組みの始まる前の最初の時は字幕がないのは知らなかった。

大相撲の字幕制作はリスピークによる音声認識方式だ(った)。ベテランのアナウンサーが本当のアナウンサーが話したことをそのまま話してコンピュータがそれを文字にする。
音声認識の文字変換の効率を高めるために歓声の入らないスタジオで話している。

複数の解説者、アナウンサーの声を色分けして示していたのは文字放送の開始時からのアイデアだ。

「視聴覚障害者向け放送のガイドライン」が公表されたことから、字幕制作の効率を高めるためにコンピュータの音声認識による字幕制作方式に各社がしのぎを削っている。
一人のアナウンサーによるストレートニュースならばかなり正確さは高いと言う。

これは逆に普段の会話の音声認識技術による字幕化は難しいということを物語っていないか。


ラビット 記