昔より声の情報を電子データに置き換える技術が上がっているように感じる。昔から変わったってぼんやりした感じじゃなくて、1年前とか半年前と比べてみたいな話でとにかく現在進行系で正確さや応答速度が向上しているように感じる。
最近すげえなと思ったのはSwitch2のゲームチャットの文字起こし機能で、ちょくちょくミスというか誤変換するものの、声聞かずに変換された文字だけで会話できるレベルになっているように感じる。反応速度もかなり良好。VCするときの文字起こしなんて、誤変換されて面白いくらいのネタ程度に思ってたんだけど、つけておいて会話の補助として機能するなってくらいには思った。
そういうのを見て興味が湧いて、動画編集ソフトで簡単に字幕起こしできないか気になったので少し調べてみた。2つほど試しに動画ソフトを使ってみたんだけど、1つボタン押すだけで全部字幕をつけてくれるし、起こしてる文字もかなり正確で気になったらちょっと修正すればいいくらいだった。今の時代に切り抜きとかするならこういうの絶対使うんだろうなという感じがした。
実はyoutubeも字幕機能があってわりと正確に機能してくれるんですよね。ただ、生放送とかリアルタイムで字幕をつけてくれないし、生放送公開後しばらくして処理が完了しないと字幕がつかないのは不便な点。出先では音無しで配信見たりするので、何喋ってるかの雰囲気だけ知りたいから間違っていてもいいから字幕ついたらいいのになあと思っています。