BitArts Blog

ロードバイク通勤のRubyプログラマで伊豆ダイバー。の個人的なブログ。

DVDで英語の勉強

好きな映画で安上がり学習のメモ。

まずDVDから英語字幕を吸い出してテキストファイルにする。DVDは映像と字幕が別データとして収められている。と言っても文字データが入ってるわけではなく、字幕も画像として入っている。だから「テキストを吸い出す」と言っても簡単には行かない。字幕を吸い出すにはSubRipというフリーソフトが使える。このソフトでは字幕画像を抽出した後OCRでテキストに変換する。最初のうちは画面を見ながら文字を入力してやらなきゃいけないのだが、しばらく教え込むと自動的に変換されるようになる。楽ではないが、現実的な作業量で抽出できる。ちなみに字幕はまずSan-Serif系の書体が使われているので、「I(大文字のアイ)」と「l(小文字のエル)」はまず区別不可能。これはまあ、仕方ない。

ちなみに、リッピングしないと抽出できなかったので、DVD Shrinkリッピングした。しょうがない。

再生は、WinDVDなら音程を変えずにスロー再生(タイムストレッチ)できる。フリーのプレーヤーならnave player limitedがお勧め。スロー再生の音質はWinDVDより良い感じ。ただDVDを再生する場合は別途コーデックが必要。