OpenAI社のAIの話を追っかけでして、Whisperの存在を知り、口述筆記をやってみたいと思って居た。
そしたら先日、Whisperより早く、GPUも食わないfaster-whisperというモジュールの存在を知った。
一昨日、以下のサイトからサンプルプログラムを頂き、動かしてみた。結果は良好。
「[ローカル環境] faster-whisperを利用してリアルタイム文字起こしに挑戦」
しかし残念な事にこのプログラムは話したものをテキストに落とす部分が無い。あと、終了させるときにエラーが出ちゃう。そこをちょいとだけ改造してみた。昨夜何度か試したが、問題は無い模様。次はGUIにしたり、ChatGPTと連携させたりとかかな?