【数円】文章を流暢な日本語で読み上げしてもらう text2speech : Amazon Polly

数円と描いたのは、100万文字につき、月当たり4ドル≒400円くらいになるため. 3000文字なら1円~5円ぐらいになる

ちょっと流暢な日本語が欲しければおそらくこのAmazon Pollyはほぼ無料で使えるのでお勧め.

特徴まとめ

  • AWSアカウント必要
  • Web上で完結
  • 100万字で400円. 3000文字で1~5円
  • 日本語を読み上げられる
  • 英語が含まれる日本語の文章は日本語英語になる
  • 英語3000文字日本語約1500文字までは、その場で聞いてその場でダウンロード可能
  • それ以上の文字数はS3バケットにおかれる
  • 日本語は男性の声と女性の声が一つずつ選べる(英語は多数)
  • スタンダードとニューラル(より自然な声)があるが、ニューラルはポルトガル語や英語のみ. 日本語はスタンダードしか選べない. ニューラルは高い

音声のサンプル

上記のように技術解説動画でも使用させてもらっているが、たまに違和感があるものの、ほとんど手直しなしにうまくいく.

上にも描いたが、日本語モードのときは、英語も日本語英語になる笑

そこは流暢な英語でよいんですけどね…

音声生成画面

音声生成画面はWebで上記のように文章を入れて、音声を聞くかダウンロードすればOK.

ニューラルモードはニューラルネットワークなどの最新技術を使ったもので、より自然. そちらは値段も高いが、一部の言語でしかまだ対応していない.
なので必然的にスタンダードモードを使うことになる.

日本語には音声が二つしかないので、声色は選べない. ここらへん、英語はより充実しているので羨ましいが…

文字数が日本語1500文字を超えると、その場のWebで聞いて、ダウンロードすることができない. 小分けにして行うか、 S3に出力するかが必要.

Amazonが出している料金の目安

https://aws.amazon.com/jp/polly/pricing/

上記のサイトで書かれているように、それぞれのケースにおける目安が書かれている.

基本的に100円を超えることは余りなさそう…
数万時読み込ませて初めて100円超えるレベル.

About the author

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です