数円と描いたのは、100万文字につき、月当たり4ドル≒400円くらいになるため. 3000文字なら1円~5円ぐらいになる
ちょっと流暢な日本語が欲しければおそらくこのAmazon Pollyはほぼ無料で使えるのでお勧め.
特徴まとめ
- AWSアカウント必要
- Web上で完結
- 100万字で400円. 3000文字で1~5円
- 日本語を読み上げられる
- 英語が含まれる日本語の文章は日本語英語になる
- 英語3000文字日本語約1500文字までは、その場で聞いてその場でダウンロード可能
- それ以上の文字数はS3バケットにおかれる
- 日本語は男性の声と女性の声が一つずつ選べる(英語は多数)
- スタンダードとニューラル(より自然な声)があるが、ニューラルはポルトガル語や英語のみ. 日本語はスタンダードしか選べない. ニューラルは高い
音声のサンプル
上記のように技術解説動画でも使用させてもらっているが、たまに違和感があるものの、ほとんど手直しなしにうまくいく.
上にも描いたが、日本語モードのときは、英語も日本語英語になる笑
そこは流暢な英語でよいんですけどね…
音声生成画面

音声生成画面はWebで上記のように文章を入れて、音声を聞くかダウンロードすればOK.
ニューラルモードはニューラルネットワークなどの最新技術を使ったもので、より自然. そちらは値段も高いが、一部の言語でしかまだ対応していない.
なので必然的にスタンダードモードを使うことになる.
日本語には音声が二つしかないので、声色は選べない. ここらへん、英語はより充実しているので羨ましいが…
文字数が日本語1500文字を超えると、その場のWebで聞いて、ダウンロードすることができない. 小分けにして行うか、 S3に出力するかが必要.
Amazonが出している料金の目安
https://aws.amazon.com/jp/polly/pricing/
上記のサイトで書かれているように、それぞれのケースにおける目安が書かれている.

基本的に100円を超えることは余りなさそう…
数万時読み込ませて初めて100円超えるレベル.