※他にも情報があればぜひ追加お願いします!
音声合成のしくみ~波形接続とSPSS~――BELL-UV-AGE-4さん
最近主流の音声合成の手法2つを、初心者向きに分かりやすく解説した動画です。
VOICEROIDやVOCALOIDで採用されている「波形接続型音声合成」と
CeVIOで採用されている「統計的パラメトリック音声合成(SPSS)」の原理が分かります。
※ただし、動画内の「ささらメソッド」に関する説明はあくまでSPSS全般のもので、CeVIOの原理はこれと異なる部分もありますので、その点はご注意ください。
※2022年現在、SPSSはDNNを採用した方法などの登場により、まとめて「統計的音声合成」と呼ばれる事が多くなっています。
各種資料
「統計的音声合成技術の現在・過去・未来」(2015)
2015年の名工大・徳田先生(CeVIOのエンジンを開発するテクノスピーチ社の共同代表でもあります)の講演資料です。
「統計的音声合成の展開と展望」(2019)
2019年の名工大・徳田先生の講演資料です。「統計的音声合成技術の現在・過去・未来」よりもDNNなどの新しい記述について詳しく記載があります。
関係者ツイート
学習データが不足する場合は、品質向上のため別の人の声で補完することはあり得るので、今後も含め常に全部が全部純度100%という約束ではない点はご理解ください。品質改善できなくなると困るので。
通常は十分な収録データがあれば、演者さんの声100%でCeVIO AIのボイスは完成します。
関連ページ
最終更新:2022年10月10日 02:53