基于英文单词的发音规则,精准预估TTS语音合成每段内容所占据的时长,以便实现更精准的字幕同步,冷门应用场景,但却是稀缺的算法资源,值得收藏备忘。
文章关键字 ‘语音合成’
英文单词朗读基于音素预估时长的JS算法
2024年12月6日,星期五借助ffmpeg.wasm纯前端实现多音频和视频的合成
2021年03月20日,星期六不借助C/C++,纯JS浏览器中ffmpeg.wasm实现指定长度、位置和数量的音频和视频合并成新的视频,此领域目前为数不多优质文章,建议收藏备忘。
HTML5语音合成Speech Synthesis API简介
2017年01月13日,星期五HTML5中和Web Speech相关的API实际上有两类,一类是“语音识别(Speech Recognition)”,另外一个就是“语音合成(Speech Synthesis)”,这两个名词听上去很高大上,实际上指的分别是“语音转文字”,和“文字变语音”。各有作用,各有千秋,兼容性也有差异……