Safari video subtitle speech

Subvoca

在 Bilibili、YouTube 和部分通用视频站看视频时,用你选择的系统语音或云端高级音色朗读字幕。

今天我们来看一个新的字幕朗读工作流。
高级语音 中文男声 M392 对话 72%

Voice tiers

两类语音,一个入口

基础语音

使用系统内置语音朗读字幕,音频生成留在本机,适合免费、快速、低延迟的日常观看。

高级语音

由 Subvoca 后端统一管理供应商和音色,用户只需要从统一音色列表中选择想听的声音。

字幕节奏

根据字幕时长和播放速度自动调整语速,尽量让朗读跟上视频节奏,减少字幕尾音被截断。

Subscription and quota

免费试用和 Plus 月度额度

登录用户每月可获得后台配置的云语音试用额度。Plus 用户通过 App Store 订阅获得更高的月度云语音生成时长。

额度按实际生成音频秒数扣减,同一个请求会用 requestId 做幂等处理,避免重试时重复扣费。

Privacy

系统语音本地生成,云语音透明计量

基础语音使用浏览器和操作系统能力,不把字幕发到云端。高级语音会把待朗读文本发送到 Subvoca 后端生成音频。

终端用户不接触供应商密钥。后台负责音色配置、用量记录和订阅状态,便于后续切换或增加云语音供应商。