pyttsx3 是一个用于 Python 的文本转语音(TTS, Text-to-Speech)库,它的主要特点和功能如下:
核心功能
- 离线工作:不需要网络连接即可实现文本到语音的转换,这是它与许多在线 TTS API(如百度语音、谷歌语音)的主要区别。
- 跨平台支持:可在 Windows、macOS 和 Linux 系统上运行,会自动适配不同系统的底层语音引擎:
- Windows:使用系统自带的 SAPI5 语音引擎
- macOS:使用 NSSpeechSynthesizer
- Linux:依赖 espeak 或 speech-dispatcher
主要特性
- 多语音支持:可以获取并切换系统中安装的不同语音(如不同性别、语言的语音)。
- 参数可调:
- 语速(rate):可设置每分钟朗读的单词数(默认约 200)
- 音量(volume):可设置播放音量(0.0 到 1.0 之间)
- 语音控制:
- 支持文本朗读(
say()方法) - 支持队列式朗读(可连续添加多个文本)
- 支持暂停、继续和停止功能
- 事件监听:可以监听语音播放的开始、结束等事件。
基本使用流程
- 安装:
pip install pyttsx3 - 初始化引擎:
engine = pyttsx3.init() - 设置参数(可选):
- 播放文本:
优缺点
- 优点:离线可用、响应速度快、轻量级、无需 API 密钥
- 缺点:语音质量依赖系统自带语音库,可能不如专业在线 TTS 服务自然;跨平台表现可能有差异
适用场景
- 简单的桌面应用程序语音提示
- 无障碍辅助工具
- 离线语音播报需求
- 快速原型开发
如果需要更高质量的语音或更多语言支持,可以考虑结合在线 TTS 服务(如 AWS Polly、Google Text-to-Speech 等)使用。




所有评论(0)