百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

TTS实战:pyttsx3文本合成语音,windows上可以,linux差强人意

ahcoder 2025-03-24 13:25 11 浏览

(此处已添加书籍卡片,请到今日头条客户端查看)

本篇目录(大约需要花费3分钟):

1、背景

2、实践

3、反思一下

4、转换方法实现

5、重新尝试总结,

1、背景

今天要做一个文本转语音接口,研究了一天TTSs,不想使用花钱的接口,不想放弃,尝试了python使用pyttsx3方式实现

windows上实验还可以,但是linux上的结果不尽人意,特别不满意。所以今天写下感受。最终先使用了讯飞的语音合成api,先完成接口开发,后面有时间再研究其他的方式

2、实现过程

首先就是查找资料并实现

pyttsx3是Python中的文本到语音转换库。与其他库不同,它可以脱机工作,并且与Python 2和3兼容

实现步骤如下:

第一步:安装库(centos 、debian 需要还安装 espeak,ffmpeg,否则转换时会报错)

pip3 install  pyttsx3

第二步实现的代码:

import pyttsx3
engine = pyttsx3.init() # object creation
""" 把语音存储到文件 """
engine.save_to_file("Hello World!!!",'~/abc.mp3')

"""更改速率"""
rate = engine.getProperty('rate')   # getting details of current speaking rate
print (rate)                        #printing current voice rate
engine.setProperty('rate', 125)     # setting up new voice rate


"""更改音量"""
volume = engine.getProperty('volume')   #getting to know current volume level (min=0 and max=1)
print (volume)                          #printing current volume level
engine.setProperty('volume',1.0)    # setting up volume level  between 0 and 1

"""更改声音"""
voices = engine.getProperty('voices')       #得到当前voices的详情
#engine.setProperty('voice', voices[0].id)  #改变下标,可以更换vocie,转换男声和女声
#engine.setProperty('voice', 'zh')   #linux 转换中文,使用此voive,同时支持英文
engine.setProperty('voice', voices[1].id)   #改变下标,可以更换vocie

engine.say("Hello World!")
engine.say('My current speaking rate is ' + str(rate))
engine.runAndWait()
engine.stop()

以上内容转自:
https://www.jianshu.com/p/1a5f5d450c12

在windows上和linux上都能实现,但是linux上的voice和windows的不一样,导致转出的效果差别很大。最终linux服务器上不是很满意。因为没有现成的windows服务器,暂时放弃了这种方案。

3、反思一下

为什么会出现windows上和linux上的不同,我去查找了官网,发现了一段话,翻译过来就是

Windows上使用的是sapi5语音合成引擎,Mac OS X上是nsspeech合成器,eSpeak 其他平台上使用,即,linux上使用的espeak。

4、转换方法实现

为了完成目前的接口开发,我使用了讯飞语音合成,新用户(企业用户)一年有50万的免费使用,那么我先使用讯飞的api实现接口。

昨天发了个微头条,发现很多人对这个感兴趣,所以就总结下,发下自己的感受。



5、重新尝试总结

这次进行了tts的尝试,没有成功使用pyttsx3实现我的接口开发,但是收获了很多。比如发现了一个网站可以免费的转换,也发现了微软接口的一个实现。

如果大家感兴趣的,可以在评论区留言“666”,我下期分享下自己找到的资料。

相关推荐

ARM64内核内存布局图(ARM64内核内存布局图解)

ARM64架构处理器采用48位物理寻址机制,最大可以寻找到256TB的物理地址空间。对于目前的应用来说已经足够了,不需要扩展到64位的物理地址寻址。虚拟地址也同样最大支持48位支持,所以在处理器的架构...

ARM64 linux 调试串口通信(ARM64 linux 调试串口通信实验报告)

ARM64linux调试串口通信随着国产机普及很多工作也转移到了新平台上,以前调试设备用的笔记本电脑也换成新国产ARM64架构的了。本文以绿联CM204USB-A转RJ45Console调试线...

Gentoo Linux 终止对 Itanium IA-64 体系的支持

GentooLinux是最后几个继续维护Itanium(IA-64)架构构建的Linux发行版之一,但现在这些已停产的英特尔处理器正在逐步淘汰。由于Linux6.7内核放弃了对Itan...

如何检查 Linux 系统是 32 位还是 64 位?这9个命令查的又快又准!

在Linux系统中,位数(bit)通常指的是CPU架构的位宽,即CPU一次能够处理的数据量。32位系统和64位系统在内存寻址能力、计算性能和软件支持上存在显著差异:「32位系统」:...

调出好画面!带你玩转飞凌嵌入式AM62x开发板的显示接口

来源:飞凌嵌入式官网“显示”是嵌入式开发板最为重要的功能之一,能够支持更多种类、更高规格的显示接口,意味着它能够应对的使用场景也更加广泛。每一款嵌入式开发板在出厂前都会做屏幕调试,但在客户的实际项目开...

带你玩转AM62x开发板的显示接口——LVDS的显示和修改方式

此前小编已为大家介绍过OK6254-C开发板的RGB显示和修改方式,今天将继续为大家介绍OK6254-C开发板的LVDS显示和修改方式。话不多说,我们进入正题。1、LVDS接口规格飞凌嵌入式OK62...

AM335x继任者?AM6254性能解析(am2361p)

飞凌嵌入式FET6254-C核心板基于TISitaraTMAM62x系列工业级处理器设计开发,采用ARMCortex-A53架构,主频最高可达1.4GHz;并集成了丰富的接口,可广泛应用于的工...

如何在 Linux 发行版中安装微信和 QQ?

很多人因为工作沟通的原因需要用到微信和QQ,那么如何在Linux发行版中安装微信和QQ呢?以下是一些尝试的解决方法。QQ上一个版本的QQLinux版还是在2009年,而在现在,基于N...

MySQL:物理备份工具XBK(mysql 备份方案)

XBK的优缺点:XBK(PerconaXtraBackup)优点:1.免费2.热备:备份期间不阻塞innodb和XtraDB表,但会阻塞Myisam表3.物理备份:备份恢复快XBK缺点:1.不支持远...

AMD锐龙9 9950X CPU AIDA64跑分曝光:比7950X最高快45%

IT之家6月26日消息,Anandtech论坛网友igor_kavinski本周一发布帖子,分享了AMD旗舰锐龙99950X处理器的AIDA64基准测试跑分,与当前基于Z...

qemu linux内核(5.10.209)开发环境搭建

版本信息宿主机:ubuntu20.04.6LTS(FocalFossa)虚拟机:ubuntu20.04.6LTS(FocalFossa)安装宿主机的步骤省略,和一般的在vmware中安...

iPhone 7成刷机神器,成功运行乌班图、Linux、安卓

在智能机刚开始流行的时候,很多手机发烧友都喜欢刷机,当时民间大神们制作了特别多优化的ROM。后来随着手机硬件的逐步提升,以及厂商们对系统的大力优化,让大家对于刷机的兴趣也越来越少。不知道大家还记得这部...

12 款最佳免费开源 Linux 渲染器 | 火狐浏览器 130.0 版本更新

12款最佳免费开源Linux渲染器Linux的一大优势在于其拥有丰富的开源软件,可以满足艺术家、摄影师、动画师和设计师的需求。凭借价格低廉的硬件、免费的软件以及少量的才能和灵感,任何人都可以创...

Linux中xargs 命令详解与实用场景

xargs是Linux系统中常用的命令行工具之一,它能够从标准输入构造参数列表并传递给其他命令使用,是处理批量数据操作时的重要利器。一、xargs的基本语法xargs[OPTION]...[C...

Linux 磁盘扩容(非LVM)方式(linux扩容lvm磁盘容量)

今天接到一个客户的需求,CentOS的/分区容量太小了,OA系统所有的数据都在这下面,由于当时前同事给客户安装系统时采用了标准分区,而不是LVM逻辑卷,所以不支持在线扩容。df-hT查看磁盘使...