谷歌文本转语音(gtts)批量转换

  • 1. 测试环境
  • 2. 谷歌云平台注册
  • 3. gtts 使用
    • 3.1. 基本介绍
    • 3.2. 准备工作
    • 3.3. 本地环境变量设置
    • 3.4. 安装python包
  • 4. 测试

最近工作中要将文本转换成多国语音,试了下gtts,效果不错,来记录下

1. 测试环境

项目版本
操作系统Ubuntu20.04
python3.8
Google Cloud Platform试用版

注意:
1、由于需要试用谷歌云平台,所以需要能够访问谷歌的方法,在此不在赘述


2、为了申请谷歌云平台账号,需要拥有VISA信用卡或者PayPal账号,用于注册时的验证

2. 谷歌云平台注册

点击谷歌云平台,转到谷歌云平台,申请账号,注册流程按照提示来就可以,但是必须要有前文提到的东西,注册成功后,会有90天的免费体验时间。

在这里插入图片描述

3. gtts 使用

3.1. 基本介绍

gtts(google text to speech)使用由 Google 的 AI 技术提供支持的 API 将文字转换为自然而逼真的语音。可以在这个页面看到一些官方的使用文档,本文也在该文档指导下进行。

在这里插入图片描述

3.2. 准备工作

从基本介绍可以看出,gtts是通过API调用的方式实现的,因此我们必须先启用谷歌云平台中的gtts api功能。为了能够成功开启该功能,具体操作步骤如下:

  1. 登录到云控制台,新建一个项目,这里设置名字为txt2wav

    在这里插入图片描述

  2. 确认待使用项目已启用结算选项。这个是谷歌收费的,当前我们是免费使用期间,正常跳转到结算页后,是能找到我的结算账号的,如果出现没有结算账号的情况,按照这里的说明进行操作。

    在这里插入图片描述

  3. 开启gtts API。在产品搜索框内输入speech,进行搜索,并打开 Cloud Text-to-Speech API 页面,之后选择启用 API。注意该操作是启用当前激活项目的 gtts API(Google Cloud Platform后面显示的即为当前激活项目)。

    在这里插入图片描述

  4. 创建服务账号。必须通过服务账号才能访问 API,相当于认证,创建一个服务账号,可选项都可不填。注意该操作是在当前激活项目中创建服务账号(Google Cloud Platform后面显示的即为当前激活项目)。

    在这里插入图片描述

  5. 创建完成后,点击服务账号的电子邮件信息,会打开配置页面,添加新密钥,正常添加即可,最后会选择密钥格式,这里选择json格式并进行下载。

    在这里插入图片描述

3.3. 本地环境变量设置

  1. 设置用于身份验证的本地环境变量。本地每次调用 API 时,都会使用该变量指向的密钥进行身份认证,具体命令如下,将该命令添加到~/.bashrc中,并将KEYPATH换成你的密钥存储位置,具体到文件本身如/home/rsa/aaa.json
export GOOGLE_APPLICATION_CREDENTIALS="${KEY_PATH}"

3.4. 安装python包

本次测试使用的是系统自带的python3.8,也可以使用虚拟环境,使用以下指令安装gtts的python包。

pip3 install --upgrade google-cloud-texttospeech

4. 测试

注意:测试过程中,要保证能够正常访问谷歌。

  1. 本次测试样例的功能为:读取txt内文本信息,转换为语音后,保存。文本内格式如下,每一行由保存文件名称和待转换文字组成,如第一行,将会将i love you转换为语音,并保存为iloveyou.wav

    在这里插入图片描述

  2. 测试源码如下,部分代码进行了注释,gtts转换后的音频够实现指定采样率、通道、格式等信息,具体API使用手册参见这里

    #!/bin/env python
    
    from google.cloud import texttospeech
    import wave
    
    client = texttospeech.TextToSpeechClient()
    
    voice = texttospeech.VoiceSelectionParams(
        ```
        转换的语言码 en-US 代表美国,支持的语言查看 https://cloud.google.com/text-to-speech/docs/voices
        ```
        language_code="en-US", 
        ```
        语音播报性别选择
        ```
        ssml_gender=texttospeech.SsmlVoiceGender.FEMALE
    )
    
    audio_config = texttospeech.AudioConfig(
        ```
        输出语音文件的编码方式,可以选择mp3、wav(LINEAR16)等
        ```
        audio_encoding=texttospeech.AudioEncoding.LINEAR16,
        ```
        输出语音文件的采样率
        ```
        sample_rate_hertz = 8000
    )
    
    index = 0
    filenames = []
    with open("test.txt", "r") as f:
        for line in f.readlines():
            line = line.strip('\n')
            filename, text = line.split(",", 1)
            filename = filename.strip(" ")
            filenames.append(filename)
            text = text.strip(" ")
            synthesis_input = texttospeech.SynthesisInput(text=text)
            response = client.synthesize_speech(
                input=synthesis_input, voice=voice, audio_config=audio_config
            )
            with open(filename, "wb") as out:
                out.write(response.audio_content)
                out.close()
        f.close()
    

热门文章

暂无图片
编程学习 ·

C语言二分查找详解

二分查找是一种知名度很高的查找算法,在对有序数列进行查找时效率远高于传统的顺序查找。 下面这张动图对比了二者的效率差距。 二分查找的基本思想就是通过把目标数和当前数列的中间数进行比较,从而确定目标数是在中间数的左边还是右边,将查…
暂无图片
编程学习 ·

GMX 命令分类列表

建模和计算操作命令: 1.1 . 创建拓扑与坐标文件 gmx editconf - 编辑模拟盒子以及写入子组(subgroups) gmx protonate - 结构质子化 gmx x2top - 根据坐标生成原始拓扑文件 gmx solvate - 体系溶剂化 gmx insert-molecules - 将分子插入已有空位 gmx genconf - 增加…
暂无图片
编程学习 ·

一文高效回顾研究生课程《数值分析》重点

数值分析这门课的本质就是用离散的已知点去估计整体,就是由黑盒子产生的结果去估计这个黑盒子。在数学里这个黑盒子就是一个函数嘛,这门课会介绍许多方法去利用离散点最大化地逼近这个函数,甚至它的导数、积分,甚至微分方程的解。…
暂无图片
编程学习 ·

在职阿里5年,一个28岁女软测工程师的心声

简单的先说一下,坐标杭州,14届本科毕业,算上年前在阿里巴巴的面试,一共有面试了有6家公司(因为不想请假,因此只是每个晚上去其他公司面试,所以面试的公司比较少) ​ 编辑切换为居中…
暂无图片
编程学习 ·

字符串左旋c语言

目录 题目: 解题思路: 第一步: 第二步: 第三步: 总代码: 题目: 实现一个函数,可以左旋字符串中的k个字符。 例如: ABCD左旋一个字符得到BCDA ABCD左旋两个字符…
暂无图片
编程学习 ·

设计模式--观察者模式笔记

模式的定义与特点 观察者(Observer)模式的定义:指多个对象间存在一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新。这种模式有时又称作发布-订阅模式、模型-视图模式&#xf…
暂无图片
编程学习 ·

睡觉突然身体动不了,什么是睡眠痽痪症

很多朋友可能有这样的体验,睡觉过程中突然意识清醒,身体却动弹不了。这时候感觉非常恐怖,希望旁边有一个人推自己一下。阳光以前也经常会碰到这样的情况,一年有一百多次,那时候很害怕晚上到来,睡觉了就会出…
暂无图片
编程学习 ·

深入理解C++智能指针——浅析MSVC源码

文章目录unique_ptrshared_ptr 与 weak_ptrstd::bad_weak_ptr 异常std::enable_shared_from_thisunique_ptr unique_ptr 是一个只移型别(move-only type,只移型别还有std::mutex等)。 结合一下工厂模式,看看其基本用法&#xff…
暂无图片
编程学习 ·

@TableField(exist = false)

TableField(exist false) //申明此字段不在数据库存在,但代码中需要用到它,通知Mybatis-plus在做写库操作是忽略它。,.
暂无图片
编程学习 ·

Java Web day15

第十二章文件上传和下载 一、如何实现文件上传 要实现Web开发中的文件上传功能,通常需要完成两步操作:一.是在Web页面中添加上传输入项;二是在Servlet中读取上传文件的数据,并保存到本地硬盘中。 需要使用一个Apache组织提供一个…
暂无图片
编程学习 ·

【51nod 2478】【单调栈】【前缀和】小b接水

小b接水题目解题思路Code51nod 2478 小b接水 题目 输入样例 12 0 1 0 2 1 0 1 3 2 1 2 1输出样例 6解题思路 可以发现最后能拦住水的都是向两边递减高度(?) 不管两个高积木之间的的积木是怎样乱七八糟的高度,最后能用来装水的…
暂无图片
编程学习 ·

花了大半天写了一个UVC扩展单元调试工具

基于DIRECTSHOW 实现的,用的是MFC VS2019. 详见:http://www.usbzh.com/article/detail-761.html 获取方法 加QQ群:952873936,然后在群文件\USB调试工具&测试软件\UVCXU-V1.0(UVC扩展单元调试工具-USB中文网官方版).exe USB中文网 USB中文…
暂无图片
编程学习 ·

贪心(一):区间问题、Huffman树

区间问题 例题一:区间选点 给定 N 个闭区间 [ai,bi]请你在数轴上选择尽量少的点,使得每个区间内至少包含一个选出的点。 输出选择的点的最小数量。 位于区间端点上的点也算作区间内。 输入格式 第一行包含整数 N,表示区间数。 接下来 …
暂无图片
编程学习 ·

C语言练习实例——费氏数列

目录 题目 解法 输出结果 题目 Fibonacci为1200年代的欧洲数学家,在他的着作中曾经提到:「若有一只免子每个月生一只小免子,一个月后小免子也开始生产。起初只有一只免子,一个月后就有两只免子,二个月后有三只免子…
暂无图片
编程学习 ·

Android开发(2): Android 资源

个人笔记整理 Android 资源 Android中的资源,一般分为两类: 系统内置资源:Android SDK中所提供的已经定义好的资源,用户可以直接拿来使用。 用户自定义资源:用户自己定义或引入的,只适用于当前应用的资源…
暂无图片
编程学习 ·

零基础如何在短时间内拿到算法offer

​算法工程师是利用算法处理事物的职业 算法(Algorithm)是一系列解决问题的清晰指令,也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。 如果一个算法有缺陷,或不适合于某个问题,执…
暂无图片
编程学习 ·

人工智能:知识图谱实战总结

人工智能python,NLP,知识图谱,机器学习,深度学习人工智能:知识图谱实战前言一、实体建模工具Protegepython,NLP,知识图谱,机器学习,深度学习 人工智能:知识图…
暂无图片
编程学习 ·

【无标题】

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注…