
我们有账号后登录,并点击此处(百度语音)创建一个应用,如下图所示。

然后就可以看到创建完成的应用和 APPID、API KEY 以及 Secret KEY。

Step2: 准备数据
语音合成是将文本转换为可播放的音频文件的服务,我们从大姚的订单库中找到一段订单信息文本如下:
三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)
Step3: 编写一个语音合成示例程序
有了第一步的 API KEY 以及 Secret KEY,以及第二步的数据,我们就可以编写一个示例代码来调用百度AI开放平台的文字识别功能。
准备开发环境
小帅选择使用Java来快速搭建一个原型,关于如何安装Java,可以参考百度经验哦。百度AI提供了非常完善的API文档和封装调用更方便的工具包。接下来小帅将使用Maven来搭建工程环境。
pom.xml配置如下:
com.baidu.aip java-sdk 4.12.0
编写代码
粘贴以下内容,不要忘记替换你的 APPID、APIKEY 以及 SECRETKEY 和 图片文件。
运行main方法即可。
import com.baidu.aip.speech.AipSpeech;import com.baidu.aip.speech.TtsResponse;import com.baidu.aip.util.Util;import org.json.JSONObject;import java.util.HashMap;public class Sample {//第一步创建应用获取的三个值private static String APPID = "你的 App ID";private static String APIKEY = "你的 Api Key";private static String SECRETKEY = "你的 Secret Key";
public static void main(String[] args) { // 初始化一个AipSpeech AipSpeech client = new AipSpeech(APPID, APIKEY, SECRETKEY); // 调用接口 第二步准备的图片 HashMap options = new HashMap(); //合成的文本内容 String text = "三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼 去往 东城区北三环东路36号喜来登大酒店(北京金隅店)"; //发音人选择 /** * 度小宇=1,度小美=0,度逍遥=3,度丫丫=4 * 度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5 **/ options.put("per", "0"); //语速,取值0-9,默认为5中语速 options.put("spd", "3"); TtsResponse res = client.synthesis(text, "zh", 1, options); byte[] data = res.getData(); JSONObject res1 = res.getResult(); if (data != null) { try { Util.writeBytesToFileSystem(data, "F:testaudio度小美Demooutput.mp3"); } catch (IOException e) { e.printStackTrace(); } } if (res1 != null) { System.out.println(res1.toString()); }}}
保存接口返回语音byte[] 转存为MP3格式文件。这里说明一下,默认返回就是MP3格式的数据哦。如果想要其他格式:
//3为mp3格式(默认);//4为pcm-16k;//5为pcm-8k;//6为wav(内容同pcm-16k);//注意aue=4或者6是语音识别要求的格式,但是音频内容不是语音识别要求的自然人发音,所以识别效果会受影响。options.put("aue", "3");点击访问合成的示例MP3文件。
语音合成单例加载。10次测试耗时如下(单位:ms(毫秒))。第一次需要加载一次AUTH。耗时多了一些。后续基本都持平在710ms以内。
发送请求到返回数据耗时:1493发送请求到保存文件耗时:1495发送请求到返回数据耗时:611发送请求到保存文件耗时:612发送请求到返回数据耗时:609发送请求到保存文件耗时:610发送请求到返回数据耗时:473发送请求到保存文件耗时:474发送请求到返回数据耗时:549发送请求到保存文件耗时:550发送请求到返回数据耗时:673发送请求到保存文件耗时:674发送请求到返回数据耗时:754发送请求到保存文件耗时:755发送请求到返回数据耗时:676发送请求到保存文件耗时:676发送请求到返回数据耗时:582发送请求到保存文件耗时:582发送请求到返回数据耗时:662发送请求到保存文件耗时:663发送请求到返回数据平均耗时:708.2ms发送请求到保存文件平均耗时:709.1msfor (int i = 0; i < 10; i++) {options = new HashMap();options.put("per", "0");options.put("spd", "3");long startTime = System.currentTimeMillis();TtsResponse res = client.synthesis(text, "zh", 1, options);byte[] data = res.getData();if (data != null) {long endTime = System.currentTimeMillis();System.out.println("发送请求到返回数据耗时:" + (endTime - startTime));try {Util.writeBytesToFileSystem(data, "F:estaudio度小美Demooutput.mp3");long saveEndTime = System.currentTimeMillis();System.out.println("发送请求到保存文件耗时:" + (saveEndTime - startTime));} catch (IOException e) {e.printStackTrace();}}JSONObject res1 = res.getResult();if (res1 != null) {System.out.println(res1.toString());}System.out.println();}
会员到访语音提醒搞起来,简单看一下业务流程图。主要看语音合成、语音提醒部分即可。
YOO必优科技-AI写作
智能图文创作平台,让内容创作更简单
38 查看详情
![]()
人脸会员识别可以看百度AI的官方解决方案 https://www.php.cn/link/bce15390acb84d49e513cb3f2963c523
本业务中人脸识别、摄像头厂商暂时没用百度AI。这一点我也很无奈。迫于公司要求呀。如果再来一次选择,绝对强制提议选择百度AI(怕太便宜而告终 你懂得)。
接口调用封装,并符合业务系统使用。
会员信息采集
后端会员人脸信息处理
/**
- 会员人脸信息添加
- @param csFace
- @return */@AutoLog(value = "会员人脸信息添加")@ApiOperation(value="会员人脸信息添加", notes="会员人脸信息添加")@PostMapping(value = "/add")public Result add(@RequestBody CsFace csFace) {Result result = new Result();CsFaceGroup group = new CsFaceGroup();try {//这里存人脸信息到人脸库就不演示了。人脸库存入成功后业务系统再记录csFaceService.save(csFace);//把会员人脸信息提交给JOB等待后续执行。方便前端页面交互不等待//人脸会员信息只是在一个JobFace类中增加一个List容器public static List vipFaceMap = new ArrayList();JobFace.vipFaceMap.add(csFace);result.success("添加成功!");} catch (Exception e) {log.info(e.getMessage());result.error500("操作失败-人脸服务存在异常");}return result;}
会员到访定制提示音频合成定时任务
import cn.hutool.core.date.DatePattern;import cn.hutool.core.date.DateUtil;import cn.netand.common.factory.BDFactory;import cn.netand.modules.csface.entity.CsFace;import cn.netand.modules.csface.service.ICsFaceService;import com.baidu.aip.speech.AipSpeech;import com.baidu.aip.speech.TtsResponse;import com.baidu.aip.util.Util;import lombok.extern.slf4j.Slf4j;import org.quartz.Job;import org.quartz.JobExecutionContext;import org.quartz.JobExecutionException;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.beans.factory.annotation.Value;import java.io.File;import java.text.SimpleDateFormat;import java.util.Arrays;import java.util.Date;import java.util.HashMap;import java.util.List;
/**
@Description 人脸会员音频生成
@author 小帅丶
@className VipVoiceJob
@Date 2019/11/20 22:11 **/@Slf4jpublic class VipVoiceJob implements Job {@Value(value = "${xiaoshuai.path.upload}")private String uploadpath;
@Autowiredprivate GeneralDealBeanUtil generalDealBeanUtil;
@Autowiredprivate ICsFaceService csFaceService;
//获取音频合成的客户端AipSpeech aipSpeech = BDFactory.getAipSpeech();
@Value(value = "${xiaoshuai.domainVoice}")private String domainVoice;
/**
- 度小宇=1,度小美=0,度逍遥=3,度丫丫=4
- 度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5 **/private static final List audioType = Arrays.asList("1", "0", "3", "4", "106", "110", "111", "103", "5");private static final String LANGUAGE_ZH = "zh";private static final Integer CTP = 1;private static final String AUDIO = ".mp3";
//任务执行详情@Overridepublic void execute(JobExecutionContext jobExecutionContext) throws JobExecutionException {System.out.println("execute VipVoiceJob = " + DateUtil.format(new Date(), DatePattern.NORM_DATETIME_PATTERN));List vipFaceMap = JobFace.vipFaceMap;int vipFaceSize = vipFaceMap.size();if (vipFaceSize > 0) {vipFaceMap.forEach(csFace -> {//获取会员信息try {generalAudio(csFace);csFace.setVoiceStatus(1);csFaceService.updateById(csFace);} catch (Exception e) {System.out.println(e.getMessage());csFace.setVoiceStatus(2);csFaceService.updateById(csFace);}});JobFace.vipFaceMap.clear();}}
/**
- @Description 生成全部音库音频文件
- @Author 小帅丶
- @Date 2019/11/20 23:28
- @param face 会员人脸数据
- @return void **/public void generalAudio(CsFace face) {String ctxPath = uploadpath;String bizPath = "audios";File file = new File(ctxPath + File.separator + bizPath + File.separator + face.getId());if (!file.exists()) {file.mkdirs();// 创建文件根目录}long startTime = System.currentTimeMillis();audioType.forEach(audioTypeStr -> {HashMap options = new HashMap();//合成的文本内容String text = "XX门店提醒 " + face.getName() + " 会员到访";//发音人选择options.put("per", audioTypeStr);//语速,取值0-9,默认为5中语速options.put("spd", "3");String fileName = audioTypeStr + AUDIO;TtsResponse response = aipSpeech.synthesis(text, LANGUAGE_ZH, CTP, options);byte[] data = response.getData();if (data != null) {try {String savePath = file.getPath() + File.separator + fileName;String filePath = bizPath + File.separator + face.getId() + File.separator + fileName;if (null != face.getVoiceType() && face.getVoiceType().equals(Integer.parseInt(audioTypeStr))) {filePath = filePath.replace("", "/");face.setVoicePath(filePath);face.setVoiceUrl(domainVoice + filePath);}Util.writeBytesToFileSystem(data, savePath);} catch (Exception e) {System.out.println(e.getMessage());}}});long endTime = System.currentTimeMillis();System.out.println("总耗时 = " + (endTime - startTime) + "ms");}}
添加一条定时任务

会员音频提示文件生成

会员到访APP推送

以上就是【百度AI语音合成】会员到访门店语音提醒的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/810815.html
微信扫一扫
支付宝扫一扫