答案:JavaScript通过Web Speech API实现语音识别与合成。使用SpeechRecognition将语音转文本,需HTTPS及浏览器支持,推荐Chrome;通过SpeechSynthesis将文本转语音,可调节语速、音调、音量,适用于朗读与辅助功能。二者结合可用于语音记事本、无障碍工具等场景,注意权限、兼容性与用户体验。

要构建一个语音识别或语音合成应用,JavaScript 提供了浏览器原生支持的 API,分别是 Web Speech API 中的 SpeechRecognition(语音识别)和 SpeechSynthesis(语音合成)。这两个接口让开发者可以轻松实现听写、语音控制、朗读文本等功能。
语音识别:使用 SpeechRecognition
SpeechRecognition 接口允许你将用户的语音转换为文本。虽然目前在部分浏览器中仍需加前缀,但 Chrome 支持较好。
示例代码:
开启语音识别并获取结果:
// 检查浏览器是否支持const SpeechRecognition = window.SpeechRecognition || window.webkitSpeechRecognition;if (!SpeechRecognition) { console.log("当前浏览器不支持语音识别");}const recognition = new SpeechRecognition();recognition.lang = 'zh-CN'; // 设置语言recognition.interimResults = false; // 是否返回中间结果recognition.maxAlternatives = 1;// 开始识别document.getElementById('start-btn').onclick = () => { recognition.start();};// 获取结果recognition.onresult = (event) => { const transcript = event.results[0][0].transcript; document.getElementById('output').textContent = transcript; console.log('识别结果:', transcript);};// 错误处理recognition.onerror = (event) => { console.error('识别出错:', event.error);};
说明与建议:
立即学习“Java免费学习笔记(深入)”;
用户首次使用时会弹出麦克风权限请求,需确保页面在 HTTPS 环境下运行。 interimResults 设为 true 可实时显示未完成的识别内容。 注意兼容性:Safari 和 Firefox 基本不支持,推荐用于 Chrome 或基于 Chromium 的浏览器。
语音合成:使用 SpeechSynthesis
SpeechSynthesis 接口可以将文本“朗读”出来,适合做语音提示、辅助阅读等场景。
GarbageSort垃圾识别工具箱
GarbageSort垃圾识别工具箱是一个基于uni-app开发的微信小程序,使用SpringBoot2搭建后端服务,使用Swagger2构建Restful接口文档,实现了文字查询、语音识别、图像识别其垃圾分类的功能。前端:微信小程序 采用 uni-app 开发框架,uni-app 是一个使用 Vue.js 开发所有前端应用的框架,开发者编写一套代码,可发布到iOS、Android、H5、以及各
0 查看详情
示例代码:
让浏览器朗读输入框中的文字:
const synth = window.speechSynthesis;document.getElementById('speak-btn').onclick = () => { const text = document.getElementById('text-input').value; if (!text || synth.speaking) return; // 避免重复播放 const utterance = new SpeechSynthesisUtterance(text); utterance.lang = 'zh-CN'; utterance.rate = 1; // 语速,0.1 到 10 utterance.pitch = 1; // 音调,0 到 2 utterance.volume = 1; // 音量,0 到 1 synth.speak(utterance);};// 停止朗读document.getElementById('stop-btn').onclick = () => { synth.cancel();};
进阶技巧:
可通过 speechSynthesis.getVoices() 获取可用语音列表,支持不同性别或语言的发音人。 绑定 utterance.onend 事件可在朗读后执行回调。 部分系统/浏览器对中文语音支持有限,可测试不同设备效果。
实际应用场景建议
结合两个功能,你可以构建如下应用:
语音记事本:用户说话 → 转文字保存;点击按钮 → 文字朗读出来。 无障碍工具:自动朗读网页内容,或通过语音命令导航。 语言学习助手:用户朗读句子 → 识别后比对正确文本;错误时用语音反馈。
开发时注意用户体验:
添加状态提示(如“正在聆听…”、“朗读中”)。 提供手动输入备用方案,避免语音失败导致功能不可用。 控制连续识别频率,防止触发过多请求。基本上就这些。利用 Web Speech API,无需引入大型框架或服务,就能快速做出实用的语音交互功能。虽然功能受限于浏览器支持,但在合适场景下非常高效。
以上就是如何用JavaScript构建一个语音识别或合成应用?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/738327.html
微信扫一扫
支付宝扫一扫