开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27631876
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101064000
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151062200
OpenAI Whisper实时语音识别：低延迟下的高效语音转文本实践
本文深入探讨OpenAI Whisper在实时语音识别中的应用，重点解析其实现近乎实时语音转文本的技术原理、优化策略及实际应用场景。通过代码示例与性能分析，为开发者提供可落地的解决方案。
问题终结者2025.09.23 12:53200
uniapp实现跨端语音输入：微信小程序与H5全攻略
本文详细讲解在uniapp框架下实现语音输入功能的方法，覆盖微信小程序和H5平台，提供完整的API调用、权限处理和跨端兼容方案，助力开发者快速构建语音交互功能。
php是最好的2025.09.23 12:53200
从声波到文本：初探语音识别ASR算法的技术演进与实践
本文从语音识别ASR算法的基本原理出发，系统梳理了传统算法与深度学习算法的核心差异，重点解析了声学模型、语言模型及解码器的技术演进，并通过Python代码示例展示了端到端ASR模型的实现过程，最后探讨了ASR算法在工业级应用中的优化方向。
十万个为什么2025.09.23 12:53200
多领域中文语音识别数据集WenetSpeech：解锁AI语音新可能
本文介绍了多领域中文语音识别数据集WenetSpeech的发布背景、数据集特点及详细下载教程，助力开发者与企业提升语音识别模型性能。
半吊子全栈工匠2025.09.23 12:53200
从数据到部署：端到端语音指令识别全流程解析
本文以端到端语音指令识别模型为核心，系统阐述从数据生成、模型训练到测试的全流程技术细节。通过合成数据生成、Transformer架构设计、混合精度训练等关键技术，结合代码示例与评估指标，为开发者提供可复现的完整实现方案。
新兰2025.09.23 12:53200
纯前端实现文字语音互转：Web技术的创新突破
本文深入探讨如何利用纯前端技术实现文字与语音的双向转换，涵盖Web Speech API、第三方库集成及性能优化策略，为开发者提供无后端依赖的完整解决方案。
问题终结者2025.09.23 12:53200
WaveNet：重新定义语音识别的自回归生成模型深度解析
WaveNet作为DeepMind提出的自回归生成模型，通过扩张因果卷积和Softmax分类器突破了传统语音识别的参数限制，在语音合成与识别领域展现出卓越性能。本文从技术原理、核心创新、应用场景及实践优化四个维度展开系统分析，为开发者提供从理论到落地的全流程指导。
狼烟四起2025.09.23 12:53200
AI智能机器人语音识别实现全解析：从技术原理到工程实践
本文深入解析AI智能机器人语音识别的技术原理、关键算法及工程实现方法，涵盖声学特征提取、声学模型构建、语言模型优化等核心环节，并提供实际开发中的优化建议。
carzy2025.09.23 12:53200
两天Star量破千：Whisper蒸馏模型引领语音识别效率革命
OpenAI的Whisper模型通过知识蒸馏技术实现轻量化，在保持高准确率的同时实现数倍加速，GitHub项目两天内获千余Star，成为语音识别领域焦点。本文解析技术原理、性能对比及行业影响。
carzy2025.09.23 12:53200
Vosk开源语音识别：技术解析、应用场景与开发实践
本文深入解析Vosk开源语音识别工具的核心技术、应用场景及开发实践，涵盖其离线识别能力、多语言支持特性及跨平台兼容性，通过代码示例展示Python与Java集成方案，并提供工业质检、医疗记录等领域的落地建议。
carzy2025.09.23 12:53200

创作

写文章

我的文章

最热文章

活动