开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:271040076
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101217000
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151093800
纯本地实时语音转文字：隐私与效率的双重飞跃
本文深入探讨了纯本地实时语音转文字技术的实现原理、核心优势、应用场景及开发实践，旨在为开发者提供一套完整的解决方案。
快去debug2025.09.23 12:53600
从零搭建HMM-GMM语音识别模型：技术解析与实战指南
本文详细解析了基于隐马尔可夫模型（HMM）与高斯混合模型（GMM）的语音识别系统从零搭建的全流程，涵盖声学特征提取、模型训练与解码等核心环节，并提供Python代码示例与工程优化建议。
rousong2025.09.23 12:53600
基于MFCC模板匹配的MATLAB语音识别GUI系统实现详解
本文详细阐述了基于MFCC特征提取与模板匹配算法的语音识别系统在MATLAB环境下的实现方法，包含完整的GUI设计流程与源码解析。系统通过MFCC特征参数化语音信号，采用动态时间规整（DTW）算法实现模板匹配，最终通过图形化界面完成语音指令识别。
demo2025.09.23 12:53600
ASR接口性能解析：WER与SER指标详解
本文深入解析语音识别接口（ASR）的核心性能指标——词错误率（WER）和句错误率（SER），从定义、计算方法、影响因素到优化策略，为开发者提供系统性技术指南。
起个名字好难2025.09.23 12:53600
LobeChat部署指南：Docker与Vercel双路径实现AI全能应用
本文详解如何通过Docker与Vercel部署支持语音输入、图片识别和插件体系的LobeChat，覆盖环境配置、功能扩展和性能优化全流程。
宇宙中心我曹县2025.09.23 12:53600
基于MFCC与RNN的简易语音识别系统构建指南
本文详细介绍了MFCC特征提取与RNN模型在语音识别中的应用，通过Python代码示例展示了从音频预处理到模型训练的全流程，适合初学者快速上手。
宇宙中心我曹县2025.09.23 12:53600
Web端语音识别新方案：WebRTC与Whisper的融合实践
本文探讨了Web端语音识别的实现方案，重点介绍了WebRTC与Whisper的结合使用，包括技术原理、实现步骤、性能优化及实际应用场景，为开发者提供了一套完整的Web端语音识别解决方案。
Nicky2025.09.23 12:53600
Android车载语音开发：全局掌控的艺术与实践
本文深入探讨Android车载系统语音交互开发的核心要点，从全局视角解析语音功能集成策略，涵盖系统架构、多模态交互、性能优化及安全合规等关键领域，为开发者提供系统性指导。
很酷cat2025.09.23 12:53600
低延迟流式语音识别：人机交互的实时革命
本文聚焦低延迟流式语音识别技术在人机交互场景中的实践，探讨其技术原理、实现难点及优化策略，结合智能客服、车载系统等典型场景，分析实时性、准确率与鲁棒性提升路径，为开发者提供架构设计与性能调优的实用指南。
公子世无双2025.09.23 12:53600
基于Docker的Kaldi语音识别实践指南
本文详细介绍了如何使用Docker容器化技术部署Kaldi语音识别系统，涵盖环境配置、模型训练与测试的全流程，适合开发者和企业用户快速上手。
问答酱2025.09.23 12:53600

创作

写文章

我的文章

最热文章

活动