开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:271029276
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101211100
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151086700
纯本地实时语音转文字：技术突破与应用革新
"本文聚焦纯本地实时语音转文字技术，从技术原理、应用场景、开发实践到优化策略，全面解析其如何实现高效、安全、低延迟的语音转写，为开发者提供从0到1的完整指南。"
十万个为什么2025.10.10 19:02400
深度解析DeepSpeech语音识别项目：从理论到实践的全流程实现
本文详细解析DeepSpeech语音识别项目的实现原理与工程实践，涵盖模型架构、数据预处理、训练优化及部署应用全流程，为开发者提供可落地的技术指南。
demo2025.10.10 19:02400
Android原生SpeechRecognizer：从基础到进阶的语音识别实践
本文深入解析Android原生SpeechRecognizer的架构、核心API、使用场景及优化策略，结合代码示例与实战经验，为开发者提供完整的语音识别集成指南。
c4t2025.10.10 19:02400
IOS音视频实战：ASR与Siri的离线在线语音识别方案解析
本文深入探讨了iOS平台上的ASR（自动语音识别）与Siri语音识别方案，涵盖离线与在线两种模式的技术原理、实现细节及优化策略，为开发者提供全面的语音识别解决方案。
渣渣辉2025.10.10 19:02400
基于Transformers的多语种Whisper模型微调实战指南
本文深入探讨如何使用Transformers库对Whisper模型进行多语种语音识别任务的微调，从模型原理、数据准备、训练配置到优化策略，为开发者提供完整的微调流程与实用技巧。
十万个为什么2025.10.10 19:02400
基于Web Speech API的网页语音交互全攻略
本文深入探讨如何利用Web Speech API在网页中实现语音合成与识别功能，涵盖基础原理、代码实现、优化策略及典型应用场景。
da吃一鲸8862025.10.10 19:01400
iOS音视频实战：ASR与Siri的离线/在线语音识别方案解析
本文深入探讨iOS平台上ASR与Siri的离线/在线语音识别技术实现，涵盖原理、集成方法、性能优化及实用建议，助力开发者构建高效语音交互应用。
渣渣辉2025.10.10 19:01400
端到端语音识别新标杆：WeNet框架深度解析
本文全面调研了端到端语音识别框架WeNet，从技术原理、核心优势、应用场景及实践建议四个维度展开，旨在为开发者及企业用户提供深入的技术解析与实操指导。
JC2025.10.10 19:01400
Voila：195ms超低延迟端到端AI语音模型开启全双工对话新时代
本文深度解析开源端到端AI语音模型Voila的核心技术突破，重点探讨其195ms超低延迟实现机制、全双工对话能力对交互体验的革新，以及开源生态对开发者与企业的实际价值。
梅琳marlin2025.10.10 19:01400
CMUSphinx：开源语音识别引擎的技术解析与实践指南
本文深入解析CMUSphinx语音识别引擎及其开源SDK的核心架构、技术优势及开发实践，为开发者提供从环境搭建到模型优化的全流程指导，助力快速构建高精度语音识别系统。
沙与沫2025.10.10 19:01400

创作

写文章

我的文章

最热文章

活动