开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:271021676
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101206100
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151082000
流式语音识别与流媒体语音识别口令：技术解析与应用实践
本文深入探讨流式语音识别与流媒体语音识别口令的技术原理、应用场景及实现方法，为开发者与企业用户提供实用指导，助力高效构建语音交互系统。
demo2025.10.10 19:01100
Android车载语音开发：全局掌控的艺术与实践
本文深入探讨Android车载系统语音开发的核心要点，从全局视角出发，解析语音交互架构设计、多模态融合策略及性能优化方法，助力开发者打造高效稳定的车载语音系统。
十万个为什么2025.10.10 19:01100
OpenAI 计划推出 GPT-4o 语音模式：AI 语音交互新纪元来临
OpenAI 宣布将推出 GPT-4o 语音模式，实现低延迟、高拟真的无缝语音交互，或重塑智能客服、教育、娱乐等领域应用场景。本文深度解析技术原理、应用场景及开发者机遇。
新兰2025.10.10 19:01100
基于torchaudio的语音识别：全流程解决方案与实践指南
本文深入探讨基于torchaudio库的语音识别解决方案，从音频预处理、特征提取到模型训练与部署的全流程技术解析，结合实际案例与代码示例，为开发者提供可落地的语音识别系统开发指南。
php是最好的2025.10.10 19:01100
解读PaddleSpeech：中英混合语音识别的技术突破与应用实践
本文深入解析PaddleSpeech中英混合语音识别技术的核心原理、模型架构及实际应用场景，帮助开发者快速掌握技术要点，并提供从环境配置到模型优化的全流程指导。
新兰2025.10.10 19:01100
探索AI声音技术：数字音频、语音识别与TTS全解析
本文全面解析AI声音技术的三大核心领域——数字音频处理、语音识别及TTS（文本转语音），涵盖基础原理、技术进展及实际应用示例，助力开发者与企业用户掌握关键技术要点。
菠萝爱吃肉2025.10.10 19:01100
vosk实时语音识别：免费SDK助力开发者高效集成
本文介绍Vosk实时语音识别SDK的免费特性、技术优势、应用场景及集成方法，助力开发者快速实现语音交互功能。
KAKAKA2025.10.10 19:01100
深度解析：语音识别开源项目与源码全攻略
本文从技术原理、开源生态、源码解析三个维度全面剖析语音识别开源项目，提供从环境搭建到模型调优的完整指南，帮助开发者快速掌握核心开发技能。
蛮不讲李2025.10.10 19:01100
Web端语音识别实战：WebRTC+Whisper技术方案解析
本文详细介绍如何利用WebRTC实现实时音频采集，结合Whisper模型完成Web端语音识别，包含完整代码示例与技术实现要点。
搬砖的石头2025.10.10 19:01100
语音识别上传全流程解析：从操作到优化的技术指南
本文系统梳理语音识别上传的核心流程，涵盖文件格式处理、API调用、错误处理等关键环节，提供分步骤操作指南与代码示例，助力开发者高效实现语音数据识别与上传。
KAKAKA2025.10.10 19:01100

创作

写文章

我的文章

最热文章

活动