开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

客悦智能客服

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:27629976
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:101062400
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:151060300
Easy Voice Toolkit：一站式开源AI语音工具箱，赋能开发者与企业用户新体验
Easy Voice Toolkit作为一款功能丰富的开源AI语音工具箱，集成了语音合成、语音识别及模型训练三大核心功能，为开发者与企业用户提供了高效、灵活的解决方案，助力语音技术快速落地应用。
KAKAKA2025.10.10 19:01200
前端断网语音识别：构建离线与在线协同的语音网络体系
在弱网或断网环境下实现语音识别功能，是提升用户体验的关键技术突破。本文深入解析前端断网语音识别的技术原理、实现路径及网络协同策略，为开发者提供从本地模型优化到混合识别架构设计的完整方案。
da吃一鲸8862025.10.10 19:01200
基于HMM的Python语音识别模型：从理论到实践
本文深入解析HMM（隐马尔可夫模型）在语音识别中的应用，结合Python实现从特征提取到解码的全流程，提供可复用的代码框架与优化策略。
很酷cat2025.10.10 19:01200
基于ASR语音识别与Python的实现原理
本文深入解析ASR语音识别技术原理，结合Python工具库实现完整流程，涵盖声学特征提取、声学模型、语言模型及解码器四大核心模块，并提供实战代码示例。
很酷cat2025.10.10 19:01200
科大讯飞语音听写（流式版）WebAPI：Web与H5场景下的语音交互实践指南
本文详细解析科大讯飞语音听写（流式版）WebAPI的技术特性，结合Web前端与H5场景，提供语音识别、搜索、听写的完整实现方案，助力开发者快速构建高效语音交互系统。
菠萝爱吃肉2025.10.10 19:01200
基于PyTorch的中文语音识别：深度学习实战指南
本文聚焦中文语音识别领域，结合深度学习理论与PyTorch框架，系统阐述语音识别技术原理、模型构建及优化策略，提供从数据预处理到模型部署的全流程指导。
沙与沫2025.10.10 19:01200
基于CNN与PyTorch的NLP语音识别模型训练全解析
本文深入探讨基于CNN（卷积神经网络）与PyTorch框架的NLP语音识别模型训练方法，涵盖声学特征提取、模型架构设计、损失函数优化及训练技巧，为开发者提供可复用的技术方案。
很酷cat2025.10.10 19:01200
深度解析：SwiftUI中Siri语音识别的实现与原理
本文深入解析SwiftUI框架下Siri语音识别的实现方法，从系统架构到开发实践，全面揭示其技术原理与应用场景。
c4t2025.10.10 19:01200
FireRedASR：小红书开源的语音识别全能王
小红书开源工业级自动语音识别模型FireRedASR，支持普通话、方言及歌曲歌词精准识别，提供高精度、低延迟的语音转文字解决方案，助力开发者与企业高效应用。
问题终结者2025.10.10 19:01200
GPT-4o 语音模式来袭：OpenAI 开启无缝 AI 语音交互新纪元｜AGI 掘金资讯 7.29
OpenAI 宣布即将推出 GPT-4o 语音模式，通过实时语音交互、多语言支持及低延迟技术，重新定义 AI 语音聊天体验。本文深入解析其技术架构、应用场景及对开发者与企业的影响，并提供实践建议。
起个名字好难2025.10.10 19:01200

创作

写文章

我的文章

最热文章

活动