开发者热搜

企业服务-技术知识-百度开发者中心-汇聚开放、助力、共赢

文心快码 Baidu Comate

飞桨PaddlePaddle

千帆大模型平台

企业服务

全部文章

超级补全支持智能 import、AI代码审查上线，文心快码近期更新汇总
import、Code Review、反复调试，这些你觉得麻烦的小事，现在可以“搞定”了。
文心快码BaiduComate2025.07.16 19:2766832
生产力UP！文心快码 Rules 功能实战指南
一文学会在Comate AI IDE中配置Rules
文心快码BaiduComate2025.07.30 17:1078700
用文心快码Zulu打造太阳系3D模拟器：从需求到落地的全流程实践
基于NASA数据与React+Three.js技术栈，探索编程智能体在3D仿真领域的应用突破
文心快码BaiduComate2025.07.31 17:1581300
星海智算云平台部署DeepSeek-R1-70B全流程指南及优化策略
本文详细解析在星海智算云平台部署70B参数大模型的全流程，涵盖环境配置、模型加载、性能优化及平台专属福利，提供可落地的工程实践方案。
十万个为什么2025.09.09 10:31000
手把手教你本地部署DeepSeek-V3并免费体验100度算力包
本文详细介绍了如何在本地环境中部署DeepSeek-V3模型，包括环境准备、安装步骤、配置调优等关键环节，并指导读者如何免费获取和使用100度算力包来运行模型。文章还提供了常见问题解答和性能优化建议，帮助开发者快速上手并充分发挥DeepSeek-V3的强大能力。
rousong2025.09.09 10:31100
DeepSeek本地部署全流程详解：从环境配置到实战应用
本文提供一份完整的DeepSeek本地部署指南，涵盖硬件需求、环境配置、模型部署、性能优化及常见问题解决方案，帮助开发者高效实现私有化AI能力部署。
沙与沫2025.09.09 10:31000
DeepSeek本地部署全流程详解与最佳实践
本文详细介绍了DeepSeek大模型本地部署的全流程，包括环境准备、硬件配置、安装步骤、性能优化和常见问题解决方案，为开发者和企业用户提供一站式部署指南。
carzy2025.09.09 10:31000
Deepseek V3评测：6850亿参数MoE架构开源大模型的多维度能力解析
本文对Deepseek V3这一6850亿参数的混合专家(MoE)架构开源大模型进行了全方位评测，重点分析其在文档处理、逻辑推理、算法编程等核心场景下的真实能力水平，为开发者提供客观的技术参考和应用建议。
rousong2025.09.09 10:31000
Transformers v4.50.3集成DeepSeek-V3 MoE模型，开源性能比肩GPT-4
本文详细解析了Transformers v4.50.3的重大更新，重点介绍了新集成的DeepSeek-V3开源MoE模型的技术特性、性能优势及实际应用场景，并提供了迁移指南和性能优化建议。
谁偷走了我的奶酪2025.09.09 10:31100
DeepSeek-V3论文解析：低成本突破大模型训练算力瓶颈
本文深度解析梁文锋团队发布的DeepSeek-V3论文，揭秘其通过混合精度训练、梯度累积优化、参数高效微调等创新技术，实现大模型训练成本降低80%的突破性方案，为AI开发者提供可落地的算力优化方法论。
快去debug2025.09.09 10:31000
梁文锋署名论文揭秘：DeepSeek-V3如何以低成本突破大模型算力瓶颈
本文深度解析梁文锋团队发表的DeepSeek-V3论文，系统阐述其通过混合精度训练、动态稀疏注意力、梯度累积优化等创新技术，在降低70%训练成本的同时保持模型性能，为行业提供可复用的算力优化方案。
热心市民鹿先生2025.09.09 10:31000
深度解析大模型架构：从DeepSeek-V3到Kimi K2的技术演进
本文通过对比DeepSeek-V3与Kimi K2两大主流大语言模型，系统剖析了Transformer架构的核心技术细节，包括注意力机制优化、位置编码改进、计算效率提升等关键创新点，并探讨了当前LLM技术发展的趋势与挑战。
da吃一鲸8862025.09.09 10:31000
国产大模型DeepSeek-V3全球瞩目：671B MoE架构与558万美元低成本训练解析
本文深度解析国产大模型DeepSeek-V3的技术突破，聚焦其6710亿参数MoE架构设计、仅558万美元的超低训练成本，以及对中国AI产业发展的战略意义。从技术原理、成本优势到应用场景，为开发者和企业提供全面洞察与实践建议。
搬砖的石头2025.09.09 10:31000

创作

写文章

我的文章

最热文章