Windows下Ollama+Deepseek-r1本地部署全攻略：从零到跑的完整指南

作者：新兰2025.09.23 14:46浏览量：0

简介：本文为Windows用户提供Ollama与Deepseek-r1本地部署的详细步骤，涵盖环境配置、模型下载、运行调试全流程，适合开发者及AI爱好者快速上手本地化大模型部署。

一、部署前准备：环境与工具配置

1.1 系统要求与兼容性检查

Windows 10/11（64位）是部署Ollama+Deepseek-r1的最低要求，需确保系统版本支持WSL2或Docker Desktop。建议配置：CPU为4核以上，内存≥16GB（模型越大需求越高），硬盘剩余空间≥50GB（用于模型存储）。可通过右键“此电脑”→“属性”查看系统信息，或使用命令wmic os get caption,version确认版本。

1.2 依赖工具安装

WSL2与Linux发行版：若选择WSL2路径，需通过PowerShell以管理员身份运行：
```
wsl --install
wsl --set-default-version 2
wsl --install -d Ubuntu-22.04
```
安装后重启系统，在Microsoft Store中搜索并安装Ubuntu 22.04 LTS。
Docker Desktop：访问Docker官网下载Windows版，安装时勾选“Use WSL 2 instead of Hyper-V”以获得更好性能。安装完成后，启动Docker Desktop并验证：
```
docker run hello-world
```
CUDA与cuDNN（GPU加速可选）：若使用NVIDIA显卡，需安装对应版本的CUDA Toolkit和cuDNN。访问NVIDIA CUDA下载页面，选择与显卡驱动兼容的版本（如CUDA 11.8），下载后运行安装程序。cuDNN需从NVIDIA cuDNN页面下载，解压后将文件复制到CUDA安装目录（如C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8）。

二、Ollama安装与配置

2.1 Ollama下载与安装

访问Ollama官方GitHub，下载最新版.msi安装包（如ollama-x.x.x-windows-amd64.msi）。双击运行，按向导完成安装，默认安装路径为C:\Program Files\Ollama。安装后，通过命令提示符验证：

ollama version

若显示版本号，则安装成功。

2.2 Ollama基础配置

Ollama默认监听端口11434，可通过修改配置文件C:\Users\<用户名>\.ollama\config.json调整（如更改端口或启用HTTPS）。配置示例：

{
  "listen": ":8080",
  "tls": {
    "cert": "/path/to/cert.pem",
    "key": "/path/to/key.pem"
  }
}

修改后重启Ollama服务：

net stop ollama
net start ollama

三、Deepseek-r1模型部署

3.1 模型下载与验证

Ollama支持直接拉取Deepseek-r1模型，通过以下命令下载（以7B参数版本为例）：

ollama pull deepseek-r1:7b

下载完成后，验证模型完整性：

ollama show deepseek-r1:7b

输出应包含模型架构、参数数量、许可证等信息。若下载失败，检查网络连接或手动从Hugging Face模型库下载，解压后放置到Ollama模型目录（默认C:\Users\<用户名>\.ollama\models）。

3.2 模型运行与调试

启动Deepseek-r1服务：

ollama run deepseek-r1:7b

进入交互界面后，可输入提示词测试（如“解释量子计算的基本原理”）。若需通过API调用，使用以下命令启动服务：

ollama serve --model deepseek-r1:7b --host 0.0.0.0 --port 8080

通过Postman或curl测试API：

curl -X POST http://localhost:8080/api/generate \
  -H "Content-Type: application/json" \
  -d '{"prompt": "写一首关于春天的诗", "temperature": 0.7}'

四、性能优化与问题排查

4.1 内存与显存管理

分页内存：Ollama默认使用分页内存，可通过--memory参数限制（如ollama run --memory 8G deepseek-r1:7b）。
GPU加速：若安装CUDA，在运行命令中添加--gpu参数：
```
ollama run --gpu deepseek-r1:7b
```
使用nvidia-smi监控显存占用，避免溢出。

4.2 常见问题解决

端口冲突：若11434或8080被占用，修改Ollama配置或运行命令中的端口。
模型加载失败：检查模型文件是否完整，或重新下载。
API无响应：确认服务是否启动，防火墙是否放行端口。

五、进阶应用与扩展

5.1 自定义模型配置

修改C:\Users\<用户名>\.ollama\models\deepseek-r1\7b\Modelfile，调整参数如temperature、top_p等，然后重新构建：

ollama create deepseek-r1:7b-custom -f .\Modelfile

5.2 多模型共存

Ollama支持同时运行多个模型，通过不同端口区分：

ollama serve --model deepseek-r1:7b --port 8080 &
ollama serve --model deepseek-r1:13b --port 8081 &

六、总结与建议

本文详细介绍了Windows下Ollama+Deepseek-r1的部署流程，从环境配置到模型运行，覆盖了关键步骤与常见问题。建议初学者先从7B模型开始，逐步尝试更大参数版本。对于生产环境，建议使用Docker容器化部署，提升可维护性。未来可探索模型量化（如4bit/8bit）以降低内存需求，或结合LangChain等框架构建复杂应用。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

Windows下Ollama+Deepseek-r1本地部署全攻略：从零到跑的完整指南

一、部署前准备：环境与工具配置

1.1 系统要求与兼容性检查

1.2 依赖工具安装

二、Ollama安装与配置

2.1 Ollama下载与安装

2.2 Ollama基础配置

三、Deepseek-r1模型部署

3.1 模型下载与验证

3.2 模型运行与调试

四、性能优化与问题排查

4.1 内存与显存管理

4.2 常见问题解决

五、进阶应用与扩展

5.1 自定义模型配置

5.2 多模型共存

六、总结与建议

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者