手把手教你用Python+文心一言：零基础搭建AI看图写诗系统

作者：rousong2025.10.10 16:40浏览量：2

简介：本文详细介绍如何使用Python Flask框架与文心一言API搭建AI看图写诗网页应用，包含完整源码、环境配置步骤及技术实现原理，适合开发者快速上手AI+Web项目开发。

一、项目背景与核心价值

在AI技术快速发展的今天，将图像识别与自然语言生成结合的创意应用备受关注。本项目通过Python构建Web界面，集成文心一言的文本生成能力，实现用户上传图片后自动生成对应诗歌的功能。该系统不仅展示了多模态AI的应用场景，更可作为教育工具、文化创意产品或技术演示案例。

1.1 技术选型依据

Python Flask：轻量级Web框架，适合快速开发原型系统
文心一言API：提供高质量的中文诗歌生成能力
HTML5+Bootstrap：实现响应式前端界面
Base64编码：简化图片传输处理

1.2 典型应用场景

文旅行业：为景点照片自动生成诗词
教育领域：辅助语文教学的创意写作
社交平台：增加图片分享的趣味性
技术展示：AI多模态交互演示

二、完整开发环境配置指南

2.1 基础环境准备

# 创建虚拟环境（推荐）
python -m venv ai_poem_env
source ai_poem_env/bin/activate  # Linux/Mac
# 或 ai_poem_env\Scripts\activate (Windows)
# 安装必要依赖
pip install flask requests pillow

2.2 文心一言API配置

登录百度智能云平台
创建应用获取API Key和Secret Key

在项目目录创建.env文件：

ERNIE_API_KEY=your_api_key
ERNIE_SECRET_KEY=your_secret_key

三、核心功能实现详解

3.1 后端服务架构

from flask import Flask, render_template, request, jsonify
import requests
import base64
import os
from dotenv import load_dotenv
load_dotenv()
app = Flask(__name__)
def get_access_token():
    """获取文心一言API访问令牌"""
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {
        "grant_type": "client_credentials",
        "client_id": os.getenv("ERNIE_API_KEY"),
        "client_secret": os.getenv("ERNIE_SECRET_KEY")
    }
    response = requests.post(url, params=params)
    return response.json().get("access_token")
@app.route('/')
def index():
    return render_template('index.html')
@app.route('/generate_poem', methods=['POST'])
def generate_poem():
    # 获取图片并转换为Base64
    image_file = request.files['image']
    image_bytes = image_file.read()
    image_base64 = base64.b64encode(image_bytes).decode('utf-8')
    # 调用文心一言API（简化版）
    access_token = get_access_token()
    poem_api_url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions?access_token={access_token}"
    prompt = f"根据以下图片内容生成一首五言绝句：{image_base64[:200]}..."  # 实际需处理完整图片
    headers = {'Content-Type': 'application/json'}
    data = {
        "messages": [{"role": "user", "content": prompt}]
    }
    response = requests.post(poem_api_url, headers=headers, json=data)
    poem = response.json().get("result", "未能生成诗歌，请重试")
    return jsonify({"poem": poem})

3.2 前端界面实现

<!-- templates/index.html -->
<!DOCTYPE html>
<html>
<head>
    <title>AI看图写诗</title>
    <link href="https://cdn.jsdelivr.net/npm/bootstrap@5.3.0/dist/css/bootstrap.min.css" rel="stylesheet">
</head>
<body>
    <div class="container mt-5">
        <h1 class="text-center">AI看图写诗</h1>
        <div class="card mt-4">
            <div class="card-body">
                <form id="poemForm">
                    <div class="mb-3">
                        <label for="imageUpload" class="form-label">上传图片</label>
                        <input class="form-control" type="file" id="imageUpload" accept="image/*">
                    </div>
                    <button type="submit" class="btn btn-primary">生成诗歌</button>
                </form>
                <div id="result" class="mt-4 p-3 border" style="display:none;">
                    <h5>生成的诗歌：</h5>
                    <pre id="poemText"></pre>
                </div>
            </div>
        </div>
    </div>
    <script>
        document.getElementById('poemForm').addEventListener('submit', async (e) => {
            e.preventDefault();
            const formData = new FormData();
            formData.append('image', document.getElementById('imageUpload').files[0]);
            const response = await fetch('/generate_poem', {
                method: 'POST',
                body: formData
            });
            const result = await response.json();
            document.getElementById('poemText').textContent = result.poem;
            document.getElementById('result').style.display = 'block';
        });
    </script>
</body>
</html>

四、关键技术点解析

4.1 图片处理优化

实际应用中需添加图片压缩：
```python
from PIL import Image
import io

def compress_image(image_bytes, max_size=512):
img = Image.open(io.BytesIO(image_bytes))
img.thumbnail((max_size, max_size))
buffered = io.BytesIO()
img.save(buffered, format=”JPEG”, quality=85)
return buffered.getvalue()


## 4.2 API调用最佳实践
1. 实现令牌缓存机制
2. 添加重试逻辑处理网络异常
3. 设置合理的请求超时时间
## 4.3 诗歌生成提示词设计
有效提示词应包含：
- 诗歌类型（五言/七言）
- 主题关键词提取
- 风格要求（古典/现代）
- 韵律要求（平仄/押韵）
# 五、项目部署与扩展建议
## 5.1 生产环境部署
```bash
# 使用Gunicorn部署
pip install gunicorn
gunicorn -w 4 -b 0.0.0.0:5000 app:app
# Nginx配置示例
server {
    listen 80;
    server_name yourdomain.com;
    location / {
        proxy_pass http://127.0.0.1:5000;
        proxy_set_header Host $host;
    }
}

5.2 功能扩展方向

多风格诗歌生成（唐诗/宋词/现代诗）
图片主题识别增强
用户收藏与分享功能
批量图片处理
诗歌质量评估体系

六、完整项目源码获取

项目完整代码已托管至GitHub，包含：

所有Python后端代码
HTML/CSS/JS前端文件
依赖管理文件
部署配置示例

访问地址：[GitHub项目链接]（示例链接，实际使用时替换）

七、常见问题解决方案

7.1 API调用失败处理

检查网络连接
验证API Key有效性
查看错误码对照表：
- 400: 参数错误
- 401: 认证失败
- 429: 请求频率过高

7.2 图片处理异常

限制文件类型（仅允许jpg/png）
添加文件大小限制（建议<5MB）
实现错误图片检测

7.3 诗歌质量优化

调整提示词结构
尝试多次生成取优
添加后处理（韵律修正）

八、技术演进方向

集成更先进的图像描述模型（如BLIP-2）
采用流式响应提升用户体验
实现个性化诗歌生成（用户风格学习）
添加多语言支持

本项目的完整实现展示了如何将先进的AI能力转化为实用的Web应用。开发者可以通过修改提示词工程、调整模型参数或扩展前端功能，快速打造出具有特色的AI创意产品。实际部署时建议添加用户认证、使用量统计和日志监控等企业级功能。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

手把手教你用Python+文心一言：零基础搭建AI看图写诗系统

一、项目背景与核心价值

1.1 技术选型依据

1.2 典型应用场景

二、完整开发环境配置指南

2.1 基础环境准备

2.2 文心一言API配置

三、核心功能实现详解

3.1 后端服务架构

3.2 前端界面实现

四、关键技术点解析

4.1 图片处理优化

5.2 功能扩展方向

六、完整项目源码获取

七、常见问题解决方案

7.1 API调用失败处理

7.2 图片处理异常

7.3 诗歌质量优化

八、技术演进方向

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者