跳转到主要内容
MakeAIGuide
中级 35 分钟阅读 更新于 2026年1月5日

Make教程:用GPT-4o多模态能力自动构建Notion电子图书馆

结合HCTI网页截图和GPT-4o图像识别,自动从豆瓣读书页面提取书名、作者、评分等元数据,一键保存到Notion知识库。

准备好开始自动化了吗?

使用 Make.com 构建此工作流 — 入门版永久免费。

免费试用 Make.com

概述

这是一套利用GPT-4o多模态能力构建的智能图书管理方案。

通过网页截图+AI图像识别的创新方式,绕过传统爬虫限制,实现图书信息的自动采集:

  1. 触发任务 - Notion数据库状态变更触发
  2. 网页截图 - HCTI将豆瓣页面转为图片
  3. AI识别 - GPT-4o从图片中提取结构化数据
  4. 格式转换 - 确保输出为标准JSON格式
  5. 数据存储 - 自动回写Notion知识库

Notion图书馆效果 自动填充的图书信息展示


核心决策因素

在选择图书管理自动化方案时,需考量:

  • 自动化效率 - 能否显著减少手动录入时间
  • 数据准确性 - 提取的书名、作者、评分是否准确
  • 易用性 - 搭建和维护的技术门槛
  • 成本 - 第三方服务的免费额度和长期费用
  • 扩展性 - 能否应用于其他数据采集场景

技术规格参考

规格项参数值备注
HCTI免费额度50次/月网页截图服务
截图像素密度建议设为3提高清晰度确保识别准确
GPT-4o Token1000-3000根据需求调整
提取字段数4-6个书名、作者、出版社、页数、价格、评分等

前置准备

在开始之前,请确保准备好:

Notion数据库结构

创建图书管理数据库,包含以下字段:

  • 书名 (Title) - 图书标题
  • 链接 (URL) - 豆瓣图书页面链接
  • 状态 (Select) - 待处理/开始/已完成
  • 作者 (Text) - 作者信息
  • 出版社 (Text) - 出版社名称
  • 出版年 (Text) - 出版年份
  • 页数 (Number) - 页数
  • 价格 (Text) - 定价
  • 豆瓣评分 (Number) - 评分

工作流架构

阶段一:触发与检索

Notion检索模块 Notion数据库检索模块配置

使用Notion Watch Database Items监控状态变更:

配置要点:

  • 监控条件:状态字段变为”开始”
  • 获取字段:链接URL

阶段二:网页截图

HCTI模块配置 将URL转换为图片的HCTI模块

使用HCTI将豆瓣页面转换为图片:

配置要点:

  • URL:从Notion获取的豆瓣链接
  • 像素密度:设为3(提高清晰度)
  • 输出格式:PNG或JPG

为什么用截图? 豆瓣等网站有反爬机制,直接抓取HTML困难。通过截图+AI识别的方式,可以绕过技术限制。


阶段三:GPT-4o多模态识别

GPT-4o配置 GPT-4o多模态模型识别图片内容

将截图发送给GPT-4o进行信息提取:

提示词设计 结构化提示词示例

提示词设计:

请从这张豆瓣图书页面截图中提取以下信息:
1. 书名
2. 作者
3. 出版社
4. 出版年份
5. 页数
6. 定价
7. 豆瓣评分

请以JSON格式返回,字段名使用英文:
{
  "title": "",
  "author": "",
  "publisher": "",
  "year": "",
  "pages": "",
  "price": "",
  "rating": ""
}

阶段四:JSON格式保证

GPT-4o多模态模块无法100%保证JSON格式输出,需要额外处理:

解决方案:

  • 添加一个普通的OpenAI对话模块
  • 要求将上一步输出转换为标准JSON
  • 确保数据可被后续模块正确解析

阶段五:回写Notion

将提取的结构化数据更新到Notion数据库:

映射关系:

  • title → 书名
  • author → 作者
  • publisher → 出版社
  • year → 出版年
  • pages → 页数
  • price → 价格
  • rating → 豆瓣评分
  • 状态 → 已完成

扩展应用

这套工作流不仅限于图书管理,还可以扩展到:

  • 商品价格监控 - 截图电商页面,提取价格变化
  • 股票走势分析 - 截图行情页面,提取关键数据
  • 招聘信息抓取 - 截图招聘页面,提取岗位信息
  • 竞品分析 - 截图竞品页面,提取产品信息

只需调整提示词,即可适应不同场景。


注意事项

在实操中容易遇到的”坑”:

  1. 识别准确性 - 基于图片识别可能有细微错误,复杂字母或特殊排版风险更高

  2. JSON输出不稳定 - 多模态模块需要额外添加对话模块确保JSON格式

  3. 截图清晰度 - 像素密度建议设为3,太低会影响识别准确率

  4. 平台分享限制 - YouTube等平台可能限制包含JSON括号的内容分享


适用场景

推荐使用的用户

  • 数字知识管理爱好者 - 希望高效管理个人藏书或阅读清单
  • 数据采集需求者 - 需要从网页抓取结构化数据
  • 自动化探索者 - 对Make.com和GPT-4o应用有兴趣

可能不适合的情况

  • 对技术配置完全不熟悉且不愿学习的用户
  • 对数据准确性有100%极致要求的场景
  • 每月处理量极小,手动录入成本更低的用户

常见问题

为什么要用截图而不是直接抓取网页?

豆瓣等网站有反爬机制,直接抓取困难。通过截图+GPT-4o多模态识别,可以绕过技术限制,且对任何网页都适用。

HCTI免费额度够用吗?

每月50次免费截图,对于个人图书管理场景通常足够。如需大量使用可考虑付费计划。

识别准确率如何?

根据测试,GPT-4o识别准确率很高,但对于复杂字母或特殊排版仍可能有细微错误,建议重要数据人工复核。

可以用于其他网站吗?

可以!只需调整提示词,就能应用于商品价格监控、股票走势分析、招聘信息抓取等场景。


下一步

学会了基础工作流后,你可以尝试:

  • 添加豆瓣评分筛选,自动标记高分书籍
  • 集成阅读进度追踪
  • 添加定时任务监控书籍价格变化
  • 扩展到其他数据采集场景

有问题欢迎在评论区留言交流!

常见问题

为什么要用截图而不是直接抓取网页?
豆瓣等网站有反爬机制,直接抓取困难。通过截图+GPT-4o多模态识别,可以绕过技术限制,且对任何网页都适用。
HCTI免费额度够用吗?
每月50次免费截图,对于个人图书管理场景通常足够。如需大量使用可考虑付费计划。
识别准确率如何?
根据测试,GPT-4o识别准确率很高,但对于复杂字母或特殊排版仍可能有细微错误,建议重要数据人工复核。
可以用于其他网站吗?
可以!只需调整提示词,就能应用于商品价格监控、股票走势分析、招聘信息抓取等场景。

立即开始构建你的自动化

加入超过50万用户,使用 Make.com 实现工作自动化。无需编程,免费开始。

免费开始使用
无需信用卡每月1,000次免费操作5分钟快速上手

相关教程

关于作者

AC

Alex Chen

Automation Expert & Technical Writer

Alex Chen 是一位认证的 Make.com 专家,拥有超过5年构建企业自动化解决方案的经验。曾任科技初创公司软件工程师,现致力于帮助企业利用 AI 和无代码工具提升效率。

资质认证

Make.com Certified PartnerGoogle Cloud Certified500+ Automations BuiltFormer Software Engineer
免费试用 Make.com