Make教程:用Make批量自动总结科研文献并归档到Notion知识库
结合Notion、PDF.co和ChatGPT构建科研文献自动化工作流,批量提取PDF元数据,生成2000-3000字结构化报告,支持通用总结与特定课题双分支输出。
准备好开始自动化了吗?
使用 Make.com 构建此工作流 — 入门版永久免费。
概述
这是一套为科研人员量身定制的文献管理自动化方案。
通过结合Notion的知识库管理、PDF.co的文档解析以及ChatGPT的智能总结能力,实现科研文献的全自动处理:
- 触发任务 - Notion数据库状态变更为”开始”
- 下载文献 - 自动获取PDF文件
- 提取文本 - PDF.co解析文档内容
- 元数据提取 - ChatGPT结构化提取DOI、期刊等信息
- 双分支总结 - Router实现通用总结+课题摘要
- 归档存储 - 结果回写Notion知识库
完整的科研文献自动化工作流架构
核心决策因素
在选择科研自动化工具时,需重点考量:
- 自动化效率 - 能否显著减少手动操作时间,批量处理文献
- 灵活性与定制化 - 是否支持根据研究需求定制提示词和输出格式
- 整合能力 - 能否无缝集成Notion、PDF工具、AI模型等常用工具
- 结果质量 - 生成的总结是否准确、结构清晰、避免编造
- 成本效益 - 相关服务的收费是否经济合理
技术规格参考
| 规格项 | 参数值 | 备注 |
|---|---|---|
| 报告字数 | 约2,000-3,000字 | 可通过提示词调整 |
| AI模型 | GPT-4o | 用于总结与元数据提取 |
| PDF提取范围 | 前0-3页 | 避免超出上下文限制 |
| Max Token | 4,000 | OpenAI模块设置 |
| 输出格式 | Markdown | 结构化报告格式 |
| Notion检索限制 | 10条/次 | 单次工作流处理条目数 |
前置准备
在开始之前,请确保准备好:
- Make.com 账号(免费注册)
- Notion 账号和科研文献数据库
- PDF.co 账号(pdf.co,有免费额度)
- OpenAI API密钥
Notion数据库结构
创建科研文献库,包含以下字段:
- 标题 (Title) - 文献标题
- 文件 (Files & Media) - PDF文件
- 状态 (Select) - 未处理/开始/已完成
- DOI (Text) - 文献DOI
- 期刊 (Text) - 发表期刊
- 通用总结 (Text) - AI生成的通用摘要
- 课题摘要 (Text) - 针对特定研究方向的摘要
数据库Schema设计,包含元数据和摘要字段
工作流架构
阶段一:触发与文件获取
使用Notion Watch Database Items模块监控状态变更:
配置要点:
- 监控条件:状态字段变为”开始”
- 检索限制:建议设为10条,避免一次处理过多
阶段二:PDF文本提取
使用toString函数处理二进制数据
使用PDF.co的PDF to Text模块提取内容:
关键设置:
- 提取页数:0-3页(前几页通常包含摘要和核心内容)
- 输出处理:使用
toString公式将二进制转为文本
重要:PDF.co输出的是二进制代码,直接传给OpenAI会报错。必须在映射时使用
toString函数进行转换。
阶段三:元数据结构化提取
将提取的文本发送给ChatGPT,结构化提取元数据:
提示词设计:
请从以下文献内容中提取:
1. 文献标题
2. DOI(如有)
3. 发表期刊
4. 作者列表
5. 发表年份
以JSON格式返回结果。
文献内容:
{{pdf_text}}
重要:建议将参数设置为非必需(optional),避免因某些文献缺少DOI等信息而导致工作流报错。
阶段四:双分支总结(Router)
使用Router实现通用总结和课题摘要双输出
这是本工作流的核心亮点——使用Router创建双分支:
分支一:通用总结
- 生成2000字左右的文献综述
- 包含研究背景、方法、结论等标准结构
分支二:课题摘要
- 根据你的研究方向(如”大语言模型”)生成针对性摘要
- 提供理论启示、实验改进建议、未来研究线索
提示词示例(课题摘要):
你是一位专注于[大语言模型]研究的学者。请阅读以下文献,
从你的研究视角分析:
1. 该文献对你研究的启示
2. 可借鉴的方法论
3. 潜在的合作或扩展方向
字数要求:800-1000字
阶段五:结果回写Notion
将生成的总结和元数据更新到Notion:
注意事项:
- 复制Router分支时,新分支的Notion更新模块需要手动调整Page ID
- 确保Page ID指向正确的数据来源,否则会更新错误的页面
注意事项
在实操中容易遇到的”坑”:
-
元数据缺失 - 预印本或部分文献可能缺少DOI、期刊信息,将字段设为optional
-
上下文限制 - 长篇PDF只能提取前几页,可能遗漏后续重要信息
-
二进制转换 - PDF.co输出需要用
toString函数转换,否则OpenAI报错 -
PDF.co计费 - 按页收费,长期使用需评估成本
-
Router分支ID - 复制分支后需手动调整Notion模块的Page ID映射
实际效果
Notion中自动生成的文献总结效果
处理能力:
- 自动填充文献元数据(标题、DOI、期刊等)
- 生成2000-3000字的结构化通用总结
- 针对特定课题生成800-1000字的研究摘要
效率提升:
- 批量处理:一次可处理10篇文献
- 状态驱动:只需在Notion中改状态为”开始”即可触发
适用场景
推荐使用的用户
- 科研人员/研究生/博士生 - 需要处理大量文献的学术工作者
- 教师 - 需要快速了解领域最新进展
- 金融分析师/市场研究员 - 需要处理大量报告的专业人士
可能不适合的情况
- 对Make.com和API配置完全不熟悉的零基础用户
- 预算有限且不愿为PDF.co付费的用户
- 需要极致精细化阅读和批判性分析的场景(自动化无法完全替代深度阅读)
常见问题
预印本或缺少DOI的文献怎么处理?
元数据提取可能不完整,建议将Notion属性设为非必需(optional),避免因缺失字段导致工作流报错。
长篇PDF如何处理上下文限制?
工作流通常只提取PDF前几页(0-3页)进行总结,确保不超过模型上下文限制。如需完整分析,可分批处理。
PDF.co收费吗?
按页计费,新用户有免费额度。长期使用需考虑成本,也可探索其他PDF转文本方案作为替代。
如何实现通用总结和特定课题总结双输出?
使用Make.com的Router模块创建双分支,一条生成通用总结,另一条根据你的研究方向生成针对性摘要。
下一步
学会了基础工作流后,你可以尝试:
- 添加文献引用格式自动生成
- 集成Zotero等专业文献管理工具
- 添加多语言翻译功能
- 设置定时任务自动处理新上传的文献
有问题欢迎在评论区留言交流!
常见问题
- 预印本或缺少DOI的文献怎么处理?
- 元数据提取可能不完整,建议将Notion属性设为非必需(optional),避免因缺失字段导致工作流报错。
- 长篇PDF如何处理上下文限制?
- 工作流通常只提取PDF前几页(0-3页)进行总结,确保不超过模型上下文限制。如需完整分析,可分批处理。
- PDF.co收费吗?
- 按页计费,新用户有免费额度。长期使用需考虑成本,也可探索其他PDF转文本方案作为替代。
- 如何实现通用总结和特定课题总结双输出?
- 使用Make.com的Router模块创建双分支,一条生成通用总结,另一条根据你的研究方向生成针对性摘要。



