Make教程：用Make批量自动总结科研文献并归档到Notion知识库

概述

这是一套为科研人员量身定制的文献管理自动化方案。

通过结合Notion的知识库管理、PDF.co的文档解析以及ChatGPT的智能总结能力，实现科研文献的全自动处理：

触发任务 - Notion数据库状态变更为”开始”
下载文献 - 自动获取PDF文件
提取文本 - PDF.co解析文档内容
元数据提取 - ChatGPT结构化提取DOI、期刊等信息
双分支总结 - Router实现通用总结+课题摘要
归档存储 - 结果回写Notion知识库

Make工作流概览 完整的科研文献自动化工作流架构

核心决策因素

在选择科研自动化工具时，需重点考量：

自动化效率 - 能否显著减少手动操作时间，批量处理文献
灵活性与定制化 - 是否支持根据研究需求定制提示词和输出格式
整合能力 - 能否无缝集成Notion、PDF工具、AI模型等常用工具
结果质量 - 生成的总结是否准确、结构清晰、避免编造
成本效益 - 相关服务的收费是否经济合理

技术规格参考

规格项	参数值	备注
报告字数	约2,000-3,000字	可通过提示词调整
AI模型	GPT-4o	用于总结与元数据提取
PDF提取范围	前0-3页	避免超出上下文限制
Max Token	4,000	OpenAI模块设置
输出格式	Markdown	结构化报告格式
Notion检索限制	10条/次	单次工作流处理条目数

前置准备

在开始之前，请确保准备好：

Make.com 账号（免费注册）
Notion 账号和科研文献数据库
PDF.co 账号（pdf.co，有免费额度）
OpenAI API密钥

Notion数据库结构

创建科研文献库，包含以下字段：

标题 (Title) - 文献标题
文件 (Files & Media) - PDF文件
状态 (Select) - 未处理/开始/已完成
DOI (Text) - 文献DOI
期刊 (Text) - 发表期刊
通用总结 (Text) - AI生成的通用摘要
课题摘要 (Text) - 针对特定研究方向的摘要

Notion科研知识库结构 数据库Schema设计，包含元数据和摘要字段

工作流架构

阶段一：触发与文件获取

使用Notion Watch Database Items模块监控状态变更：

配置要点：

监控条件：状态字段变为”开始”
检索限制：建议设为10条，避免一次处理过多

阶段二：PDF文本提取

PDF.co模块配置 使用toString函数处理二进制数据

使用PDF.co的PDF to Text模块提取内容：

关键设置：

提取页数：0-3页（前几页通常包含摘要和核心内容）
输出处理：使用toString公式将二进制转为文本

重要：PDF.co输出的是二进制代码，直接传给OpenAI会报错。必须在映射时使用toString函数进行转换。

阶段三：元数据结构化提取

将提取的文本发送给ChatGPT，结构化提取元数据：

提示词设计：

请从以下文献内容中提取：
1. 文献标题
2. DOI（如有）
3. 发表期刊
4. 作者列表
5. 发表年份

以JSON格式返回结果。

文献内容：
{{pdf_text}}

重要：建议将参数设置为非必需(optional)，避免因某些文献缺少DOI等信息而导致工作流报错。

阶段四：双分支总结（Router）

Router双分支配置 使用Router实现通用总结和课题摘要双输出

这是本工作流的核心亮点——使用Router创建双分支：

分支一：通用总结

生成2000字左右的文献综述
包含研究背景、方法、结论等标准结构

分支二：课题摘要

根据你的研究方向（如”大语言模型”）生成针对性摘要
提供理论启示、实验改进建议、未来研究线索

提示词示例（课题摘要）：

你是一位专注于[大语言模型]研究的学者。请阅读以下文献，
从你的研究视角分析：
1. 该文献对你研究的启示
2. 可借鉴的方法论
3. 潜在的合作或扩展方向

字数要求：800-1000字

阶段五：结果回写Notion

将生成的总结和元数据更新到Notion：

注意事项：

复制Router分支时，新分支的Notion更新模块需要手动调整Page ID
确保Page ID指向正确的数据来源，否则会更新错误的页面

注意事项

在实操中容易遇到的”坑”：

元数据缺失 - 预印本或部分文献可能缺少DOI、期刊信息，将字段设为optional
上下文限制 - 长篇PDF只能提取前几页，可能遗漏后续重要信息
二进制转换 - PDF.co输出需要用toString函数转换，否则OpenAI报错
PDF.co计费 - 按页收费，长期使用需评估成本
Router分支ID - 复制分支后需手动调整Notion模块的Page ID映射

实际效果

完成的文献总结页面 Notion中自动生成的文献总结效果

处理能力：

自动填充文献元数据（标题、DOI、期刊等）
生成2000-3000字的结构化通用总结
针对特定课题生成800-1000字的研究摘要

效率提升：

批量处理：一次可处理10篇文献
状态驱动：只需在Notion中改状态为”开始”即可触发

适用场景

可能不适合的情况

对Make.com和API配置完全不熟悉的零基础用户
预算有限且不愿为PDF.co付费的用户
需要极致精细化阅读和批判性分析的场景（自动化无法完全替代深度阅读）

常见问题

预印本或缺少DOI的文献怎么处理？

元数据提取可能不完整，建议将Notion属性设为非必需(optional)，避免因缺失字段导致工作流报错。

长篇PDF如何处理上下文限制？

工作流通常只提取PDF前几页(0-3页)进行总结，确保不超过模型上下文限制。如需完整分析，可分批处理。

PDF.co收费吗？

按页计费，新用户有免费额度。长期使用需考虑成本，也可探索其他PDF转文本方案作为替代。

如何实现通用总结和特定课题总结双输出？

使用Make.com的Router模块创建双分支，一条生成通用总结，另一条根据你的研究方向生成针对性摘要。

下一步

学会了基础工作流后，你可以尝试：

添加文献引用格式自动生成
集成Zotero等专业文献管理工具
添加多语言翻译功能
设置定时任务自动处理新上传的文献

有问题欢迎在评论区留言交流！

Make教程：用Make批量自动总结科研文献并归档到Notion知识库

准备好开始自动化了吗？

概述

核心决策因素

技术规格参考

前置准备

Notion数据库结构

工作流架构

阶段一：触发与文件获取

阶段二：PDF文本提取

阶段三：元数据结构化提取

阶段四：双分支总结（Router）

阶段五：结果回写Notion

注意事项

实际效果

适用场景

推荐使用的用户

可能不适合的情况

常见问题

预印本或缺少DOI的文献怎么处理？

长篇PDF如何处理上下文限制？

PDF.co收费吗？

如何实现通用总结和特定课题总结双输出？

下一步

常见问题

立即开始构建你的自动化

相关教程

Make教程：用Apify自动采集YouTube视频数据构建Notion知识库

Make教程：5分钟搞定第一个Make工作流，从入门到实战

Make教程：自动化基础与核心概念全解析

Make教程：用AI自动分类Notion知识库并建立数据库关联

关于作者

Alex Chen