第53期 软件使用!zotero抓取知网文献全要素及错误分析
2024年11月2日大约 3 分钟
第53期 软件使用!zotero抓取知网文献全要素及错误分析
**第2期**介绍过关于知网文献抓取失败的各种因素及处理
但经过跟同学朋友的交流后发现过程中还存在各种问题
本期从新视角着手介绍如何实现知网文献的确定抓取
目录
[TOC]
抓取流程
zotero抓取知网文献的流程大致是
- 安装浏览器的插件
- 浏览器插件与zotero建立联系
- 当特定的翻译器文件识别到目标网址(例如知网)
- 抓取知网中的条目信息并获取全文
抓取报错
当抓取流程错误,配置不完全时,会出现如下bug
- 无法抓取,显示翻译器故障
- 翻译器文件错误
- 茉莉花版本不是最新
- 可以抓取蓝色网页,无全文,无条目信息
- 未检测到知网翻译器
- 显示可以抓取,但无全文,无条目信息
- 浏览器与翻译器不匹配
- VPN网址
- 可以抓取到条目信息,但无全文
- 茉莉花版本非最新
抓取五要素
概览
浏览器插件
- 每次更新翻译器后都需要同步更新浏览器插件
浏览器设置
- 在使用过程中,edge浏览器bug最少(个人遇到的)
- mac的safari无法使用zotero插件
- 谷歌浏览器bug:近期(12.25):谷歌浏览器在120版本后无法抓取到条目信息和全文。暂时无法解决,需要切换浏览器
茉莉花版本
- 由于知网近期进行了较大的更新
- 务必确保茉莉花的插件(截至23-12-25)最新才能抓取知网条目
- zotero 7 1.0.0-10
- zotero 6 0.28
茉莉花配置
- 安装茉莉花后,要手动在设置里更新才可以获取最新翻译器
网络条件
- 校园VPN的环境下可能无法正常抓取
- 会显示翻译器抓取错误
- 请切换到知网的官方网址进入,或使用校外访问
- 如果可以抓取到条目信息无法抓取全文,可通过插件抓取条目信息并手动下载全文拖动到zotero里
- 如果是特殊网络的vpn导致无法抓取条目,自行查阅是否是知网流量走了代理,设置好正确的规则可以解决错误
其它
茉莉花插件安装
公众号回复”插件“获取zotero6和zotero7最新版本茉莉花插件
手动更新翻译器
参考第二期内容
如何反馈插件错误
Issues · l0o0/jasminum (github.com)(https://github.com/l0o0/jasminum/issues)