CDN Space
Learn Skills ,Record Life
CDN Space

[转载]Zoreto+SciHub+shortdoi:免费下载99%的文献

本文转载于公众号:青柠学术

原文地址:Zoreto搭配SciHub
使用Zoreto-shortdoi插件

相关链接:zoroeto-shortdoi的Github首页
青柠学术:Zoreto教程——打造最佳文献生态

一、Zoreto配置Sci-Hub

从Zotero PDF retrieval谈起

从Zotero 5.0.56版本开始,Zotero迎来了PDF retrieval功能。

详情可见Zotero官网的文章“Improved PDF retrieval with Unpaywall integration”[1]

该功能会在你用Zotero Connector保存文献时,自动检查Unpaywall上是否有可供下载的免费文献。

“ Unpaywall能免费下载文献,但你不要以为它和Sci-Hub一样是非法的。其实Unpaywall是个非盈利性合法组织,它整合了数千个Open Access期刊或数据库,将免费文献集中之后开放API,从而供其他平台使用。

假如你在网页端保存的文献是Open Access的,Zotero Connector就会将PDF同文献条目一起抓取,比如下面这样。

https://pic3.zhimg.com/80/v2-fa4bbafccc7a97983ca63d195385f41a_720w.jpg

当然,对于已经在Zotero中却还没有PDF附件的文献条目,点击右键菜单中的Find Available PDF,即可下载文献,比如下面这样。

https://pic3.zhimg.com/80/v2-b46c2b64d32ebb9c87e6ff2b0f6a11de_720w.jpg

但是,毕竟Unpaywall只支持OA文献,而OA文献又只是少数。也就是说,通过Unpaywall无法解决付费文献的下载问题。

不过幸运的是,作为一款开源软件,Zotero的开发者为很多功能带来了可定制的能力,方便用户根据自己的喜好自定义。

PDF retrieval功能也不例外,Zotero允许用户自定义PDF解析器(custom PDF resolvers),也就是说你可以将其他网站作为PDF解析器,来替代Unpaywall。

详情可以访问Zotero官网链接Custom PDF Resolvers[2]

这为我们将Sci-Hub作为PDF resolver带来可能!

考虑到PDF resolver是内置在Zotero中的,这能保证我们能稳定使用该功能,就算Zotero更新了也丝毫不用担心,这一点就比使用第三方插件要有保障得多!

下面具体介绍如何将Sci-Hub作为PDF解析器!

设置Sci-Hub作为PDF解析器

PDF resolvers的设置在Zotero的Config Editor中。

我们打开Zotero的首选项,进入Advanced-->Config Editor。?

https://pic1.zhimg.com/80/v2-43021d0025cb4f5e46ba6325315e3ad8_720w.jpg

搜索extensions.zotero.findPDFs.resolvers,如下。

https://pic3.zhimg.com/80/v2-e4f000a59bb6dac46433d0a2ca512ca6_720w.jpg

双击extensions.zotero.findPDFs.resolvers,默认情况下是只有一对[]

https://pic1.zhimg.com/80/v2-a277bd829d1a84db0a2add011b47ee38_720w.jpg

删除[],并将以下代码粘贴进去。

{
    "name":"Sci-Hub",
    "method":"GET",
    "url":"https://sci-hub.se/{doi}",
    "mode":"html",
    "selector":"#pdf",
    "attribute":"src",
    "automatic":true
}

然后点击OK。?

https://pic4.zhimg.com/80/v2-bb26d95d0b3a9f21cdbbd7fde4d95a33_720w.jpg

到此就成功将Sci-Hub配置为PDF解析器了,也就是说替代了默认的Unpaywall。

现在,无需重启Zotero,即可调用Sci-Hub免费下载文献了。

这里顺便提三点:

  1. "url":"https://sci-hub.se/{doi}"中,建议使用.se,因为.se支持SSL链接。
  2. "url":"https://sci-hub.se/{doi}"还能看到一点。由于Sci-Hub是通过doi下载文献的,因此该PDF解析器也需要doi。也就说你的文献必须要有doi,如果doi是空缺的,便无法通过PDF解析器免费下载文献。幸运的是,对于缺失doi的文献,我们可以通过插件zotero-shortdoi[3]插件一键抓取doi(请参考zotero-shortdoi + Sci-Hub,让99%的文献都能被免费下载!)。
  3. "automatic":true,如果设置为true,Zotero会自动下载保存到Zotero中的文献的PDF。比如你用Zotero Connector保存了一些文献到Zotero,它便会自动帮你从Sci-Hub下载文献,并附在相应文献条目下。如果你不需要自动下载,可以设置为"automatic":false

使用方法前面介绍过,主要有两种:

第一种:Zotero Connector

通过Zotero Connector保存的文献,会自动下载PDF,无需任何操作。(看不到进度条,下载速度取决于网速)

第二种:Find Available PDF

选中单篇或者多篇文献,手动点击右键菜单中的Find Available PDF,会弹出单独的窗口显示下载进度。同样,下载速度取决于网络速度。?

https://pic2.zhimg.com/80/v2-d620c2887f71c0e5fa029a186284eabd_720w.jpg

关于“下载速度取决于网络速度”有下面两点需要注意;

  • 如果你未开启任何网络加速器(比如梯z),即正常使用网络,可以认为Find Available PDF的进度就是你手动从Sci-Hub下载文献的速度。大家应该都体验过,不开启加速器的情况下,Sci-Hub的访问速度还是比较慢的,甚至有时候PDF加载不出来。
  • 假如你开启了加速器,推荐使用全局代理模式,而不是PAC模式,因为两种情况下Find Available PDF的进度差异非常大,可以认为,使用全局代理模式几乎可以做到十几秒下一篇文献甚至更快。不过记住,下载完文献,切回到PAC模式,因为PAC模式下Zotero无法同步文献到坚果云。
  • 如果发现个别PDF出现损坏的情况,可以尝试将代码中的https修改为http。

二、用 zotero-shortdoi 解决doi缺失问题

doi可以看成文献的身份证,是它的唯一标识符,几乎每一篇论文(Journal Article)都有doi。网站https://www.doi.org可以通过doi解析每一篇文章的网页链接。

也就是说,要想免费下载文献,你Zotero文献的DOI栏不能是空缺的。?一旦缺失doi,在右键菜单中是不会有Find Available PDF的,相当于没有了输入参数。

https://i0.wp.com/codeword.info/wp-content/uploads/2020/03/image-6.png?fit=640%2C392&ssl=1

可是有些时候,用Zotero Connector在网页端保存或者PDF自动抓取得到的文献中,会有个别文献可能会缺失doi,这会给我们通过Sci-Hub下载文献造成不便。(虽然还有很多其他方式可以快速下载,以后介绍)

因此今天就介绍一款可以快速抓取文献doi的插件zotero-shortdoi[1]。这款插件我已经使用挺久了,好用又稳定,绝对不会让你失望,而且还支持批量文献的doi抓取。

从GitHub上下载最新版本,如下。

https://i2.wp.com/codeword.info/wp-content/uploads/2020/03/image-7.png?fit=640%2C386&ssl=1

安装到Zotero。(这个大家应该都会,不多说)

在Zotero的插件面板中中,它是以Zotero DOI Manager显示的。

https://cdn.codeword.info/wp-content/uploads/2020/03/image-8.png?x-oss-process=image/interlace,1/quality,Q_85#

这里,可能有人好奇了:为什么这款插件叫做shortdoi呢?

有shortdoi,那肯定有longdoi。其实我们平常在使用的doi,都是longdoi。

下面两种常见形式都是longdoi,其实它们是等效的。唯一的区别在于第二个doi添加了https://www.doi.org域名。我前面说了,https://www.doi.org是通过doi解析文献的,因此每篇文献的doi前面其实都有这么个相同的域名。既然相同,自然可以省略,从而得到下面第一个doi这样子。

  • 10.1016/j.nanoen.2018.11.062
  • https://doi.org/10.1016/j.nanoen.2018.11.062

那么,可能有的人觉得这两个doi还是有点长了,特别是在参考文献排版时不够美观,因此就诞生了shortdoi,来缩短doi的字符长度。

任意选中一篇或多篇文献(原本缺失doi的或者有doi的),右键菜单如下。

https://cdn.codeword.info/wp-content/uploads/2020/03/image-9.png?x-oss-process=image/interlace,1/quality,Q_85#

可以看到有三项子菜单:

  • Get shortDOIs
  • Get longDOIs
  • Verify and clean DOIs

点击Get longDOIsVerify and clean DOIs的效果几乎没有差异,都是抓取文献的longDOIs。?

https://cdn.codeword.info/wp-content/uploads/2020/03/image-10.png?x-oss-process=image/interlace,1/quality,Q_85#

而且需要注意的是,只有longDOI才能被Sci-Hub所识别。因此这里就不用管Get shortDOIs了,用不上。

获取到了DOI后,就可以右键文献,点击Find Available PDF从Sci-Hub下载文献了!

这里顺便介绍下zotero shortdoi插件的默认设置,还蛮重要。

点击Zotero菜单栏Tools–>DOI Manager Preferences。?

https://cdn.codeword.info/wp-content/uploads/2020/03/image-11.png?x-oss-process=image/interlace,1/quality,Q_85#

zotero-shortdoi插件会自动为新添加到Zotero中的文献添加DOI,这里建议大家勾选Long DOI作为默认DOI形式。

https://cdn.codeword.info/wp-content/uploads/2020/03/image-12.png?x-oss-process=image/interlace,1/quality,Q_85#

从上图还可以看到,对于未找到DOI的文献,zotero-shortdoi会自动分配一些标签,比如Invalid DOIMultiple DOI等。一般情况不会发生,所以这里不用管。

到此就介绍完zotero-shortdoi的全部了!

赞赏

CDN

文章作者

发表评论

textsms
account_circle
email

CDN Space

[转载]Zoreto+SciHub+shortdoi:免费下载99%的文献
本文转载于公众号:青柠学术 原文地址:Zoreto搭配SciHub 使用Zoreto-shortdoi插件 相关链接:zoroeto-shortdoi的Github首页 青柠学术:Zoreto教程——打造最佳…
扫描二维码继续阅读
2020-03-24