微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

与基于生物浏览器的Entrez Pubmed搜索相比,基于浏览器的Pubmed搜索产生的点击率有所不同

如何解决与基于生物浏览器的Entrez Pubmed搜索相比,基于浏览器的Pubmed搜索产生的点击率有所不同

我有一个每周脚本,该脚本针对在上周内创建的多个搜索条件,对Pubmed进行抓取。 使用的搜索字词如下所示: (leucine AND valine AND isoleucine) AND ("2020/10/31"[crdt] : "2020/11/06"[crdt] 我使用创建日期crdt过滤器来仅搜索上周内创建的出版物。通过这种方式,如果每周进行搜索,并且时间间隔彼此相邻,则不应错过任何出版物。

我的脚本如下所示(为简单起见,我现在只计算找到的搜索命中次数):

from Bio import Entrez

Entrez.email = "Your.Name.Here@example.org"
handle = Entrez.esearch(db='pubmed',term='(leucine AND valine AND isoleucine) AND ("2020/10/31"[crdt] : "2020/11/06"[crdt])',usehistory='y',retmax='50')
record = Entrez.read(handle)
handle.close()
results_nr=str(len(record['IdList']))
print(f'Found Hits: {results_nr}')

如果运行脚本,则会收到以下输出Found Hits: 7

但是,如果我在浏览器中发布的搜索词上运行相同的搜索字词,则会得到 8个匹配

https://pubmed.ncbi.nlm.nih.gov/?term=%28leucine+AND+valine+AND+isoleucine%29+AND+%28%222020%2F10%2F31%22%5BCRDT%5D+%3A+%222020%2F11%2F06%22%5BCRDT%5D%29

我的脚本找不到的一篇论文如下,这是浏览器搜索中的最新文章https://pubmed.ncbi.nlm.nih.gov/33156242/

但是,如果我查看此出版物的元数据,则会发现crdt- 2020/11/06 12:12。因此,该出版物符合我的搜索条件,并且还应该在我的脚本搜索中弹出?

我怀疑元数据中的其他日期之一干扰了我的搜索https://pubmed.ncbi.nlm.nih.gov/33156242/?format=pubmed):

MHDA- 2020/11/07 06:00
crdt- 2020/11/06 12:12
PHST- 2020/11/06 12:12 [entrez]
PHST- 2020/11/07 06:00 [pubmed]
PHST- 2020/11/07 06:00 [medline]

有人知道这种差异可能来自何处吗?任何帮助将不胜感激!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。