如何解决与基于生物浏览器的Entrez Pubmed搜索相比,基于浏览器的Pubmed搜索产生的点击率有所不同
我有一个每周脚本,该脚本针对在上周内创建的多个搜索条件,对Pubmed进行抓取。
使用的搜索字词如下所示:
(leucine AND valine AND isoleucine) AND ("2020/10/31"[crdt] : "2020/11/06"[crdt]
我使用创建日期或crdt
过滤器来仅搜索上周内创建的出版物。通过这种方式,如果每周进行搜索,并且时间间隔彼此相邻,则不应错过任何出版物。
我的脚本如下所示(为简单起见,我现在只计算找到的搜索命中次数):
from Bio import Entrez
Entrez.email = "Your.Name.Here@example.org"
handle = Entrez.esearch(db='pubmed',term='(leucine AND valine AND isoleucine) AND ("2020/10/31"[crdt] : "2020/11/06"[crdt])',usehistory='y',retmax='50')
record = Entrez.read(handle)
handle.close()
results_nr=str(len(record['IdList']))
print(f'Found Hits: {results_nr}')
如果运行脚本,则会收到以下输出:Found Hits: 7
但是,如果我在浏览器中发布的搜索词上运行相同的搜索字词,则会得到 8个匹配。
我的脚本找不到的一篇论文如下,这是浏览器搜索中的最新文章: https://pubmed.ncbi.nlm.nih.gov/33156242/
但是,如果我查看此出版物的元数据,则会发现crdt- 2020/11/06 12:12
。因此,该出版物符合我的搜索条件,并且还应该在我的脚本搜索中弹出?
我怀疑元数据中的其他日期之一干扰了我的搜索(https://pubmed.ncbi.nlm.nih.gov/33156242/?format=pubmed):
MHDA- 2020/11/07 06:00
crdt- 2020/11/06 12:12
PHST- 2020/11/06 12:12 [entrez]
PHST- 2020/11/07 06:00 [pubmed]
PHST- 2020/11/07 06:00 [medline]
有人知道这种差异可能来自何处吗?任何帮助将不胜感激!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。