微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Ubuntu16.04安装爬虫框架scrapy

scrapy框架需要在Python2.7,lxml,OpenSSL,pip程序或库的基础之上创建。

因此 ,首先,先检查下是否包含上述四个程序或库

kuku@worker1:~$python
Python2.7.12(default,Jul12016,15:12:24)
[GCC5.4.020160609]onlinux2
Type"help","copyright","credits"or"license"formoreinformation.
>>>

可以看到Ubuntu16.04已经预置了python 2.7

接着查看是否还有lxml

>>>importlxml
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<module>
ImportError:Nomodulenamedlxml
>>>
>>>importOpenSSL
>>>

发现没有lxml,有OpenSSL,于是先安装lxml

kuku@worker1:~$sudoapt-getinstallpython-lxml

重新进入

kuku@worker1:~$python
Python2.7.12(default,"credits"or"license"formoreinformation.
>>>importlxml
>>>

没有报错。为保证后续正确安装,需依次执行

kuku@worker1:~$sudoapt-getinstallpython-dev
kuku@worker1:~$sudoapt-getinstalllibevent-dev
kuku@worker1:~$sudoapt-getinstallpython-pip
kuku@worker1:~$sudopipinstall--upgradepip

后执行

kuku@worker1:~$pipinstallScrapy

即可完成Scrapy的安装,查看下scrapy相关命令

kuku@worker1:~$scrapy

wKioL1gsTLaSogffAABQ0GpWPkw832.png-wh_50

然后可以创建一个新的项目

kuku@worker1:~$scrapystartprojectnewproject
NewScrapyproject'newproject',usingtemplatedirectory'/usr/local/lib/python2.7/dist-packages/scrapy/templates/project',createdin:
/home/kuku/newproject

Youcanstartyourfirstspiderwith:
cdnewproject
scrapygenspiderexampleexample.com
kuku@worker1:~$
kuku@worker1:~$sudoaptinstalltree

使用tree看下newproject文件目录

kuku@worker1:~$treenewproject/

wKiom1gsTgDiMWeMAAAglwb_DtI575.png-wh_50

接下来可以根据自己需要对里面文件进行相应的编辑,以满足自己需求。

原文地址:https://www.jb51.cc/ubuntu/356014.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐