有不少读者在询问如何入门Python、如何入门Python数据分析,之前跟大家分享了两本零基础入门Python的书籍:《Python编程从入门到实践》 和《笨办法学Python3》。
今天来给大家分享一本Python数据分析入门的书籍,书名是《Python数据分析基础》。
相关书籍已经整理好电子文档需要的可以加兮子ssmp54996 记得备注【python】
本书面向的读者
按照书中的介绍:
本书面向的读者主要是那些经常使用电子表格软件进行数据处理,但从未写过一行代码的人。
Lemon 觉得这个范畴还是很清晰的,当然,Lemon 阅读完这本书之后,觉得范围也可以适当的拓宽些,包括经常处理电子表格的、需要定期生成报表的、有一定的数据可视化需求的、以及需要对数据进行统计性描述的,都可以参考下本书的部分内容。
对于这点,Lemon 也是深有感触。前些年,Lemon 还没有开始学 Python ,当时管理许多的项目,用 excel 处理数据感觉有些力不从心,于是开始寻找解决方案,找了一圈,最后用微软的 access 用 sql 语句撸了一个小型的项目管理工具。现在看来,如果当时会 Python,会要方便很多。
书中的Python环境
书中的代码使用的Python版本是 Python 3.5版,本书作者是在 windows 平台对代码进行测试的, 如果你的电脑上的 Python 版本是 3.5 以及之上的,应该是可以运行的。
由于 Python 是跨平台的,因此,windows、Linux 以及 MacOS 系统应该都没问题。
对用 Python 的安装,书中推荐安装 Anaconda , Lemon 一般也是直接安装 Anaconda,主要是比较省事。
关于 Python 环境的安装,这个还是需要自己去弄,不同的电脑环境,有时候会出现一些小小的问题,这个主要还是需要自己通过搜索来解决。
书中的代码,原书作者已经发布在其 Github 上,大家可以免费去获取,地址如下:
https://github.com/cbrownley/foundations-for-analytics-with-python
数据文件处理
书中花了比较大的篇幅来讲解关于数据文件的处理,主要包括 csv文件、excel文件以及 数据库。
对于数据分析入门而言,可能遇到比较多的文件类型还是 excel 和 csv ,所以书中对这两类介绍也是比较多。
书中介绍了用纯 Python、内置模块、第三方库等途径来操作这两类文件,涉及到 内置 csv模块、xlrd、xlwt 等。对于需要读取数据,尤其是需要写入数据,用这些工具还是挺方便的。
如果只是读取数据,然后进行数据清洗等处理,Lemon 一般喜欢用 Pandas 。
此外,对于数据库,书中也介绍了 内置的 sqlite3 模块,以及 以及流行的数据库 MysqL 。
数据可视化
主要涉及四个可视化库,分别是 Matplotlib
、Pandas
、ggplot
和 seaborn
。
除了 ggplot
,其余三个, Lemon 也是经常使用的。
运行后效果如下:
关于 Matplotlib,前不久 Lemon 整理了一份 100个项目入门 Matplotlib 的内容,有兴趣的同学可以前往查看:
自动运行脚本
Lemon 觉得还有一个内容估计大家是感兴趣的,那就是使用 Python 来按计划自动运行脚本,由于是在商业环境中,有一些需要定期上报的内容,比如日报、周报、月报、季报、年报等(特别烦!!!)。
前不久,阿里取消周报,都能上热搜,可见这些报表都么重要,又是多么招人厌!
如果你用 Python 来自动运行一些格式高度一致的内容,那自然会省事很多。别人在埋头苦干的时候,估计你就有功夫摸鱼啦。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。