技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

17.splash_case02

时间：2020-08-21分类：XML作者：编程之家

# 抓取《我不是药神》的豆瓣评论

import csv
import time
import requests
from lxml import etree

fw = open('douban_comments.csv','w')
writer = csv.writer(fw)
writer.writerow(['comment_time','comment_content'])

for i in range(0,20):

    # url = 'http://localhost:8050/render.html?url=https://movie.douban.com/subject/26752088/comments?start={}&limit=20&sort=new_score&status=P&timeout=30&wait=0.5'.format(i*20)
    url = 'https://movie.douban.com/subject/26752088/comments?start={}&limit=20&sort=new_score&status=P'.format(i*20)

    response = requests.get(url)

    tree = etree.HTML(response.text)

    comments = tree.xpath('//div[@class="comment"]')

    for item in comments:
        comment_time = item.xpath('./h3/span[2]/span[contains(@class,"comment-time")]/@title')[0]
        comment_time = int(time.mktime(time.strptime(comment_time,'%Y-%m-%d %H:%M:%s')))
        comment_content = item.xpath('./p/span/text()')[0].strip()
        print(comment_time)
        print(comment_content)
        writer.writerow([comment_time,comment_content])

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：xml – 查找所有子元素的最大值并在下一篇：我应该为xml文件创建一个新的扩展吗

相关推荐

php输出xml格式字符串

php输出xml格式字符串

作者：编程之家时间：2023-09-11

J2ME Mobile 3D入门教程系列文章之一

J2ME Mobile 3D入门教程系列文章之一

作者：编程之家时间：2023-09-11

XML轻松学习手册

XML轻松学习手册

作者：编程之家时间：2023-09-11

XML入门的常见问题(一)

XML入门的常见问题(一)

作者：编程之家时间：2023-09-11

XML入门的常见问题(三)

XML入门的常见问题(三)

作者：编程之家时间：2023-09-11

XML轻松学习手册（2）XML概念

XML轻松学习手册（2）XML概念

作者：编程之家时间：2023-09-11

xml文件介绍及使用

xml文件介绍及使用

作者：编程之家时间：2023-09-11

xml编程(一)-xml语法

xml编程(一)-xml语法

作者：编程之家时间：2023-09-11

XML文件结构和基本语法

XML文件结构和基本语法

作者：编程之家时间：2023-09-11

第2章　包装类

第2章　包装类

作者：编程之家时间：2023-09-11

小编推荐

苹果市值2025年有望达4万亿美元