技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

jparser 网页转码 python 库

程序名称：jparser

授权协议: MIT

操作系统: 跨平台

开发语言: Python

jparser 介绍

jparser是一个python库，用于网页转码，也就是从html源码中抽取正文的结构化数据：文本段落和图片。目前主要针对新闻资讯类页面进行了优化。

import urllib2
from jparser import PageModel
html = urllib2.urlopen("http://news.sohu.com/20170512/n492734045.shtml").read().decode('gb18030')
pm = PageModel(html)
result = pm.extract()

print "==title=="
print result['title']
print "==content=="
for x in result['content']:
    if x['type'] == 'text':
        print x['data']
    if x['type'] == 'image':
        print "[IMAGE]", x['data']['src']

示例：

http://jparser.duapp.com/

依赖：lxml

jparser 官网

https://github.com/fxsjy/jparser

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

相关推荐

MuPlayer 是一款跨平台、轻量级的音频播放解决方案，是百度@音乐前端团队开发维护的浏览端音频播放内核，它基于HTML5

作者：编程之家时间：2021-04-11

OS FLV 是一个开源和可嵌入网页的flv播放器。这个播放器拥有大量的选项可以通过嵌入代码进行设置.

作者：编程之家时间：2021-04-11

DewPlayer音乐播放器,样式很简单,而且很实用.播放器可以根据自己的喜好改变颜色,也算比较个性化吧.但唯一的不足就是只支持MP3格式的音乐。

作者：编程之家时间：2021-04-11

JW FLV MEDIA PLAYER是一个开源的在网页上使用的Flash视频、音频以及图片播放器，支持 Sliverlight

作者：编程之家时间：2021-04-11

Speakker 是一个基于 Web 浏览器的音乐播放器，只提供很多高级播放功能包括播放列表管理和分享。

作者：编程之家时间：2021-04-11

Player Framework

Player Framework 是一个开源的支持 HTML5 的视频播放器框架，同时也支持 Silverlight 和 Windows Phone

作者：编程之家时间：2021-04-11

Sewise Player是一款专业的免费网页视频、流播放器，它功能强大，体积小，跨平台，使用方便简洁、随心所欲：

作者：编程之家时间：2021-04-11

SoundManager 2 利用 HTML5 和 Flash 技术提供了稳定和阔平台的音乐播放功能，只有 10K 的 JS 包。

作者：编程之家时间：2021-04-11

xPlayer v1.0 特性: 文件大小 9.78kb; 可以自定义皮肤; 3.支持 http 和 rtmp 视频; 4.音量调节,全屏播放,拖拽播放;

作者：编程之家时间：2021-04-11

XPlayer豆瓣音乐播放器

XPlayer 豆瓣音乐播放器特点： 1.自动侦测Douban网页的歌曲 2.Douban网页关闭，歌曲能够继续播放

作者：编程之家时间：2021-04-11

小编推荐

苹果市值2025年有望达4万亿美元