tagparser Python的HTML文档解析

程序名称：tagparser

授权协议: MIT

操作系统: 跨平台

开发语言: Python

tagparser 介绍

很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具. 正则表达式方法速度快,缺点是不好找到匹配的正则.
其他类似beautiful的工具因为要全面分析html,而html不像xml那么严格,语法比较复杂所以效率很糟糕.这个工具就是为了处里这种问题的.

这个工程只有一个文件 .tagparser.py 它可以方便分析像xml html 等这种标记语言. 只要他是’<’和’>’括起来的标记语言.

分析的方式是’抽’式的.也就是说扫描一个个字符当遇到一个tag时也就是遇到一个<>的时候,回调一个函数onGetTag()
,可以重载这个函数做自己的处理.

如遇到

回调 onGetTag(tagstr, tagstro). tagstr = p tagstro = P tagstr 是小写的tag
tagstro是源文件的大小写状态

遇到内容回调 onGetTxt(txtstr) , txtstr是如:<tag>xxxxxxxxx</tag> xxxxx即内容

使用例子,提取网易新闻页的主要内容,新闻标题,内容主体: 例如:

p = TagParser()  
p.fetchUrl('http://news.163.com/09/0117/04/4VR79MP60001124J.html')  
p.printResult()

输出一个网页的新闻.

tagparser 官网

http://code.google.com/p/tagparser/

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

相关推荐

MuPlayer 是一款跨平台、轻量级的音频播放解决方案，是百度@音乐前端团队开发维护的浏览端音频播放内核，它基于HTML5

OS FLV 是一个开源和可嵌入网页的flv播放器。这个播放器拥有大量的选项可以通过嵌入代码进行设置.

DewPlayer音乐播放器,样式很简单,而且很实用.播放器可以根据自己的喜好改变颜色,也算比较个性化吧.但唯一的不足就是只支持MP3格式的音乐。

JW FLV MEDIA PLAYER是一个开源的在网页上使用的Flash视频、音频以及图片播放器，支持 Sliverlight

Speakker 是一个基于 Web 浏览器的音乐播放器，只提供很多高级播放功能包括播放列表管理和分享。

Player Framework

Player Framework 是一个开源的支持 HTML5 的视频播放器框架，同时也支持 Silverlight 和 Windows Phone

Sewise Player是一款专业的免费网页视频、流播放器，它功能强大，体积小，跨平台，使用方便简洁、随心所欲：

SoundManager 2 利用 HTML5 和 Flash 技术提供了稳定和阔平台的音乐播放功能，只有 10K 的 JS 包。

xPlayer v1.0 特性: 文件大小 9.78kb; 可以自定义皮肤; 3.支持 http 和 rtmp 视频; 4.音量调节,全屏播放,拖拽播放;

XPlayer豆瓣音乐播放器

XPlayer 豆瓣音乐播放器特点： 1.自动侦测Douban网页的歌曲 2.Douban网页关闭，歌曲能够继续播放

歌词插件最新更新，扩展性能稍微有点提升了，不多说了，更多敬请查看首页http://luochunzong.sinaapp.com/?p=84

ABPlayerHTML5是一个在HTML5下的弹幕播放器（同步显示视频于评论）实现。类似功能的播放器可以参考基于Flash的MukioPlayer和PADPlayer。

AudioPlayer.js 是一个 jQuery 的插件，实现了 HTML5 的音乐播放器，无需任何图片，实现了响应式布局，支持触摸操作。

看个片儿不发烫

替换中国大陆主流视频网站的 Flash 播放器为 HTML5 播放器使用 Mac 的同学都可能碰到过在线看视频引起机子风扇狂转、机身发烫等情况，这是因为 Flash 占用了过多系统资源的缘故。

AetherPlayer 是一个类CD的轻量HTML5播放器，特别适合博客及个人站点使用。它漂亮得不像……咳，这边吹牛的话就不说了。

SmarterStreaming

专注、极致、智慧，国内外为数不多不依赖开源框架、跨平台(windows/android/iOS)、公网推送(支持rtmp)-播放(支持rtmp/rtsp)业界真正靠谱的超低延迟。

node-kugou-client

node-kugou-client 是 Node.js 酷狗客户端。安装 npm install node-kugou-client 使用 var kugou = require(\"node-kugou-client\");

Youku-HTML5-Player Youku HTML5 播放器扩展 —— 告别 flash 和广告

Youku HTML5 播放器扩展 —— 告别 flash 和广告关于官方内测 html5 播放器 Firefox ( xpi 直接安装) ( firefox 50.0+)

Chimee 由奇舞团研制的 h5 播放器，它支持 mp4、m3u8、flv 等多种格式。通过插件式开发，能满足业务方快速迭代、灰度发布等要求。让开发者能够轻松快捷地完成视频场景的开发。

OneVideo是一款基于OneBase+UniApp开发的小视频播放移动应用。

分类导航

热门文章

最新文章