我正在为一个爬虫编写一组类,它抓取一个起始页,根据参数拉出三个链接(使用Simple
Html Dom Parser找到允许使用类似选择器的jquery),抓取这些页面,然后转到第2页,选择接下来3页.当前最大页面是57次.
不用说我得到了:
允许的内存大小为50331648字节耗尽错误消息.
为了让你知道,在拉入第一页的内容后,我运行了一个go()函数,它连续地拉入页面,直到达到$this-> maxpages.我想我可以在实例化类时运行循环,但这会有所帮助.
您可以调整内存限制:
ini_set('memory_limit','128M');
但我会尝试让脚本使用更少的内存.确保您释放不再需要存在的任何内容的数据/引用.
memory_get_usage()可用于调试内存使用量累积的位置.
原文地址:https://www.jb51.cc/php/138975.html
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。