如何读取 urllib3 下载的 .net 文件? 更新

如何解决如何读取 urllib3 下载的 .net 文件? 更新

我正在使用 airports.net 从 github 下载文件 urllib3,并使用 networkx.read_pajek 将其作为图形对象读取,如下所示:

import urllib3
import networkx as nx


http = urllib3.PoolManager()
url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
f = http.request('GET',url)
G = nx.read_pajek(f.data(),encoding = 'UTF-8')
print(G)

然后有错误

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-16-7728c1228755> in <module>
     13 url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
     14 f = http.request('GET',url)
---> 15 G = nx.read_pajek(f.data(),encoding = 'UTF-8')
     16 print(G)
     17 

TypeError: 'bytes' object is not callable

能否请您详细说明如何做到这一点?

更新:如果我将 f.data() 更改为 f.data,则会出现一个新错误

/usr/local/lib/python3.6/dist-packages/urllib3/connectionpool.py:847: InsecureRequestWarning: Unverified HTTPS request is being made. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
  InsecureRequestWarning)
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-2-e96ad6eb1bfb> in <module>()
      6 url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
      7 f = http.request('GET',url)
----> 8 G = nx.read_pajek(f.data,encoding = 'UTF-8')
      9 print(G)

<decorator-gen-781> in read_pajek(path,encoding)

4 frames
/usr/local/lib/python3.6/dist-packages/networkx/readwrite/pajek.py in <genexpr>(.0)
    159     for format information.
    160     """
--> 161     lines = (line.decode(encoding) for line in path)
    162     return parse_pajek(lines)
    163 

AttributeError: 'int' object has no attribute 'decode'

解决方法

从错误消息中可以推断出,也可以在 the docs 中读取,HTTPResponse.databytes 类型的属性而不是方法。因此,您需要 f.data 而不是 f.data() 才能检索该值。

更新

关于 AttributeError:正如可以在 network docs 中验证的那样,函数 read_pajek 期望它的第一个参数是包含数据的文件的路径,而不是实际数据。因此,您可以将字节转储到文件中,然后将该文件的路径作为参数传递。有几个选项:

  1. 只需使用硬编码的文件名。这可以说是最简单的,不需要额外的导入。
import urllib3
import networkx as nx

FILE_NAME = "/tmp/test.net"

http = urllib3.PoolManager()
url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
f = http.request('GET',url)

with open(FILE_NAME,"w") as fh:
    fh.write(f.data.decode())

G = nx.read_pajek(FILE_NAME,encoding='UTF-8')
print(f"G='{G}',G.size={G.size()}")
  1. 使用 tempfile 标准库模块为您管理文件(即给它一个随机名称,然后在不再使用后将其删除)。
import tempfile

import urllib3
import networkx as nx

http = urllib3.PoolManager()
url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
f = http.request('GET',url)

with tempfile.NamedTemporaryFile() as fh:
    fh.write(f.data)
    G = nx.read_pajek(fh.name,encoding='UTF-8')

print(f"G='{G}',G.size={G.size()}")
  1. 使用 io.BytesIOio.StringIO(“内存文件”)。这会创建一个对象,该对象存储在内存 (RAM) 中,但具有类似于存储在磁盘上的常规文件的 API。访问存储在 RAM 中的内容要(快得多!)快得多,因此出于性能原因,这很有用。当然,您不能总是使用它,因为您只有这么多 RAM,但在您的特定情况下,您已经在内存中拥有数据,因此将其转储到磁盘将是巨大的浪费时间,只是为了让 networkx 将其读回内存。虽然在您的特定情况下,您可能不会注意到差异,因为您似乎只下载了 1 个不太大的文件一次,但也许将来会派上用场。
import io

import urllib3
import networkx as nx

http = urllib3.PoolManager()
url = 'https://raw.githubusercontent.com/leanhdung1994/WebMining/main/airports.net'
f = http.request('GET',url)

data = io.BytesIO(f.data)

G = nx.read_pajek(data,encoding = 'UTF-8')
print(f"G='{G}',G.size={G.size()}")

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)&gt; insert overwrite table dwd_trade_cart_add_inc &gt; select data.id, &gt; data.user_id, &gt; data.course_id, &gt; date_format(
错误1 hive (edu)&gt; insert into huanhuan values(1,&#39;haoge&#39;); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive&gt; show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 &lt;configuration&gt; &lt;property&gt; &lt;name&gt;yarn.nodemanager.res