微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 python 在大文件上应用翻译时获取“socket.timeout:读取操作超时”

如何解决使用 python 在大文件上应用翻译时获取“socket.timeout:读取操作超时”

我正在使用 google_trans_new 翻译英文。我有一个熊猫数据框,它有 1000 多行。当我应用翻译逻辑时,它会抛出“socket.timeout: The read operation timed out”错误。 在我的代码中,我定义了 socket.setdefaulttimeout 并且还在每个拆分中将数据帧拆分为 100 行,但我仍然遇到相同的错误

示例数据框

enter image description here

代码

from google_trans_new import google_translator
import socket
import numpy as np

socket.setdefaulttimeout(900)

exl_file = 'ipfile.xlsx'
df = pd.read_excel(exl_file)

translator = google_translator()

splitSize = 100
for g,df in df.groupby(np.arange(len(df)) // splitSize):
    print(df.shape)
    df['trans_val'] = df['value'].apply(lambda x: translator.translate(x,lang_tgt='en'))

错误

socket.timeout: _ssl.c:761:握手操作超时

您能否建议是否有更好的方法将翻译逻辑应用于大文件

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。