如何解决获取添加到文件中的字符列表
我有一个原始文件,另一个包含一些额外的字符。我正在寻找添加到此文件的字符列表。我尝试使用difflib,但由于在字符的中间可以插入字符,所以出现错误。
import difflib
with open('file1') as f1:
f1_text = f1.read()
with open('file2') as f2:
f2_text = f2.read()
differ = difflib.Differ()
diffs = list(differ.compare(f1_text,f2_text))
lines = list(diffs)
removed = [line[1:] for line in lines if line[0] == '-']
f = open("results","a")
f.write(''.join(removed))
File1
Lorem ipsum dolor坐在amet,私服adidascing精英,sed do 临时劳动者和劳动者联合会Ut Enim广告 最小veniam,quis nostrud锻炼ullamco labisnis ut aliquip ex ea commodo结果。 Duis aute irure dolor in 在深情的天鹅绒中重新演绎 壁画准圣人occaecat cupidatat非偶然的,在 尽职调查罪魁祸首。
File2
LRorFem ipsum docdlor坐在avcvcmet,consigect5tur adiFbpiscing精英,sed做 临时劳动者和劳动者联合会Ut Enim广告 最小veniam,quis nostrud锻炼ullamco labisnis ut aliquip ex ea commodo cocdnseqduat。 Duis aute irure dolor in 在深情的天鹅绒中重新演绎 壁画准圣人occaecat cupidatat非偶然的,在 尽职调查罪魁祸首。
结果
R f c d c v c m t c o n s G e c t e 5 t r a d F p i s c i n g g l i t,s d d e i u's m o d t e m p o n c i d i n d u n t u t
l a b o r e t t o l o r e a ma g a a。曼联 我是一个男的,我是个男的,我是个男的 l a m c o l a b o r i s i i t a l i q u i p e x e a
预期结果: RFdcvcvcG5Fbcdd
解决方法
您只需要一次遍历每个文件一个字符
result = []
with open('file1') as file1,open('file2') as file2:
ch1,ch2 = file1.read(1),file2.read(1)
while ch1 and ch2:
if ch1 == ch2:
ch1,file2.read(1)
else:
result.append(ch2)
ch2 = file2.read(1)
print(result)
['R','F','c','d','v','G','5','b','d']
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。