如何解决Python中的split\'\\\\ n\'方法如何实现?
| 这是一个理论问题,可以理解Java和Python之间的差异。 要将文件的内容读入Java数组中,需要知道行数,以便在声明数组时定义数组的大小。而且由于您无法事先知道它,因此您需要应用一些技巧来克服该问题。 但是在Python中,列表可以是任意大小,因此可以通过以下方式将文件内容读入列表:lines = open(\'filename\').read().split(\'\\n\')
要么
lines = open(\'filename\').readlines()
在这种情况下,split(\'\\ n \')如何工作? Python实现是否还在下面执行某种技巧(例如在需要时将数组的大小加倍等等)?
对此有任何启发的信息将不胜感激。
解决方法
str.split()
的实现内部调用list.append()
,后者又调用内部函数list_resize()
。从此函数的源代码中的注释:
这与列表大小成比例地过度分配,从而留出了空间
以获得额外的增长。过度分配是轻微的,但是
足以长期提供线性时间摊销行为
在表现不佳的情况下的appends()序列
系统realloc()。
增长模式是:0、4、8、16、25、35、46、58、72、88,...
,如果您正在寻找实现它的实际代码,请尝试以下操作:
http://svn.python.org/view/python/trunk/Objects/stringlib/split.h?view=markup
对于“基本”拆分,请开始查看第148行。
简短摘要:他们在字符串中循环查找定义的拆分字符,然后使用\“ PyList_Append \”将最后一个查找和当前查找之间的字符串(或第一种情况的字符串开头)添加到输出元组。最后,他们将字符串的其余部分添加到元组。
它们具有占位符,可以在结果元组达到当前最大大小时为其分配更多空间,并具有用于检查单个拆分字符与另一个拆分字符串的独立函数(即,如果要在\'/ t \'上拆分)您可以通过一个单独的功能将其设置为两个字符)。
,我认为(尽管我没有重新检查代码)split()方法计算字符串中换行的数量,然后分配一个正确大小的列表。
但是,所有Python列表都具有总体分布,因此重复地附加到它们上面就是摊销的线性时间。
,您可以检查1)http://svn.python.org/view/python/trunk/Objects/listobject.c?view=markup
2)http://svn.python.org/view/python/trunk/Include/listobject.h?view=markup
简而言之,Java:矢量:: Python:列表
,split( [sep [,maxsplit]])
使用sep作为分隔符字符串,返回字符串中单词的列表。如果给出maxsplit,则最多完成maxsplit分割。 (因此,列表最多包含maxsplit + 1个元素)。如果未指定maxsplit,则分割数没有限制(进行所有可能的分割)。连续定界符未分组在一起,因此被视为定界空字符串(例如
\'1„2\'.split(\',\')
返回[\'1\',\'\',\'2\']
。
sep参数可以包含多个字符
例如,
\'1,2,3\'.split(\',\'2\',\'3\']
。
使用指定的分隔符分割空字符串将返回[\'\']
。
docs.python.org
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。