text-parsing - 编程之家

我已经用 PHP为自己制定了这个解决方案,但我很好奇,它可以做得如何不同 – 甚至更好.我主要感兴趣的两种语言是PHP和 Javascript,但我有兴趣看到今天可以用其他任何主要语言(多数是C#,Java等)来完成这些工作. >只返回发生大于X的字 >只返回长度大于Y的字 >忽略常用术语,如“和,是,等等” >在处理之前,请随意删除标点符号(即“约翰的”成为“约翰”) >返回结果集合/数组额外

将文本文件中隐藏格式的数据导入R

从一个可恶的当地政府网站下载了一堆数据.有77,000个项目条目看起来与以下内容完全相同,包含在纯文本文件中.我需要将这堆粪便导入R作为数据框： Instrument: 201301240005447 Recorded: 01/24/2013 Consideration: $150,125.00 Document Type: MORTGAGES Pages: 17 Grantor: BYRES,

在Haskell中高效地解析ASCII文件

我想在 Haskell中重新实现一些我的ASCII解析器,因为我以为我可以获得一些速度.然而,即使一个简单的“grep和count”比 Python的一个恶作剧慢得多. 有人可以解释一下为什么以及如何正确执行？所以任务是计算以字符串“foo”开头的行. 我的基本Python实现： with open("foo.txt", 'r') as f: print len([line for li

php – 搜索引擎关键词解析器

这是我想要做的：我需要创建一个使用以下运算符的搜索引擎解析器： >苹果和橘子(AND操作符) >苹果或橘子(OR操作符) >苹果而不是橘子(AND NOT操作符) >“苹果”(行情操作符) >苹果和(橘子或梨)(圆括号运算符) > Appl *(明星操作符) 使用一些preg_replace,我设法将字符串转换为数组,然后解析此数组以获取MySQL查询. 但我不喜欢这种方式而且非常不稳定！我在

sql-server – 如何解析字符串并从中创建多个列？

我有一个包含名称值对的varchar(max)字段,在每行中我都有名称UnderScore Value. 我需要对它进行查询,以便它返回两列中的Name,Value对(因此通过解析文本,删除下划线和“new line”char. 所以从此 select NameValue from Table 我在哪里得到这个文字： Name1_Value1 Name2_Value2 Name3_Value3 我