如何将单词列表读入包含单词位置的元组?

如何解决如何将单词列表读入包含单词位置的元组?

我有一个文本文件,我想编写一个函数来读取这个文件并返回一个元组列表,其中每个元组将包含作为字符串的单词、作为 int 的单词行号以及单词的最后一个字符为 int。样本输入,

example of the first line         
followed by the second line

示例输出:

[
  ("example",1,8);
  ("of",11);
  ("the",15);
  ("first",21);
  ("line",26);
  ("followed",2,13);
  ("by",16);
  ("the",20);
  ("second",27);
  ("line",32)
]

解决方法

你正在寻找的函数看起来像这样,

let read filename =
  In_channel.read_lines filename |>
  List.mapi ~f:(fun line data ->
      String.split data ~on:' ' |>
      List.fold_map ~init:0 ~f:(fun pos word ->
          let pos = pos + String.length word in
          pos+1,(word,line+1,pos-1)) |>
      snd) |>
  List.concat

这是如何使用它。先安装依赖,

opam install dune stdio merlin

接下来,设置您的项目,

dune init exe readlines --libs=base,stdio

然后在您喜欢的编辑器中打开 readlines.ml 并将其内容替换为以下内容,

open Base
open Stdio

let read filename =
  In_channel.read_lines filename |>
  List.mapi ~f:(fun line data ->
      String.split data ~on:' ' |>
      List.fold_map ~init:0 ~f:(fun pos word ->
          let pos = pos + String.length word in
          pos+1,pos-1)) |>
      snd) |>
  List.concat

let print =
  List.iter ~f:(fun (line,data,pos) ->
      printf "(%s,%d,%d)\n" line data pos)

let main filename =
  print (read filename)

let () = match Sys.get_argv () with
  | [|_; filename|] -> main filename
  | _ -> failwith "expects one argument: filename"

要运行和测试,请创建一个示例输入,例如一个名为 test.txt

的文件
example of the first line
followed by the second line

(确保最后一行后跟一个换行符)

现在你可以运行它了,

dune exec ./readlines.exe test.txt

结果应该如下,

(example,1,6)
(of,9)
(the,13)
(first,19)
(line,24)
(followed,2,7)
(by,10)
(the,14)
(second,21)
(line,26)

(注意,我是从 0 而非 1 开始计算位置)。

您也可以在 utop 中以交互方式运行此代码,但您需要安装 basestdio 并将它们加载到解释器中,使用

#require "base";;
#require "stdio";;

如果您使用的不是 utop 而是默认的 OCaml 顶层,您还需要安装 ocamlfind (opam install ocamlfind) 并执行

#use "topfind";;
#require "base";;
#require "stdio";;
,

如果您只想将标准库用作字符串,您可以使用 class Product extends Model { /** * The product point of contact (which is an user). */ public function pointOfContact() { return $this->belongsToMany(User::class,'product_point_of_contact'); } } 以及在每一行上应用的其他一些东西来做您想做的事情。
这是一个关于如何处理第一留置权的例子

String.split_on_char

正如 ivg 所说,你可以用 let ic = open_in (*your file name*) in let first_line = input_line ic in let words = String.split_on_char ' ' first_line in let rec aux accLen = function | [] -> [] | s :: ts -> match s with (* empty string means that their were a white space before the split *) | "" -> aux (accLen +1) ts | s -> let l = accLen + String.length s in (1,s,l) :: aux l ts in aux 0 words;; 替换 aux 函数:

List.fold_left
,

不包括文件 I/O 组件,但可以正确处理单词之间的多个空格,包括制表符。一些有趣的 .equals() 用法来娱乐新的 OCaml 程序员。

fold_left

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)> insert overwrite table dwd_trade_cart_add_inc > select data.id, > data.user_id, > data.course_id, > date_format(
错误1 hive (edu)> insert into huanhuan values(1,'haoge'); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive> show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 <configuration> <property> <name>yarn.nodemanager.res