技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

awk – 将日期时间附加到6亿行文件中每行的末尾

时间：2020-08-21分类：Linux作者：编程之家

我有一个6.8亿行(19gig)的文件,我需要在每一行上附加日期时间.我每晚都得到这个文件,我必须将处理它的时间添加到每行的末尾.我尝试了很多方法,包括sed / awk并将其加载到sql 数据库中,最后一列默认为当前时间戳.

我想知道是否有快速的方法来做到这一点？到目前为止,我最快的方法需要两个小时,考虑到此文件中信息的紧迫性,这个方法还不够快.这是一个平面的CSV文件.

EDIT1：

这是我到目前为止所做的：

awk -v date="$(date +"%Y-%m-%d %r")" '{ print $0","date}' lrn.ae.txt > testoutput.txt

时间= 117分钟

perl -ne 'chomp; printf "%s.pdf\n",$_' EXPORT.txt > testoutput.txt

时间= 135分钟

MysqL load data local infile '/tmp/input.txt' into table testoutput

时间= 211分钟

解决方法

一个简化 mjuarez’ helpful approach的解决方案：

yes "$(date +"%Y-%m-%d %r")" | paste -d',' file - | head -n "$(wc -l < file)" > out-file

请注意,与链接答案中的方法一样,您必须事先知道输入行的数量 – 这里我使用wc -l来计算它们,但如果数字是固定的,只需使用该固定数字.

> yes不断重复其参数,每个参数都在其自己的输出行上,直到它被终止.> paste -d’,’file – 在单个输出行上粘贴文件和标准输入( – )中相应的一对行,用以下内容分隔,>因为yes产生“无限”输出,所以head -n“$(wc -l< file)”确保一旦处理完所有输入行就停止处理. 管道的使用充当了内存限制,因此内存不足是一个问题.

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：linux – 打开RDB文件失败…只读文下一篇：在Antergos Linux上找不到“OPENSS

相关推荐

Linux ARP防火墙如何设置

在Linux系统中，设置ARP防火墙可以通过多种方法实现，包括使用iptables、firewalld或特定的工具如arpwatch和arpbind。以下是详细的设置步骤和工具推荐：### 使用i...

作者：编程之家时间：2024-10-10

Linux Jack2怎样编译更快

在Linux环境下，使用Jack2进行编译时，可以采取以下策略来提高编译速度：1. **使用多线程编译**： - 利用GNU Make的并行编译功能。在运行`make`命令时，可以通过添加...

作者：编程之家时间：2024-10-10

Linux Getid准确度高吗

`getid`命令在Linux系统中用于获取当前进程的有效用户ID（EUID），它通常用于确定当前进程的所有者。关于其准确度，我们可以从以下几个方面进行分析：### 准确度分析- **功能实现...

作者：编程之家时间：2024-10-10

Linux Codesign如何操作

在Linux环境下，codesign工具用于对代码进行签名，以确保其完整性和来源的可信性。以下是使用codesign工具进行操作的基本步骤：1. **安装codesign**： - 如果尚...

作者：编程之家时间：2024-10-10

Linux Transform功能强大吗

Linux中的`tr`命令，其英文全称是“transform”，即转换的意思。它是一个非常实用的文本处理工具，功能强大，主要用于字符转换、压缩和删除操作。以下是关于`tr`命令的相关信息：### ...

作者：编程之家时间：2024-10-10

Linux ARP防火墙如何有效

Linux中的ARP防火墙是一种用于防止ARP欺骗攻击的安全措施，它通过监控和过滤ARP请求和响应来保护网络。以下是Linux ARP防火墙的有效性及其配置方法：### Linux ARP防火墙的...

作者：编程之家时间：2024-10-10

Linux Getid如何精准识别

在Linux中，`getpid()`函数是用于获取当前进程的ID号。如果你想要精准地识别一个进程，使用`getpid()`是一个很好的选择。下面是一个简单的示例代码，展示了如何使用`getpid(...

作者：编程之家时间：2024-10-10

Linux Jack2性能优异吗

Linux Jack2的性能是否优异，取决于多个因素，包括使用场景、硬件配置、系统优化等。Jack2是一个开源的音频服务器和通信框架，它可以在Linux和其他类Unix操作系统上运行。它被广泛用于...

作者：编程之家时间：2024-10-10

Linux Transform有哪些应用场景

Linux中的`tr`命令，其英文全称是“transform”，主要用于字符转换、压缩和删除操作。以下是一些具体的应用场景：- **字符替换**：将文件中的小写字母替换为大写字母。- **删除字...

作者：编程之家时间：2024-10-10

Linux ARP防火墙好用吗

Linux下有多种ARP防火墙工具，它们各有特点，但通常都具备一定的易用性。以下是一些推荐的Linux ARP防火墙工具：- **服务器安全狗Linux版**：专为Linux服务器设计，集成了DD...

作者：编程之家时间：2024-10-10

小编推荐

苹果市值2025年有望达4万亿美元