AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

logstash日志收集走过的坑

时间：2022-09-04分类：Kafka作者：编程之家原文地址

问题1：OOM内存溢出

背景介绍，通常对logstash的应用，是logstash日志收集日志然后写入到kafka，因为logstash本身是插件化，所以就会应用到kafka-output-plugin，该插件直接调用的kafka-client的包。

回归正题，什么时候回出现OOM呢，当单条日志大于1M时，此时kafka-client源码中会拒绝该日志的接收，logstash在向kafka发送日志时，如果发送不成功，会继续重试(可以通过修改配置文件调整重试次数)。

解决办法：日志规范的修改，或者将大于1M的日志过滤掉。

问题2：日志收集慢，占用cpu或内存高

这个问题对于logstash本身采用Jruby语言编写有关，当然如果你安装的logstash是6之前的版本。那么其性能本身会差很多。如果采用6以后的版本，无论吞吐率，还是cpu和内存消耗，都会好很多（采用异步队列）

问题3：日志重复收集

情况1：当采用logstash-5.4.3版本，但输入插件升级到最新版本时，在rotation的时候回重复收集数据。

情况2：input插件采用老版本时，由于sincedb保存文件的时候是通过inode标识的。新版的是通过inode及文件路径+名的形式记录，不会重复。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

kafka分区分配策略

# 前言现有主流消息中间件都是生产者-消费者模型，主要角色都是：Producer -> Broker -> Consumer，上手起来非常简单，但仍有需要知识点需要我们关注，才能避免一些错误的使用情况，或者使用起来更加...

作者：jtea 时间：2024-09-24

Kafka报错：Exception in thread “main“ joptsimple.UnrecognizedOptionException: zookeeper is not a recogn

错误的根源是：kafka版本过高所致，2.2+=的版本，已经不需要依赖zookeeper来创建/查看topic，新版本使用--bootstrap-server替换老版本的--zookeeper-server，即可解决。

作者：血煞长虹时间：2022-12-20

湖仓一体电商项目十九：业务实现之编写写入DWS层业务代码

DWS层主要是存放大宽表数据，此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBase中“ODS_PRODUCT_CATEGORY”商品分类表与“ODS_PRODUCT_INFO”商品表维度数据获取浏览商...

作者：Lansonli 时间：2022-12-19

Springboot 配置使用 Kafka

不多BB讲原理，只教你怎么用，看了全网没有比我更详细的了，yml 配置，Config 工厂代码配置都有，batch-size、acks、offset、auto-commit、trusted-packages、poll-timeout、linger 应有尽有，批量消费、开启事务、定...

作者：繁华尽头满是殇时间：2022-12-19

【Kafka从成神到升仙系列五】面试官问我 Kafka 生产者的网络架构，我直接开始从源码背起.......

终于写完了，其实最开始学kafka的时候是今年2月份，那时候还不懂什么是IO，看源码的通信基本看不懂后来，花了几个月的时间学了操作系统 --> 计算机网络 --> Linux 通信 --> Java NIO --> Netty，现在看K...

作者：爱敲代码的小黄时间：2022-12-19

Greenplum GPKafka【实践 01】使用GPKafka实现Kafka数据导入Greenplum数据库踩坑问题记录不断更新ing

使用GPKafka实现Kafka数据导入Greenplum数据库踩坑问题记录（不断更新ing）

作者：シ風箏时间：2022-12-19

uni-app 超详细教程一从菜鸟到大佬

uniapp 超详细教程（从菜鸟到大佬）

作者：邢帥兵_ 时间：2022-12-06

Flink最全面教程(自己总结的)

用了100+天总结出来的Flink学习笔记

作者：Moleft 时间：2022-12-06

通过java方式使用Kafka

基于Java API方式使用Kafka

作者：李大寶时间：2022-12-06

【Kafka从成神到升仙系列四】你真的了解 Kafka 的缓存池机制嘛

本章我们讲述了Kafka生产端为了避免频繁的GC，创建了缓存池的机制当生产端申请的内存为16KB时，从缓存池中取缓存使用，非16KB则取不可复用的ByteBuffer使用我们在生产中要尽量避免不可复用的ByteBuffer的产生，根据当...

作者：爱敲代码的小黄时间：2022-11-25