微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

怎样解析kafka

怎样解析kafka,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

一、什么是kafka?

        首先我们要明白kafka是在什么需求下产生的。随着近年来大数据的不断崛起,社交、搜索、商业活动等产生了巨大的数据量,我们面临的问题也随之而来。我们应该怎样收集这些巨大的信息量?我们能否及时的收集到这些数据?收集之后我们预备怎样处理?

        由这些问题产生了一种新的业务模型:生产者与消费者。数据的产生者被叫做生产者(用户、企业),数据的处理者叫做消费者(NoSQL,Hadoop,)。那么如何解决生产者与消费者之间的信息传递问题呢?kafka就是解决生产者与消费者之间信息传递的框架,实现了信息的无缝对接。

二、kafka的特点:

1、高产出的分布式消息系统

2、单个kafka服务每秒可处理数以千计客户端发来的几百MB数据。

3、一个单一集群可作为一个大数据处理中枢,集中处理各种类型业务。

4、消息被持久化到磁盘(可处理TB数据级别数据但仍保持极高数据处理效率),并且有备份容错机制

5、生产出的消息可立即被消费者消费

三、kafka的组件

1、Topics and Logs:消息存放的目录即主题,Kafka集群将每个topic将被分成多个partition(区),每一个partition都是一个有序的、不可变的消息序列,它在存储层面是以append log文件形式存在的。任何发布到此partition的消息都会被直接追加到log文件的尾部。每条消息在文件中的位置称为offset(偏移 量),offset为一个long型数字,它是唯一标记一条消息。

2、Producer:生产消息到topic的一方。Producer将消息发送的指定topic中,producer决定将消息发送到哪个partition中。

3、Consumer:订阅topic消费消息的一方。消息传递通常由两种模式,queuing(队列,每个Consumer从消息队列中取走一个消息)和publish-subscribe (发布-订阅,消息被广播到每个Consumer)

4、broker:Kafka集群包含一个或多个服务器

看完上述内容,你们掌握怎样解析kafka的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注编程之家行业资讯频道,感谢各位的阅读!

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐