大数据学习—Kafka的核心调优参数

随着大数据开发的发展，越来越多的人想要转行或者学习大数据开发这一块，工资和发展前景都让大家越来越看好。而kafka作为一个核心模块，是学习过程的一个要点知识，今天我们就一起来看一下关于Kafka的核心调优参数。

kafka的配置属性多达几百个，在生产环境中对kafka进行调优时，要如何设置Kafka的核心调优参数？在调优之前，我们要先分析业务场景，然后在吞吐量、延时、可靠性和可用性4个方面做权衡。

下面我们就从这四个方面来了解一下，从而逐一分析kafka应该设置哪些核心属性以及提供建议值。

1、吞吐量优先

吞吐量优先意味着需要尽可能提升每秒发送消息的吞吐量

常见场景：日志收集

压缩类型为什么选择lz4? 因为这种类型的压缩方式下，吞吐量最大。吞吐量优先时，会占用大量的网络带宽，如果不希望影响整个网络，可以设置配额。

2、低延时优先

低延是指producer开始发送消息到consumer接收到消息的时间差。低延时优先意味着每条消息需要尽可能快地完成端对端（从producer到consumer）的传递

常见场景：近实时数据的传输、聊天、视频弹幕等应用

3、可用性优先

提高可用性，就需要在kafka出现故障时，能够尽快地恢复。

acks对吞吐量、延时和可靠性的影响

1、可靠性优化

可靠性就是要降低丢失消息的概率。最常见的做法就是通过消息复制实现高可靠。

default.replication.factor和min.insync.replicas的区别 default.replication.factor是指分区的总的副本个数，min.insync.replicas是指ISR列表中最少的在线副本的个数（含leader）,当在线的副本个数小于min.insync.replicas时，生产者发送消息会失败。default.replication.factor=3，min.insync.replicas=2表示消息总共有3个副本，当在线的副本大于或者等于2时，生产者可以继续发送消息，能够容忍1个备份不可用，否则不能发送消息。

以上就是关于kafka的核心调优参数内容了，希望对大家能有所帮助。如果想了解更多详情，请点击成都加米谷大数据官网吧！

展开阅读全文

页面更新：2024-04-24

标签：在线核心参数数据吞吐量可用性生产者副本可靠性个数属性场景常见消息类型科技

1 2 3 4 5

大数据学习—Kafka的核心调优参数

大数据培训收费方式有哪些呢？三种方式要知道

深入解析大数据Hadoop中的HDFS

大数据改变着生活中的哪些东西？

学习大数据后，我们可以用在哪些地方？

什么样的人适合大数据开发？

Apple 推出最专业的 iPhone 13 Pro 和 iPhone 13 Pro Max

大数据行业中的女性职员

加米谷：从四个方面来解读大数据的发展

大数据开发培训学校怎么选择呢？

轻薄续航美颜全都要：小米Civi动手玩

最均衡的骁龙870手机：realme真我GT Neo2动手玩

直击2021苹果秋季发布会：Apple Watch Series 7发布售价399美元

做大数据行业需要具备的基础知识有哪些？

全新 iPad mini 动手玩：统一设计语言，但果冻屏现象存在

直击2021苹果秋季发布会：新 iPad 和有史以来变化最大的 iPad mini