首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Kafka实战宝典:如何跨机房传输数据

工作遇到Kafka跨机房传输到远程机房场景,之前方案是使用Flume消费后转发到目标kafka,当topic增多并且数据量变大后,维护性较差且Flume较耗费资源。...一、原理 参考官网:http://kafka.apache.org/10/documentation.html#basic_ops_mirror_maker 参考:https://www.sohu.com...建议: 建议启动多个kafak-mirror-maker.sh 进程来完成数据同步,这样就算有进程挂掉,topic同组消费者可以进行reblance; 建议将kafka-mirror-maker.sh...; 二、使用和配置 消费端配置(consumer.properties) 生产环境source kafka版本是0.10,使用zk指定集群地址,配置方式如下: ‍zookeeper.connect=zk1...) 配置mirror-makersource集群和target集群版本多不一致,当前生产使用kafka版本是1.0.0版本,producer配置如下: bootstrap.servers = 192.168

2.9K40

Kafka 宣布弃用 Java 8。。

Maker 2 configuration and deprecation of Mirror Maker 1 Ability to restart a connector's tasks on a...Java 8 虽然有点老了,但依然是现在市场上用最多版本,虽然有些中间件不再支持 Java 8 了,但实际开发工作并不受影响,Java 8+ 系列教程也写了一堆了,关注公众号Java技术栈在菜单栏中进行阅读吧...Kafka 目前支持 Java 版本如下: 从官网看,Kafka 目前支持两个 LTS 版本( Java 8 和 Java 11) 如果启用 TLS,那么 Java 11 性能将得到显著提升,所以官方也强烈推荐大家使用...,建议使用较为新一点安全版本,防止老版本安全漏洞。...2.8.0) Kafka 就宣布替换  Zookeeper 了: 不过到现在还不是很成熟,目前还不建议用在生产环境,官方也只是建议在开发环境进行试用。

78430
您找到你想要的搜索结果了吗?
是的
没有找到

不惧流量持续上涨,BIGO 借助 Flink 与 Pulsar 打造实时消息系统

Kafka broker 磁盘故障 / 空间占用率过高时,需要进行人工干预。 集群跨区域同步使用 KMM(Kafka Mirror Maker),性能和稳定性难以达到预期。...为了进一步加深对 Apache Pulsar 理解,衡量 Pulsar 能否真正满足我们生产环境大规模消息 Pub-Sub 需求,我们从 2019 年 12 月开始进行了一系列压测工作。...经过 3~4 个月压测和调优,我们认为 Pulsar 完全能够解决我们使用 Kafka 时遇到各种问题,并于 2020 年 4 月在测试环境上线 Pulsar。...3Apache Pulsar at BIGO:Pub-Sub 消费模式 2020 年 5 月,我们正式在生产环境使用 Pulsar 集群。...Pulsar 在 BIGO 场景主要是 Pub-Sub 经典生产消费模式,前端有 Baina 服务(用 C++ 实现数据接收服务),Kafka Mirror Maker 和 Flink,以及其他语言如

68250

使用Flink 与 Pulsar 打造实时消息系统

3、当 Kafka broker 磁盘故障/空间占用率过高时,需要进行人工干预。 4、集群跨区域同步使用 KMM(Kafka Mirror Maker),性能和稳定性难以达到预期。...为了进一步加深对 Apache Pulsar 理解,衡量 Pulsar 能否真正满足我们生产环境大规模消息 Pub-Sub 需求,我们从 2019 年 12 月开始进行了一系列压测工作。...由于我们使用是机械硬盘,没有 SSD,在压测过程遇到了一些性能问题,在 StreamNative 协助下,我们分别和 进行了一系列调优,Pulsar 吞吐和稳定性均有所提高。...Apache Pulsar at BIGO:Pub-Sub 消费模式 2020 年 5 月,我们正式在生产环境使用 Pulsar 集群。...Pulsar 在 BIGO 场景主要是 Pub-Sub 经典生产消费模式,前端有 Baina 服务(用 C++ 实现数据接收服务),Kafka Mirror Maker 和 Flink,以及其他语言如

1.2K20

kafka:MirrorMaker-V1(MM1)到MirrorMaker-V2(MM2)

0 回顾MM1 在上篇文章我们介绍了MirrorMaker-V1(MM1),本质上MM1是Kafka消费者和生产者结合体,可以有效地将数据从源群集移动到目标群集,但没有提供太多其他功能。...虽然官方提供了4部署方式: 专用MirrorMaker集群运行 单机MirrorMaker运行 在connect cluster上运行 以MM1方式运行 本来cosmozhu准备使用第三方式运行MM2...MM2启动脚本是connect-mirror-maker.sh,从名称上来看connect开头,很明显这块是纳入到了kafka-connect框架。...它启动配置文件为config/connect-mirror-maker.properties MM2配置详解 以最新版本kafka2.5为例。...数量设置 MM2启动命令 bin/connect-mirror-maker.sh config/connect-mirror-maker.properties 参考资料: https://cwiki.apache.org

2.3K30

kafka:MirrorMaker-V1(MM1)到MirrorMaker-V2(MM2)

回顾MM1 在上篇文章我们介绍了MirrorMaker-V1(MM1),本质上MM1是Kafka消费者和生产者结合体,可以有效地将数据从源群集移动到目标群集,但没有提供太多其他功能。...官方提供了4部署方式: 专用MirrorMaker集群运行 单机MirrorMaker运行 在connect cluster上运行 以MM1方式运行 本来cosmozhu准备使用第三方式运行MM2集群...MM2启动脚本是connect-mirror-maker.sh,从名称上来看connect开头,很明显这块是纳入到了kafka-connect框架。...它启动配置文件为config/connect-mirror-maker.properties MM2配置详解 以最新版本kafka2.5为例。...数量设置 MM2启动命令 bin/connect-mirror-maker.sh config/connect-mirror-maker.properties 参考资料: https://cwiki.apache.org

2K100

FAQ系列之Kafka

获取有关可以在 Kafka Java 代码调用哪些功能更多信息最佳方法是查看 Java 文档。并且仔细阅读! 如果关心性能和稳定性,最好 Kafka 记录大小是多少?...这也是使用kafka-consumer-groups命令行工具完成。这通常是一种管理功能,用于绕过损坏记录、数据丢失或从代理或主机故障恢复。...此外,请考虑以下事项: Cloudera 建议对 Mirror Maker 使用“拉”模型,这意味着写入目标的 Mirror Maker 实例正在目标集群“附近”主机上运行。...我们有两篇关于在 Flume 中使用 Kafka 博文: 原帖:Flafka:Apache Flume 遇到 Apache Kafka 进行事件处理 CDH 5.8/Apache Kafka 0.9.../Apache Flume 1.7 此更新版本:Cloudera Enterprise 5.8 新功能:Flafka 对实时数据摄取改进 如何构建使用来自 Kafka 数据 Spark 流应用程序

94830

Kafka基本概念与安装指南(单机+集群同步)

不过在kafka使用还是遇到一些问题,比如mirrormaker莫名其妙丢失数据[原因稍后再说],消费数据offset错乱[之后介绍spark streaming时候再解释] 总之,还是遇到了不少问题...本篇就从下面几个方面介绍一下kafka: 基本介绍 安装与helloworld producer consumer mirror maker跨集群同步 控制台 基本介绍 Kafka是一款分布式消息队列框架...安装与hello world 按照官方文档步骤,是最快入门方式: 下载安装包 去官方下载地址下载安装包,并参照对应版本文档即可,下载后执行下面的命令: > tar -xzf kafka_2.11...maker 如果公司有云环境,可能还涉及到多个集群环境数据同步。...主要用到了kafka-run-class.sh,kafka-mirror-maker.sh脚本其实就是对它一层封装: exec $(dirname $0)/kafka-run-class.sh kafka.tools.MirrorMaker

895100

独家分享:Kafka集群间信息复制攻略来了!

导读:Kafka 是最广泛使用大数据消息分发组件,由于各种原因,大部分 Kafka 用户都在不同环境下保有多个集群,而数据整合分析需求又要求这些集群数据可以汇聚到一起。...基于地理位置场景 跨国跨地域公司由于性能,法规等要求,在业务所在地创建了 Kafka 集群对当地业务数据进行收集和处理。...创建 Kafka 原集群和目标集群,并确保网络互连互通 – 这里 Kafka 可以是自建集群也可以是托管版本 CKafka 集群。 2.    ...在配置好之后,用下面的命令(需要调整好路径,和需要同步 topic )来做拉取和向目标写入。 /bin/kafka-mirror-maker.sh --consumer.config ....创建 Kafka 原集群和目标集群,并确保网络互连互通 – 这里 Kafka 可以是自建集群也可以是托管版本CKafka集群 2.

2K80

Nexus3常用功能备忘

关于nexus3 Java开发者常在内网部署nexus3作为以下用途: 中央仓库缓存; 内网私有仓库; 接下来分别实战这两个功能; 环境信息 nexus3版本:3.19.1 maven版本:3.6.3...JDK:1.8.0_191 nexus3部署 本文聚焦nexus3使用,不在此讨论部署细节,推荐使用docker来部署,这里是在一台家用NAS上通过docker部署,详情可参考《群晖DS218...这里要注意是,如果您创建私有仓库用来保存自己发布二方库,最好建两个,一个用来保存正式发布,Version policy类型:Release,另一个保存开发(maven本地不缓存),Version...:8081/repository/nexus-private/ 有了仓库,接下来设置开发环境Maven了; Maven设置(使用缓存仓库) 先做aliyun-proxy仓库设置,这样就可以使用nexus3...现在私有仓库已经有jar了,接下来看看maven如何使用这个jar文件; maven使用私有仓库 打开maven配置文件settings.xml; 找到profiles节点,增加一个profile配置

1.3K10

Kafka系列】(一)Kafka入门

后续文章我们将陆续探讨 Kafka 是如何做到以上三点Kafka生态 Kafka有哪些版本?...「Apache Kafka」:这是Kafka官方发行版,由Apache软件基金会进行维护和管理。Apache Kafka是一个开源项目,提供了稳定版本和官方支持。...如果你使用 Apache Kafka 碰到任何问题并提交问题到社区,社区都会比较及时地响应你。这对于我们 Kafka 普通使用者来说无疑是非常友好。...比如 CDH 6.1.0 版本发布Apache Kafka 已经演进到了 2.1.0 版本,但 CDH Kafka 依然是 2.0.0 版本,显然那些在 Kafka 2.1.0 修复 Bug...此外,Kafka 0.10.x还引入了Kafka Mirror Maker,用于在不同Kafka集群之间进行数据复制和同步。

25610

Kafka实战(五) - Kafka秘技坂本之争

不论是哪种Kafka,本质上都基于core Apache Kafka 那就来说说Apache Kafka版本问题 1 缘何"在乎"你这版本号 直接使用最新版本不就好了吗? 当然了!...最后0表示修订版本号,也就是Patch号 Kafka社区在发布1.0.0版本后特意写过一篇文章,宣布Kafka版本命名规则正式从4位演进到3位,比如0.11.0.0版本就是4位版本号。...公开JMX操作以动态设置记录器级别 基于时间日志段推出 为Log子系统添加Performance Suite 在zk使用修复压缩消息commit() 正式引入了副本机制,至此Kafka成为了一个真正意义上完备分布式高可靠消息队列解决方案...新版本Producer API在这个版本算比较稳定了 如果你使用0.9作为线上环境不妨切换到新版本Producer,这是此版本一个不太为人所知优势。...不得不说是,这个版本各个大功能组件都变得非常稳定了,国内该版本用户也很多,应该算是目前最主流版本之一了。

57650

Kafka实战(五) - Kafka秘技坂本之争

不论是哪种Kafka,本质上都基于core Apache Kafka 那就来说说Apache Kafka版本问题 1 缘何"在乎"你这版本号 直接使用最新版本不就好了吗? 当然了!...最后0表示修订版本号,也就是Patch号 Kafka社区在发布1.0.0版本后特意写过一篇文章,宣布Kafka版本命名规则正式从4位演进到3位,比如0.11.0.0版本就是4位版本号。...公开JMX操作以动态设置记录器级别 基于时间日志段推出 为Log子系统添加Performance Suite 在zk使用修复压缩消息commit() 正式引入了副本机制,至此Kafka成为了一个真正意义上完备分布式高可靠消息队列解决方案...新版本Producer API在这个版本算比较稳定了 如果你使用0.9作为线上环境不妨切换到新版本Producer,这是此版本一个不太为人所知优势。...不得不说是,这个版本各个大功能组件都变得非常稳定了,国内该版本用户也很多,应该算是目前最主流版本之一了。

1.1K40

kafka 生产者幂等性

拷贝数据,比如:Mirror Maker ,或者 stream processing,我们希望是,执行拷贝进程可以定期保存其在上游 topic /database 位置,并始终从此保存位置恢复...Fencing 另一个情况是,在 Mirror Maker 或其他消费者故障自动检测情况下,有可能出现误报,导致至少暂时有两个 consumer 读取相同输入并产生相同输出。...服务器将大致按顺序发布 pids ,因此只有在发布了40亿个 pids 之后才会实际进行重用。...在数据恢复情况下,pid 循环缓冲区将会被填满并且 所有 pid 过期时间都是精确。 client 端实现细节 一般重复数据消除将在 producer 自动进行。...要将其集成到像 mirror maker 和 samza 这样链接 producers 和 consumers 工具我们需要能够保存 producer pid 和 sequence number

77830

Kafka 3.3使用KRaft共识协议替代ZooKeeper

作者 | Emeni Oghenevwede 译者 | 明知山 策划 | 丁晓昀   Apache 软件基金会发布了包含许多新特性和改进 Kafka 3.3.1。...这是第一个标志着可以在生产环境使用 KRaft(Kafka Raft)共识协议版本。...在几年开发过程,它先是在 Kafka 2.8 早期访问版本发布,然后又在 Kafka 3.0 预览版本发布。 KRaft 是一种共识协议,可以直接在 Kafka 管理元数据。...活动控制器将元数据存储在事件源日志主题中,仲裁其他控制器对活动控制器创建事件做出响应。事件日志定期进行快照,确保日志不会无限增长。...这大大减少了不可用时间窗口,缩短了系统最坏情况恢复时间。下图显示了使用仲裁控制器比使用 ZooKeeper 更快地关闭具有 200 万个分区 Kafka 集群。

86140

精选Kafka面试题

因此,为了唯一地识别分区每条消息,我们使用这些偏移量。 Kafka系统工具有哪些类型? Kafka迁移工具:它有助于将代理从一个版本迁移到另一个版本。...Mirror MakerMirror Maker工具有助于将一个Kafka集群镜像提供给另一个。 消费者检查:对于指定主题集和消费者组,它显示主题,分区,所有者。 Kafka为什么那么快?...在Kafka每个分区,都有一个服务器充当leader,0到多个服务器充当follower角色。 为什么要使用Apache Kafka集群?...为了克服收集大量数据和分析收集数据挑战,我们需要一个消息队列系统。因此Apache Kafka应运而生。其好处是:只需存储/发送事件以进行实时处理,就可以跟踪Web活动。...为什么Kafka复制至关重要? 由于复制,我们可以确保发布消息不会丢失,并且可以在发生任何机器错误、程序错误或频繁软件升级时使用。 什么是Kafka地域复制?

2.9K30

Flink1.7发布新功能

Apache Flink 社区正式宣布 Apache Flink 1.7.0 发布。最新版本包括解决了420多个问题以及令人兴奋新增功能,我们将在本文进行描述。有关更多详细信息请查看完整目录。...Flink 1.7.0 版本与 1.xy 版本使用 @Public 注解注释API兼容。该版本现已上市,我们鼓励大家下载该版本并查看更新文档。 1....SQL Client 现在支持在环境文件和 CLI 会话自定义视图。此外,CLI 还添加了基本 SQL 语句自动完成功能。...2.7 Kafka 2.0 Connector FLINK-10598 Apache Flink 1.7.0 继续添加更多连接器,使其更容易与更多外部系统进行交互。...在此版本,社区添加了 Kafka 2.0 连接器,可以从 Kafka 2.0 读写数据时保证 Exactly-Once 语义。

93520

中间件PaaS层组件容灾方案及实践

可以大幅度提升集群容灾能力,当单个可用区出现意外网络不稳定、断电重启等不可抗力风险 时,仍能保证客户端在短时间等待重连后恢复消息生产和消费。...在某一个时间点内,同步启用新消费者组进行消费,同时停止老消费者消费。 新消费者持续消费 CKafka 集群数据,迁移完毕。...客户侧生产者继续将数据写入到自建kafka实例。 下载、安装并且搭建mirror-maker客户端。 配置mirror-maker生产&消费properties文件。...启动mirror-maker,开始执行消息数据同步操作。检查数据同步是否正常,如果出现异常,需要检查下相关配置文件。 修改kafka客户侧,根据某个时间点启动新消费。...当故障恢复之后,分片会自动均衡到2个可用区,整个集群自行恢复。 当4、6区之间网络抖动、断开之后:通过VIP切换,客户端可正常对ES集群上各节点进行读写。

4.2K6011

Kafka 性能实践知多少

最初 Kafka 是在 Apache 许可下进行开发,但后来 Confluent 对其进行了分支改造并提供了一个更为强大版本。...基于 Kafka 框架相关特性,在本篇文章将为大家带来四个 Kafka 最佳优化实践场景,以便能够在实际业务开发活动充分利用 Kafka 组件相关功能特性。...经过几年发展,2015 年 11 月,社区正式发布了 0.9.0.0 版本。...基于当前环境,这是一个重量级版本更迭,0.9 大版本增加了基础安全认证 / 权限功能,同时使用 Java 重写了新版本消费者 API,另外还引入了 Kafka Connect 组件用于实现高性能数据抽取...正式向大家宣布了从这个版本起,Kafka 正式升级成分布式流处理平台,同时,不久后,在 2017 年 6 月,社区发布了 0.11.0.0 版本,引入了两个重量级功能变更:一个是提供幂等性 Producer

53360

Pinterest 开源通用 PubSub 客户端库 PSC

作者 | Rafal Gancarz 译者 | 明知山 策划 | 丁晓昀 Pinterest 开源了其通用 PubSub 客户端库 PSC,该库已在生产环境使用了一年半。...Pinterest 在其平台上重度使用消息传递基础设施,包括 Apache KafkaApache Flink 和 MemQ。...Pinterest 软件工程师 Jeff Xiang 总结了使用多种消息传递后端所带来一些挑战: 多年运营经验告诉我们,平台团队拥有和维护统一 PubSub 接口可以让我们客户和业务从中极大地受益...例如,secure:/rn:kafka:prod:aws_us-west-1:shopping:transaction指定了主题、集群、区域以及客户端需要连接后端(Kafka)。...迁移所面临主要挑战是确保新迁移作业可以从 Flink 检查点文件恢复其作业状态。

10210
领券