首页
学习
活动
专区
圈层
工具
发布

基于腾讯云大数据套件 TBDS 的 flume 异常问题排查过程

现象 长期运营中发现部署了flume集群的磁盘满,经过排查发现flume的日志目录导致。...配置分析 既然是flume抛出的,且与MySQL有关,那缩小问题范围,查找flume里谁在写MySQL。...(flume的配置一般位于/etc/flume/conf/agent/flume.conf) 根据配置中唯一一条与MySQL相关的配置逻辑:读取HiveServer的日志,过滤其中的SQL语句(以...结论:MySQL服务异常导致flume提交事务时连接中断,且flume没有处理这种异常,引发死循环提交事务,并在这种异常情况下,flume已无法正常工作。...查看flume表现 flume进入无限循环的抛出异常状态,验证成功。 总结 这里的主要原因是MySQL服务异常导致产生的连锁反应。

2.5K30

Flume(五)Flume拓扑结构

简单拓扑结构 这种模式是将多个flume顺序连接起来了,从最初的source开始到最终sink传送的目的存储系统。...此模式不建议桥接过多的flume数量, flume数量过多不仅会影响传输速率,而且一旦传输过程中某个节点flume宕机,会影响整个传输系统。...image.png 复制和多路复用 Flume支持将事件流向一个或者多个目的地。...image.png 负载均衡和故障转移 Flume支持使用将多个sink逻辑上分到一个sink组,sink组配合不同的SinkProcessor可以实现负载均衡和错误恢复的功能。...用flume的这种组合方式能很好的解决这一问题,每台服务器部署一个flume采集日志,传送到一个集中收集日志的flume,再由此flume上传到hdfs、hive、hbase等,进行日志分析。

60641
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Flume(一)Flume原理解析

    一、Flume简介   flume 作为 cloudera 开发的实时日志收集系统,受到了业界的认可与广泛应用。...但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来,尤其是在 Flume OG 的最后一个发行版本 0.9.4....  及代码架构,重构后的版本统称为 Flume NG(next generation);改动的另一原因是将 Flume 纳入 apache 旗下,cloudera Flume 改名为 Apache Flume...4.2、Flume数据流   1)Flume 的核心是把数据从数据源收集过来,再送到目的地。...结合在云开发中的应用来举个例子,当syslog, java, nginx、 tomcat等混合在一起的日志流开始流入一个agent   后,可以agent中将混杂的日志流分开,然后给每种日志建立一个自己的传输通道

    3K60

    Flume

    1 Flume丢包问题   单机upd的flume source的配置,100+M/s数据量,10w qps flume就开始大量丢包,因此很多公司在搭建系统时,抛弃了Flume,自己研发传输系统,但是往往会参考...一些公司在Flume工作过程中,会对业务日志进行监控,例如Flume agent中有多少条日志,Flume到Kafka后有多少条日志等等,如果数据丢失保持在1%左右是没有问题的,当数据丢失达到5%左右时就必须采取相应措施...2 Flume与Kafka的选取   采集层主要可以使用Flume、Kafka两种技术。   Flume:Flume 是管道流方式,提供了很多的默认实现,让用户通过参数部署,及扩展API。   ...Kafka和Flume都是可靠的系统,通过适当的配置能保证零数据丢失。然而,Flume不支持副本事件。...(选择性发往指定通道) 11 Flume监控器   1)采用Ganglia监控器,监控到Flume尝试提交的次数远远大于最终成功的次数,说明Flume运行比较差。主要是内存不够导致的。

    56420

    腾讯云偷袭腾讯云

    02李鑫眼神.jpg 时间回到九月份的一个下午,坐在工位上的的E.m突然接到一个秘密任务: 干掉腾讯云! 行动代号:干掉腾讯云  下达这道命令的是Fooying。...Fooying是腾讯安全云鼎实验室的成员,负责守卫腾讯云的安全。从加入腾讯的那一天起,他和他的团队就枕戈待旦,时时刻刻提防着黑客对腾讯云的攻击。...随着腾讯云的快速发展,越来越多的企业入驻腾讯云,不少黑客也将攻击的目标转移到了云上。国内外因为被黑客攻击导致的删库、数据泄露、病毒勒索的公司比比皆是。腾讯云安全的重要性可想而知。...刘钢工位前.JPG Rud是本次红蓝对抗的红军负责人,将迎战蓝军猛烈的攻击,守卫腾讯云。 在腾讯,每天都有众多安全人员在巡视、建设腾讯云的安全防线。尽管如此,攻防两端终究是一场不均衡的较量。...腾讯云的红蓝对抗已经逐步常态化,既是保护自己的方式,也是守护云上合作伙伴的重要途径。 腾讯云,正在用一场场自我的战斗,磨练出更安全的云。

    137.5K30

    flume简介

    参考 Flume架构以及应用介绍 一.简介 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据...;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。...image.png 二.主要功能 1.日志收集 Flume最早是Cloudera提供的日志收集系统,目前是Apache下的一个孵化项目,Flume支持在日志系统中定制各类数据发送方,用于收集数据。...2.数据处理 Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力 Flume提供了从console(控制台)、RPC(Thrift-RPC)、text(文件)、tail(UNIX...image.png 三.Flume架构 Flume使用agent来收集日志,agent包括三个组成部分: source:收集数据 channel:存储数据 sink :输出数据 Flume使用source

    69020

    flume 入门

    前言 本文是基础性文章,针对初次接触flume的朋友,简化了大部分内容,后续有时间会加上相关高级使用 为什么需要flume?...负载均衡:flume 是分布式,对于大数据收集有天然优势 对 hdfs 支持友好 灵活:flume 收集基于单个 agent,扩展方便灵活 flume 有什么优势?...优势都是相对而言,我们简单以 kafka 来对比: 组件灵活,可定制化高 数据处理能力相对较强 对hdfs 有特殊优化 开启一个简单的flume 这里我们先什么都不管,先来玩一下flume,感受一下flume...版本 下载 flume :http://flume.apache.org/download.html 解压,得到如下目录 ?...flume一般架构 首先我们先来看一下 flume 的整体架构,官网架构图如下 ?

    62420

    Flume学习笔记

    flume学习笔记 一、什么是Flume?     ...二、flume特性     Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。     ...一般的采集需求,通过对flume的简单配置即可实现     Flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景 三、flume组件解析     ...对于每一个Agent来说,它就是一共独立的守护进程(JVM),它从客户端接收数据     1、Flume分布式系统中最核心的角色是agent,flume采集系统就是由一个个agent所连接起来形成     ...将flume-env.sh.template  改为 flume-env.sh         在里面配置JAVA_HOME 五、测试     创建一个myconf文件夹,在里边写配置文件

    1K30
    领券