挽风 - 个人中心 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

挽风

LV1

发表了文章 2023-12-182023-12-18 11:27:44

Flink CDC

CDC是Change Data Capture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变...

挽风 2023-12-182023-12-18 11:27:44

数据库、flink、import、配置、数据

发表了文章 2023-11-052023-11-05 08:47:53

Flink日志采集-ELK可视化实现

针对按照⽇志⽂件⼤⼩滚动⽣成⽂件的⽅式，可能因为某个错误的问题，需要看好多个⽇志⽂件，还有Flink on Yarn模式提交Flink任务，在任务执行完毕或...

挽风 2023-11-052023-11-05 08:47:54

flink、elk、部署、可视化、日志

关注了用户 2023-11-032023-11-03 13:25:38

Lansonli

CSDN大数据领域博客专家，华为云享专家、公众号【三帮大数据】回复关键词“大数据”送学习资料

1.2K 文章21 回答6.3K 关注者

发表了文章 2023-10-172023-10-17 15:46:40

spark-submit --files

spark-submit --files通常用来加载外部资源文件，在driver和executor进程中进行访问

挽风 2023-10-172023-10-17 15:46:45

spark、hdfs、submit、异常、原理

发表了文章 2023-10-172023-10-17 15:45:25

Scala

3、与过程化编程相⽐，函数式编程⾥的函数计算可以随时调⽤，函数式编程中，函数是⼀等公民

挽风 2023-10-172023-10-17 15:45:26

scala、递归、对象、函数、接口

发表了文章 2023-10-172023-10-17 15:45:02

Redis

缓存穿透是指查询一个一定不存在的数据。由于缓存命不中时会去查询数据库，查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到数据库去查询，造成缓存穿透...

挽风 2023-10-172023-10-17 15:45:08

数据库、缓存、redis、数据、主机

发表了文章 2023-10-172023-10-17 15:44:22

HTable API有没有线程安全问题，在程序中是单例还是多例？

在单线程环境下使用hbase的htable是没有问题，但是突然高并发多线程情况下就可能出现问题。

挽风 2023-10-172023-10-17 15:44:24

api、程序、多线程、线程、线程安全

发表了文章 2023-10-172023-10-17 15:44:07

Hive如何进行权限控制？

目前hive支持简单的权限管理，默认情况下是不开启，这样所有的用户都具有相同的权限，同时也是超级管理员，也就对hive中的所有表都有查看和改动的权利，这样是...

挽风 2023-10-172023-10-17 15:44:08

数据库、hive、管理、权限、权限控制

发表了文章 2023-10-172023-10-17 15:43:46

Zookeeper

Zookeeper 作为一个分布式的服务框架，主要用来解决分布式集群中应用系统的一致性问题。ZooKeeper提供的服务包括：分布式消息同步和协调机制、服务器...

挽风 2023-10-172023-10-17 15:43:51

zookeeper、服务器、客户端、连接、数据

发表了文章 2023-10-172023-10-17 15:43:06

Hadoop

hadoop2.x core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml slaves

挽风 2023-10-172023-10-17 15:43:08

hadoop、磁盘、内存、排序、数据

发表了文章 2023-10-172023-10-17 15:42:14

SQL题目

2、 • 当签到天数%7=3 则领取3金币 • 当签到天数%7=0 则领取7金币 • 其余情况，领取1金币

挽风 2023-10-172023-10-17 15:42:18

sql、date、select、数据、数组

发表了文章 2023-10-172023-10-17 15:41:16

Flume

单机upd的flume source的配置，100+M/s数据量，10w qps flume就开始大量丢包，因此很多公司在搭建系统时，抛弃了Flume，自己...

挽风 2023-10-172023-10-17 15:41:19

flume、内存、配置、日志、数据

发表了文章 2023-10-172023-10-17 15:40:54

Flink

1）Flink 是标准的实时处理引擎，基于事件驱动。而 Spark Streaming 是微批（Micro-Batch）的模型;

挽风 2023-10-172023-10-17 15:40:57

flink、内存、配置、数据、优化

发表了文章 2023-10-172023-10-17 15:39:38

Spark

Spark是Scala语言实现的核心数据结构是RDD的基于内存迭代计算的分布式框架。

挽风 2023-10-172023-10-17 15:39:43

spark、程序、集群、内存、数据

发表了文章 2023-10-172023-10-17 15:38:48

HBase

2）无模式：每行都有一个可排序的主键和任意多的列，列可以根据需要动态的增加，同一张表中不同的行可以有截然不同的列；

挽风 2023-10-172023-10-17 15:38:49

存储、hbase、数据、索引、性能

发表了文章 2023-10-172023-10-17 15:38:06

Sqoop

Hive中的Null在底层是以“\N”来存储，而MySQL中的Null在底层就是Null，为了保证数据两端的一致性。在导出数据时采用–input-null-...

挽风 2023-10-172023-10-17 15:38:07

存储、sqoop、报表、工作、数据

发表了文章 2023-10-172023-10-17 15:37:47

Hive_

HiveSQL ->AST(抽象语法树) -> QB(查询块) ->OperatorTree（操作树）->优化后的操作树->mapreduce任务树->优化...

挽风 2023-10-172023-10-17 15:37:50

存储、hive、函数、数据、压缩

发表了文章 2022-11-282022-11-28 19:09:46

Kafka

注意：Zookeeper中保存Broker id和消费者offsets等信息，但是没有生产者信息。

挽风 2022-11-282022-11-28 19:09:46

kafka

发表了文章 2022-09-232022-09-23 09:53:18

Spark的Shuffle原理及调优

当使⽤reduceByKey、groupByKey、sortByKey、countByKey、join、cogroup等操作的时候，会发⽣shuffle操作...

挽风 2022-09-232022-09-23 09:53:18

mapreduce、bash、bash 指令、文件存储、spark

发表了文章 2022-09-012022-09-01 16:45:22

Flink学习笔记(10) - CEP

一个或多个由简单事件构成的事件流通过一定的规则匹配，然后输出用户想得到的数据 —— 满足规则的复杂事件

挽风 2022-09-012022-09-01 16:45:22

api、flink、大数据

12 3 4 5 6 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2021-04-04

个人成就

获得 248 次赞同
文章被阅读 159.6K 次

关注了：2关注者：28

挽风