腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据应用技术
专栏成员
举报
76
文章
10330
阅读量
15
订阅数
订阅专栏
申请加入专栏
全部文章(76)
数据(36)
集群(16)
spark(14)
配置(13)
flink(12)
hive(11)
函数(10)
存储(9)
kafka(8)
测试(7)
hbase(6)
排序(6)
虚拟机(6)
连接(5)
api(4)
实时监控(4)
mysql(4)
事件(4)
算法(4)
统计(4)
城市交通(4)
java(3)
数据库(3)
linux(3)
mapreduce(3)
分布式(3)
hadoop(3)
大数据(3)
dt(3)
部署(3)
服务(3)
服务器(3)
架构(3)
脚本(3)
客户端(3)
模型(3)
日志(3)
系统(3)
芯片(3)
性能(3)
优化(3)
字符串(3)
python(2)
arm(2)
apache(2)
知识图谱(2)
迁移(2)
实时数仓(2)
client(2)
date(2)
elasticsearch(2)
hdfs(2)
mac(2)
parquet(2)
string(2)
遍历(2)
变量(2)
磁盘(2)
登录(2)
对象(2)
管理(2)
环境搭建(2)
集合(2)
加密(2)
镜像(2)
开发(2)
内存(2)
设计(2)
图数据库(2)
压缩(2)
官方文档(1)
html(1)
json(1)
django(1)
打包(1)
网站(1)
容器(1)
开源(1)
缓存(1)
数据迁移(1)
ssh(1)
正则表达式(1)
jdbc(1)
推荐系统(1)
zookeeper(1)
安全(1)
windows(1)
数据结构(1)
base64(1)
case(1)
count(1)
csv(1)
import(1)
jdk8(1)
join(1)
key(1)
lag(1)
module(1)
output(1)
pycharm(1)
rank(1)
rdd(1)
root(1)
row(1)
samba(1)
server(1)
sha(1)
sort(1)
state(1)
sum(1)
timestamp(1)
txt(1)
url(1)
vmware(1)
wiki(1)
worker(1)
编程(1)
编码(1)
程序(1)
地图(1)
高德地图(1)
高可用(1)
工作(1)
关系型数据库(1)
华为(1)
接口(1)
进程(1)
科技(1)
可视化(1)
框架(1)
链表(1)
权限(1)
摄像头(1)
数据仓库(1)
数据类型(1)
数组(1)
索引(1)
网关(1)
网络(1)
线程(1)
终端(1)
注解(1)
日志文件(1)
软件设计(1)
搜索文章
搜索
搜索
关闭
ElasticSearch-7.17.24设置密码及CA证书
elasticsearch
集群
加密
配置
系统
将ElasticSearch集群从开源版本升级为具备安全认证功能的版本(如X-Pack),为集群配置SSL/TLS加密并启用安全认证。
火之高兴
2024-10-21
115
0
ElasticSearch-7.17.10集群升级至ElasticSearch-7.17.24
系统
elasticsearch
磁盘
集群
数据
1. 将三台ES节点从ElasticSearch-7.17.10升级至ElasticSearch-7.17.24; 2. 保证索引数据的正常过度,滚动升级不中断业务。
火之高兴
2024-10-21
76
0
【九】Hadoop3.3.4HA高可用配置
集群
配置
日志
数据
高可用
在 Hadoop 生态系统中,NameNode 是文件系统的中心管理器,负责管理 HDFS 的元数据。为了避免单点故障(Single Point of Failure,SPOF),Hadoop 引入了 NameNode 的高可用性架构。主要组件包括:
火之高兴
2024-08-06
148
0
【八】Zookeeper3.7.1集成Hadoop3.3.4集群安装
客户端
配置
数据
服务
集群
ZooKeeper 是一个分布式协调服务,用于分布式系统中管理配置信息、命名、同步和集群服务。它提供了一种简单的接口来访问存储在其文件系统中的数据,同时为复杂的分布式系统提供了高可用性和一致性保障。以下是 ZooKeeper 的基本原理:
火之高兴
2024-08-06
96
0
【七】Hadoop3.3.4基于ubuntu24的分布式集群安装
配置
权限
分布式
hadoop
集群
https://archive.apache.org/dist/hadoop/common/hadoop-3.3.4/ 访问apche官网源,下载3.3.4版本,我们用二进制通用版即可,因为hadoop运行在java环境,跨平台性使得无需编译arm架构版本。Hadoop 3.3.4 是当前稳定版本,兼容性和长期支持较好。此版本对最新的Spark和Flink以及Hive也有良好的支持。 然后将文件传到服务器ubuntu1节点。
火之高兴
2024-08-06
154
0
【六】集群管理工具
工作
集群
配置
终端
程序
查看java程序的运行状态是最常用的指令。 首先在ubuntu1输入该find命令,查找jps位置,需要首先完成java jdk的安装和配置。
火之高兴
2024-08-06
76
0
【五】MySql8基于m2芯片arm架构Ubuntu24虚拟机安装
虚拟机
arm
架构
配置
芯片
在 mysql_secure_installation 脚本中,VALIDATE PASSWORD COMPONENT 是一个可选的组件,用于验证和加强密码安全性。它可以强制执行强密码策略。 你可以根据自己的需求选择是否启用该组件:
火之高兴
2024-08-06
116
0
【四】jdk8基于m2芯片arm架构Ubuntu24虚拟机下载与安装
架构
芯片
虚拟机
arm
jdk8
找到最下面Java SE 看到java 8,下载使用 ARM64 Compressed Archive版本(jdk-8u411-linux-aarch64.tar.gz),因为它更加通用,可以在任何支持 ARM64 的 Linux 系统上安装。
火之高兴
2024-08-06
174
0
Zookeeper在Linux虚拟机下的安装部署
linux
zookeeper
部署
集群
虚拟机
Apache ZooKeeper是Apache软件基金会的一个开源分布式软件项目,大数据集群服务器的管理者协调者。 简言:ZK就是一个管理多个服务(集群分布式环境下)的通知机制 Watcher+文件系统 ZNode 文件系统:保存少量,服务器相关的配置文件信息。 Watcher 监听通知机制:注册监听服务器的上下线以及配置信息变更。
火之高兴
2024-07-25
139
0
Kafka生产者与消费者练习测试题
import
string
集群
数据
kafka
一、通过Producer API发送到kafka中的【topicHW】 注:topic自行创建 二、创建一个Consumer API程序,对kafka集群中的【topicHW】进行消费。 处理消费到的数据,将消费到的数据发送到另外一个名为topicDEAL 的topic中 ,要求如下:
火之高兴
2024-07-25
68
0
【已解决】pycharm下数据库转移报错:ModuleNotFoundError: No module named ‘django‘
数据库
django
module
pycharm
环境搭建
django安装了,但是找不到,在控制台执行import django也不会报错。 此时python解释器在linux的anaconda中。
火之高兴
2024-07-25
79
0
【已解决】Flink连接JDBC报错 org.apache.flink.runtime.client.JobExecutionException: Job execution failed.
连接
apache
jdbc
flink
client
Flink1.13.6 MySQL5.7.27 JDK8 Hadoop3.1.4 集成环境Idea2020
火之高兴
2024-07-25
261
0
基于大数据框架的协同过滤算法餐饮推荐系统【Update2023-11-05】
大数据
框架
数据
算法
推荐系统
首先这位作者的推荐系统给了我很大的构思启发。 Github地址:https://github.com/share23/Food_Recommender 他的系统采用实时大数据技术组件,具体有Spark Streaming,HDFS分布式存储,Hbase存储计算,消息队列采用Kafka,Flume,其中的餐饮数据是用python生成,加上linux的contab模拟流式数据。推荐模块使用ALS算法加评分。 他的系统架构和技术组件选用给了我很大帮助,包括系统业务逻辑代码,让我顺利完成了我的毕业设计。
火之高兴
2024-07-25
110
0
SparkSQL练习题-开窗函数计算用户月访问次数
排序
设计
数据
date
函数
解释:小计为单月访问次数,累计为在原有单月访问次数基础上累加 将计算结果写入到mysql的表中,自己设计对应的表结构
火之高兴
2024-07-25
67
0
HiveSQL练习题-count,sum开窗统计月度数据,求月用户新增
count
dt
sum
数据
统计
已知一个表order_tab,有如下字段: dt,order_id,user_id,amount。
火之高兴
2024-07-25
112
0
Spark面试题持续更新【2023-07-04】
变量
函数
数据
性能
spark
综上所述,Spark是一个高性能、可扩展且易用的分布式计算框架,具有丰富的功能和灵活的编程接口,适用于大规模数据处理、实时流处理、机器学习和图计算等各种场景。它在大数据领域发挥着重要的作用,并受到广泛的应用和支持。
火之高兴
2024-07-25
126
0
MySQL-多行转多列
mysql
函数
架构
数据
case
在上述语句中,我们使用了条件聚合和CASE表达式。首先使用GROUP BY a将数据按照"a"列进行分组。然后,使用CASE表达式在每个分组内根据"b"列的值进行条件判断,并提取相应的"c"列的值。最后,使用MAX函数进行聚合,获取每个分组内满足条件的最大值(即对应的"c"列的值)。这样就可以实现多行转多列的效果。
火之高兴
2024-07-25
92
0
Flink-Checkpoint&State案例测试
镜像
存储
flink
state
测试
将代码打包,上传至hadoop10 /opt/app/flink,jar; 执行命令运行jar包: [root@hadoop10 app]# flink run -c day160616.CheckPointTest /opt/app/flink.jar Job has been submitted with JobID ee5811b41a5e8c5d7dd052ed78db14b4;
火之高兴
2024-07-25
89
0
【基于Flink的城市交通实时监控平台】需求一:卡口车辆超速情况检测
数据库
实时监控
flink
摄像头
城市交通
从kafka的topic-car中读取卡口数据,将超速车辆写入mysql的select * from t_speeding_info表,当通过卡口的车速超过60就认定为超速
火之高兴
2024-07-25
88
0
MapReduce-WorldCount编程思路
mapreduce
编程
遍历
数据
数组
split阶段将文件逻辑拆分,为了分布式计算做准备,每一个MapTask生成一个临时文件,多个临时文件会进行合并,用来传递给ReduceTask,然后ReduceTask对临时文件进行计算。本Demo基于Hadoop3.1.4实验。
火之高兴
2024-07-25
72
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档