首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#spark

Apache Spark是一个开源集群运算框架,Spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。

Spark向量化计算在美团生产环境的实践

美团技术团队

Apache Spark是一个优秀的计算引擎,广泛应用于数据工程、机器学习等领域。向量化执行技术在不升级硬件的情况下,既可获得资源节省,又能加速作业执行。Glu...

11310

大数据开发语言scala:源于Java,隐式转换秒杀Java

叫我阿柒啊

在多年的学习路上,也掌握了几门比较常见的语言,例如Java、Python以及前端Vue生态中包含的语言。很多时候,各种语言相似功能的框架都会被放在一起比较,来评...

14120

一条指令,解决外网无法访问云服务器Kafka容器问题

叫我阿柒啊

在上一篇告别Zookeeper,两条命令容器化搭建Kafka跟着官方文档使用docker,在云服务器上搭建了一个单节点的Kafka集群,在云服务器上连接成功,当...

21320

一条指令,解决外网无法访问云服务器Kafka容器问题

叫我阿柒啊

在上一篇告别Zookeeper,两条命令容器化搭建Kafka跟着官方文档使用docker,在云服务器上搭建了一个单节点的Kafka集群,在云服务器上连接成功,当...

21320

基于SPARK的大规模网络表征算法及其在腾讯游戏中的应用

腾讯云开发者

本文介绍了腾讯游戏社交算法团队研发的能够处理百亿级大规模图数据的分布式网络表征算法,及其在多个游戏业务场景落地应用,并且取得明显的实际业务效果提升。

13410

03-SparkSQL入门

JavaEdge

华为 · 软件开发工程师 (已认证)

Spark 的一个组件,用于大规模数据分析的 SQL 查询引擎。Shark 提供了一种基于 SQL 的交互式查询方式,可以让用户轻松地对大规模数据集进行查询和分...

9600

01-Spark的Local模式与应用开发入门

JavaEdge

华为 · 软件开发工程师 (已认证)

必须设置集群?我才刚入门大数据诶,这么麻烦?劝退,不学了!还好 spark 也支持简单部署:

12500

Spark 原理与实践 | 青训营笔记

鳄鱼儿

Spark 于 2009 年诞生于加州大学伯克利分校 AMPLab,2013 年被捐赠给 Apache 软件基金会,2014 年 2 月成为 Apache 的顶...

9010

Apache Spark 核心原理、应用场景及整合到Spring Boot

用户7353950

Apache Spark 是一种开源的大数据处理框架,它在2009年由加州大学伯克利分校的AMPLab开发,并在2010年贡献给了Apache软件基金会。Sp...

33510

0922-7.1.9-使用Spark和Hive访问Ozone

Fayson

10310

Spark Core 整体介绍

Freedom123

DiskStore磁盘存储:spark会在磁盘上创建spark文件夹,命名为(spark-local-x年x月x日时分秒-随机数),block块都会存在这里,然...

14510

Spark SQL 整体介绍

Freedom123

spark-shell、spark-sql 都是是一个独立的 spark application,启动几个就要几个application,非常耗资源

6110

Spark 单机部署

Freedom123

1. scala配置 https://www.scala-lang.org/download/2.11.8.html

8410

spark 集群搭建

Freedom123

一. 集群规划 node01为master节点,node02,node03为worker节点

8710

Spark Streaming 整体介绍

Freedom123

1. 概要     Hadoop的MapReduce及Spark SQL等只能进行离线计算,无法满足实时性要求较高的业务需求,例如实时推荐,实时网站性能分析等...

12610

Spark Sql 详细介绍

Freedom123

    当使用Hive时,必须初始化一个支持Hive的SparkSession,用户即使没有部署一个Hive的环境仍然可以使用Hive。当没有配置hive-si...

12310

Spark RDD 整体介绍

Freedom123

    spark-shell : Spark 的交互式客户端,启动那一刻就开始执行任务,一般不用这种执行方式。

9010

Spark 整体介绍

Freedom123

    Spark 是一个大数据运算框架,使用了DAG调度程序,比基于Hadoop MapReduce 运行速度提高了100倍以上     Spark 是一个...

10210
领券