腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
将列与多个可能
的
值匹配
、
、
我试图使用awk过滤出文件中
的
数据。,it,bfsi,spark,
hadoop
,bigdata,
etl
,pentaho,611,devJohn,bangalore,software,it,bfsi,spark,
hadoop
,bigdata,
etl
,pentaho,823,dev 从现在起,我得到
的
结果是所以预
浏览 0
提问于2018-10-29
得票数 1
回答已采纳
2
回答
CDAP源插件从Sftp服务器读取数据
、
我想通过使用cdap源代码插件来读取Sftp服务器可用
的
csv文件。 at org.apache.
hadoop
.fs.FileSystem.createFileSystem(FileSystem.java:2809) ~[org.apache.
hadoop
.
hadoop
-comm
浏览 4
提问于2019-11-04
得票数 1
1
回答
将Java应用程序迁移到
Hadoop
:架构/设计障碍?
、
、
这里有一种情况:我负责构建
基于
java
的
ETL
软件(EAI )
的
迁移。我必须将其迁移到
Hadoop
( apache版本)。现在,从技术上讲,这更像是重新启动,而不是迁移--因为我没有数据库可供迁移。这是关于利用
Hadoop
的
,因此,转换阶段( '
ETL
')是并行
的
-iz-ed。这会让我
的
ETL
软件 更快
的
转换parallel-iz-ed.Scalable处理更
浏览 3
提问于2011-06-06
得票数 3
回答已采纳
1
回答
如何在使用
Hadoop
时解析NoClassDefFoundError?
、
、
、
我得到了
hadoop
jar camus-
etl
-kafka-0.1.0-SNAPSHOT.jar at com.linkedin.camus.
etl<
浏览 2
提问于2016-04-27
得票数 0
1
回答
是否适合生成数据仓库事实和维度表?
、
、
、
、
下面是我考虑通过实现
的
场景。 产出将包括: 我
的
分析是对<em
浏览 0
提问于2016-02-10
得票数 1
回答已采纳
3
回答
Hadoop
作为
ETL
工具
的
替代品,如SSIS、Informatica?
、
、
、
、
我非常了解SSIS,Informatica,用于执行
ETL
过程&将数据加载到数据仓库。我们可以用
Hadoop
代替
ETL
工具,比如Informatica用于
ETL
过程吗? 在这里,我基本上是在谈论关系表结构。我知道
hadoop
可以用于从非结构化数据中提取信息。
浏览 7
提问于2014-05-29
得票数 1
2
回答
基于
另一个数组
的
值
的
类型记录顺序数组
、
假设我有一个基数组我想按照基数组
的
相同顺序排列第二个数组let object1 = [{Name: "Java", ResourceCount: 3}, {Name: "DotNet", Resourc
浏览 7
提问于2019-10-29
得票数 1
回答已采纳
1
回答
使用Kafka将apache服务器日志加载到HDFS
、
Defaults to deflate
etl
.deflate.level=6 at org.apache.
hadoop
.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:301) at org.apache.
hadoop
.mapreduce.JobSubmi
浏览 2
提问于2015-11-16
得票数 0
2
回答
将数据直接从
Hadoop
/HDFS (本地/本地集群)加载到Redshift & Bigquery
、
、
、
、
有没有任何方法直接从
Hadoop
/HDFS (本地/本地集群)将数据加载到Redshift & Bigquery。我需要将1TB
的
数据加载到Redshift & Bigquery。所以寻找有效
的
方法来做这件事。 谢谢
浏览 1
提问于2014-06-06
得票数 3
回答已采纳
1
回答
在Windows上运行火花单元测试
、
、
binaries.at org.apache.
hadoop
.util.Shell.getWinUtilsPath(Shell.java:333)@Test val conf = new SparkConf() val sc = new SparkConte
浏览 1
提问于2014-07-02
得票数 0
回答已采纳
2
回答
使用MySQL将Server数据库映射到MapReduce数据库时获得空指针异常
我是的新手,我正在尝试将Server数据库中
的
表映射到MySQL数据库。我已经面对了很多问题,我设法解决了,即: Am使用system.profile.properties.dataproc:dataproc.conscrypt.provider.enable = false来防止另一个问题中报告
的
SSL问题。$ETLMapper.map(ETLMapReduce.java:23
浏览 4
提问于2019-07-11
得票数 0
回答已采纳
2
回答
宾得和哈多普
、
、
、
如果这个问题看起来很幼稚的话,我很抱歉,但是我对数据工程领域还很陌生,因为我现在是一个自学的人,但是我
的
问题是像宾得和
Hadoop
这样
的
ETL
产品之间有什么区别呢?当我用这个代替那个
的
时候?
浏览 0
提问于2018-04-25
得票数 2
回答已采纳
2
回答
Spark能否取代
ETL
工具
、
、
、
、
现有的流程原始结构数据被复制到Redshift
的
登台层。然后使用Informatica、Telend等
ETL
工具对数据仓库/数据仓库
的
事实表和维度表进行增量加载。所有的连接都发生在数据库层(
ETL
将查询推到数据库中)- Spark可以取代
ETL
工具并进行相同
的
处理并将数据加载到Redshift中吗?-这种架构
的
优点和缺点是什么?
浏览 1
提问于2016-11-26
得票数 10
1
回答
FileNotFoundError:[WinError 2]在cmd/Pycharm中运行pyspark时,系统找不到指定
的
文件
、
、
当我在cmd和pycharm中给pyspark时,我也面临着同样
的
问题,有没有人能帮我一下?提前谢谢。recent call last): spark = Spa
浏览 20
提问于2020-12-02
得票数 0
1
回答
我们如何处理
Hadoop
DB中处理过
的
数据(输出)?
、
、
我是
Hadoop
的
新手,如果我
的
问题太不成熟,我深表歉意。但是,在
基于
Hadoop
的
数据库中是如何工作
的
呢?在客户端,如果请求特定
的
报告,这需要来自
Ha
浏览 2
提问于2015-12-23
得票数 0
1
回答
游侠策略不适用于HDFS NFS访问
、
、
现在,尝试以两个不同
的
用户身份通过
hadoop
fs <path to the hdfs location>访问HDFS路径:[ml1@HW04 ml1c<path to the hdfs location>" [hph_
etl
@HW04 hph_
etl
]$
hadoop
fs -ls <path to- hph_
etl
hph_
etl<
浏览 0
提问于2019-08-09
得票数 0
回答已采纳
4
回答
使用AWS执行按需
ETL
、
、
、
、
我想使用AWS架构执行按需
ETL
作业。运行简单
的
按需
ETL
作业
的
最佳架构是什么?
浏览 2
提问于2015-10-06
得票数 0
1
回答
如何形成地形湖泊治理表
、
、
只是想得到一个Terraform问题
的
答案。我感兴趣
的
是在湖形成中使用受治理
的
表,并使用Terraform来分配资源。目前是否有可能形成这些地形?文档看起来很稀少。这是当前胶表
的
。它在任何地方都没有提到受支配
的
表。
浏览 7
提问于2022-04-06
得票数 2
回答已采纳
1
回答
从
Hadoop
端查找关系数据库中
的
数据
、
、
我正在将SSIS解决方案转换为
Hadoop
,以便在数据仓库中进行
ETL
处理。我
的
预期系统:问题是:在转换阶段,我需要从
hadoop
端(pig或mapreduce作业)在MySQL中查找数据。有两种解决办法:2:查询直接到MySQL。我担心MySQL服务器上会有很多连接。解决这
浏览 1
提问于2013-10-04
得票数 0
回答已采纳
2
回答
黑斑羚壳还是火种给
ETL
?
、
、
、
我最近开始研究
Hadoop
环境。我需要做一些基本
的
ETL
来填充几个表。目前,我正在使用sqoop将数据导入
Hadoop
,并使用Impala shell命令编写用于转换
的
SQL查询。但是这些天我听说了很多关于星火
的
事。在我
的
情况下,我会有什么好处写我
的
ETL
在星火而不是黑斑羚壳? 谢谢S
浏览 2
提问于2019-02-02
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于Flink的高可靠实时ETL系统
基于hadoop的免费大数据平台有哪些?
基于Hadoop的大数据平台实施——整体架构设计
基于云端监控对大数据etl脚本优化的一个方法
基于Hadoop的58同城离线计算平台设计与实践
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券