腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
Json
数据处理
为
pig
我有一个需求,我需要将
Json
数据加载到
pig
中,但似乎有一些问题,我无法加载数据。Male", 我尝试使用JsonLoader加载数据,如以下代码所示---REGISTER 'piggybank-0.15.0.jar'; inidata
浏览 9
提问于2018-02-22
得票数 0
1
回答
为什么
pig
被称为批处理
、
猪是批量处理的吗?如果是这样的话,请告诉我为什么叫批处理。它是批处理吗,因为它运行一个map reduce。
浏览 11
提问于2016-08-01
得票数 0
4
回答
用于
JSON
文件的Hadoop
、
对于处理包含
JSON
条目和Hadoop的文件,您有什么建议吗?
浏览 0
提问于2012-03-30
得票数 5
回答已采纳
2
回答
Hadoop/MapReduce中的日志文件分析
、
、
、
我想做的是:(2)由于同一q_string可能在多天内出现,所以我希望在一个月内对同一个q_strings进行分组,并在q_visits上对该q_string的所有实例进行汇总我希望输出有一个与输入类似的模式
浏览 0
提问于2013-09-21
得票数 0
回答已采纳
1
回答
错误2997:使用CSVExcelStorage时无法从后台错误重新创建异常
、
在这里,我已经分析了apache日志文件,但是当我试图将它导出
为
csv格式时,会发生错误。- mapred.job.reduce.markreset.buffer.percent未设置,设置
为
默认值0.32015-12-24 10:50:49,056主要信息org.apache.
pig
.dat
浏览 0
提问于2015-12-24
得票数 2
1
回答
不需要设置环境就能接触到大数据
、
、
、
、
是否有人知道已经
为
大
数据处理
设置了环境的沙箱? 可能是hadoop,cassandra,
pig
等等.
浏览 0
提问于2012-12-31
得票数 0
1
回答
本地缓存post映射减少占用空间的作业
、
、
、
我正在使用Hortonworks环境进行大
数据处理
。我观察到,作为来自Hive/Oozie/
Pig
等映射减少作业的一部分,我所在的本地缓存目录正在被填充,up.It
为
每个映射创建一个文件夹,用jar文件减少执行。是否有任何配置可以设置
为
自动删除它?
浏览 1
提问于2017-02-13
得票数 0
回答已采纳
2
回答
猪究竟什么时候使用Hadoop MapReduce环境?
、
、
我对Hadoop Mapreduce和
Pig
环境有疑问。在中,我发现
Pig
系统对
Pig
的拉丁代码很感兴趣。首先,我认为
Pig
使用map和reduce方法创建.jar文件,然后将该文件“发送”到Hadoop Mapreduce环境以运行mapreduce作业(这是
Pig
开发人员未来的工作)。那么,
Pig
系统到底什么时候使用Hadoop Mapreduce呢?它是在解释
Pig
拉丁语代码的过程中出现的吗?或者,如果我问我的问题换句话:作为输入发送到Hadoop Mapredu
浏览 0
提问于2012-08-30
得票数 2
回答已采纳
1
回答
Pig
:用.
pig
_schema模式文件加载数据
、
、
、
如何在同一个目录中加载带有.
pig
_schema架构文件的数据文件?有人能给出一个更好、更详细的例子吗?
浏览 1
提问于2016-10-01
得票数 1
回答已采纳
4
回答
hcatalog在hadoop中的用途是什么?
、
、
、
我是Hadoop的新手。我知道HCatalog是Hadoop的一个表和存储管理层。但它到底是如何工作的,以及如何使用它。请举一些简单的例子。
浏览 46
提问于2014-03-20
得票数 22
回答已采纳
1
回答
将
原始
JSON
加载到
Pig
中
、
、
、
我有一个文件,其中每一行都是一个
JSON
对象(实际上,它是stackoverflow的一个转储)。我想尽可能轻松地将它加载到Apache
Pig
中,但我在弄清楚如何告诉
Pig
输入格式是什么时遇到了麻烦。: 1217540572667 }, "ForumName" : "stackoverflow.com" 有没有一种方法可以
将
文件加载到
Pig
中,其中每一
浏览 0
提问于2012-09-29
得票数 5
回答已采纳
1
回答
将
JSON
格式表加载到
Pig
、
、
它接受
JSON
格式的数据(我使用了SERDE来创建它)。{"id":"1", "word":"2" ,"flag":1}.
json
_obj
浏览 5
提问于2014-03-04
得票数 0
2
回答
Pig
:在Java中将字符串重解析
为
元组
、
我将有一个
Pig
脚本,最后将其内容存储在一个文本文件中。在一个完全不同的任务中,我想读取这个文件的行,并将它们解析回元组。foo中的数据可能包含chararrays,其中包含在保存
Pig
包/元组时使用的字符,如{}()等。我可以使用以下代码读取以前保存的文件。这是可能的吗/
Pig
提供API了吗?我能找到的最接近的是StorageUtil类的textToTuple函数,但这只能生成一个包含一个DataByteArray的元组。
浏览 0
提问于2013-03-28
得票数 1
回答已采纳
1
回答
Apache
Pig
中的
Json
解析
、
、
、
、
我有个
json
:我发现我们能够
将
json
加载到PigScript中。A = LO
浏览 1
提问于2014-07-24
得票数 0
回答已采纳
2
回答
使用象鸟jsonLoader时猪作业挂起
、
、
、
、
这是的延续register /usr/hdp/current/
pig
-client/lib/piggybank.jar x = FOREACH data_inputGENERATE
jso
浏览 6
提问于2016-10-20
得票数 0
回答已采纳
1
回答
如何使用jsonloader
为
数组定义模式?
、
、
、
我正在使用elephantbird项目
将
一个
json
文件加载到
pig
中。但我不确定如何在加载时定义模式。没有找到关于相同的描述。Product2","colors":["White","Blue"],"sizes":["M"]}feed = LOAD '$INPUT' USING com.twitter.elephantbird.
pig
.load.JsonLoader() AS pro
浏览 14
提问于2015-04-08
得票数 0
1
回答
Pig
拉丁语连接性能改进
我使用
Pig
(版本0.12)和Hive (版本0.11)来分析客户事务。在我的例子中,
pig
脚本
将
按天调度;主数据包含大约500K到800K条记录(甚至多达100万条),并且将有4个额外的数据集来帮助分析主交易数据集,每个数据集大约有50K条记录。我听说在大
数据处理
中,我们应该避免连接,但在我的例子中,我不能;我必须将我的主数据集与这4个额外的数据集连接起来,并执行大量的IF-ELSE、过滤器、连接等操作,以便每天生成一些事务分析报告。如何提高
pig
脚本的性能?连接数据集的最佳方式?
浏览 2
提问于2014-07-02
得票数 0
1
回答
为什么没有执行脚本?
、
、
使用OSX,我下载了
pig
-0.11.1 as,并在bashrc中创建了一个别名。我有以下别名: 别名-0.11.1/bin/
pig
udf.import.list=org.apache.
pig
.piggybank.storage.avro
pig
.additional.jars=/dev/avro-1.7.4.jar;/dev/avro-mapred-1.7.4.jar;/dev/
json
_simple-1.1.jar;&
浏览 3
提问于2014-01-12
得票数 0
回答已采纳
1
回答
使用hadoop和相关技术对大量不同格式的文档进行索引和搜索
、
、
我们尝试
将
PDF存储在HDFS中,并通过mapper作业并行地创建lucene索引,并将索引存储在数据节点本地临时目录中。
浏览 1
提问于2014-08-07
得票数 0
1
回答
在
Pig
中解析复杂的
JSON
字符串
、
、
我想在
Pig
中解析一个复杂的
JSON
字符串。具体地说,我希望
Pig
将我的
JSON
数组理解
为
一个包,而不是单个chararray。有没有办法让
Pig
帮我找出我的模式,或者在
Pig
解析字符串时指定它?我一直在使用,但是找不到一种方法来指定模式,或者让它正确地理解我的
JSON
数组是一个数组而不是单个字符数组。
浏览 0
提问于2013-02-28
得票数 3
回答已采纳
点击加载更多
相关
资讯
python和SQL数据处理实战-父子关系表转为json
数据存储为json和csv
kafka-msgpack-json:将msgpack和protobuf转化成json
用JSON代码提高局域网监控软件的数据处理效率
为Python选择一个更快的JSON库
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券