腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8972)
视频
沙龙
1
回答
如
何在
Pig
中
按
列
连接
和
过滤
2个
关系
?
我是
Pig
脚本的新手,正在尝试修改一些现有的
pig
脚本,以便从日志文件中提取一些数据。bag2:(name11),(name22),}result bag:(uid1, (name11, name13)),} 我想我需要在这两个包上做一些
连接
/
过滤
,但不知道怎么做。
浏览 1
提问于2017-08-17
得票数 0
1
回答
在一个
过滤
语句中使用两个数据源
、
在我的
pig
脚本
中
,我从5个以上的数据源(Hive表)读取数据,其中一个是主要的源数据,其余的是一种维度数据表。我正在尝试
过滤
主数据源
关系
(或别名) w.r.t其中一个维度
关系
中
的一些值。我也尝试过使用"
浏览 1
提问于2014-06-20
得票数 0
3
回答
如
何在
Pig
中
处理多个商店-拉丁脚本
、
我有一个
pig
脚本,输入如下:我有这样的
关系
,
按
不同的
列
分组:Y=B
列
|总
列
D|总
列
E|然后,我需要将X、Y、Z存储到不同的文件夹
中
,因此会多次调用store。
Pig
知道如何只加载
和
处理一次数据,
浏览 0
提问于2013-06-22
得票数 1
回答已采纳
1
回答
有条件地从
PIG
加载HBase记录
、
、
、
、
是否有一种方法可以根据HBase
中
特定
列
的值将记录从HBase加载到猪
关系
中
?谢谢
浏览 0
提问于2013-05-15
得票数 0
2
回答
用双列串联
过滤
猪体内
、
、
我有两张表,格式如下#cc bb毫米42 24 3562#名称cid索曼. 42-47-2562当尝试
连接
由'-‘分隔的三
列
时,我使用的代码是下面的错误 a = LOAD 'default.com_data' USING org.
浏览 3
提问于2014-10-10
得票数 2
回答已采纳
1
回答
Talend将多个值传递到输出表
我应该从2个
连接
表
中
获得多个值。我会将
过滤
后的值传递给输出表。NAME 'ANIMAL' 'CAT'我用过TOracleInput
和
TOracleOutput。我的输出表上只有一头猪…… 我应该如
何在
我
浏览 3
提问于2014-09-23
得票数 0
1
回答
在度量值
中
添加+0会在可视化
中
交叉联接
列
、
我有一个表,其中包含一个简单的度量,
如
SUM(TableAmount)或COUNTROWS(表),并向该度量添加一个数字,
如
SUM(TableAmount)+0。如果我试图通过一个
关系
过滤
这个表,PowerBI
中
的表可视化将遵循
过滤
器,但如果选择了“显示没有数据的项”,则会交叉
连接
其余表项的所有
列
。如果我取消选择“显示没有数据的项目”,
过滤
器将不会被使用,表
中
的所有项目都会显示出来,但这次没有交叉
连接</em
浏览 1
提问于2018-01-30
得票数 1
2
回答
如何使用
pig
拉丁语查找最近7天的记录?
、
、
我是小猪拉丁语的初学者。我有一个要求,以找到最近7天的记录,从csv包含最近4年的数据。
浏览 5
提问于2014-04-13
得票数 1
1
回答
动态数据网站-
过滤
具有父表值的子表的行
、
、
、
我有许多具有
关系
结构的表。例如:tblSite、tblSiteImage、tblSiteAdvertisement、tblGenericCategory、tblEntityType等。我想将
过滤
器应用于所有这些表,即tblSite的
过滤
器。 这意味着,应该有tblSite数据的下拉列表(DDL)。在更改DDL
中
的数据选择之后,它应该从这些表
中
筛选数据。请注意,SiteId
列
存在于一些表
中
,
如
tblGenericCategory,但不存在于表tblEnt
浏览 5
提问于2013-11-10
得票数 0
1
回答
hadoop关于如何处理日志的建议
、
、
、
我需要一些关于我应该如
何在
Java中使用hadoop而不是
Pig
来处理基础架构日志的建议,因为我认为
Pig
在读取日志文件时不支持正则表达式
过滤
器。例如,我有cisco日志
和
web服务器日志,我希望
按
行
过滤
特定值并将其提供给hadoop。我需要一些建议,最好的方式
浏览 3
提问于2013-12-04
得票数 1
2
回答
PIG
:如何删除列名
中
的'::‘
、
我有一个猪
关系
,如下所示:我正在尝试将input_md5
关系
的所有
列
存储到一个hive表。input_md5::type: chararray,input_md5::name: chararray,input_md5::id: l
浏览 12
提问于2016-08-12
得票数 2
回答已采纳
6
回答
将IN子句与
PIG
过滤
器一起使用
PIG
支持IN子句吗?或者我应该把它分成多个or? 谢谢!
浏览 0
提问于2011-08-25
得票数 5
回答已采纳
2
回答
如
何在
hadoop
pig
中
按
顺序
连接
关系
?
、
、
现在,我想把它转换成像这样的代码行:a\tb2\tc2a\tbn\tcn 是否可以使用
pig
拉丁语,或者必须使用UDF?
浏览 1
提问于2013-05-23
得票数 0
1
回答
Pig
拉丁语
连接
性能改进
我需要一些技巧,指导
和
/或你的经验,在巨大的数据集上执行猪脚本的性能提高。 我使用
Pig
(版本0.12)
和
Hive (版本0.11)来分析客户事务。在我的例子
中
,
pig
脚本将
按
天调度;主数据包含大约500K到800K条记录(甚至多达100万条),并且将有4个额外的数据集来帮助分析主交易数据集,每个数据集大约有50K条记录。我听说在大数据处理
中
,我们应该避免
连接
,但在我的例子
中
,我不能;我必须将我的主数据集与这4个额外的数据
浏览 2
提问于2014-07-02
得票数 0
1
回答
将分隔的chararray展开为多个元组
我的
关系
中
的一
列
包含分隔值(
如
csv),我想将它们分开,以便在
关系
中
为每个值都有一个条目(与具有原子值的其他
列
相结合)。例如,如果我有以下数据:1 |23 |Steve,Joe,Bob我希望得到的
关系
包含|23 |Steve1 |23 |Bob2 |26
浏览 0
提问于2011-08-25
得票数 4
回答已采纳
1
回答
优化器在Apache体系结构
中
做什么?
、
我是Apache
Pig
的新手,并试图了解它的体系结构。有人能解释优化器在Apache体系结构
中
的作用吗?上面写着: 我不清楚projection
和
pushdown是什么意思。
浏览 0
提问于2018-11-15
得票数 1
2
回答
从以2
列
为条件的数据帧中提取顶行
以下是我的数据Cow 5 100
Pig
4 85 Sheep 3 65数据按动物分类,然后按动物群
中
的年龄分类,然后
按
体重(增加)进行排序。是否有一种方法可以对这些数据进行子集,使我只剩下最轻的动物群
和
年龄组?这就是产出将变成的样子:Cow 5 100She
浏览 3
提问于2017-11-06
得票数 0
回答已采纳
1
回答
使用循环在HBase
中
创建多个
列
限定符
、
、
、
、
我想把我的行数据转换成
列
。我有这样的状态
和
访问数据:AZ 1023 06OH 9821 06 NY在我看来,我可以
按
州
过滤
数据,然后将新
列
附加到新表
中
。我可以在
Pig
中使用少量的
列
就可以做到这一点,但我认为这样做50次是愚蠢的,我宁愿使用循环。显然,这些都是同一
列
族
中
的
列
限定
浏览 1
提问于2014-10-11
得票数 0
1
回答
配置单元-检查表的每一行
中
的数组是否包含另一个表
中
的
列
中
的任何匹配数据
、
、
、
、
我有两个包含
列
的表,如下所示。user STRING,tag STRINGuser1 help,
pig
user1 hive, hiveql, help hadoophiveql 如果我只想
过滤
出Posts表
中
包含标签表
中
列出的标签的行,如下面的结果所示
浏览 5
提问于2014-01-28
得票数 6
5
回答
Apache
Pig
和
Apache Hive有什么区别?
、
、
Pig
和
Hive的确切区别是什么?我发现两者具有相同的功能含义,因为它们用于做相同的工作。唯一的事情是实现,这对两者都是不同的。那么什么时候该使用哪种技术呢?有没有明确说明两者在适用性
和
性能方面的区别的规范?
浏览 3
提问于2012-04-23
得票数 18
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hbase数据库检索性能优化策略
Power BI报表服务器更新
全面解析大数据框架Hadoop主要模块
Pandas与SQL的数据操作语句对照
Hadoop家族产品大全介绍
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券