腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
使用
Python
Flink
API
进行
排序
我希望对groupBy的结果
进行
排序
,但没有看到像Java / Scala那样受支持的方式。我想我可以在传递给reduce_group的函数中实现迭代器,但这看起来很笨拙。
浏览 0
提问于2016-07-20
得票数 1
回答已采纳
1
回答
如何对无水印的
flink
联合数据流
进行
排序
flink
流具有多个数据流,然后
使用
org.apache.
flink
.streaming.
api
.datastream.DataStream#union方法对这些数据流
进行
合并。然后,我得到了问题,数据流是混乱的,我不能设置窗口来对数据流中的数据
进行
排序
。Sorting union of streams to identify user sessions in Apache
Flink
我得到了答案,但com.liam.learn.
flink<
浏览 30
提问于2019-01-12
得票数 2
1
回答
Flink
:默认分区/洗牌策略/函数
在默认情况下,
Flink
使用
哪些策略(散列、
排序
)来减少/分组DataSets (例如,groupBy函数或减少函数)?
Flink
用于哪些
API
-函数?在洗牌过程中
进行
分区 默认情况下?
浏览 3
提问于2016-03-02
得票数 3
回答已采纳
1
回答
带有Table和Datastream
API
的
Flink
1.14中的全局
排序
、
Flink
有两个APIs - DataStream和Table --它们可以在batch或streaming执行模式下运行。不建议
使用
DataSet
API
。如果我想在批处理模式下对有界数据
进行
全局
排序
,orderby的并行性是否仅限于1?
flink
如何处理大型数据?它是否溢出到磁盘?DataStream
API
-我没有找到任何显式的
API
来
进行
排序
。我能想到的唯一方法是
使用
自定义的函数首先按范
浏览 17
提问于2022-04-27
得票数 0
回答已采纳
2
回答
我可以在同一个DataSet作业中
使用
Flink
接口和DataStream接口吗?
、
我正在
使用
Flink
streaming从Kafka读取数据并处理数据。在应用程序启动时
使用
Kafka之前,我需要
使用
DataSet应用程序接口读取一个文件,并根据一些标准对文件
进行
排序
,然后根据它创建一个列表。然后开始以流媒体的方式从Kafka消费。我已经编写了一个逻辑来
使用
DataSet
API
从文件中读取数据并对其
进行
排序
。但是,当我尝试调整程序时,它永远不会执行,
Flink
立即开始
使
浏览 23
提问于2017-07-12
得票数 0
回答已采纳
1
回答
pyflink Table
api
中的Py4JJavaError
、
这段代码将pandas转换为
flink
表,
进行
转换后再转换回pandas。(MethodInvoker.java:244) at org.apache.
flink
.
api
.
python
.shaded.py4j.Gateway.in
浏览 102
提问于2020-07-16
得票数 0
回答已采纳
1
回答
Flink
Python
API
Bug
、
我刚刚试用了
flink
python
api
。当我尝试的时候:我得到了:该错误是由于以下位置中的路径处理导致的:
flink
-staging/
flink
-language-binding/
flink
-
p
浏览 2
提问于2015-06-18
得票数 2
1
回答
Python
Flink
连接到远程
Flink
环境
、
、
、
我让
flink
系统在远程系统中运行..假设IP为10.XX.XX.XX,端口为6123。现在我想通过RemoteExecution环境从另一个
使用
Pyflink的系统
进行
连接。我看过文档https://ci.apache.org/projects/
flink
/
flink
-docs-stable/dev/
python
/table-
api
-users-guide/table_envir
浏览 58
提问于2021-04-08
得票数 0
回答已采纳
1
回答
python
-在运行
Flink
作业时存档而不是目录异常- PyFlink
、
、
、
、
在运行pyflink应用程序时,我会得到以下异常: 我
使用
(/root/
Python
3.6/venv.zip)I've虚拟环境在应用程序(t_env.add_
python
_archive(archive_path="/root/
Python
3.6/venv.zip", target_dir=None))I'm中
使用
UDF运行
flink
作业successfully集存档路径,如果我取出UDF
浏览 22
提问于2022-03-16
得票数 0
回答已采纳
1
回答
使用
Python
的Kafka
Flink
、
我看不到太多关于kafka
flink
连接器
python
的信息。我知道它是beta version.can,我
使用
kafkaflink连接器
API
,
使用
python
.If是的,给我推荐一个这个连接器的程序。我也提到了Apache
Flink
: Kafka connector in
Python
streaming
API
, "Cannot load user class",.Also,我可以
使用
<
浏览 31
提问于2020-01-23
得票数 0
1
回答
排序
WordCount输出
Flink
、
、
我正在努力学习
Flink
,我正在做基本的WordCount教程。我想知道如何对datastream的输出
进行
排序
,以便它按降序输出计数。我不需要将其保存为文本文件,只需按降序输出到控制台。text.flatMap(new Tokenizer()) .sum(1); 现在,它写入所有计数,没有任何问题,我只想让计数按降序
排序
浏览 11
提问于2022-04-06
得票数 0
回答已采纳
1
回答
有界流上的全局窗口的
Flink
排序
、
、
、
我已经构建了一个
flink
应用程序来直接
使用
Kafka提供的数据,但是如果系统故障或者需要重新处理这些数据,我需要
使用
S3中一系列文件中的数据。处理消息的顺序是非常重要的,因此我试图在将这些消息推送到我现有的应用程序之前,先弄清楚如何对这个有界的流
进行
排序
。我尝试
使用
table将流插入一个临时表中,但是
排序
操作符总是
使用
最大并行度为1,尽管对两个键
进行
排序
。我能利用这些键来增加这种并行性吗?我一直在考虑
使用<
浏览 5
提问于2022-02-03
得票数 0
1
回答
在Apache
Flink
中
使用
Python
进行
分析
、
、
有没有办法专门
使用
Python
对
flink
作业
进行
分析?据我所知,表
api
将检索数据,我们只能
使用
api
中的函数来转换数据。我是否遗漏或误解了文档中的任何内容?
浏览 4
提问于2020-06-30
得票数 0
1
回答
如何
使用
Flink
DataStream
api
按批量执行模式中的记录字段对数据
进行
排序
?
、
我需要编写一个批处理的
flink
作业,我更喜欢
使用
DataStream
api
。在中有的替代品吗?我读过说,对于KeyedStream中的数据是按键二进制表示
进行
排序
的,我可以
使用
这个特性吗?例如,创建一个由我想要
排序
的字段组成的字符串键?
浏览 6
提问于2022-03-28
得票数 0
1
回答
PyFlink -在JAR中
使用
Scala UDF的问题
、
我尝试
使用
外部JAR在Pyflink中注册一个Scala UDF,如下所示,但得到下面的错误。(MethodInvoker.java:244) at org.apache.
flink
.
api
.
python
.shaded.py4j.Gateway.i
浏览 20
提问于2020-10-27
得票数 1
回答已采纳
1
回答
如何在AWS EMR上运行pyflink脚本?
、
我很难在AWS上运行带有apache的基本word_count.py pyflink 成功地创建了AWSEMR6.5.0集群,并
使用
以下应用程序
Flink
、Zookeeper验证了
flink
sudo
flink
run -m yarn-cluster -yid <application_id> -py /usr/lib/
flink
/examples/
python
/table/word_c
浏览 17
提问于2022-01-29
得票数 2
回答已采纳
2
回答
Pyflink表
API
流组窗口
、
、
我正试图在PyFlink中的一个窗口上
进行
一些聚合。(MethodInvoker.java:244) at org.apache.
flink
.
api
.
python
.shaded.py4j.Gateway.invoke(Gateway.java:13
浏览 15
提问于2021-06-17
得票数 1
2
回答
org.apache.
flink
.table.
api
.ValidationException:无法为编写表“default_catalog.default_database.hTable”创建接收器
、
、
、
、
(MethodInvoker.java:244) at org.apache.
flink
.
api
.
python
.shaded.py4j.Gateway.invoke(Gateway.java:282) at org.apache.<e
浏览 73
提问于2022-10-21
得票数 0
回答已采纳
1
回答
排序
后的
Flink
join运算符似乎对字段
进行
了分组(Scala)
、
、
我已经
使用
Flink
实现了一个简单的Scala对象,
使用
joins操作符
进行
播放。之后,我设置了连接操作符show my result,我决定按第一个字段对输出
进行
排序
。输出似乎是按组
排序
的。如何对完整的DataSet
进行
排序
?import org.apache.
flink
.
api
.common.operators.Order import org.apache.
flink
.<em
浏览 8
提问于2018-03-03
得票数 0
回答已采纳
1
回答
合并重新平衡的分区
、
作为流媒体应用程序的最后一步,我想对系统中的乱序事件
进行
排序
。为此,我
使用
: events.keyBy((Event event) -> event.id) .process(new SortFunction())如果我的理解是正确的,那么在这种情况下应该发生什么,如果我错了,应该纠正我的错误,即给定的键(理想情况下是1/3)的每个事件的一部分将转到SortFunction的每个并行实例,在这种情况下,为了有一个完整的
排序
,我需要创建一个map,或者另一个processFun
浏览 20
提问于2019-07-01
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券