腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
R
拆分
DF
并并
行
运行
测试
、
我有两个矩阵,我想对它们进行几次统计,将dataframe1的每一
行
与dataframe2进行比较。这些都是大型数据帧(300,000
行
和40,000
行
),因此需要进行大量比较。我想知道的是,是否有可能将dataframe1
拆分
成块,然后在多个内核上并行
运行
这些块。library(lawstat)
df
1 = matrix(ncol= 100, nrow=100)
df
1[,i] =floor
浏览 5
提问于2017-12-12
得票数 2
回答已采纳
0
回答
多pandas数据帧上的数据透视表
我将大数据
拆分
为5个数据帧,每个数据帧具有完全相同的
行
。只是想知道,是否有任何有效的方法来合并透视表
并并
行处理它们。想要做的过程是:
df
1 -->
df
2_pivot 目标是并行处理数据帧并合并它们pd.pivot_table(<e
浏览 8
提问于2017-06-02
得票数 0
2
回答
ROC曲线计算是可以
拆分
进行并行处理的吗?
在
R
(或任何其他平台/语言)中,ROC曲线的计算可以被
拆分
并并
行执行。我正在做一个w/ 150k
行
的计算,使用pROC包进行每次计算大约需要5-7分钟。
浏览 1
提问于2011-11-12
得票数 2
回答已采纳
1
回答
我如何在Python中设置和
拆分
一个dataframe值?
、
、
我一直在处理一个庞大的.csv数据集,为了以后对它们进行一些计算,我不得不对其中的每一
行
进行字符串
拆分
。我想要做的基本上是,我试图
拆分
默认字符串,这是在另一个csv数据文件,然后导出到另一个csv文件,我将对其进行一些相似
测试
。'] =
df
['Company'].apply(preprocess)
df
['Product'] =
df
['Product'].astype(str).str.repl
浏览 6
提问于2022-11-18
得票数 0
2
回答
如何使用Spark有效地检查列中的所有值?
、
Red | Red | White | Red | Red | Red |列只能在
运行
时知道val allColumns =
df
.columns val tmpDf =
df
.filter(
df
(column) === "Red&q
浏览 15
提问于2020-03-05
得票数 1
回答已采纳
1
回答
分割咕噜表任务
、
、
、
所以我有5个grunt-contrib-watch任务: 我知道grunt watch会关注所有这些内容,但我确实需要将它们分成两组--前四组用于我的设计人员
运行
静态服务器并执行sass工作时,最后两组用于执行js工作时。我正在使用grunt-concurrent将它们
拆分
并并
发<em
浏览 6
提问于2013-07-02
得票数 2
1
回答
使用gnu-parallel处理文件内容
、
我有一个文件,内容如下:/path/to/file2/path/to/file4 我想使用gnu-parallel实用程序在每一
行
上并行
运行
一个命令我不确定的是,我应该将哪些参数传递给gnu-parallel,以便按\n
拆分
文件内容
并并
行处理?
浏览 2
提问于2018-08-15
得票数 2
回答已采纳
1
回答
特定条件下通过列表的特定函数(用于循环和/或函数)
、
、
最初,我将我的
df
拆分
为三个
df
,并执行了以下操作: 基于
拆分
df
的旧代码!add_column(trophic = "pp", .before = "gmean")trophic_pt<- ...... same 然后,我合
并并
简化为最终的$ sites : chr [1:14100] "
R
1" "
R</e
浏览 36
提问于2021-02-25
得票数 0
回答已采纳
1
回答
如何在多行分隔行并在熊猫中添加新列?
、
、
、
我正在尝试将
行
拆分
为多个
行
,但当
拆分
发生时,我需要再添加一列。你能帮我怎么做吗?示例:
R
162 2.3 1预期产出: rule_id priority_orde
浏览 1
提问于2020-05-21
得票数 0
回答已采纳
1
回答
如何并行读取HBase的一个区域?
我想通过多线程读取一个区域来提高客户端的扫描速度,但是这个区域有一个起始键和结束键的元组,如何从一个区域的起始键和结束键中分出几组开始键和结束键?
浏览 0
提问于2018-03-28
得票数 1
1
回答
如何在Pyspark Dataframe中训练和
测试
拆分
的时间序列数据
、
、
、
我想对排序后的Pyspark数据帧进行基于时间的训练
测试
拆分
。假设前300
行
将在训练集中,下200
行
将在
测试
拆分
中。我可以用以下命令选择前300
行
: train =
df
.show(300) 但是如何从Pyspark dataframe中选择最后200
行
呢?
浏览 14
提问于2019-03-13
得票数 1
1
回答
使用Keras构建神经网络时,对数据进行预处理以区分输入变量和样本数据
、
、
我如何处理这种情况,以便正确地
拆分
用于训练和
测试
的数据。数据都是数字的,它不是分类的。它将被用来预测运动。
浏览 45
提问于2021-08-13
得票数 0
1
回答
在python中手动创建训练和
测试
数据集
、
、
我试图手动将数据集分割为训练和
测试
数据集,这意味着我不想使用scikit learn包。我希望以这样的方式
拆分
它们:如果
行
索引模块4等于0,则将它们放入训练数据集中,否则将它们放入
测试
数据集中。我已经在
R
中这样做了: testidx = which(1:nrow(price_accommodates_bedrooms )%%4 == 0)
df
_test = price
浏览 12
提问于2020-03-27
得票数 0
1
回答
分列列车/准确行数
测试
、
、
有大约6,000,000
行
的数据集。我使用以下代码将数据集
拆分
为火车集和
测试
集:train, test = train_test_split(
df
, test_size=0.3, random_state=42) 我想要的是将
测试
集精确地
拆分
到一定数量的
行
上,例如,
测试
集的50,000
行
。
浏览 3
提问于2021-02-09
得票数 4
回答已采纳
3
回答
R
循环帮助根据条件进行修整
、
、
我对
R
还不熟悉,并且还在为for循环而挣扎:我想根据我的
df
条件在
df
中
拆分
一些字符串: 我想用"X“开始分割,以识别我使用- grepl("X.",
df
1[,1])来
拆分
- str_split_fixed(
df
1[,1],"X",2)[,2],并且不确定如何将它合并到循环中. # if (beginswith X) then split因此,这里
浏览 4
提问于2022-01-08
得票数 0
回答已采纳
3
回答
我们可以在pandas中使用explode()的替代选项吗?
、
、
、
我正在尝试
运行
python脚本,在该脚本中我使用explode()将
行
拆分
为多行,但条件是我们可以在较高版本的pandas中使用explode(),这意味着pandas版本应大于或等于'0.25.0'所以在更高版本的pandas中,explode()
运行
得很好。output_condition', 'priority_order']).apply(lambda x: x.astype(str).str.split(',').explode()).rese
浏览 21
提问于2020-06-05
得票数 1
回答已采纳
1
回答
根据单元格值有条件地执行计算
、
、
、
新的
df
用于跟踪某些ID的响应。回答要么是,要么不是。有些ID将有所有的一种类型的响应,另一种,或者两者的混合,没有模式,whcih有哪个响应。下图为示例:我需要得到每个id的响应总数。我的最初解决方案是将“是”和“否”
行
拆分
为不同的数据格式,然后在ID上合
并并
创建一个新的列,从“不计数”中减去“是”计数。代码如下:
df
=
df
_all.groupby(['ID', 'yes_no'].size().reset_index(name
浏览 17
提问于2022-03-24
得票数 0
1
回答
拆分
奇数
行
的DataFrame,不使用双iloc
、
、
、
测试
df
'B':[4,5,6,1,4,6],'C':[7,8,9,2,7,3],由奇数
行
浏览 1
提问于2016-06-20
得票数 5
回答已采纳
1
回答
R
随机森林未定义列问题
、
、
我将数据
拆分
来训练和
测试
,下面是
R
代码后的相同: traindata <- tdm_
df
[s,] # training set method = "rf", trControl = ctrl) # train random forest rf.tfidf 当我
运行
最后一
行
时
浏览 26
提问于2019-09-13
得票数 0
回答已采纳
2
回答
如何在TFS 2013上并行
运行
MSpec
测试
?
、
我正在尝试让一堆MSpec
测试
在TFS 2013的多核上
运行
。它似乎不是从盒子里做出来的。它可以
运行
MSpec,但只能按顺序
运行
,需要一个多小时。我遵循,但在步骤4中,他说用ParallelForEach替换Foreach Xaml元素,使
测试
并行
运行
。我在TFS 2013中下载了默认构建模板。它简单得多,但它没有这个标签。
浏览 0
提问于2015-03-03
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
盘点一个Python自动化办公Excel数据处理的需求
如何用几行代码运行 40 个回归模型
Pandas实现分列功能
R语言深度学习Keras循环神经网络(RNN)模型预测多输出变量时间序列
盘点一个Excel数据分割和explode()实战问题
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券