腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5569)
视频
沙龙
2
回答
为什么
这个速度
这么
慢
?(
DF
行
中的
循环
与
独立
的
向量
)
、
我的问题是,
为什么
这个相对于第二个太慢了。datos
DF
约为7500x18var。"ERROR. ent:%i dis:%i", d$ent[i], d$dis[i]))}你可以看到两个都是“相同的”,但是有问题的那个有这个
DF
而不是一个单独的
向量
。至少我有解决方案,但我喜欢
在
未来防止这种问题。 耽误您时间,实在对不起,
浏览 1
提问于2012-04-25
得票数 6
回答已采纳
3
回答
R dplyr过滤器函数删除其他
行
。
、
library (tidyverse) 1
df
1 <- filter (flights, month == 11 | month == 12)
df
1会产生预期的结果(总共55403次观察),
df
2也会这样做,但是数据集只包含一半的观测值(总共27702次)。
df
2删除了所有其他
行
。 我的问题是:有人知道
为什么
吗?我知道<
浏览 3
提问于2021-01-15
得票数 1
回答已采纳
1
回答
根据两个数据文件中多列之间的匹配值定义新列
、
、
我需要参考两个不同的数据集,其中
df
_port_call将最终包含类标签。 for index,
浏览 2
提问于2022-01-01
得票数 0
2
回答
R如何将带有递归滞后的for
循环
转换为函数?
、
、
、
、
我可以使用for
循环
计算一个递归变量,如下所示:
df
<- as.data.frame(cbind(1:10)) for(i in 1:length(
df
$V1)) {
df
$it <- 0.5*
df
$V1 + dplyr::lag(
df
$it, default = 0)
df
但是我怎样才能用一个动态的函数来做到这一点呢?堆栈使用率15924032太接近限制“: adstwm <- funct
浏览 7
提问于2021-01-21
得票数 0
1
回答
如何迭代每一
行
(每个单元格),并检查单元格是否包含值或nan,如果nan跳过
行
、
、
、
我有这样的代码 try:我需要做的是检查每个单元格是否包含一个值,然后只执行操作,否则我需要跳过
行
,现在我使用‘和’来检查每个单元格,但是正如我们看到的,如果有更多的列,那么我需要放很多条件词。
浏览 0
提问于2021-01-06
得票数 1
回答已采纳
2
回答
熊猫-根据没有for
循环
的条件,从返回的子集中编辑单个数据帧值。
、
、
、
、
‘'
df
’是一个包含多个
行
和几个列的数据文件: if row[3] == condition_a and row[4] == condition_b(我知道您不应该在
循环
中编辑dataFrame .)但是,我想知道我是否能做得更好,因为整个
循环
已经
在
父
循环
中了。 问题是,我只希望编辑返回子集的第一
行
,而不希望编辑整个子集。这就是
为什么
循环
浏览 7
提问于2021-03-05
得票数 0
回答已采纳
1
回答
Pandas astype()非常
慢
,有大量的空值?
、
、
我有一个相当大的数据帧(95,000
行
,68列)。当我加载excel文件时,它会使某一列从文本转换为整数。我要么需要一种方法
在
加载时指定某个列是用来保存字符串的,要么需要弄清楚
为什么
astype(str)执行得如此
慢
。(
df
)问题是,
在
我的另一个数据帧的一列(95000
行
)上运行它需要7我觉得这对于
这么
简单的改变来说是很慢
浏览 50
提问于2020-02-20
得票数 0
1
回答
R中的
慢
嵌套
循环
、
、
、
、
我是R的新手,
在
向量
化一个特别
慢
的嵌套
循环
时遇到了麻烦。
循环
遍历中心列表(存储
在
结构中的
向量
),并找到这些
向量
与
下面名为x的数组的
行
之间的距离。我知道这需要
向量
化以提高速度,但我找不到合适的函数或使用apply来做到这一点。
浏览 0
提问于2013-03-05
得票数 1
回答已采纳
1
回答
加速r
循环
字符串匹配(
向量
与
data.frame)
、
、
、
、
我试图
在
r中优化一个
循环
,该
循环
计算
向量
中每个元素
与
数据帧中每一
行
的字符串匹配数。
在
小数据集中,它工作得很好(大约15分钟;11列,914
行
)。然而,
在
大型数据集(914列,18.000
行
)中运行需要几天。下面是我非常基本的
循环
: for (i in 1:dim(pidf)[1]){ richa[i,j] <- lengt
浏览 5
提问于2016-11-29
得票数 0
回答已采纳
2
回答
如何计算大数据帧的欧几里德距离(并仅保存摘要)
、
、
、
我已经编写了一个简短的'for‘
循环
来查找数据帧中的每一
行
与
所有其他
行
之间的最小欧几里得距离(并记录哪一
行
是最近的)。从理论上讲,这避免了
与
尝试计算非常大矩阵的距离度量相关的错误。然而,虽然在内存中节省的内存不是很多,但对于大型矩阵来说,它是非常非常
慢
的(我的大约150K
行
的用例仍然在运行)。 我想知道是否有人可以建议或指出我
在
矢量化我的函数方面的正确方向,使用应用或类似的。对于这个看似简单的问题,我很抱歉,但我仍然
浏览 1
提问于2013-05-10
得票数 3
回答已采纳
1
回答
当
向量
中的至少一个对象与其他
向量
r中的至少一个对象匹配时,组和索引列
、
、
我试图找到一种方法来对行进行分组,并在不使用
循环
的情况下为每个组分配索引。困难在于分组变量num没有唯一的标识符;num是数字的
向量
(定义为字符)。我希望将至少
与
向量
中任何数字相匹配的所有
行
分组。;111', '1'))library(dplyr) mutate(num = str_split(num,
浏览 2
提问于2021-02-22
得票数 2
回答已采纳
1
回答
R-加速for
循环
和粘贴/粘贴之间的组合0
、
、
、
我正在处理一个有数百万行和四列(即染色体、位置、Allele1、Allele2)的数据帧'
df
‘。现在我想将这些列中的字符连接到一个单独的
向量
'cc‘中。这是我第一次尝试: myfunc = function(CHR) { cc = data.frame(No=当然,
在
'
df
‘的列Chromosome中,CHR必须在1到22的范围内。 我的想法是:我首先创建了一个名
浏览 12
提问于2021-01-07
得票数 0
回答已采纳
2
回答
为什么
这个
循环
的时间复杂度是非线性的?
、
、
、
、
为什么
这个
循环
的时间复杂度是非线性的,
为什么
它速度
这么
慢
?
循环
采用~38s for N=50k,和~570s for N=200k。有更快的方法来做到这一点吗?Rprof()似乎表明写入内存非常
慢
。
df
<- data.frame(replicate(5, runif(200000))) Rprof(line.profiling = TRUE);
浏览 0
提问于2016-01-16
得票数 9
回答已采纳
1
回答
为什么
在
data.table
行
索引上的for
循环
比
在
data.frame上
慢
?
、
、
、
我完全搞不懂
为什么
通过
行
索引访问data.table要比访问data.frame
慢
。有什么建议可以让我
在
循环
中按顺序访问data.table的每一
行
更快吗?m = matrix(1L, nrow=100000, ncol=100) DT = as.data.table(m) [1] FALSE > all(
DF
[100
浏览 3
提问于2014-01-10
得票数 6
1
回答
有效计算余弦相似度
、
、
、
我现在正在做这个:
df
['cosine_distance'] =
df
.apply(lambda x: cosine_distances(x["tf-idf"], x["new_string"]),我当时想的也许是一棵KD树,但它需要大量的记忆,因为tf-以色列国防军
向量
的维数是2000。
浏览 1
提问于2022-04-06
得票数 0
1
回答
简单嵌套
循环
问题
、
、
在
试图实现大型数据文件中嵌套的for
循环
时,我意识到嵌套的for
循环
并没有产生我预期的结果。这是我问题的摘录。
df
<- data.frame(nrow = 20, ncol = 1)我期望并希望嵌套的for
循环
浏览 2
提问于2016-04-14
得票数 0
回答已采纳
1
回答
从导入的dataframe
行
遍历
向量
。
、
在
我遇到困难的地方是设置一个for
循环
来一次迭代所有
向量
的相同位置,从而在功能上模拟R中的逐行函数,我还想将这个问题扩展到以下应用程序: 如何设置一个
循环
,
循环
遍历一
行
并更改每一
行
中的值,并返回修改过的
向量
?如何设置一个
循环
浏览 0
提问于2019-01-07
得票数 1
回答已采纳
2
回答
向量
化数据帧中值的比较
、
、
、
我正在尝试将数据帧的每一
行
中的参数的值
与
所有其他
行
中相同参数的值进行比较。结果是
在
每一
行
与
每一
行
的交集上的矩阵为真/假。以基于
循环
的方式实现它非常简单,但对于大型数据帧需要太多的处理时间。我不知道如何“
向量
化”这段代码(使用apply?)并加快处理代码的速度。在此之前,非常感谢您。到目前为止我使用的代码;adjm<- matrix(0,nrow=nrow(
df
),ncol=n
浏览 0
提问于2013-07-05
得票数 0
1
回答
对大数据帧进行赋值
、
、
for
循环
(迭代行)时,我的代码运行得非常
慢
somethingElse <- function() {3} for(i in 1:10000) { data[i,3]=somethingElse()) 上面的代码片段
在
我的笔记本电脑上运行了20秒
为什么
它在R中
这么
慢
?我记得读过R逐列存储矩阵(例如,
与
浏览 0
提问于2013-05-24
得票数 0
1
回答
Dask:合并后写入csv非常
慢
(python)
、
、
我有一个小的Pandas数据帧(2000
行
,35列),我将它与一个大的Dask数据帧(600万
行
,550列)合并在一起。我将小Pandas数据帧转换为Dask数据帧,并使用以下代码进行合并: final_
df
=dd.merge(left=small_
df
,right=big_
df
,how='inner',on=('var1','var2','var3')) 合并操作非常快,但运行这些代码需要一段时间: final_
df
浏览 28
提问于2020-07-16
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
这几个方法颠覆你对Pandas缓慢的观念!
Pandas中高效的“For循环”
深度学习工程师(六)——向量化
Python和R之间转换的基本指南:使用Python或R知识来有效学习另一种方法的简单方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券