我的最终目标是使用QUERY和IMPORTRANGE从两个不同的工作表中提取新工作表中的数据。现在,我只是试着从一张纸拉到另一张纸。这是我使用的公式:
=QUERY(IMPORTRANGE("1YRWamg6RKnyjo1rgWkn0Nl9BNamWlJp_CHsDbeSNfzA",“表单响应1!A:H"),"SELECT Col1,Col2,Col3,Col8 WHERE NOT Col8 !=‘我今天不使用运维电话。’”,-1)
这只产生了我正在尝试从帮助中导入数据的工作表的标题。有什么建议吗?
我想用你的智慧为数据仓库系统找到正确的解决方案。以下是一些更好地理解问题的细节:
数据被组织成一个星型模式结构,具有一个大的事实和15维。
每月20B事实行
包含100行的10个维度(某种层次结构)
5维数千行
2维~200 K行
2大尺寸,50m-100米排
两个典型的查询对此DB运行。
顶级成员在dimq:中
select top X dimq, count(id)
from fact
where dim1 = x and dim2 = y and dim3 = z
group by dimq
order by count(id) desc
针对元组的度
我想知道如何处理特定类型的算法或使用什么数据结构。这个算法本质上是,如果给定一个无限大的二维数组(在本例中,假设是一个100,000 x 100,000的数组),那么遍历每一列和更改值的最有效方法是什么,并且能够查看一行是否具有所有相同的元素(遍历所有行)
编辑:我指的是大的固定尺寸,而不是无限大。基本上,数组中的所有时间元素都是1和0。另外,当我使用一个简单的二维数组运行我的算法时,我得到了一个超过时间限制的错误,我确信这是由于遍历每一行而引起的。所以我只需要一种更快的方法来改变列中的值。但更重要的是,查看哪些行有匹配的元素。
我有一个问题,找到算法所需的内存的大O顺序意味着什么?
比如,这和大o操作有什么区别?
E.g
给出以下伪代码,并使用初始化的二维数组A,两维大小均为n:
for i <- 1 to n do
for j <- 1 to n-i do
A[i][j]= i + j
内存的大o符号不就是n^2,计算也是n^2吗?
我有两个numpy数组A和B,它们都具有维度[2,2,n],其中n是一个非常大的数字。我想在前两维中将A和B相乘,得到C,即C=AB,其中C有维数[2,2,n]。
实现这一目标的最简单方法是使用for循环,即
for i in range(n):
C[:,:,i] = np.matmul(A[:,:,i],B[:,:,i])
但是,这是低效的,因为n非常大。用numpy最有效的方法是什么?