腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
用于
数据
仓库的OBT (一个
大
表)与星型模式
、
面试过程的一部分包括
数据
建模和ETL设计。Kimball的“
数据
仓库工具包”描述了一个维度
模型
,它代表了一家公司,比如塔吉特( Target )或沃尔玛( Walmart ),零售额及其相关尺寸。我听说过像我这样的公司使用OBT或"One Big“方法,通过消除对JOIN的需求,使
分析
师的生活更加轻松,并提高查询性能。此外,如今存储成本如此之低,而且大多数现代DWs (Redshift、BiqQuery等)都采用了基于柱状结构的体系结构,我认为我们可以安全地抛开对额外冗余的担忧(在两个表中出现两次相同的
数
浏览 0
提问于2022-03-29
得票数 1
1
回答
计算时间和精度折衷
、
我知道有许多预测
模型
(广义线性
模型
、树
模型
、神经网络
模型
、支持向量机
模型
、knn
模型
、朴素贝叶斯
模型
、.)已经被提议用于执行各种
分析
任务。现在,当
数据
被称为“
大
”时,我正在努力寻找关于它们性能的适当引用。换句话说,当
数据
变得非常
大
时,它们的性能如何?训练时间是否比线性增加得多?当
数据
高时(对于各种预测
模型
),在计算时间和精度之间是否存在比较基准。
浏览 0
提问于2015-05-11
得票数 1
3
回答
用最坏/avg/
最佳
情形进行渐近
分析
、
、
、
、
我知道最坏的/avg/最好的情况是用来确定算法的复杂度时间成一个函数,但是它是如何用于渐近
分析
的呢?我理解上/紧/下界(
大
O,
大
欧米茄,
大
θ)是用来比较两个函数,并看到它的极限(增长)是从另一个角度看的,随着n的增加,但我很难看出最坏/avg/
最佳
情况
大
O和渐近
分析
之间的区别。把我们的最坏/avg/
最佳
情况
大
O计算到渐近
分析
和测量界,我们
浏览 5
提问于2013-08-11
得票数 0
回答已采纳
2
回答
如何向客户端web提供输出
、
我已经将Firestore集合导出到Google来进行
数据
分析
和聚合。什么是向客户端web应用程序提供
大
查询输出的
最佳
实践(使用Google产品)?
浏览 3
提问于2020-05-27
得票数 0
回答已采纳
4
回答
如何从COBOL/CICS系统迁移到现代Oracle/C++/Server安装程序
、
、
、
、
我在这里的具体问题是: 问候
浏览 3
提问于2009-03-06
得票数 2
1
回答
基于3个月
数据
集的多变量时间序列预测
、
、
、
我有3个月的
数据
(每一行对应于每一天),我希望对相同的
数据
执行多变量时间序列
分析
:Date Capacity_booked Total_Bookings Total_Searches%Variation 我收到的输出是- 预测
数
浏览 10
提问于2019-11-17
得票数 13
2
回答
Sybase PowerDesigner中的多态性关联
、
、
我想在Sybase PowerDesigner工具中实现4个实体之间的多态性,但在概念
数据
模型
中没有解释如何做到这一点。 你能帮我做这个吗?
浏览 0
提问于2011-05-06
得票数 0
回答已采纳
1
回答
当训练
数据
集中时,XGBoost和随机森林导致对测试集的不断预测。
、
、
、
、
我正在做组学
数据
分析
,我有一个269x600
数据
集,我分成训练和测试集(80-20)。我要预测的变量是嬉皮士的浓度,有4个不同的值(0,75,150,300),但我正在对其进行回归。我在以XGBoost为中心的培训集上使用caret基础设施运行随机森林和,在那里进行交叉验证以选择
最佳
的超参数。问题是,当我使用选定的
模型
预测测试集时,我获得了(几乎)常数的预测。然而,当我运行相同的
模型
,但在非中心训练集,预测是非常好的,这些甚至超过了我以前的所有
模型
。 因此,我的问题是:
浏览 3
提问于2017-05-21
得票数 1
1
回答
对Django中的用户继承的两种
模型
使用信号
、
、
、
、
假设我们有两个向用户
模型
发送信号的
模型
:from django.contrib.auth.models import User ) 现在,每次创建用户时,我们都可以通过个人
模型
和公司
模型
来扩展它
浏览 2
提问于2021-12-29
得票数 0
1
回答
firebase/GA4
数据
在Bigquery中是否会回溯更改
、
、
、
、
我现在正在BigQuery中设置GA4/Firebase,并在它上面使用进行
分析
。由于这两个源的
数据
非常
大
,我希望激活增量加载,并且只更新今天+昨天的
分析
模型
(而不是每次完全刷新所有
数据
)。这就是我不确定的地方: GA4/Firebase
数据
可以回溯更改吗?如果是,需要多少小时/天? 提前感谢!
浏览 2
提问于2021-03-26
得票数 2
1
回答
Spring Roo -
数据
库反向工程冻结
、
、
我能够运行Oracle
数据
库逆向工程--模式来创建roo>
数据
库的
模型
,以验证我正在进行的概念验证。命令行在第三次尝试更新架构后冻结。我可以在spring-roo日志中看到以下内容: // Spring Roo 1.3.2 reverse rev 8387857日志打开时间: 2016-04-13 19:39:41
数据
库属性列表//
数据
库反向工程失败
浏览 2
提问于2016-04-14
得票数 0
1
回答
为Server
分析
服务导入VS连接
、
、
我想知道与
数据
库方法之间的区别,因为我知道我将使用度量值。 消息模板维度(具有与部门同名的应用程序名称)
浏览 2
提问于2019-05-20
得票数 0
回答已采纳
1
回答
大
数据
支持向量机建模
、
、
但是有更多的
数据
行作为201497,我不能为
数据
建模的处理提供更多的内存(获取问题:不能分配大于2.7GB的向量大小)。 因此,我已经使用了Amazon微型和大型的SCM建模实例。有人能建议我用大
数据
建模来解决这个问题吗?或者这有什么问题吗?
浏览 3
提问于2012-10-30
得票数 1
1
回答
在有噪声的标签分类任务中要检查哪些样本?
、
、
我有一个带有噪声标签的
数据
集,我在其上训练一个二进制分类器。检查损失,我发现一些样本被错误地分类为高置信度,另一些被分类为犹豫不决,大约0.5置信度。如果我有一个预算来检查错误预测的样本并对它们重新命名,那么选择
模型
确定但错误的样本还是
模型
不确定的样本更好呢?一方面,如果我选择的样本
模型
有很高的可信度,它可能是一个样本的分类正确,但有一个不好的标签,或样本确实被错误分类。后者是一个非常有价值的样本,因为分类器有很高的可信度。然而,前者是无用的,因为
模型
实际上是正确的。 另一方面,如果我选择的样本
模
浏览 0
提问于2021-03-24
得票数 1
回答已采纳
1
回答
Matlab
模型
设计后的重用降维
、
、
、
、
一些降维方法,如逐步回归报告
最佳
特征,所以我将使用这些特征作为我的分类模式和另一种方法,如PCA转换
数据
到一个新的空间,例如,我使用60%的
最佳
报告列(特征)。关键问题是在使用最终
模型
的阶段。例如,我使用过去一年和两年前的财务
数据
作为今天的财务状况。所以现在我想用过去和今天的
数据
来预测明年。我的问题是:在插入我设计的分类
模型
之前,我应该使用PCA作为新的输入
数据
吗?如何使用(例如,主成分
分析
)来处理这些
数据
?我必须像
浏览 3
提问于2014-03-27
得票数 0
回答已采纳
1
回答
Tensorflow如何从
大
图像的小
数据
集中采样大量纹理
我有100张
大
尺寸(1000x1000)的图像,我想用它们作为纹理
分析
系统的训练
数据
集。我想随机生成大约200x200的纹理样本。做这件事最好的方法是什么?实现包括
模型
中的预处理层,这些层在图像上进行随机裁剪,并且只做大量的时期来容纳少量的
大
图片,但是在大约400个时期之后,TF将毫无例外地崩溃(它将退出)。我现在发现自己编写了一个
数据
生成器(tf.keras.utils.Sequence),它将在请求时返回一批样本,但我感觉自己正在重新发明轮子,它变得越来越笨拙-让我认为这不是最好的方
浏览 11
提问于2021-05-08
得票数 0
1
回答
如何将时间序列
数据
传递给SARIMA,ARIMA,SARIMAX等
、
、
我试图预测一家公司的股价,
数据
是非平稳的。
分析
原始
数据
用静态
数据
绘制ACF、PACF图确定MA和AR滞后我应该将
浏览 0
提问于2023-05-08
得票数 0
回答已采纳
1
回答
改进表识别
、
我尝试使用表单识别器
分析
发票,标签tool.The发票包含字段和表
数据
。表中的所有
数据
都由ocr进程识别并可读。不幸的是,这些表并不总是被认为是表。有时,只有一半的
数据
被识别为表,在某些情况下,没有任何标记为表。说:“表
数据
应该被自动检测,并在最终的输出JSON文件中可用。但是,如果
模型
无法检测到所有表
数据
,您也可以手动标记这些字段。用不同的标签标记表中的每个单元格。如果表单中的表有不同的行数,请确保至
浏览 4
提问于2020-07-08
得票数 1
1
回答
数据
建模和维度建模有什么区别?
、
、
、
、
我一直在学习
数据
仓库的概念,我发现这两个主题有点令人困惑。我读过多篇博客文章,我明白
数据
建模包括三个步骤在
数据
仓库中,我们需要执行某些步骤:步骤2:确定措施步骤4:确定度量的粒度如果有人问,如何设计一个
数据
仓库,什么应该是正确的答案。在设计
数据
仓库时,这些建模技术从何而来。 如果有人能为我提供任何关于
浏览 0
提问于2020-11-19
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
2020十大最佳大数据分析工具,果断收藏
数据监控分析模型研究
“数据中心服务能力成熟度评价模型”分析机房服务能力域最佳手段
小白学习数据分析的最佳方法
爆款的数据化模型分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券