我正在运行一个分类器(logistic回归)。我的数据集上的信息如下:
dataset size= 279 observations
(第80/20号规则)
train size= 233
test size = 56
# of events in train = 31
# of events in test = 8
我想我的分类器和结果可能会因为这个比例不相等而受到影响。有什么办法可以避免偏见问题和提高准确性吗?你个人对这些数据有何看法?
我正在使用Talend Open Studio fro Integration版本7.1.1。我需要连接Azure数据库的数据提取和数据上传从Talend到我们的SQL数据库。我已经通过下面的链接连接到Azure cosmos dbs。
但在我的Talend DB连接中,我可以找到任何CosmosDBconnection类型或组件。甚至我试着在包中搜索,但没有找到。谁能告诉我如何安装或启用CosmosDBConnection或如何使用Talend连接到Cosmos数据库。
我刚刚开始学习一些关于数据库的东西,我意识到有DBMS和RDBMS。 我个人使用MS SQL SERVER 2014和MS SQL Server Management Studio 2014。我如何确定/选择是否要使用DBMS或RDBMS,我与此有何关系,我如何知道我正在使用的是什么? 如果有人问我“您使用的是rdbms还是dbms”,我应该怎么回答? 如果我将表关联在一起,我的系统会变成RDBMS吗? 我不明白这个。