我是机器学习的初学者,我是通过参与Kaggle竞赛来学习的。我从著名的泰坦尼克号生存问题开始,通过尝试/从别人那里得到帮助,我能够训练我的数据,但我的问题是:我如何理解输出并进入下一阶段?
这是我的密码:
import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split
train_path = "C:\\Users\\Omar\\Downloads\\Titanic Data\\train.csv"
t
我想使用准确率、精确度、召回率和F-measure作为性能度量。在只考虑准确性的情况下,代码工作得很好,但是当有很多指标时,我会得到错误。我想知道我怎样才能做到这一点?
import matplotlib.pyplot as plt
from sklearn import model_selection
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassif
我对randomForest的模型调用是:
Call:
randomForest(formula = medv ~ ., data = training_set, ntree = 100, set.seed = 500)
Type of random forest: regression
Number of trees: 100
No. of variables tried at each split: 4
Mean of squared residuals: 0.1200638
% Var explained: 87.96
我们如何解释所有这些数字?对No.有什么建议?在每
要编译tf.keras模型,您可以这样做:
model.compile(
optimizer='sgd',#'adam', or what not
loss='sparse_categorical_crossentropy',
metrics=['accuracy','mae']
)
还有哪些指标可以用作' metrics‘的参数值?我试图在中寻找它们,但没有结果。我在找整个名单。
编辑:我知道可以使用显式的形式。例如:
metrics=[tf.keras.metrics.Mean