腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
pandas
块
处理
大
数据
,
将
x_train
和
y_train
的
数据
拆
分成
机器
学习
?
pandas
、
machine-learning
Df_chunk=pd.read_csv(文件名,chunk=1000)
X_train
、
Y_train
、X_test、Y_test=train_test.split(df_chunk)
如何
使用
df_chunk对x
和
y训练
数据
进行分割
浏览 11
提问于2021-05-03
得票数 0
3
回答
从CSV文件加载线性支持向量机分类
数据
集
python
、
svm
、
libsvm
, 5, 10, 15, 20.25, 43, 9.55, 10.34, B我试图将此
数据
集分离并分类为以下内容x(样本
数据
),而"M,M,B,B,M”中
的
那个是y(这是与其
数据
集匹配
的
分类)。我正在尝试创建一个已经加载
的
python代码,它可以打印出被
数据
分隔
的
数据
以及它
的
分类。它与线性支持向
浏览 3
提问于2019-11-20
得票数 1
回答已采纳
1
回答
当
数据
非常庞大时,
将
数据
放入
机器
学习
keras模型中
python-3.x
、
numpy
、
machine-learning
、
keras
、
numpy-ndarray
在
使用
keras
的
机器
学习
教程中,训练
机器
学习
模型
的
代码就是这个典型
的
一行代码。model.fit(
X_train
, nb_epoch=5, validation_split=0.1) 当训练
数据
X_train
和<
浏览 13
提问于2018-08-17
得票数 2
回答已采纳
1
回答
如何
解释虹膜
数据
集结果?
python
、
scikit-learn
我正在
使用
虹膜
数据
集
学习
机器
学习
的
基础知识。我想我理解了拆分
数据
并对新
数据
进行预测
的
想法;但是,我在理解以下代码得到
的
结果时遇到了问题: iris = load_iris()y = iris.target
X_train
, X_test,
y_train
, y_test = train_test_split(
浏览 0
提问于2020-02-24
得票数 0
2
回答
对
数据
拆分进行随机化,以便对此函数进行训练
和
测试
python
、
arrays
、
python-3.x
、
numpy
我写了一个函数,根据总大小
的
百分比
将
numpy ndarray、x_data
和
y_data拆
分成
训练
和
测试
数据
。percentage_split): p = int(number_of_samples * percentage_split)
y_train
= y_data[0:p] x_test
浏览 1
提问于2018-08-20
得票数 2
回答已采纳
2
回答
给定一个单独
的
离散
数据
集,我应该
如何
将其划分为训练
数据
和
测试
数据
?
machine-learning
、
xgboost
、
training
我有一个libSVM格式
的
数据
集,由6000个条目组成,每个条目有5个索引,每个索引有一个二进制值1或2。每一个条目的标签为1或0,我正在尝试
使用
各种
机器
学习
算法来确定给定一组特定5个索引/值
的
正确标签(0或1)。例如,考虑以下
数据
集(真正
的
数据
集是6000行):0 101:0 102:1 103:0 104:1 105:1 0 101:0 102,如xgbo
浏览 0
提问于2019-04-10
得票数 0
1
回答
如何
预测需要预加工
的
单个
数据
样本
machine-learning
、
scale
当我阅读scikit
学习
示例时,典型
的
机器
学习
流程是预
处理
-->
学习
-->预测。Pipeline(steps) y_pred = pi
浏览 1
提问于2018-04-04
得票数 0
回答已采纳
5
回答
将
张量
分成
训练集
和
测试集
tensorflow
、
cross-validation
、
training-data
假设我
使用
TextLineReader阅读了一个文本文件。在Tensorflow中,是否有办法将其分为训练集
和
测试组?
浏览 8
提问于2017-01-25
得票数 23
回答已采纳
3
回答
什么是培训
和
测试
数据
集?
machine-learning
、
dataset
、
data-science
、
kaggle
我刚刚参加了各种
数据
科学
和
机器
学习
比赛。有人能解释一下这些
数据
集是什么以及我们
如何
在解决问题
的
同时
使用
这些
数据
集吗?
浏览 3
提问于2017-09-15
得票数 1
4
回答
XGBoost大型
数据
集~1TB
bigdata
、
data
、
xgboost
像XGBoost或Lightbgm这样
的
梯度增强解决方案可以用于大量
的
数据
吗?我有一个820 of
的
csv文件,包含10亿个观测,每个观察都有650个
数据
点。对于XGBoost来说,这是太多
的
数据
吗?我已经在互联网上搜索了一个解决方案,当
数据
无法进入内存内存时,就没有用了。我读过关于xgb
的
外部内存
的
文章,但是没有详细
的
文档。谁能帮我指出正确
的
方向吗?
浏览 0
提问于2019-06-15
得票数 8
1
回答
基于NumPy
的
自动Keras训练中
的
StratifiedKFold数组值错误
pandas
、
numpy
、
tensorflow
、
keras
、
auto-keras
背景 我
的
情感分析研究涉及到各种各样
的
数据
集。最近,我遇到了一个
数据
集,不知何故,我无法成功地进行训练。我主要
处理
的
是.CSV文件格式
的
开放
数据
,因此
Pandas
和
NumPy被大量
使用
。在我
的
研究中,其中一种方法是尝试集成自动
机器
学习
(AutoML),而我选择
使用
的
库是Auto-Keras,主要是
使用<
浏览 5
提问于2022-05-06
得票数 0
回答已采纳
2
回答
scikit
学习
LinearRegression字符串预测值
python
、
pandas
、
scikit-learn
在
使用
教程完成了一些课程
和
示例之后,我尝试创建我
的
第一个
机器
学习
模型。我从这里获得了训练
数据
:,我正在
使用
panda加载这个csv
数据
。 主要问题是预测列是字符串,并且所有算法都
使用
浮点数。当然,我可以手动映射所有带有数字(0,1,2)
的
字符串,并
使用
更改后
的
文件,但我尝试找出一种方法,
使用
panda或scikit自动替换字符串值-
学习
并将它们映
浏览 0
提问于2017-03-07
得票数 0
1
回答
为多标签分类准备训练
数据
集
python
、
scikit-learn
、
classification
、
multilabel-classification
我只是遵循了代码 (对sklearn 0.17做了一些小
的
修改)。在该示例中,
数据
只是列表或numpy数组。现在我想在磁盘上准备一个玩具训练
数据
集,并
使用
datasets.load_files加载它以进行多标签分类。然而,简单地遵循约定,然后将相同
的
文件复制到多个文件夹中,并不会生成列表列表(也就是。那么,为多标签分类准备
数据
集
的
正确方法是什么?
浏览 0
提问于2016-05-02
得票数 2
2
回答
在Python中执行SVM时
的
值错误
python
、
scikit-learn
、
svm
我试图
使用
生成
的
数据
集运行支持向量机线性内核。我
的
数据
集有5000行
和
4列:我
将
数据
分成
20%
的
测试
和
80%
的
培训:并得到一个形状为(4000,4)
的
列车<
浏览 2
提问于2019-11-11
得票数 0
回答已采纳
3
回答
Python数组错误
python
、
scikit-learn
对于
使用
sklearn
和
python进行
数据
分析,我还是比较陌生
的
,并且尝试在我从.csv文件中加载
的
数据
集上运行一些线性回归。我已经
将
数据
加载到train_test_split中,没有任何问题,但是当我试图匹配我
的
训练
数据
时,我会收到一个错误ValueError: Expected 2D array, got 1D arraymodel = lm.fit(
X_train
,
y_train<
浏览 0
提问于2018-03-27
得票数 0
回答已采纳
1
回答
ValueError: X有两个特性,但MinMaxScaler需要一个特性作为输入
python
、
pandas
、
dataframe
、
numpy
、
scikit-learn
我
将
numpy数组
分成
X
和
y,最初由
Pandas
DataFrame组成,如下所示:array([[ 2.86556780e-03, 1.87100798e-01],array([19.08666992, 19.09239006, 19.08938026, ..., 45.21157634,我将它们
分成
训练
和
测试
数据
集(X, y, test_si
浏览 20
提问于2022-03-07
得票数 0
回答已采纳
1
回答
Sklearn.linear_model导入LinearRegression不适用于
数据
系列,但适用于
数据
帧。为什么?
python
、
pandas
、
dataframe
、
series
、
sklearn-pandas
我
使用
了下面的代码
块
,我得到了一个回溯错误;from sklearn.linear_model import LinearRegressionregressor = LinearRegression(fit_intercept=True)-----------464
浏览 0
提问于2020-01-07
得票数 2
2
回答
如何
重塑
机器
学习
数据
以匹配输入形状?
python
、
numpy
、
machine-learning
、
model
、
artificial-intelligence
所以我有一些
机器
学习
数据
分成
测试
和
训练
数据
。
数据
从csv文件中导入,并
使用
numpy数组拆分为训练
和
测试
数据
。我能够很好地拆分
数据
,但是当我试图在模型中
使用
这些
数据
时,我会得到以下错误: ValueError: Input 0 of layer "mobilenetv2_1.00_3998" is incompatible
数据
浏览 13
提问于2022-02-17
得票数 -1
1
回答
执行K-折叠交叉验证:
使用
相同
的
培训集
和
单独
的
验证集
validation
、
machine-learning
、
statistics
、
scikit-learn
、
cross-validation
我正在
使用
Python
学习
框架来构建一个决策树。目前,我正在将我
的
培训
数据
分成
两个单独
的
集合,一个用于培训,另一个用于验证(通过K重交叉验证实现)。要交叉验证我
的
模型,我应该像上面概述
的
那样将我
的
数据
分成
两组,还是简单地
使用
完整
的
培训集?我
的
主要目标是防止过度适应。我在网上看到了关于这两种方法
的
使用
和<
浏览 4
提问于2015-11-23
得票数 1
回答已采纳
4
回答
ValueError:输入包含无穷
大
或值对于dtype('float64')太大
python
、
machine-learning
我需要帮助我正在研究
机器
学习
。我尝试
使用
以下代码导入
数据
集: import numpy as np
浏览 0
提问于2019-04-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
FX某飞学城Python开发+AI人工智能工程师(完结)
数据预处理代码分享——机器学习与数据挖掘
没事也来跑跑代码吧
机器学习整体流程总结
简单教程:用Python解决简单的水果分类问题
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券