腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何通过OpenNLP从
HTML
格式的EMail文件中提取数据?
、
、
、
、
这些电子邮件是
HTML
格式。 但是,它们并不都形成一个特定的结构。每封电子邮件的格式都不同。我尝试过jsoup来提取数据,但是很难为每种特定类型的
html
编写提取
代码
。我是否可以创建自己的包含
html
内容的
训练
数据,对其进行注释,并根据
训练
数据中的
html
结构对其进行
训练
,以检测位置和名称?
浏览 0
提问于2016-01-03
得票数 0
4
回答
KNN算法在
训练
阶段做什么?
、
、
与线性回归等其他算法不同,KNN似乎不会在
训练
阶段执行任何计算。就像在线性回归的情况下,它在
训练
phase.But中找到系数,那么KNN呢?
浏览 62
提问于2019-02-04
得票数 9
回答已采纳
1
回答
xgboost和sagemaker.xgboost有什么不同?
、
、
、
、
问题真的很清楚。现在我正在学习AWS的世界,这个问题让我头疼。import xgboost和import sagemaker.xgboost的区别是什么? 在SageMaker上,我可以使用普通的XGBoost库,我知道我可以用sagemaker.xgboost选择不同的EC2类型。但是除了这个,还有什么不同呢?有什么很大的区别吗?
浏览 12
提问于2020-10-09
得票数 0
1
回答
fasttext train_supervised函数有没有理想的参数值?
、
、
、
、
我正在用fasttext的train_supervised
训练
我的模型,但是对于这个函数,有没有什么理想的或最好的参数值,你可以告诉我,我也在使用Kfold和一些值,我如何在这个问题中找到最佳的K-折叠数我的解决方案是使用快速文本的自动调谐功能来为模型找到最佳的参数值来
训练
,但是有什么可能的建议给我吗?下图显示了我在模型中的最佳参数。最后,我使用fasttext的预
训练
单词向量模型进行
训练
。 ?
浏览 87
提问于2021-11-02
得票数 0
回答已采纳
3
回答
当分析人员而不是开发人员编写测试时,对规范的工具建议?
、
、
、
但是,我不希望开发人员、测试人员或领域专家不得不阅读或编写类似于
代码
的内容。 到目前为止,我已经看过、和其他各种(例如)。我拒绝接受spock和类似的工具,因为它们以开发人员为主要受众。
浏览 2
提问于2011-12-19
得票数 5
回答已采纳
1
回答
LightGBM最佳迭代始终返回1
、
'colsample_bytree': 0.08, 'lambda_l2' : 0.2,} 使用
训练
参数20000,) 但我的
训练
过程总是在我从
训练
函数中删除了它,
训练
浏览 43
提问于2020-06-22
得票数 0
3
回答
源
代码
交接
训练
我们必须在我们开发的应用程序的源
代码
上培训客户专业人员。我应该在他们的源
代码
培训计划中包含什么内容?任何帮助都将不胜感激。 问候
浏览 3
提问于2008-10-22
得票数 2
回答已采纳
1
回答
使用OpenIE提取给定实体的关系
、
我想知道是否可以使用OpenIE,或者是否有一个可用的选项可以用来指定实体,而不是使用OpenIE从文本中提取它们。以及它找到的实体之间的关系? 例如:奥巴马是美国总统。投入-奥巴马,美国产出-总裁
浏览 21
提问于2019-06-11
得票数 0
1
回答
提高CNN模型对水果分类的精度- Pytorch
、
我需要用3600个
训练
图像和900个测试图像对樱桃、草莓和西红柿进行分类。然而,我的模型表现很差,而且拟合过度。我尝试了weight_decay以避免过拟合,但模型给出了形状不适合的错误。我的
训练
准确率是85%,我的测试准确率是60%。 这大致是我的
训练
数据,它们都在300x300像素左右 ?
浏览 39
提问于2021-10-04
得票数 1
2
回答
SageMaker TensorFlow估计器源
代码
S3上传路径
、
、
、
我使用SageMaker TensorFlow估计器进行
训练
,并使用output_path参数指定模型工件的输出路径,其值为s3://<bucket>/<prefix>/。模型
训练
完成后,将在指定的output_path中创建一个名为<training_job_name>/output的目录。我遇到的问题是,默认情况下,用于
训练
的源
代码
也会上传到S3,但不是放在s3://<bucket>/<
浏览 26
提问于2019-05-19
得票数 0
回答已采纳
2
回答
使用sklearn和随机森林显示过拟合
、
、
、
、
我相信这可以通过
训练
模型来证明,直到我们看到
训练
的准确性在增加,验证数据在减少。但是我如何在
代码
中做到这一点呢?
浏览 59
提问于2020-10-25
得票数 0
2
回答
在Keras中连续
训练
多个模型以进行超参数优化
、
、
、
其思想是使用相同的
训练
数据集
训练
多个模型,每次更改一些参数,以查看哪个参数效果最好。为了做到这一点,我需要每次从头开始
训练
每个模型。我当前的
代码
(简化)是: scores= [] model = Sequential() model.add(...)但我不能理解
代码
是否做了上面描述的事情,或者相反,是否
训练
了依赖于前一个模型的模型。
浏览 24
提问于2019-10-02
得票数 3
回答已采纳
1
回答
Microsoft azure是否具有对pdf或word文件进行分类的认知服务?
、
、
、
我是微软认知服务的新手,并且已经经历了自定义视觉,其中我们可以对可以在运行时分类的图像进行分类。我们有一些类似的产品,我们可以上传一个.PDF或word文件,它会根据之前的培训返回类别。 我也接触过Azure的ML studio,但它似乎不接受PDF和word文件
浏览 16
提问于2020-08-18
得票数 0
1
回答
如何在AWS理解中获取(或
训练
理解)文档类别
、
或者,我如何
训练
AWS理解来识别文档的类别?
浏览 20
提问于2021-10-29
得票数 0
1
回答
OpenNLP可以使用超文本标记语言作为培训的一部分吗?
、
、
、
、
我正在使用转换成纯文本的
html
文档为TokenNameFinder创建一个
训练
集,但是我的精度很低,我想使用
HTML
标记作为
训练
的一部分。比如粗体的单词和不同页边距的句子。
浏览 2
提问于2012-04-11
得票数 1
回答已采纳
1
回答
如何在tensorflow.js中
训练
doc2vec模型?
、
、
、
、
我需要在tensorflow.js中
训练
一个doc2vec模型,以便将其部署到浏览器上。可以在tensorflow.js中
训练
doc2vec模型吗?
浏览 6
提问于2020-12-29
得票数 0
1
回答
如何将清理后的文本数据拆分成除随机抽样以外的
训练
和测试数据集
、
、
、
、
的数量干净的id表示它是唯一的,并且有一些原始id映射到它现在我不想随机拆分我的清理的文本数据(’clean_df‘)我需要一些基于标准的采样来从这个大约2k行的整个清理的文件中创建两个数据集,一个用于
训练
模型
浏览 13
提问于2019-10-17
得票数 1
3
回答
如果本地离群点因素需要没有异常值的
训练
数据,为什么它被归类为无监督的?
、
所以我不明白为什么这个算法需要预先过滤的
训练
数据。也许这里的“培训数据”仅仅意味着“数据开始?”但是SciKit- training提供的示例
代码
清楚地显示了没有异常的培训数据。更重要的是,如何使用该算法在
训练
数据中发现异常? 这是网站。https://scikit-learn.org/stable/auto_例子/邻居/情节_洛夫_新颖性_detection.
html
#sphx-glr-auto-examples-neighbors-plot-lof-novel
浏览 0
提问于2019-02-04
得票数 0
回答已采纳
1
回答
隐马尔可夫模型
训练
中的不等长观测序列
、
我想用隐马尔可夫模型
训练
序列分类器。观测序列的长度不是固定的。我尝试了一些HMM包,如Matlab的HMM工具箱和Kevin的库。它们似乎都要求用户指定转移概率矩阵和发射概率矩阵的大小。
浏览 0
提问于2018-07-20
得票数 1
1
回答
在内存中加载caffe模型
、
每次
训练
模型时,我都必须加载模型。模型的加载大约需要3.9秒。我想在内存中加载模型一次,这样我就可以继续使用它进行
训练
。
浏览 13
提问于2019-07-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
利用HTML代码下载配有HTTP
HTML 语言代码 参考手册
详解HTML与CSS代码的规范
0060 PHP代码嵌入到HTML网页当中
HTML5 实现动态爱心网页代码
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券