腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
我
不
能在
Hadoop
中
getFileName
和
显示
它
的
格式
(
Word
文件名
计数
)?
java
、
hadoop
、
mapreduce
输入是一个名为Wiki-micro.txt
的
文本文件...字数统计程序运行正常..
我
需要
的
是修改
它
&将它
的
输出
格式
从(字数
计数
)改为(
Word
####Filename
计数
)
我
想要
我
的
输出
格式
(
Word
#Filename
计数
),您能告诉
我
我
哪里出错了吗?
我
使用了输入拆分
浏览 11
提问于2020-03-07
得票数 0
回答已采纳
1
回答
Python创建新列并将数据存储在.CSV文件
中
。
python
、
csv
、
io
、
text-files
、
counter
在
我
的
Python
中
,
我
尝试打开.txt文件,列出该文件
中
的
单词列表,
计数
单词出现
的
次数(
计数
器)并将其放入.csv文件
中
。
我
的
文件名
为1870.txt-1892(1871年,1872年,1873…1892.txt)。这里
的
所有内容都正常,但是
我
希望每个文件都能放进下一篇专栏。outputt) writer =
浏览 3
提问于2016-05-13
得票数 0
回答已采纳
3
回答
使用
Hadoop
启动守护进程时出错
java
、
hadoop
我
已经在
我
的
ubuntu上安装了
hadoop
,但是问题是每次
我
开始使用它,
我
不能使用它直到我
格式
化
我
的
namenode?可能出了什么问题?请给我这个建议。
我
在JDK版本1.8.0_25上使用
Hadoop
1.2.1版本
浏览 5
提问于2014-11-26
得票数 0
回答已采纳
3
回答
mapReduce模式
的
最好
的
python实现是什么?
python
、
mapreduce
什么是最好
的
MapReduce实现,一个框架或一个库,可能
和
Apache
hadoop
one一样好,但如果它是用Python语言编写
的
,最好是文档良好且易于理解,完全实现为MapReduce模式,高可伸缩性,高稳定性
和
轻量级。
我
在谷歌上搜索了一个叫mincemeat
的
,不太确定,但还有其他人很出名吗? 谢谢
浏览 2
提问于2011-09-01
得票数 4
2
回答
用火花流读取binaryFile
apache-spark
、
spark-streaming
我
在哪里可以找到所有的inputformatClass?文档没有提供这方面的链接。
我
认为ValueClass与inputformatClass有某种联系。在使用二进制文件
的
非流版本
中
,
我
可以获得每个文件
的
ByteArrays。有什么方法可以让
我
在sparkStreaming上得到同样
的
信息吗?如果不是的话,
我
在哪里可以找到这些细节。这意味着所支持
的
输入
格式
及其生成
的
值类。最后,我们
浏览 1
提问于2017-08-20
得票数 2
1
回答
Hadoop
流简单作业失败错误python
java
、
python
、
hadoop
、
mapreduce
、
streaming
我
是
hadoop
和
mapreduce
的
新手,
我
正在尝试编写一个mapreduce来统计一个字
计数
txt文件
中
的
前10个单词。
我
的
txt文件“q2_result.txt”看起来如下:yourselves 73youst 1 youth
我
知道您可以在
Hadoop
命令中将一个标志传递给-D选项,
浏览 1
提问于2016-09-30
得票数 0
回答已采纳
1
回答
查找包含一个单词
的
所有文件,然后计算行数
bash
、
text-processing
我
需要递归地查找所有包含特定单词
的
文件,如果该单词存在于文件
中
,则需要查找该文件
中
的
行数。
我
一直在尝试使用grep,但到目前为止
我
还没有成功。
浏览 0
提问于2014-05-23
得票数 1
4
回答
计数
列表元素
c++
、
linked-list
、
counter
我
正在编写一个双链接列表,在该列表
中
,
我
从给定文件
中
读取字符串。因此,
我
编写了一个名为Node
的
类,其中存储了一个字符串(读单词)
和
一些用于字长
和
其他参数
的
整数。读取文件
中
的
所有字符串后,打开第二个文件,再次读出每个单词,并将该单词与链接列表
中
的
字符串进行比较。之后,
我
将所有找到
的
单词存储在一个结果文件
中
。现在
浏览 5
提问于2014-10-03
得票数 1
1
回答
如何在
Hadoop
中使用自定义类型
hadoop
例如: DataStruct =
文件名
,
word
。
我
的
计划是分两次完成,在第一次
中
,
我
将输入文件映射到(DataStruct,1)键值对,然后将其减少为-> (DataStruct,count)。
我
设想每一行都是这样
的
格式
: ..file2
word
6 ..
我
的
第一个(也是次要
的
)问题是,这是否是解决这个问题
浏览 6
提问于2019-09-02
得票数 1
回答已采纳
2
回答
Hive创建空表,即使有大量
的
文件
hadoop
、
hive
我
将一些文件放入hdfs (/path/to/directory/)
中
,其中包含以下数据;62 FABBC9ED9719A5030B2F6A4591EDB180这些文件是从另一个hdfs下载
的
。
我
试图通过蜂巢创建外部表;id int,) ROW FORMAT DELIMITED FIELDS TERMINATEDHive成
浏览 3
提问于2015-01-27
得票数 1
回答已采纳
1
回答
如何使用Java 8
和
流在一组文件中
计数
文件
和
单词
java
、
file
、
lambda
、
java-8
我
现在很难过。
我
试图完成一项任务,在这个分配
中
访问一个文件目录,并对文件进行
计数
,然后读取文件本身,并在每个文件中
计数
单词。这是
我
贴出
的
一个问题
的
延续,但“答案”根本无助于解决
我
的
问题()编写一个程序,该程序使用流有效地
计数
出现在一组文件(files.zip)
中
的
不同长度
的
单词。您
的
输出类似于:(
计数
浏览 5
提问于2017-12-09
得票数 0
1
回答
进一步过滤通过目录循环返回
的
文件
c#
、
.net
、
windows-7
我
有一个非常小
的
代码,将循环通过一个网络驱动器,并返回所有文件
的
文件名
和
扩展名。
我
将输出设置为
显示
在列表框
中
。
我
目前
的
难题是,
它
输入了临时文件"~filename.ext“,这使
我
无法
计数
。如何指导
它
忽略所有临时文件"~filename.ext“。statusCodeLB.Items.Clear(); fore
浏览 3
提问于2016-02-06
得票数 1
回答已采纳
1
回答
c#
我
的
吸气器不起作用
c#
我
试图在Visual
中
为
我
的
类编写一个anagram分析器,但是当我从另一个类调用getter时,
我
的
列表是空
的
。getPreparedList{ { } } 在这里,
我
删除了不需要
的
字符
我
做了一个字符串来测试它是否会
显示
,但preparedWord列
浏览 0
提问于2013-11-01
得票数 0
回答已采纳
1
回答
当
格式
为EXCEL时,SSRS 2014 URL access总是生成XLS而不是XLSX
excel
、
reporting-services
、
sql-server-2014
我
有SQL Server 2014,
我
正在尝试通过URL访问访问我
的
报表。据我所知,Excel
格式
应该为
我
提供一个XLSX文件,
它
支持无限行数。但是,在查看了
我
的
日志文件之后,
我
注意到对于超过65536行
的
任何报告,
我
都会得到最大
的
行错误。对此进行研究后,
我
发现,每当我以EXCEL
格式
通过URL请求报告时,它们都会生成一个XLS文件,而不是XLS
浏览 5
提问于2015-05-12
得票数 3
回答已采纳
1
回答
如何在
Hadoop
中
创建自定义输出
格式
java
、
hadoop
、
output
我
试图创建一个字
计数
hadoop
程序
的
变体,它在一个目录
中
读取多个文件并输出每个单词
的
频率。问题是,
我
希望
它
输出一个单词,后面跟着
文件名
,然后是那个文件
的
频率。现在,
它
只输出一个键值对。().getName();编辑
浏览 2
提问于2015-04-13
得票数 1
回答已采纳
2
回答
Hadoop
的
Word
百分比程序
java
、
hadoop
、
mapreduce
、
word-count
我
正在研究一个名为WordCount程序
的
稍微改进
的
版本,
它
应该输出书中单词所占
的
百分比。例如:war 0.00002332423%...所以至少应该有两份工作: 减速机:用相同
的</e
浏览 3
提问于2014-03-12
得票数 2
回答已采纳
2
回答
从java操作访问Oozie上下文
java
、
hadoop
、
oozie
我
有以下用例。在oozie工作流
中
,map-还原操作生成一系列诊断
计数
器.
我
希望在map后面有另一个java操作--还原操作。java操作基本上是基于map
的
计数
器进行验证--还原操作,并根据验证条件
和
结果生成一些通知。这个想法起作用
的
关键是,java操作必须能够访问上游映射中
的
所有
计数
器--还原操作,就像oozie如何在其工作流xml中使用EL来访问它们一样。 现在
我
不知道从何说起。因此,任何指针
浏览 0
提问于2015-07-26
得票数 0
回答已采纳
2
回答
这类内容
的
MySQL结构?
mysql
、
structure
我
有几百个文本文件,这些文本文件
的
数据看起来如下:Define: 0/70Facto: 16/75 是否适合这样
的
数据库?,如果是的话,
我
想不出一种正确构造表
的
方法。人们可能会考虑为Capo、Define、Largo
和
Facto创建列,但是在这几百个文本文件中有大约200个不同
的
单词,如果要这样做,每个字都需要一个列。
浏览 2
提问于2012-09-04
得票数 0
回答已采纳
8
回答
Linux:删除
不
包含所有指定单词
的
文件
linux
、
bash
、
file
、
shell
在目录
中
,如何删除缺少任何指定单词
的
文件,以便只留下包含所有单词
的
文件?
我
试图使用grep
和
rm命令编写一个简单
的
bash shell脚本,但是
我
迷路了。
我
对Linux完全陌生,任何帮助都将不胜感激。
浏览 2
提问于2009-03-05
得票数 13
回答已采纳
1
回答
基于php会话值检索目录
中
的
文件
php
我
有工作代码,可以
显示
目录
中
的
文件,并将它们
显示
在表
中
。但是,
文件名
的
前4个字符是客户端代码。因此,如果用户被记录,
我
只需要
显示
用户文件,而不需要
显示
其他文件。
我
已经查看了substr,可以检索
和
回显
文件名
的
前4个字符。但是,由于数组,这个回显'DEMODEMODEMODEMODEMODEMO‘而不是'DEM
浏览 1
提问于2014-11-10
得票数 0
回答已采纳
点击加载更多
相关
资讯
为什么图片转pdf后只留下一部分?
什么是文件后缀扩展名?如何在 Windows 电脑中修改文件扩展名
win32com操作word API精讲 第九集 Document.SaveAs保存文档
值得收藏的Word 出现缓慢、崩溃的常见原因、及避开的办法
Terminal安全技巧第三期:探索实用的命令行工具
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券