扩展一个类，该类扩展Hadoop的Mapper

。

在Hadoop中，Mapper是MapReduce编程模型中的一个组件，用于将输入数据切分为一系列的键值对，并对每个键值对进行处理。扩展一个类来实现自定义的Mapper功能，可以根据具体需求对输入数据进行处理和转换。

以下是一个示例的扩展类，该类扩展了Hadoop的Mapper：

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import import org.apache.hadoop.mapreduce.Mapper;

public class CustomMapper extends Mapper<LongWritable, Text, Text, Text> {
    
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        // 自定义的Mapper逻辑
        // 对输入数据进行处理和转换
        // 将处理结果写入Context中作为输出
        
        // 示例：将输入的每一行数据按照制表符进行分割，并将第一个字段作为输出的键，第二个字段作为输出的值
        String[] fields = value.toString().split("\t");
        if (fields.length >= 2) {
            String outputKey = fields[0];
            String outputValue = fields[1];
            context.write(new Text(outputKey), new Text(outputValue));
        }
    }
}

在上述示例中，我们扩展了Hadoop的Mapper类，并重写了其map方法。在map方法中，我们可以根据具体需求对输入数据进行处理和转换，并将处理结果写入Context中作为输出。

对于这个扩展类的应用场景，可以根据具体需求进行定制。例如，可以用于数据清洗、数据转换、数据过滤等任务。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云Hadoop服务：https://cloud.tencent.com/product/emr
腾讯云云原生服务：https://cloud.tencent.com/product/tke
腾讯云数据库服务：https://cloud.tencent.com/product/cdb
腾讯云服务器运维服务：https://cloud.tencent.com/product/cvm
腾讯云人工智能服务：https://cloud.tencent.com/product/ai
腾讯云物联网服务：https://cloud.tencent.com/product/iot
腾讯云移动开发服务：https://cloud.tencent.com/product/mcs
腾讯云存储服务：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/baas
腾讯云元宇宙服务：https://cloud.tencent.com/product/vr

请注意，以上链接仅供参考，具体产品选择应根据实际需求进行评估和决策。

页面内容是否对你有帮助？

有帮助

没帮助

用MapReduce Java解析文件

、、

我正在尝试用Hadoop MapReduce解析json文件，但在编译时遇到了奇怪的错误，这些错误在以前的MapReduce项目中没有得到。 Mapper.java:43: error: type Mapper does not take parameters public static class Map extends Mapper<LongWritable, Text, Text, Text> { ^ Mapper.java:45: error: cannot find symbol publ

浏览 6提问于2018-01-24得票数 0

回答已采纳

2回答

mapreduce类中的奇怪错误

、、

这个错误看似微不足道，但不会消失。我定义了以下类： import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapred.F

浏览 5提问于2014-08-19得票数 2

回答已采纳

2回答

使用Hadoop中的Put的HBase，但在HBase外壳中看不到价值

、

我有一个简单的map/reduce作业，它扫描一个hbase表，然后修改另一个hbase表。hadoop作业似乎成功完成，但是当我检查hbase表时，该条目没有出现在其中。以下是hadoop程序： import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.conf.Configured; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.cl

浏览 1提问于2012-02-28得票数 0

回答已采纳

1回答

为什么这个映射减少程序可以在没有导入的情况下使用不合格的“`Context`”？

、

我正在学习来自的Hadoop MapReduce示例。程序中的Context是否指如果是，为什么它可以使用不合格的Context而不使用import org.apache.hadoop.mapreduce.Mapper.Context 谢谢。 import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWrit

浏览 1提问于2019-05-21得票数 0

回答已采纳

1回答

Hadoop映射器:类或接口

我对Hadoop中的基本Mapper结构感到有点困惑。在web上，许多示例实现使用Mapper作为类，因此它们的类扩展了Mapper。据我所知，在Hadoop19中，Mapper是一个接口。发生了什么？

浏览 3提问于2013-06-11得票数 3

回答已采纳

2回答

组合器应该继承(或扩展) Hadoop中的哪个类？

、、

在Hadoop中，mapper和reducer类应该扩展Mapper或Reducer接口。但是，我找不到组合器类应该扩展的接口。Hadoop中组合器类的签名是什么？

浏览 5提问于2013-01-05得票数 0

2回答

使用Java查找字符串的MapReduce

、、、、

我试图从一个文本文件中搜索一个特定的字符串并出现该字符串，但在运行此代码后，我得到了io.LongWritable之间的classCastException。 Error: java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.Text at searchaString.SearchDriver$searchMap.map(SearchDriver.java:1) at org.apache.hadoop.map

浏览 0提问于2016-04-30得票数 0

1回答

在Hadoop中，Mapper.Context的API文档在哪里？

、、

我很高兴能跟上Hadoop的速度，包括签出t 类Mapper的文档广泛引用了类Mapper.Context (org.apache.hadoop.mapreduce.Mapper.Context)。但是，我看不到为那个Mapper.Context类/接口/任何东西找到API文档，只有在旧版本的API中除外。在当前的API中，我在哪里可以找到Mapper.Context的文档？我看到很多地方都在使用它(最常见的是context.write方法)，但是尽管花了一些时间搜索，我还是找不到这些方法的当前文档。

浏览 1提问于2015-11-02得票数 4

回答已采纳

1回答

在Hadoop中找不到类异常

、、

我正在尝试运行一个hadoop单单元程序来计算字数，我在windows 10 64位和Cygwin上执行此操作，这是我正在使用的程序： import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.ap

浏览 0提问于2016-07-26得票数 3

回答已采纳

1回答

基于Java Mapper/Reducer的Hadoop流

、、、

我试图通过一些维基百科转储(以压缩的bz2形式)使用java /Reducer运行hadoop流作业。我正在尝试使用，这是维基媒体最近发布的一个界面。 WikiReader_Mapper.java 包courseproj.example；// Mapper:对每一篇文章的出现发出(令牌，1)。公共类WikiReader_Mapper扩展MapReduceBase实现Mapper<Text，IntWritable> { //重用对象，以节省创建对象的开销。私有最终静态文本键=新文本()；私有最终静态IntWritable值=新IntWritable(1)；@覆盖公共空映射(文本键、

浏览 0提问于2013-04-16得票数 2

回答已采纳

2回答

如何在Hadoop的Mapper和Reducer中提供子类？

、、

我有一个从超级(父)类扩展的子(子)类。我想要一种为Mapper的输入值提供通用类型的方法，这样我就可以提供子值和父值作为有效值，如下所示：公共静态类MyMapper扩展Mapper<.、Mapper<.、...> 我希望MyChildClass (从MyParentClass扩展而来)也是有效的。但是，当我运行程序时，如果该值是一个子类，则会得到一个异常：类型与map值不匹配:预期MyParentClass，接收MyChildClass 如何使子类和父类都成为映射程序的有效输入/输出值？更新： package hipi.examples.dumphib; impo

浏览 2提问于2017-02-10得票数 0

回答已采纳

3回答

“类型不匹配的键从地图:预期的org.apache.hadoop.io.IntWritable，接收的org.apache.hadoop.io.LongWritable”-Every的东西看起来正确

我试图用新的API (0.20.2)编写简单的地图缩减程序，以找到最大素数。这就是我的Map和reduce类看起来像…的样子 public class PrimeNumberMap extends Mapper<LongWritable, Text, IntWritable, IntWritable> { public void map (LongWritable key, Text Kvalue,Context context) throws IOException,InterruptedException { Integer value = new Integer(K

浏览 3提问于2012-06-13得票数 1

1回答

在Hadoop2.2.0中运行作业的IBM_JAVA错误

、、

Exception in thread "main" java.lang.NoSuchFieldError: IBM_JAVA at org.apache.hadoop.security.UserGroupInformation.getOSLoginModuleName(UserGroupInformation.java:303) at org.apache.hadoop.security.UserGroupInformation.<clinit>(UserGroupInformation.java:348) at org.apache.hadoop.mapredu

浏览 2提问于2014-03-09得票数 1

1回答

在Eclipse中运行ClassNotFoundException示例时使用WordCount

、、、

我正在尝试运行WordCount映射/减少作业的示例性代码。我正在Hadoop1.2.1上运行它。我在我的Eclipse上运行它。下面是我试图运行的代码： package mypackage; import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.h

浏览 4提问于2013-11-04得票数 2

回答已采纳

1回答

MapReduce设计模式中的Mapper类和Reducer类

、、

我是MapReduce新手，我对Mapper类和Reducer类设计中的代码有一些疑问。我熟悉MapReduce加入MapReduce，我学到了以下内容： public static class CustsMapper extends Mapper<Object, Text, Text, Text> { public void map(Object key, Text value, Context context) throws IOException, InterruptedException { 在上面的代码片段中，我了解到我们将类扩展到Mapper类，并且由

浏览 0提问于2017-08-26得票数 1

回答已采纳

1回答

如何解决在Mapreduce中执行任务链时参数错误的链表不适用的问题？

、、、、

我正在使用Hadoop1.2.1，eclipse。我试图将三个映射任务链接到一个Mapreduce作业中。在eclipse中编写Mapreduce代码时，我会遇到错误，例如chainmapper不适用于参数，也不能设置inputpath。以下是我的mapreduce代码， package org.myorg; import java.io.IOException; import java.net.URI; import java.nio.file.FileSystem; import java.util.StringTokenizer; import javax.security.aut

浏览 2提问于2014-08-11得票数 1

5回答

Hadoop Basics程序中的java.lang.NoClassDefFoundError

、、、、

我正在尝试Hadoop的Basic MapReduce程序，它的教程在上这个类的完整代码是(代码出现在网络上的上述url上) import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.ha

浏览 0提问于2012-12-08得票数 5

回答已采纳

1回答

用org.apache.hadoop.mapred.mapper接口实现"in mapper“设计模式

、

我正在实现一些hadoop应用程序。我几乎完成了我的编码部分。但在阅读了"Lin & Chris Dryer“中的mapper设计模式书后，想要改进编码器。对于这种方法的有效实现，需要在map函数中保持一定的状态一段时间，然后输出结果。因为这可以通过将一些数据结构作为mapper类中的成员变量，然后在cleanup方法中发出来轻松实现。上面的实现在"org.apache.hadoop.mapreduce.mapper"interface.上是可行的但实际上我不能在我的系统中设置新的hadoop api，所以使用hadoop0.18，它没有“mapdreduce

浏览 0提问于2012-11-30得票数 0

回答已采纳

1回答

Map Reduce作业中的NullPointerException

、、

我正在尝试使用java api批量上传到Hbase。当调用Mapper类时，我得到了以下异常。这是我在调试我的驱动程序时发现的，当调试器试图命中映射器代码时，会出现code.This错误。我的Hfile已创建，但无法加载到Hbase中 16/08/10 04:09:56 INFO mapred.Task: Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCalculatorPlugin@7363c839 16/08/10 04:09:56 INFO mapred.MapTask: Processing

浏览 8提问于2016-08-10得票数 1

2回答

作业类型中的方法setPartitionerClass(Class<?extendsPartitioner>)不适用于参数(Class<WordCountPartitioner>)

、

我的驱动程序代码： import org.apache.hadoop.conf.Configured; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.li

浏览 8提问于2015-10-04得票数 2

2回答

尝试运行MRUnit示例时的冲突API

、、、

我一直在使用MRUnit，并尝试在和教程后面运行hadoop示例。虽然我不是一个粉丝，但我一直在使用Eclipse来运行代码，并且一直收到setMapper函数的错误 import java.io.IOException; import java.util.ArrayList; import java.util.List; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apach

浏览 6提问于2014-06-06得票数 1

2回答

在下面的代码中，对象是如何生成的？

、

我正在试着理解一段java代码。(Java基础知识) 这就是了 WordCountMapper类 package com.company; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; import java.io.IOException; public class WordCountMapper extends Map

浏览 0提问于2017-10-21得票数 0

1回答

扩展一个类，该类扩展Hadoop的Mapper

、

这是Hadoop中扩展Mapper类的Map类1的示例。3是Hadoop的Mapper类。我想创建扩展ExampleMapper的MyExampleMapper，它也扩展了hadoop的Mapper 2。我这样做是因为我只想在ExampleMapper中设置一个属性，以便在创建MyExampleMapper或其他示例时，不必自己设置该属性，因为我已经扩展了ExampleMapper。有可能做到这一点吗？ 1个示例映射器 import org.apache.hadoop.mapreduce.Mapper; public class ExampleMapper extends Ma

浏览 4提问于2016-08-07得票数 0

2回答

设置类路径后，包org.apache.hadoop.conf不存在

、、、、

我是hadoop的初学者，使用hadoop的初学者指南作为教程。我使用的是MacOSX10.9.2和hadoop版本1.2.1。当我在终端中调用echo $PATH时，我已经设置了所有适当的类路径：我得到的结果如下： /Library/Frameworks/Python.framework/Versions/2.7/bin:/Users/oladotunopasina/hadoop-1.2.1/hadoop-core-1.2.1.jar:/Users/oladotunopasina/hadoop-1.2.1/bin:/usr/share/grails/bin:/usr/share/gr

浏览 0提问于2014-06-24得票数 8

回答已采纳

2回答

在hadoop中实现多映射器和单归约器

、、

我是hadoop的新手。我有多个文件夹，其中包含在hadoop中处理数据的文件。我对map-reducer算法中的mapper实现有疑问。我是否可以指定多个映射器来处理多个文件，并使用单个reducer将所有输入文件作为一个输出？如果可能，请提供实施上述步骤的指导原则。

浏览 1提问于2012-08-30得票数 0

回答已采纳

1回答

向MySQL数据库写入数据时map中的类强制转换异常减少作业

、、

我正在尝试在mysql数据库中装载数据，但是遇到了类强制转换异常错误，下面是我使用的过程：我首先创建了一个实现Writable和DBWritable接口的DBWritable类。然后，我使用还原作业在数据库中写入数据，但是当我运行作业时，它失败了，因为它说有一个错误： java.lang.ClassCastException: com.amalwa.hadoop.DataBaseLoadMapReduce.DBOutputWritable cannot be cast to org.apache.hadoop.mapreduce.lib.db.DBWritable at org.apach

浏览 2提问于2015-03-18得票数 1

回答已采纳

2回答

Hadoop:找不到类

、

我刚刚开始学习hadoop，并遵循了"Hadoop --权威指南“。我测试了编写Map和Reduce类的第一种方法，其中Mapper和Reducer是接口。代码运行得很好。然后我开始编写代码，其中Map和Reduce是带有Context类的抽象类。顺便说一句，我正在使用hadoop 1.2.1，我看到了以下错误 MaxTemperatureReducer.java:5: error: cannot find symbol public class MaxTemperatureReducer extends Reducer<Text, IntWritable, Text, Int

浏览 2提问于2014-11-29得票数 0

1回答

如何将java.lang.Class<Mapper>转换为java.lang.class<TableMapper>

、、

有关解决方案，请参阅底部。我正在尝试编写一些通用的处理代码，但在其中的一个子类中，它需要一个更具体的类。所以基类是一个类类型的字段，在子类中，我试图将这个类对象转换为类型，它是org.apache.hadoop.hbase.mapreduce.Mapper的一个子类。我从Netbeans中得到以下错误： "Incompatible types required: java.lang.Class<org.apache.hadoop.hbase.mapreduce.TableMapper> found: java.lang.class<capture#3 o

浏览 0提问于2011-09-24得票数 1

回答已采纳

1回答

不能将Mahout minhash org.apache.hadoop.io.LongWritable转换为org.apache.hadoop.io.Text

、、

我正在使用： hadoop-1.2.1和mahout-distribution-0.8 当我尝试使用以下命令运行HASHMIN方法时： $MAHOUT_HOME/bin/mahout org.apache.mahout.clustering.minhash.MinHashDriver -i tce-data/cv.vec -o tce-data/out/cv/minHashDriver/ -ow 我得到了这个错误： tce@osy-Inspiron-N5110:~$ $MAHOUT_HOME/bin/mahout org.apache.mahout.clustering.minhash.Min

浏览 4提问于2013-09-11得票数 0

1回答

java.lang.Exception: java.lang.RuntimeException:配置对象中的错误

、、

首先谢谢你的帮助。在map类中，我实例化了另一个类WebPageToText。我的第一个问题:在Hadoop中运行代码时，map类中的打印会出现吗?第二个问题:请帮助我解决这个错误。我一直遇到这样的问题： 14/04/02 20:39:35 INFO util.NativeCodeLoader: Loaded the native-hadoop library 14/04/02 20:39:36 WARN snappy.LoadSnappy: Snappy native library is available 14/04/02 20:39:36 INFO snapp

浏览 1提问于2014-04-03得票数 0

回答已采纳

3回答

Hadoop中的依赖注入

、、

我想在Mapper类中注入一个依赖项。示例Mapper类： public class Mapper() { private MyInterface myObject; public void map() { // Map code here } } 我想使用Spring将MyInterface的实现注入myObject。这不可能直接使用spring，因为Hadoop框架本身实例化Mapper对象。唯一的方法是向Mapper类添加一个配置函数&然后执行如下操作： public void configure() { // c

浏览 6提问于2014-07-16得票数 3

回答已采纳

1回答

当Servlet尝试运行Hadoop2.2.0 MapReduce作业时出现异常

、、、、

解决了(解决方案在注释中) 我在ubuntu13.10和EclipseKeplerv4.3上使用Hadoop2.2.0(伪分布式模式)开发我的Hadoop程序和动态without(没有Maven)。当我从命令行运行作业时，我的Hadoop项目(称为"WorkTest.jar“)可以正常工作："Hadoop WorkTest.jar”，并且我正确地看到了终端上的工作进度。 Hadoop项目包含四个元素： DriverJob.java (配置和启动作业的类) Mapper.java Combiner.java Reducer.java 现在，我用Servl

浏览 3提问于2014-03-31得票数 0

回答已采纳

1回答

Eclipse中Hadoop Mapreduce中的导入错误

、、、、

我试图在Eclipse中编译一些Hadoop 2.3.0MapReduce作业。我导入了以下jars hadoop-mapreduce-client-core-2.3.0.jar commons-cli-1.2.jar hadoop-common-2.3.0.jar 但是，每当我导入org.apache.hadoop.mapreduce.Mapper时，我就会得到以下错误 The class file Mapper<KEYIN,VALUEIN,KEYOUT,VALUEOUT> contains a signature '(Lorg/apache/hadoop/mapred

浏览 1提问于2014-04-07得票数 0

3回答

用于Java类文件的Hadoop Streaming -file选项的问题

、

我正在努力解决hadoop流媒体中"-file“选项中的一个非常基本的问题。首先，我尝试了流媒体中最基本的示例： hadoop@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-streaming-0.20.203.0.jar -mapper org.apache.hadoop.mapred.lib.IdentityMapper \ -reducer /bin/wc -inputformat KeyValueTextInputFormat -input gutenberg/* -output guten

浏览 0提问于2011-07-22得票数 2

回答已采纳

2回答

hadoop中用于搜索的映射器程序说明

我是hadoop的新手，所以我在理解这些程序时遇到了一些困难。那么，如果有人能帮助我理解这个mapper程序？ package SearchTxn; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.NullWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class MyMap extends Mapper&

浏览 3提问于2016-06-11得票数 1

1回答

Hadoop映射方法是否有“实现”？

在某些书籍(如Hadoop、权威指南)中，Mapper方法的定义如下：公共类MapClass扩展Mapper扩展Mapper<. 但是在其他书中(比如Hadoop in Action)是这样的：公共静态类MapClass扩展了MapReduceBase实现Mapper <. 哪一个比较好，或者有什么区别？也许第一种选择是更新的？为什么是静态的？问候

浏览 4提问于2013-08-21得票数 0

回答已采纳

3回答

Mapper和Reducer是Hadoop版本2中的接口吗？

、、、

我知道Mapper和Reducer是Hadoop 2中的接口。但是在编写代码时，我仍然看到使用扩展映射程序或扩展还原器而不是实现.Is的例子，这是有原因的，还是因为向后兼容性而在旧版本中实现的？这是我学习的链接

浏览 2提问于2016-05-04得票数 0

回答已采纳

1回答

对早期post的说明(处理输入文件中的前N行)

、

我想创建一个映射器，它只处理输入文件中的前k行。我偶然发现了这篇文章： run表示覆盖方法，如下所示： @Override public void run(Context context) throws IOException, InterruptedException { setup(context); int rows = 0; while (context.nextKeyValue()) { if (rows++ == 10) { break; } map(context.getCurrentKey(), context.getCurr

浏览 1提问于2014-02-28得票数 0

2回答

为流式作业指定自己的输入格式

、

我定义了自己的输入格式，如下所示，以防止文件拆分： import org.apache.hadoop.fs.*; import org.apache.hadoop.mapred.TextInputFormat; public class NSTextInputFormat extends TextInputFormat { @Override protected boolean isSplitable(FileSystem fs, Path file) { return false; } } 我使用Eclipse将其编译成一个类NSTextInputF

浏览 2提问于2012-02-09得票数 4

1回答

问题:将表从hadoop导出到mysql

这是我的sqoop脚本，用于将表从hadoop导出到mysql： export ## Database details --connect jdbc:mysql://mktgcituspoc1.cisco.com:3306/poc --username pocuser --password pocuser ## Table to export to --table mktg_site_pub --export-dir ##/app/MarketingIT/warehouse/mktg_mbd.db/performance_tst /app/dev/MarketingIt/warehouse/h

浏览 2提问于2015-02-20得票数 0

回答已采纳

1回答

使用Hadoop的MapReduce :类型不匹配

、

我正在运行一个简单的hadoop程序，并得到以下错误： java.io.IOException: Type mismatch in key from map: expected org.apache.hadoop.io.Text, recieved org.apache.hadoop.io.LongWritable 映射器： public static class myMapper extends Mapper<LongWritable, Text, Text, Text> public void map(LongWritable key, Text line,OutputColl

浏览 0提问于2013-02-03得票数 0

回答已采纳

1回答

映射减少抛出错误中的对类

、、、、

为什么结对类在下面的代码中抛出一个错误 import java.io.IOException; import java.util.*; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.map

浏览 3提问于2014-11-03得票数 1

回答已采纳

1回答

为什么IdentityMapper在org.apache.hadoop.mapreduce库中消失？

、、、

在较早版本的hadoop库(即org.apache.hadoop.mapred.lib)中，有一个名为的Mapper的基本实现，它本质上将所有键值对传递给Reducer。但是，我在较新版本的hadoop库(org.apache.hadoop.mapreduce.lib)中发现，它没有任何名为IdentityMapper的类( Mapper的所有子类都可以找到)。我可以知道IdentityMapper是更改了它的名称还是消失在新的库中吗？如果答案是第二个，我能进一步知道为什么IdentityMapper消失了吗？这是否意味着我们可以连锁多个减速器之间没有Mapper？

浏览 1提问于2013-10-29得票数 3

回答已采纳

7回答

TaskTracker为每个输入拆分或每个键值对生成一个新的映射器？

我在一些网站上发现了以下问题，但我不确定答案是否正确。 MapReduce程序中的哪个Hadoop服务生成了一个新的Mapper？ JobTracker生成一个新的Mapper来处理单个文件中的所有记录。 TaskTracker生成一个新的Mapper来处理每个键值对。 TaskTracker生成一个新的Mapper来处理单个输入分割中的所有记录。 JobTracker调用TaskTracker的configure ()方法，然后调用map ()方法，最后调用close ()方法。网站说答案是选项2，但我混淆了答案3。与mapper的java文档一样，我发现

浏览 4提问于2015-01-02得票数 0

2回答

Hadoop命令行-D选项无法工作

、、

我试图在hadoop (如-D )中使用-Dmapred.mapper.mystring=somexyz命令行选项传递一个变量(而不是属性)。我能够在驱动程序中设置一个conf属性，并在mapper中读取它。因此，我可以使用它将字符串作为附加参数传递，并在驱动程序中设置它。但是我想看看是否可以使用-D选项来做同样的事情。我的命令是： $HADOOP_HOME/bin/hadoop jar /home/hduser/Hadoop_learning_path/toolgrep.jar /home/hduser/hadoopData/inputdir/ /home/hduser/hadoopDa

浏览 4提问于2014-07-08得票数 8

回答已采纳

1回答

不是org.apache.hadoop.mapreduce.Mapper

、、

我正在写一个mapreduce项目。我想把一个数组从mapper发送到reducer。但它有一个错误，我无法修复它。我导入这些类： import java.io.DataInput; import java.io.DataOutput; import java.io.EOFException; import java.io.IOException; import java.net.Socket; import java.util.HashMap; import java.util.HashSet; import ja

浏览 0提问于2018-01-25得票数 0

2回答

由于ClassCastException，hadoop MultipleInputs失败

、

我的hadoop版本是1.0.3，当我使用多个输入时，我得到了这个错误。 java.lang.ClassCastException: org.apache.hadoop.mapreduce.lib.input.TaggedInputSplit cannot be cast to org.apache.hadoop.mapreduce.lib.input.FileSplit at org.myorg.textimage$ImageMapper.setup(textimage.java:80) at org.apache.hadoop.mapreduce.Mapper.run(Mapper.jav

浏览 0提问于2012-06-21得票数 18

回答已采纳

1回答

Hadoop ClassPath单节点集群Mac

、

需要帮助。虽然有很多不同的答案可用，我也尝试过，但无法使它发挥作用。我在我的mac os中本地插入hadoop，当我尝试编译java程序时，我得到了以下错误。我知道问题在于如何设置正确的类路径，但在可能的情况下，提供类路径并不能使其工作。我已将hadoop安装在/usr/local/c业力/hadoop/1.2.1/libexec下面。我的java主页设置为导出HADOOP_CLASSPATH=${HADOOP_HOME}/bin:${JAVA_HOME}/bin:${PATH}“$(/usr/libexec/java_ home )”，并将类路径设置为导出JAVA_HOME= 但仍然会出现

浏览 3提问于2013-11-15得票数 0

回答已采纳

1回答

java.io.IOException:类型不匹配的值从地图:预期的org.apache.hadoop.io.Text，接收的org.apache.hadoop.io.IntWritable

、、、

我试着用两个映射器和一个减速器。我得到了以下错误:我想组合几个键，并且我期望根据每个键得到其求和的输出。我不知道哪一部分是错的。如果您能为我的代码找到一些错误，那将是非常感谢的。 java.io.IOException: Type mismatch in value from map: expected org.apache.hadoop.io.Text, recieved org.apache.hadoop.io.IntWritable at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.collect(MapTask.java:8

浏览 0提问于2018-04-09得票数 1

回答已采纳

3回答

hadoop版本不兼容

、

我在Hadoop0.20.2版本上开发了一个带有reduce-side join的MapReduce。所有的java类都可以编译，没有任何错误。我的程序按它必须的方式工作。但此版本的hadoop是在测试虚拟机上运行的。在我的真实集群上，我有另一个版本的hadoop (Hadoop2.00-cdh4.1.2)。当我想编译java-classes时，它不能工作。我得到100个错误，如下所示： JoinMapper.java:8: package org.apache.hadoop.filecache does not exist import org.apache.hadoop.filecache

浏览 4提问于2012-12-26得票数 3