WordCountWithCombiner.java example

Explorer

hadoop-test-master
- src
  - main
    - java
      - org
        apache
        oozie
        AppType.java
        BuildInfo.java
        cli
        CLIParser.java
        OozieCLI.java
        OozieCLIException.java
        client
        AuthOozieClient.java
        BulkResponse.java
        BundleJob.java
        CoordinatorAction.java
        CoordinatorJob.java
        JMSConnectionInfo.java
        JMSConnectionInfoWrapper.java
        Job.java
        OozieClient.java
        OozieClientException.java
        SLAEvent.java
        WorkflowAction.java
        WorkflowJob.java
        XOozieClient.java
        event
        Event.java
        JobEvent.java
        SLAEvent.java
        jms
        JMSHeaderConstants.java
        JMSMessagingUtils.java
        JSONMessageDeserializer.java
        MessageDeserializer.java
        message
        CoordinatorActionMessage.java
        EventMessage.java
        JobMessage.java
        SLAMessage.java
        WorkflowJobMessage.java
        rest
        JsonTags.java
        JsonToBean.java
        JsonUtils.java
        RestConstants.java
        flume
        FlumeEventContentLoggerInterceptor.java
        FlumeEventGenerator.java
        HazelcastQueueSource.java
        RegexFilterBuilder.java
        hadoop
        HCatMapReduce.java
        MapperCleaner.java
        ReduceJoin.java
        RemoteJob.java
        SequenceFileReader.java
        SequenceFileWordCount.java
        SequenceFileWriter.java
        WordCount.java
        WordCountPredefined.java
        WordCountWithCombiner.java
        hbase
        FreqCounter.java
        Generator.java
        mahout
        recommendations
        GroupLens10mRatingsItemRecommenderEvaluator.java
        GroupLens10mRatingsRecommender.java
        GroupLens10mRatingsRecommenderEvaluator.java
        RecommenderIntro.java
        RecommenderIntroEvaluator.java
        RecommenderIntroStatsEvaluator.java
        dating
        GenderRescorer.java
        LibimsetiRecommender.java
        LibimsetiRecommenderRunner.java
        wikipedia
        AggregateAndRecommendReducer.java
        AggregateCombiner.java
        CooccurrenceColumnWrapperMapper.java
        PartialMultiplyMapper.java
        UserVectorSplitterMapper.java
        UserVectorToCooccurrenceMapper.java
        UserVectorToCooccurrenceReducer.java
        WikipediaToItemPrefsMapper.java
        WikipediaToUserVectorReducer.java
        oozie
        DoubleAction.java
        NoOpAction.java
        OozieJobRunnerUtil.java
        Workflow2PreRunner.java
        Workflow2Runner.java
        zookeeper
        DataMonitor.java
        Executor.java
        flume
        ConfigWatcher.java
        FlumeProperties.java
        ZClient.java
  - test
    - java
      - org
        hadoop
        WordCountTest.java

package org.hadoop;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.IOException;

/**
 * @author Krisztian_Horvath
 */
public class WordCountWithCombiner {

    public static class WordCountMapper extends Mapper<Object, Text, Text, IntWritable> {
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();

        public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
            String[] words = value.toString().split(" ");
            for (String str : words) {
                word.set(str);
                context.write(word, one);
            }
        }
    }

    public static class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable> {
        public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
            int total = 0;
            for (IntWritable val : values) {
                total += val.get();
            }
            context.write(key, new IntWritable(total));
        }
    }

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = new Job(conf, "word count");
        job.setJarByClass(WordCount.class);
        job.setCombinerClass(WordCountReducer.class);
        job.setMapperClass(WordCountMapper.class);
        job.setReducerClass(WordCountReducer.class);
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        FileInputFormat.addInputPath(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));
        System.exit(job.waitForCompletion(true) ? 0 : 1);
    }
}