TweetsTopology.java example

Explorer

openbus-master
- StormSiddhiPOC
  - src
    - main
      - java
        com
        produban
        openbus
        storm
        SiddhiBolt.java
        SiddhiBoltAux.java
        SiddhiTopology.java
        SiddhiTopologyAux.java
        SimpleFileStringSpout.java
        trident
        EchoBolt.java
        HDFSOutputTopology.java
        HDFSStore.java
        HDFSUtils.java
        ParseProxy.java
        Print.java
    - test
      - java
        Topologia.java
- core
  - src
    - main
      - java
        com
        produban
        openbus
        analysis
        AvroLogDecoder.java
        BrokerSpout.java
        DateTimeTransformation.java
        HDFSPersistence.java
        KeywordsFilter.java
        LogParser.java
        OpenbusProcessorTopology.java
        ProxyLogParser.java
        ProxyLogParserUDF.java
        RawLogTopology.java
        SimpleFileStringSpout.java
        TweetJsonDecoder.java
        TweetsTopology.java
        WebServerLog2TSDB.java
        WebServerLogFilter.java
        broker
        AvroProducer.java
        BasicConsumer.java
        BasicProducer.java
        persistence
        ElasticSearchIndexer.java
        HDFSStore.java
        HDFSUtils.java
        OpenTSDBRecoder.java
        RedisCounterStore.java
        RemoteRecoder.java
        serialization
        AvroDeserializer.java
        AvroSerializer.java
        util
        Common.java
        Conf.java
        Constant.java
        DatePartition.java
        FormatUtil.java
        KafkaLocal.java
        LogFilter.java
        WebServerLog2Json.java
        ZooKeeperHelper.java
        ZookeeperLocal.java
    - test
      - java
        com
        produban
        openbus
        analysis
        ProxyLogParserTest.java
        broker
        KafkaAvroMessagesTest.java
        KafkaBasicTest.java
        serialization
        AvroSerializationTests.java
        util
        UtilTest.java
- examples
  - camus
    - src
      - java
        br
        com
        produban
        openbus
        camus
        coders
        AvroMessageDecoder.java
        schemaregistry
        AvroLocalSchemaRegistry.java
        model
        avro
        AgentDataAvro.java
        RequestAvro.java
  - esdump
    - src
      - main
        java
        com
        produban
        openbus
        esdump
        ESDumpDriver.java
        ESDumpMapper.java
        RunDump.java
  - weblogs
    - src
      - main
        java
        com
        produban
        openbus
        examples
        ApacheLogProducerSample.java
        OpenbusProcessorFileTopology.java
      - test
        java
        com
        produban
        openbus
        examples
        ApacheLogProducerTest.java
- onlineTopology
  - src
    - main
      - java
        com
        produban
        openbus
        siddhiCep
        MediaCondicionadaAggregatorFactory.java
        MediaCondicionadaAggregatorInteger.java
        MediaCondicionadaAnteriorAggregatorFactory.java
        MediaCondicionadaAnteriorAggregatorInteger.java
        SumadorCondicionalConReinicioAggregatorFactory.java
        SumadorCondicionalConReinicioAggregatorLong.java
        storm
        OnlineSiddhiTopology.java
        SiddhiBolt.java
        SimpleFileStringSpout.java
        Tuple2Stream.java
        storm_ES
        DefaultTupleMapper.java
        ElasticSearchBolt.java
        StormElasticSearchConstants.java
        TupleMapper.java
        trident
        EchoBolt.java
        HDFSOutputTopology.java
        HDFSStore.java
        HDFSUtils.java
        ParseProxy.java
        Print.java
        webservice
        CamposOrigen.java
        Estado.java
        HttpEntityEnclosingDeleteRequest.java
        MetricaOnLine.java
        OrigenEstructurado.java
        QueryCep.java
        StreamCep.java
        TableCep.java
    - test
      - java
        SiddhiBoltMetricTest1.java
        SiddhiBoltMetricaOnlineRadius1.java
        SiddhiBoltMetricaOnlineRadius4.java
        SiddhiBoltTickTuple.java
        SiddhiTopology.java
        SiddhiTopologyAux.java
        SorterTest.java
        Topologia.java
        Tuple2StreamTest.java
        kafkaSpoutTest.java
- topologias
  - src
    - main
      - java
        com
        produban
        openbus
        storm
        EchoBolt.java
        SiddhiBolt.java
        SiddhiTopology.java
        SimpleFileStringSpout.java
        topologies
        BrokerSpout.java
        IronportLocationParser.java
        IronportParser.java
        KafkaState.java
        Localizacion.java
        LocationStore.java
        OpenbusFileNameFormat.java
        OpenbusHdfsState.java
        OpenbusHdfsStateFactory.java
        OpenbusHdfsUpdater.java
        OpenbusIronportLocationTopology.java
        OpenbusIronportTopology.java
        OpenbusPostfixLocationTopology.java
        OpenbusPostfixTopology.java
        OpenbusProxyLocationTopology.java
        OpenbusProxyTopology.java
        OpenbusRadiusEntityTopology.java
        PostfixLocationParser.java
        PostfixParser.java
        ProxyLocationParser.java
        ProxyParser.java
        RadiusEntityParser.java
        SimpleFileStringSpout.java
        TimeStampRotationPolicy.java
    - test
      - java
        com
        produban
        openbus
        topologies
        KafkaProducerTestTwoTopologies.java
        pruebaFechas.java
- topologies
  - src
    - main
      - java
        com
        produban
        openbus
        topologies
        BrokerSpout.java
        IronportParser.java
        OpenbusFileNameFormat.java
        OpenbusHdfsState.java
        OpenbusHdfsStateFactory.java
        OpenbusHdfsUpdater.java
        OpenbusIronportTopology.java
        OpenbusPostfixTopology.java
        OpenbusProxyTopology.java
        PostfixParser.java
        PostfixTopology.java
        ProxyParser.java
        SimpleFileStringSpout.java
        TimeStampRotationPolicy.java
    - test
      - java
        com
        produban
        openbus
        topologies
        pruebaFechas.java
- web_console
  - src
    - main
      - java
        com
        produban
        openbus
        console
        domain
        CamposOrigen.java
        Estado.java
        MetricaBatch.java
        MetricaOnLine.java
        OrigenEstructurado.java
        QueryCep.java
        StreamCep.java
        TableCep.java
        dto
        CreateForm.java
        CreateOnLineForm.java
        QueryDTO.java
        TableDTO.java
        hive
        HiveConnector.java
        repository
        CamposOrigenRepository.java
        EstadoRepository.java
        MetricaBatchRepository.java
        MetricaOnLineRepository.java
        OrigenEstructuradoRepository.java
        QueryCepRepository.java
        StreamCepRepository.java
        TableCepRepository.java
        service
        CamposOrigenService.java
        CamposOrigenServiceImpl.java
        EstadoService.java
        EstadoServiceImpl.java
        MetricaBatchService.java
        MetricaBatchServiceImpl.java
        MetricaOnLineService.java
        MetricaOnLineServiceImpl.java
        OrigenEstructuradoService.java
        OrigenEstructuradoServiceImpl.java
        QueryCepService.java
        QueryCepServiceImpl.java
        StreamCepService.java
        StreamCepServiceImpl.java
        TableCepService.java
        TableCepServiceImpl.java
        util
        HttpConnector.java
        ScheduledJob.java
        web
        ConsoleController.java
        ConsoleInterceptor.java
        CreateForm.java
        LoginController.java
        ServiceOnLineController.java
        siddhiCep
        MediaCondicionadaAggregatorFactory.java
        MediaCondicionadaAggregatorInteger.java
        MediaCondicionadaAnteriorAggregatorFactory.java
        MediaCondicionadaAnteriorAggregatorInteger.java
        SumadorCondicionalConReinicioAggregatorFactory.java
        SumadorCondicionalConReinicioAggregatorLong.java
    - test
      - java
        Test.java
        com
        produban
        openbus
        console
        domain
        TestMetricasOnLine.java

package com.produban.openbus.analysis;

import backtype.storm.Config;
import backtype.storm.StormSubmitter;
import backtype.storm.generated.StormTopology;
import backtype.storm.tuple.Fields;
import com.lexicalscope.jewel.cli.ArgumentValidationException;
import com.lexicalscope.jewel.cli.CliFactory;
import com.lexicalscope.jewel.cli.Option;
import com.produban.openbus.persistence.ElasticSearchIndexer;
import com.produban.openbus.util.Common;
import storm.trident.Stream;
import storm.trident.TridentTopology;

import javax.ws.rs.OPTIONS;
import java.util.ArrayList;
import java.util.List;

/**
 * A Trident topology for processing a stream of Tweets
 */
public class TweetsTopology {

    public static StormTopology buildTopology (TweetsTopologyOptions options){

        TridentTopology topology = new TridentTopology();

        BrokerSpout kafkaTweetSpout = new BrokerSpout( options.getKafkaTopic(),
                                                       Common.join(options.getZookeeper(), ","),
                                                       options.getKafkaClientID(),
                                                       options.isForceFromStart());

        ElasticSearchIndexer esIndexer = new ElasticSearchIndexer(options.getElasticSearchClusterName(),
                                                                  options.getElasticSearchIndex(),
                                                                  options.getElasticSearchNodes());

        List<String> tweetFields = new ArrayList<>();
        tweetFields.add("tweetId");
        tweetFields.add("rawDate");
        tweetFields.add("date");
        tweetFields.add("text");
        tweetFields.add("lang");
        tweetFields.add("retweetCount");
        tweetFields.add("longitude");
        tweetFields.add("latitude");
        tweetFields.add("userFollowerCount");
        tweetFields.add("userLocation");
        tweetFields.add("userName");
        tweetFields.add("userId");
        tweetFields.add("userImgUrl");
        tweetFields.add("urls");
        tweetFields.add("mentionedUsers");
        tweetFields.add("hashtags");

        Stream stream = topology.newStream("spout", kafkaTweetSpout.getOpaquePartitionedTridentSpout())
                //topology.newStream("spout", kafkaTweetSpout.getPartitionedTridentSpout())
                .each(new Fields("bytes"), new TweetJsonDecoder(), new Fields(tweetFields))
                .each(new Fields("text"), new KeywordsFilter(options.getFilterKeyWords()))
                //do something interesting here
                .each(new Fields(tweetFields), esIndexer, new Fields("indexed"));

        return topology.build();
    }


    public static void main(String[] args) throws Exception {

        //parse topology arguments:
        TweetsTopologyOptions appOptions = null;
        try {
            appOptions = CliFactory.parseArguments(TweetsTopologyOptions.class, args);
        }
        catch(ArgumentValidationException e)
        {
            System.out.println(e.getMessage());
            System.exit(-1);
        }

        Config stormConfig = new Config();
        stormConfig.setNumWorkers(appOptions.getStormNumWorkers());

        StormSubmitter.submitTopology(appOptions.getTopologyName(), stormConfig, buildTopology(appOptions));
    }


    /*
     Definition of topology arguments (this uses JewelCLI library)
    */
    public interface TweetsTopologyOptions
    {
        @Option(defaultValue = "tweetsTopology")
        String getTopologyName();

        @Option
        List<String> getZookeeper();

        @Option
        List<String> getElasticSearchNodes();

        @Option
        String getElasticSearchClusterName();

        @Option
        String getElasticSearchIndex();

        @Option
        String getKafkaTopic();

        @Option(defaultValue = "3")
        int getStormNumWorkers();

        @Option(defaultValue = "tweetsTopology")
        String getKafkaClientID();

        @Option
        List<String> getFilterKeyWords();

        @Option
        boolean isForceFromStart();

        @Option(shortName = "h", helpRequest = true)
        boolean getHelp();
    }
}