RandomGreedyLearner.java example

Explorer

storm-applications-master
- src
  - main
    - java
      - storm
        applications
        AppDriver.java
        StormRunner.java
        bolt
        ACDBolt.java
        AbstractBolt.java
        AbstractFilterBolt.java
        AbstractRankerBolt.java
        AbstractScoreBolt.java
        AlertTriggerBolt.java
        BargainIndexBolt.java
        BayesRuleBolt.java
        CTBolt.java
        CalculateSentimentBolt.java
        CtrBolt.java
        DataInstAlertTriggerBolt.java
        DataInstancesScoreBolt.java
        DataStreamAnomalyScoreBolt.java
        ECRBolt.java
        ENCRBolt.java
        FoFiRBolt.java
        FraudPredictorBolt.java
        GeoStatsBolt.java
        GeographyBolt.java
        GlobalACDBolt.java
        GlobalMedianCalculatorBolt.java
        HouseLoadPredictorBolt.java
        IntermediateRankingsBolt.java
        LoadPredictorBolt.java
        MapMatchingBolt.java
        MovingAverageBolt.java
        ObservationScoreBolt.java
        OutlierDetectionBolt.java
        PlugLoadPredictorBolt.java
        PlugMedianCalculatorBolt.java
        RCRBolt.java
        ReinforcementLearnerBolt.java
        RepeatVisitBolt.java
        RollingCountBolt.java
        RollingCtrBolt.java
        ScoreBolt.java
        SlidingWindowStreamAnomalyScoreBolt.java
        SmartGridSlidingWindowBolt.java
        SpeedCalculatorBolt.java
        SpikeDetectionBolt.java
        SplitSentenceBolt.java
        StatusCountBolt.java
        StreamAnomalyScoreBolt.java
        TokenizerBolt.java
        TopKAlertTriggerBolt.java
        TopicExtractorBolt.java
        TotalRankingsBolt.java
        URLBolt.java
        VariationDetectorBolt.java
        VisitStatsBolt.java
        VolumeCountBolt.java
        VwapBolt.java
        WordCountBolt.java
        WordProbabilityBolt.java
        constants
        AdsAnalyticsConstants.java
        BargainIndexConstants.java
        BaseConstants.java
        ClickAnalyticsConstants.java
        FraudDetectionConstants.java
        LinearRoadConstants.java
        LogProcessingConstants.java
        MachineOutlierConstants.java
        ReinforcementLearnerConstants.java
        SentimentAnalysisConstants.java
        SmartGridConstants.java
        SpamFilterConstants.java
        SpikeDetectionConstants.java
        TrafficMonitoringConstants.java
        TrendingTopicsConstants.java
        VoIPSTREAMConstants.java
        WordCountConstants.java
        hooks
        BoltMeterHook.java
        SpoutMeterHook.java
        metrics
        MetricsFactory.java
        model
        ads
        AdEvent.java
        cdr
        CDRDataGenerator.java
        CallDetailRecord.java
        finance
        GoogleQuoteFetcher.java
        IndicatorParameter.java
        Quote.java
        QuoteCollection.java
        QuoteFetcher.java
        TimeSeries.java
        YahooQuoteFetcher.java
        fraud
        predictor
        IMarkovModelSource.java
        MarkovModel.java
        MarkovModelFileSource.java
        MarkovModelPredictor.java
        MarkovModelResourceSource.java
        ModelBasedPredictor.java
        Prediction.java
        prepare
        MarkovStateTransitionModel.java
        Projection.java
        StateTransitionCombiner.java
        StateTransitionMapper.java
        StateTransitionReducer.java
        gis
        GPSRecord.java
        Point.java
        Polygon.java
        Road.java
        RoadGridList.java
        Sect.java
        learner
        IntervalEstimator.java
        OptimisticSampsonSampler.java
        RandomGreedyLearner.java
        ReinforcementLearner.java
        ReinforcementLearnerFactory.java
        SampsonSampler.java
        log
        LogEntry.java
        NotificationDetails.java
        Severity.java
        metadata
        MachineMetadata.java
        scorer
        DataInstanceScorer.java
        DataInstanceScorerFactory.java
        MachineDataInstanceScorer.java
        ScorePackage.java
        sentiment
        BasicClassifier.java
        LingPipeClassifier.java
        SentimentClassifier.java
        SentimentClassifierFactory.java
        SentimentResult.java
        smartgrid
        House.java
        Household.java
        SmartPlug.java
        spam
        OfflineTraining.java
        Word.java
        WordMap.java
        sink
        AsyncFileSink.java
        BaseSink.java
        CassandraBatchSink.java
        CassandraCountBatchSink.java
        ConsoleSink.java
        FileSink.java
        NullSink.java
        RedisSink.java
        SocketSink.java
        formatter
        ActionFormatter.java
        BasicFormatter.java
        Formatter.java
        FullInfoFormatter.java
        MachineMetadataFormatter.java
        spout
        AbstractSpout.java
        BufferedReaderSpout.java
        FileSpout.java
        GeneratorSpout.java
        KafkaSpout.java
        RedisSpout.java
        SocketSpout.java
        StockPriceSpout.java
        TradeQuoteSimulatedSpout.java
        TwitterStreamingSpout.java
        generator
        CDRGenerator.java
        Generator.java
        MachineMetadataGenerator.java
        RandomSentenceGenerator.java
        SensorGenerator.java
        SmartPlugGenerator.java
        parser
        AdEventParser.java
        BeijingTaxiTraceParser.java
        ClickStreamParser.java
        CommonLogParser.java
        DublinBusTraceParser.java
        GoogleTracesParser.java
        JsonEmailParser.java
        JsonParser.java
        Parser.java
        SensorParser.java
        SmartPlugParser.java
        StringParser.java
        TransactionParser.java
        tools
        NthLastModifiedTimeTracker.java
        Rankable.java
        RankableObjectWithFields.java
        Rankings.java
        SlidingWindowCounter.java
        SlotBasedCounter.java
        topology
        AbstractTopology.java
        AdsAnalyticsTopology.java
        BargainIndexTopology.java
        BasicTopology.java
        ClickAnalyticsTopology.java
        FraudDetectionTopology.java
        LinearRoadTopology.java
        LogProcessingTopology.java
        MachineOutlierTopology.java
        ReinforcementLearnerTopology.java
        SentimentAnalysisTopology.java
        SmartGridTopology.java
        SpamFilterTopology.java
        SpikeDetectionTopology.java
        TrafficMonitoringTopology.java
        TrendingTopicsTopology.java
        VoIPSTREAMTopology.java
        WordCountTopology.java
        util
        JavaUtils.java
        bloom
        BloomCalculations.java
        BloomFilter.java
        ODTDBloomFilter.java
        collections
        FixedMap.java
        FixedSizeQueue.java
        LimitQueue.java
        config
        ClassLoaderUtils.java
        Configuration.java
        PropertiesUtils.java
        data
        DataTypeUtils.java
        DateUtils.java
        Pair.java
        SentimentValueOrdering.java
        StringUtil.java
        TabularData.java
        TextInt.java
        Tuple.java
        geoip
        GeoIP2Location.java
        IPLocation.java
        IPLocationFactory.java
        Location.java
        hadoop
        Utility.java
        hash
        MurmurHash.java
        io
        FileUtils.java
        IOUtils.java
        maps
        BingMapsLookup.java
        math
        AverageTracker.java
        BFPRT.java
        Entropy.java
        HistogramStat.java
        MaximumLikelihoodNormalDistribution.java
        OutlierTracker.java
        RandomUtil.java
        RunningMedianCalculator.java
        SimpleStat.java
        StateTransitionProbability.java
        SummaryArchive.java
        VariableEWMA.java
        sort
        SecondarySort.java
        Sorter.java
        stream
        StreamValues.java
        TupleUtils.java
        window
        SlidingWindow.java
        SlidingWindowCallback.java
        SlidingWindowEntry.java

/*
 * avenir: Predictive analytic based on Hadoop Map Reduce
 * Author: Pranab Ghosh
 * 
 * Licensed under the Apache License, Version 2.0 (the "License"); you
 * may not use this file except in compliance with the License. You may
 * obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0 
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or
 * implied. See the License for the specific language governing
 * permissions and limitations under the License.
 */

package storm.applications.model.learner;

import java.util.HashMap;
import java.util.Map;
import storm.applications.constants.ReinforcementLearnerConstants;
import storm.applications.constants.ReinforcementLearnerConstants.Conf;
import storm.applications.util.config.Configuration;
import storm.applications.util.math.SimpleStat;

/**
 * Random greedy reinforcement learner
 * @author pranab
 *
 */
public class RandomGreedyLearner extends ReinforcementLearner {
    private static final String PROB_RED_LINEAR = "linear";
    private static final String PROB_RED_LOG_LINEAR = "logLinear";
    
    private double randomSelectionProb;
    private String probRedAlgorithm;
    private double probReductionConstant;
    
    private Map<String, SimpleStat> rewardStats = new HashMap<>();
    
    @Override
    public void initialize(Configuration config) {
        randomSelectionProb   = config.getDouble(Conf.RANDOM_SELECTION_PROB, 0.5);
        probRedAlgorithm      = config.getString(Conf.PROB_RED_ALGORITHM, PROB_RED_LINEAR );
        probReductionConstant = config.getDouble(Conf.PROB_RED_CONSTANT,  1.0);

        for (String action : actions) {
            rewardStats.put(action, new SimpleStat());
        }
    }

    @Override
    public String[] nextActions(int roundNum) {
        double curProb = 0.0;
        String action = null;
        
        if (probRedAlgorithm.equals(PROB_RED_LINEAR )) {
            curProb = randomSelectionProb * probReductionConstant / roundNum ;
        } else {
            curProb = randomSelectionProb * probReductionConstant * Math.log(roundNum) / roundNum;
        }
        curProb = curProb <= randomSelectionProb ? curProb : randomSelectionProb;

        if (curProb < Math.random()) {
            //select random
            action = actions[(int)(Math.random() * actions.length)];
        } else {
            //select best
            int bestReward = 0;
            
            for (String thisAction : actions) {
                int thisReward = (int)(rewardStats.get(thisAction).getMean());
                if (thisReward >  bestReward) {
                    bestReward = thisReward;
                    action = thisAction;
                }
            }
        }

        selActions[0] = action;
        return selActions;
    }

    @Override
    public void setReward(String action, int reward) {
        rewardStats.get(action).add(reward);
    }
}