GPFLinearTest.java example

Explorer

jml-master
- jmll-master
  - experiments
    - src
      - main
        java
        com
        spbsu
        bernulli
        EM.java
        FittedModel.java
        Learner.java
        MCMCBernoulliMixture
        BernoulliPrior.java
        LLPrior.java
        MCMCBernoulliEstimation.java
        UniformPrior.java
        Mixture.java
        MixtureObservations.java
        Multinomial.java
        StochasticSearch.java
        betaBinomialMixture
        BetaBinomialMixture.java
        BetaBinomialMixtureEM.java
        RegularizedBetaBinomialMixtureEM.java
        caches
        BetaCache.java
        Digamma1Cache.java
        DigammaCache.java
        naiveMixture
        BernoulliMixtureEM.java
        NaiveMixture.java
        crawl
        GameProcess.java
        StartCrawl.java
        WSEndpoint.java
        bl
        Event.java
        GameSession.java
        Hero.java
        Mob.java
        crawlSystemView
        HeroView.java
        InventoryView.java
        MapView.java
        MobsListener.java
        MobsView.java
        PlayerActionView.java
        StatusView.java
        Subscribable.java
        SystemView.java
        events
        HeroListener.java
        InventoryListener.java
        MapListener.java
        PlayerActionListener.java
        StatusListener.java
        SystemViewListener.java
        helpers
        CategoricalFeaturesMap.java
        CodeSet.java
        map
        CrawlGameSessionMap.java
        Layer.java
        Position.java
        PositionManager.java
        TerrainType.java
        data
        Command.java
        Message.java
        Protocol.java
        impl
        CoordinateMessage.java
        FlavourMessage.java
        InputCommandMessage.java
        InputModeMessage.java
        KeyCode.java
        KeyCommand.java
        KeyMessage.java
        MonsterInfoMessage.java
        PackedCellMessage.java
        PackedUnsignedLong.java
        PlayerInfoMessage.java
        UpdateMapCellMessage.java
        UpdateMapMessage.java
        system
        EmptyFieldsDefault.java
        GameEnded.java
        GameStarted.java
        GoLobbyMessage.java
        IgnoreMessage.java
        LobbyComplete.java
        LoginMessage.java
        LoginSuccessMessage.java
        MenuMessage.java
        PingCommand.java
        PongMessage.java
        RegisterMessage.java
        SetGameLinks.java
        StartGameMessage.java
        StartSpectateMessage.java
        UpdateMenuMessage.java
        learning
        FeaturesBuilder.java
        HeroFeaturesBuilder.java
        InventoryFeaturesBuilder.java
        LearnDataBuilder.java
        State.java
        StatusFeaturesBuilder.java
        features
        CategoricalFeature.java
        Feature.java
        NumericalFeature.java
        sessions
        WeightedRandomWalkGameSession.java
        utils
        GenerateCppEnumWriter.java
        direct
        BroadMatch.java
        gen
        SimpleGenerativeModel.java
        WordGenProbabilityProvider.java
        exp
        modelexp
        Experiment.java
        Model.java
        Query.java
        Setup.java
        Stat.java
        User.java
        managers
        SerpManager.java
        WizardManager.java
        setup
        SimpleExclusive.java
        users
        FeedbackUser.java
        UniformUser.java
        UserFactory.java
        multiclass
        spoc
        GreedyCML.java
        RunnerECOC.java
        SearchAvaliableMxMath.java
        SearchMCGreedyAllParams.java
        SearchMCMathAllParams.java
        SearchMCParams.java
        full
        mx
        bruteforce
        FullMatrixLearning.java
        optimization
        ECOCMulticlass.java
        SeparatedMLLLogit.java
        tools
        FeatureFrequency.java
        Runner.java
        region
        ExperimentsRunner.java
        wiki
        CreateWikiCharDict.java
      - test
        java
        com
        spbsu
        exp
        BernoulliTest.java
        DispersionTest.java
        Java8ParallelStreamsTest.java
        PGMEMLogDataTest.java
        StreamsBenchmark.java
        multiclass
        DiplomaGradFacTest.java
        ECOCComboTest.java
        GradFacTest.java
        HierClassTests.java
        SPOCMethodTest.java
        weak
        CustomWeakBinClass.java
        CustomWeakMultiClass.java
  - ml
    - src
      - main
        java
        com
        spbsu
        ml
        BFGrid.java
        BinModelWithGrid.java
        BinOptimizedModel.java
        Binarize.java
        BlockedTargetFunc.java
        BlockwiseFuncC1.java
        CompositeTrans.java
        DynamicGridEnabled.java
        GridEnabled.java
        GridTools.java
        JMLLCLI.java
        ProgressHandler.java
        RankIt.java
        TargetFunc.java
        Vectorization.java
        cli
        JMLLCLI.java
        builders
        data
        DataBuilder.java
        impl
        DataBuilderClassic.java
        DataBuilderCrossValidation.java
        methods
        MethodsBuilder.java
        grid
        DynamicGridBuilder.java
        GridBuilder.java
        impl
        BootstrapOptimizationBuilder.java
        FMWorkaroundBuilder.java
        GradientBoostingBuilder.java
        GreedyObliviousTreeBuilder.java
        GreedyObliviousTreeDynamic2Builder.java
        GreedyObliviousTreeDynamicBuilder.java
        GreedyTDBumpyRegionBuilder.java
        GreedyTDCherryRegionBuilder.java
        GreedyTDRegionBuilder.java
        LassoGreedyObliviousTreeBuilder.java
        MultiClassSplitBuilder.java
        MultiClassSplitGradFacBootstrapBuilder.java
        MultiClassSplitGradFacBuilder.java
        MultiClassSplitGradFacFilterBuilder.java
        MultiClassSplitGradFacSvdNBuilder.java
        MultiClassSplitOneVsRestBuilder.java
        MultiLabelConflictBuilder.java
        MultiLabelSubsetsBuilder.java
        MultiLabelWrapperBuilder.java
        RandomForestBuilder.java
        RegionForestBuilder.java
        RidgeGreedyObliviousTreeBuilder.java
        RidgeRegressionLeavesObliviousTreeBuilder.java
        cv
        FoldsEnumerator.java
        KFoldCrossValidation.java
        gridsearch
        GridSearch.java
        OptimumHolder.java
        ParametersExtractor.java
        ParametersGridEnumerator.java
        modes
        AbstractMode.java
        impl
        Apply.java
        ConvertPool.java
        ConvertPoolJson2Classsic.java
        ConvertPoolLibSvm.java
        CrossValidation.java
        Fit.java
        GridSearch.java
        PrintPoolInfo.java
        SplitJsonPool.java
        ValidateModel.java
        ValidatePool.java
        output
        ModelWriter.java
        printers
        DefaultProgressPrinter.java
        HistogramPrinter.java
        MultiLabelLogitProgressPrinter.java
        MulticlassProgressPrinter.java
        ResultsPrinter.java
        clustering
        ClusterizationAlgorithm.java
        GenericClusterizationAlgorithm.java
        impl
        ConnectedComponentOptimizer.java
        ForelAlgorithm.java
        GenericNearestNeighborAlgoritm.java
        KMeansAlgorithm.java
        NearestCentroidAlgorithm.java
        NearestCentroidDRAlgorithm.java
        NearestNeighborAlgoritm.java
        NearestNeighborDRAlgorithm.java
        cuda
        CudaException.java
        JCublasHelper.java
        JCudaConstants.java
        JCudaHelper.java
        JCudaMemory.java
        JCurandHelper.java
        data
        ArrayBased.java
        impl
        FloatMatrix.java
        FloatVector.java
        root
        array
        VectorScale.java
        nn
        Dropout.java
        data
        Aggregate.java
        DSIterator.java
        StatisticCalculator.java
        cherry
        CherryBestHolder.java
        CherryLoss.java
        CherryPick.java
        CherryPointsHolder.java
        CherryStochasticSubset.java
        CherrySubset.java
        impl
        BinarizedDataSet.java
        RankedDataSet.java
        set
        DataSet.java
        VecDataSet.java
        impl
        VecDataSetImpl.java
        softBorders
        GibbsExpWeightedPermutationsWalker.java
        Sampler.java
        stats
        OrderByFeature.java
        tools
        BinModelBuilder.java
        BinarySaver.java
        DataTools.java
        DynamicBinModelBuilder.java
        FakePool.java
        FeaturesTxtPool.java
        HierTools.java
        MCTools.java
        MultiLabelTools.java
        Pool.java
        PoolBuilder.java
        PoolByRowsBuilder.java
        SmallPoolReader.java
        SubPool.java
        dynamicGrid
        AggregateDynamic.java
        impl
        BFDynamicGrid.java
        BinarizedDynamicDataSet.java
        BinaryFeatureImpl.java
        MedianRow.java
        StaticRow.java
        interfaces
        BinaryFeature.java
        DynamicGrid.java
        DynamicRow.java
        models
        BinDynamicOptimizedModel.java
        ObliviousTreeDynamicBin.java
        trees
        BFDynamicOptimizationSubset.java
        GreedyObliviousTreeDynamic.java
        GreedyObliviousTreeDynamic2.java
        factorization
        Factorization.java
        impl
        ALS.java
        ElasticNetFactorization.java
        SVDAdapterEjml.java
        StochasticALS.java
        func
        BiasedLinear.java
        Ensemble.java
        FuncEnsemble.java
        FuncJoin.java
        Linear.java
        NormalizedLinear.java
        ScaledFunc.java
        TransJoin.java
        generic
        ChainProbSum.java
        Const.java
        ElementaryFunc.java
        Identity.java
        Log.java
        Logit.java
        MultiLogit.java
        ParallelFunc.java
        Pow.java
        ReLU.java
        Sigmoid.java
        SubVecFuncC1.java
        Sum.java
        SumSigmoid.java
        WMultiLogit.java
        WSum.java
        WSumSigmoid.java
        io
        BFGridStringConverter.java
        DynamicGridStringConverter.java
        EnsembleModelConversionPack.java
        FMModelConversionPack.java
        FuncEnsembleConversionPack.java
        FuncJoinConversionPack.java
        JoinedBinClassModelConversionPack.java
        JoinedProbsModelConversionPack.java
        ModelsSerializationRepository.java
        MultiClassModelConversionPack.java
        MultiLabelBinarizedModelConversionPack.java
        ObliviousMultiClassTreeConversionPack.java
        ObliviousTreeConversionPack.java
        ObliviousTreeDynamicBinConversionPack.java
        RegionConversionPack.java
        TransJoinConversionPack.java
        loss
        CELogit.java
        ChooseComplimentLLLogit.java
        CombL2.java
        ComplementLLLogit.java
        CompositeFunc.java
        CorrL2.java
        DSSumFunc.java
        DSSumFuncC1.java
        DSSumFuncComposite.java
        ExclusiveComplementLLLogit.java
        F1Logit.java
        FBetaLogit.java
        L2.java
        L2GreedyTDRegion.java
        L2Reg.java
        LL.java
        LLLogit.java
        LLX2.java
        LOOL2.java
        LogL2.java
        MLL.java
        MLLLogit.java
        PLogit.java
        RLogit.java
        SatL2.java
        ShiftedL2.java
        ShiftedLLLogit.java
        StatBasedLoss.java
        WeightedL2.java
        WeightedLLLogit.java
        WeightedLoss.java
        blockwise
        BlockwiseL2.java
        BlockwiseMLLLogit.java
        BlockwiseMultiLabelLogit.java
        BlockwiseSatL2.java
        BlockwiseStatBasedLoss.java
        BlockwiseWeightedLoss.java
        multiclass
        ClassicMulticlassLoss.java
        MCMacroF1Score.java
        MCMacroPrecision.java
        MCMacroRecall.java
        MCMicroF1Score.java
        MCMicroPrecision.java
        MCMicroRecall.java
        util
        ConfusionMatrix.java
        MultilabelConfusionMatrix.java
        MultilabelExampleTableOutput.java
        MultilabelThresholdPrecisionMatrix.java
        multilabel
        ClassicMultiLabelLoss.java
        MultiLabelExactMatch.java
        MultiLabelHammingLoss.java
        MultiLabelMacroFScore.java
        MultiLabelMicroFScore.java
        MultiLabelOVRLogit.java
        meta
        DSItem.java
        DataSetMeta.java
        FeatureMeta.java
        PoolFeatureMeta.java
        TargetMeta.java
        impl
        FeatureMetaImpl.java
        JsonDataSetMeta.java
        JsonFeatureMeta.java
        JsonTargetMeta.java
        PoolFeatureMetaImpl.java
        TargetFeatureImpl.java
        fake
        FakeFeatureMeta.java
        FakeTargetMeta.java
        items
        FakeItem.java
        FocusItem.java
        QURLItem.java
        ViewportAnswersWeighting.java
        methods
        BootstrapOptimization.java
        ElasticNetMethod.java
        FMTrainingWorkaround.java
        GradientBoosting.java
        LARSMethod.java
        LASSOMethod.java
        LassoGradientBoosting.java
        LassoRegionsForest.java
        MTA.java
        MultiClass.java
        MultipleVecOptimization.java
        Optimization.java
        PGMEM.java
        RandomForest.java
        SeqOptimization.java
        StochasticGradientDescent.java
        VecOptimization.java
        greedyMergeOptimization
        GreedyMergePick.java
        MergeOptimization.java
        ModelComparators.java
        RegularizedLoss.java
        RegularizedLossComparator.java
        greedyRegion
        AdditiveStatisticsExtractors.java
        BFOptimizationRegion.java
        BFWeakConditionsOptimizationRegion.java
        BFWeakConditionsStochasticOptimizationRegion.java
        BinaryRegion.java
        GreedyPolynomialExponentRegion.java
        GreedyRegion.java
        GreedyTDBumpyRegion.java
        GreedyTDIterativeRegion.java
        GreedyTDLinearRegion.java
        GreedyTDRegion.java
        GreedyTDRegionNonStochasticProbs.java
        GreedyTDWeakRegionMTA.java
        RegionBasedOptimization.java
        RegionForest.java
        cherry
        GreedyTDCherryRegion.java
        OutLoss.java
        OutLoss2.java
        OutLoss3.java
        cnfMergeOptimization
        CherryOptimizationSubset.java
        CherryOptimizationSubsetMerger.java
        GreedyMergedRegion.java
        ModelComplexityCalcer.java
        linearRegressionExperiments
        EmpericalBayesRidgeRegression.java
        MultipleEbsRidgeRegression.java
        MultipleLeastAngle.java
        MultipleRidgeRegression.java
        MultipleValidationRidgeRegression.java
        RidgeRegression.java
        RidgeRegressionCache.java
        ValidationRidgeRegression.java
        WeakLeastAngle.java
        multiclass
        MultiClassOneVsRest.java
        gradfac
        FMCBoosting.java
        GradFacBootstrapMulticlass.java
        GradFacFilterMulticlass.java
        GradFacMulticlass.java
        GradFacSvdNMulticlass.java
        MultiClassColumnBootstrapOptimization.java
        hierarchical
        HierarchicalClassification.java
        HierarchicalRefinedClassification.java
        spoc
        AbstractCodingMatrixLearning.java
        CMLHelper.java
        CMLMetricOptimization.java
        ECOCCombo.java
        SPOCMethodClassic.java
        SPOCMethodProbsDecoder.java
        impl
        CodingMatrixLearning.java
        CodingMatrixLearningGreedy.java
        CodingMatrixLearningGreedyParallels.java
        multilabel
        MultiLabelConflictMulticlass.java
        MultiLabelSubsetsMulticlass.java
        rvm
        RVM.java
        RVMCache.java
        trees
        BFOptimizationSubset.java
        GreedyContinuesObliviousSoftBondariesRegressionTree.java
        GreedyExponentialObliviousTree.java
        GreedyLeastAngleObliviousTrees.java
        GreedyObliviousTree.java
        GreedyObliviousTreeValidationRidgeLeaves.java
        GreedyObliviousTreeWithVecOptimizationLeaves.java
        GreedyObliviousTreeWithWeakLearner.java
        LassoGreedyObliviousTree.java
        MutedFeatureObliviousTreeEnsemble.java
        RidgeGreedyObliviousTree.java
        wrappers
        MultiLabelWrapper.java
        MultiMethodOptimization.java
        models
        BumpyRegion.java
        CNF.java
        CherryRegion.java
        ContinousObliviousTree.java
        ExponentialObliviousTree.java
        FMModel.java
        LinearRegion.java
        ModelTools.java
        MultiClassModel.java
        ObliviousMultiClassTree.java
        ObliviousTree.java
        PolynomialExponentRegion.java
        QuadraticModel.java
        Region.java
        RegionBase.java
        ShifftedTrans.java
        TransObliviousTree.java
        gpf
        AttractivenessModel.java
        ClickProbabilityModel.java
        GPFGbrtModel.java
        GPFGbrtOptimization.java
        GPFLinearModel.java
        GPFLinearOptimization.java
        GPFModel.java
        Session.java
        Tensor3.java
        Tensor4.java
        weblogmodel
        BlockV1.java
        SessionV1AttractivenessModel.java
        WebLogV1ClickProbabilityModel.java
        WebLogV1GPFSession.java
        multiclass
        HierarchicalModel.java
        JoinedBinClassModel.java
        JoinedProbsModel.java
        MCModel.java
        MultiClass2BinaryModel.java
        MulticlassCodingMatrixModel.java
        MulticlassCodingMatrixModelProbsDecoder.java
        multilabel
        ConflictThresholdMultiLabelModel.java
        MultiLabelBinarizedModel.java
        MultiLabelModel.java
        MultiLabelSubsetsModel.java
        ThresholdProbsMultiLabelModel.java
        nn
        LayeredNetwork.java
        NeuralSpider.java
        nfa
        InputNode.java
        NFANetwork.java
        NFATopology.java
        NonDeterminedNode.java
        OutputNode.java
        WeightsCalculator.java
        pgm
        CompositePGM.java
        ProbabilisticGraphicalModel.java
        Route.java
        SimplePGM.java
        optimization
        FuncConvex.java
        Optimize.java
        PDQuadraticFunction.java
        StochasticGradientDescent.java
        TensorNetFunction.java
        impl
        FlexStepDescent.java
        GradientDescent.java
        MagicDescent.java
        Nesterov1.java
        Nesterov2.java
        tools
        QuadrFormTransformer.java
      - test
        java
        com
        spbsu
        ml
        BlockwiseTest.java
        DataToolsTest.java
        GridTest.java
        HierToolsTests.java
        MethodsTests.java
        ModelsTest.java
        NNTest.java
        OptimizersTest.java
        ScorePrinter.java
        SerializationTest.java
        TwoStepBlenderLearning.java
        cli
        cv
        FoldsEnumeratorTest.java
        cuda
        Charts.java
        JCublasHelperTest.java
        JCudaMemoryTest.java
        JCurandHelperTest.java
        data
        impl
        FloatMatrixTest.java
        FloatVectorTest.java
        root
        array
        VectorScaleTest.java
        nn
        DropoutTest.java
        data
        tools
        MCToolsTest.java
        methods
        rvm
        RVMTest.java
        models
        gpf
        GPFGbrtTest.java
        GPFLinearTest.java
        optimization
        TensorNetFuncTest.java
        testUtils
        TestResourceLoader.java
    - tests
      - src
        com
        spbsu
        ml
        ModelsTest.java
        PGMEMTest.java

package com.spbsu.ml.models.gpf;

import com.spbsu.commons.math.vectors.VecTools;
import com.spbsu.commons.math.vectors.impl.vectors.ArrayVec;
import com.spbsu.commons.random.FastRandom;
import com.spbsu.commons.util.ArrayTools;
import com.spbsu.ml.models.gpf.weblogmodel.BlockV1;
import com.spbsu.ml.models.gpf.weblogmodel.WebLogV1GPFSession;
import org.junit.Ignore;
import org.junit.Test;

import java.io.IOException;
import java.io.InputStream;
import java.util.*;
import java.util.zip.GZIPInputStream;


import static junit.framework.Assert.assertEquals;

/**
 * User: irlab
 * Date: 22.05.14
 */
@Ignore
public class GPFLinearTest {
  private final int random_seed = 0;

  @Test
  public void testArtificialClicks() throws IOException {
    final List<Session<BlockV1>> dataset_nonfinal;
    try (InputStream is = new GZIPInputStream(WebLogV1GPFSession.class.getResourceAsStream("ses_100k_simple_rand1_h10k.dat.gz"))) {
      dataset_nonfinal = WebLogV1GPFSession.loadDatasetFromJSON(is, new GPFLinearModel(), 100);
    }
    final List<Session<BlockV1>> dataset = dataset_nonfinal;

    System.out.println("dataset size: " + dataset.size());

    FastRandom rand = new FastRandom(random_seed);

    // generate random model
    final GPFLinearModel model_true = new GPFLinearModel();
    model_true.PRUNE_A_THRESHOLD = 1E-5;
    model_true.trainClickProbability(dataset);
    for (int i = 0; i < model_true.NFEATS; i++)
      model_true.theta.set(i, rand.nextGaussian());

    // generate artificial clicks
    int n_sum_clicks = 0;
    for (int nSes = 0; nSes < dataset.size(); nSes++) {
      //System.out.println("session " + nSes);
      final Session<BlockV1> ses = dataset.get(nSes);
      final List<Integer> click_indexes = new ArrayList<Integer>();
      int state = Session.Q_INDEX;
      int click_s = 0;
      while (state != Session.E_INDEX) {
        final double[] probs = new double[ses.getEdgesFrom(state).length];
        for (int j = 0; j < probs.length; j++)
          probs[j] = model_true.eval_f(ses, state, ses.getEdgesFrom(state)[j], click_s);

        double sum = 0;
        for (int j = 0; j < probs.length; j++)
          sum += probs[j];
        for (int j = 0; j < probs.length; j++)
          probs[j] /= sum;

        //        StringBuffer probs_str = new StringBuffer();
        //        for (int j = 0; j < probs.length; j++)
        //          probs_str.append("" + (j == 0 ? "" : ", ") + "(" + state + "->" + ses.getEdgesFrom(state)[j] + ": " + probs[j] + ")");
        //        System.out.println("  probs: " + probs_str);

        state = ses.getEdgesFrom(state)[rand.nextSimple(new ArrayVec(probs))];
        //System.out.println("  state " + state + " " + ses.getBlock(state));
        click_s = ses.getBlock(state).blockType == Session.BlockType.RESULT && rand.nextDouble() <= model_true.getClickGivenViewProbability(ses.getBlock(state)) ? 1 : 0;
        if (click_s == 1)
          click_indexes.add(state);
      }
      ses.setClick_indexes(ArrayTools.convert(click_indexes.toArray(new Integer[click_indexes.size()])));
      //System.out.println("" + nSes + ": " + click_indexes);
      n_sum_clicks += click_indexes.size();
    }
    System.out.println("clicks generated, avg: " + n_sum_clicks/(float)dataset.size() + " clicks/session, " + dataset.size() + " sessions");

    int nObservations = 0;
    for (final Session ses: dataset)
      nObservations += ses.getClick_indexes().length + 1;
    final int fullds_nobservations_all = nObservations;

    for (int random_seed_local = 1; random_seed_local < 2; random_seed_local++) {
      System.out.println("\n############################################################################");
      System.out.println("random_seed_local =\t" + random_seed_local);
      rand = new FastRandom(random_seed_local);

      // generate random model
      final GPFLinearModel model0 = new GPFLinearModel(model_true);
      for (int i = 0; i < model0.NFEATS; i++)
        model0.theta.set(i, rand.nextGaussian());

      final GPFLinearOptimization optimizer = new GPFLinearOptimization();
      final double model_true_expll = Math.exp(-optimizer.evalDatasetGradientValue(model_true, dataset, false).loglikelihood);
      System.out.println("model_true loglikelihood: " + model_true_expll);
      assertEquals(8.4, model_true_expll, 0.1);

      final long t1 = System.currentTimeMillis();
      final double model0_expll = Math.exp(-optimizer.evalDatasetGradientValue(model0, dataset, false).loglikelihood);
      System.out.println("model0 loglikelihood:     " + model0_expll);
      assertEquals(97.9, model0_expll, 0.1);
      final long t2 = System.currentTimeMillis();
      System.out.println("time loglikelihood eval: " + (t2-t1) + " ms");

      final int iteration_dataset_pass_count = 20;

      optimizer.SGD_BLOCK_SIZE = 1;
      final int iteration_count = iteration_dataset_pass_count * dataset.size() / optimizer.SGD_BLOCK_SIZE;
      optimizer.step_eta0 = 0.1; //0.01;
      optimizer.step_gamma = 0.75;
      optimizer.step_a = dataset.size() / optimizer.SGD_BLOCK_SIZE;
      model0.PRUNE_A_THRESHOLD = model_true.PRUNE_A_THRESHOLD;

      System.out.println("optimizer.SGD_BLOCK_SIZE = " + optimizer.SGD_BLOCK_SIZE);
      System.out.println("optimizer.step_eta0      = " + optimizer.step_eta0);
      System.out.println("optimizer.step_a         = " + optimizer.step_a);
      System.out.println("optimizer.step_gamma     = " + optimizer.step_gamma);
      System.out.println("model0.PRUNE_A_THRESHOLD = " + model0.PRUNE_A_THRESHOLD);

      optimizer.listener = new GPFLinearOptimization.IterationEventListener() {
        @Override
        public void iterationPerformed(final GPFLinearOptimization.IterationEvent e) {
          if (optimizer.SGD_BLOCK_SIZE < dataset.size() && e.iter % (dataset.size() / optimizer.SGD_BLOCK_SIZE) != 0) return;
          final double model0_dist = Math.sqrt(model0.theta.l2(e.model.theta));
          final double model_true_dist = Math.sqrt(model_true.theta.l2(e.model.theta));
          double fullds_loglikelihood = e.fullds_loglikelihood;
          int fullds_nobservations_correct = e.fullds_nobservations_correct;
          if (fullds_loglikelihood == 0.) {
            final GPFLinearOptimization.DatasetGradientValue gradV = optimizer.evalDatasetGradientValue(e.model, dataset, false);
            fullds_loglikelihood = gradV.loglikelihood;
            fullds_nobservations_correct = gradV.nObservations;
          }
          System.out.println("" + (new Date()) +
                  "\t" + e.iter + "(" + (e.iter * optimizer.SGD_BLOCK_SIZE / dataset.size()) + "/" + (iteration_count * optimizer.SGD_BLOCK_SIZE / dataset.size()) + ")" +
                  "\tL=" + Math.exp(-fullds_loglikelihood) +
                  "\teta=" + e.step_size +
                  "\tmodel0_dist=" + model0_dist +
                  "\tmodel_true_dist=" + model_true_dist +
                  (optimizer.do_ignore_improbable_sessions ? "" : "\timprobable_obs=" + (fullds_nobservations_all - fullds_nobservations_correct) + "(" + (fullds_nobservations_all - fullds_nobservations_correct)/(float)fullds_nobservations_all + ")") +
                  "\tL_partial=" + Math.exp(-e.loglikelihood) +
                  "\tgrad_norm=" + VecTools.norm(e.gradient) +
                  "\tgrad=[" + e.gradient + "]");
        }

        @Override
        public void backstepPerformed(final GPFLinearOptimization.IterationEvent e) {
          System.out.println("  L > last_L: " + Math.exp(-e.fullds_loglikelihood) + " > " + Math.exp(-e.loglikelihood) + ", go back and set a_m = " + optimizer.step_a_m);
        }
      };

      final GPFLinearModel model_optimized = optimizer.StochasticGradientDescent(model0, dataset, iteration_count);

      final long t3 = System.currentTimeMillis();
      System.out.println("time optimization: " + (t3-t2)/1000 + " sec");
      final double model_final_expll = Math.exp(-optimizer.evalDatasetGradientValue(model_optimized, dataset, false).loglikelihood);
      System.out.println("final loglikelihood:      " + model_final_expll);
      assertEquals(10.3, model_final_expll, 0.1);
    }
  }

  @Test
  public void testOptimizeSGD() throws IOException {
    final List<Session<BlockV1>> dataset_nonfinal;
    try (InputStream is = new GZIPInputStream(WebLogV1GPFSession.class.getResourceAsStream("ses_100k_simple_rand1_h10k.dat.gz"))) {
      dataset_nonfinal = WebLogV1GPFSession.loadDatasetFromJSON(is, new GPFLinearModel(), 100);
    }
    final List<Session<BlockV1>> dataset = dataset_nonfinal;
    final List<Session<BlockV1>> test_dataset_nonfinal;
    try (InputStream is = new GZIPInputStream(WebLogV1GPFSession.class.getResourceAsStream("ses_100k_simple_rand2_h10k.dat.gz"))) {
      test_dataset_nonfinal = WebLogV1GPFSession.loadDatasetFromJSON(is, new GPFLinearModel(), 100);
    }
    final List<Session<BlockV1>> test_dataset = test_dataset_nonfinal;

    final boolean test_sorted_clicks_model = false;
    if (test_sorted_clicks_model) {
      System.out.println("test_sorted_clicks_model");
      for (final Session ses: dataset)
        ses.sortUniqueClicks();
      for (final Session ses: test_dataset)
        ses.sortUniqueClicks();
    }

    int nObservations = 0;
    for (final Session ses: dataset)
      nObservations += ses.getClick_indexes().length + 1;
    final int fullds_nobservations_all = nObservations;

    int n_sum_clicks = 0;
    for (final Session ses: dataset)
      n_sum_clicks += ses.getClick_indexes().length;
    System.out.println("dataset size: " + dataset.size() + " sessions, avg " + (n_sum_clicks / (float)dataset.size()) + " clicks/session");

    final FastRandom rand = new FastRandom(random_seed);

    double best_ll = 1111;
    double test_ll = 1111;
    for (int ntry = 0; ntry < 1; ntry++) {
      System.out.println("########################################################\n");
      System.out.println("" + new Date() + ": ntry: " + ntry + "\n");

      // generate random model
      final GPFLinearModel model0 = new GPFLinearModel();
      model0.trainClickProbability(dataset);
      for (int i = 0; i < model0.NFEATS; i++)
        model0.theta.set(i, rand.nextGaussian());

      final GPFLinearOptimization optimizer = new GPFLinearOptimization();

      final long t1 = System.currentTimeMillis();
      final double model0_expll = Math.exp(-optimizer.evalDatasetGradientValue(model0, dataset, false).loglikelihood);
      System.out.println("model0 loglikelihood:     " + model0_expll);
      assertEquals(13.3, model0_expll, 0.1);
      final long t2 = System.currentTimeMillis();
      System.out.println("time loglikelihood eval: " + (t2-t1) + " ms");

      final int iteration_dataset_pass_count = 10;

      optimizer.SGD_BLOCK_SIZE = 1;
      final int iteration_count = iteration_dataset_pass_count * dataset.size() / optimizer.SGD_BLOCK_SIZE;
      optimizer.step_eta0 = 0.1; //0.01;
      optimizer.step_gamma = 0.75;
      optimizer.step_a = dataset.size() / optimizer.SGD_BLOCK_SIZE;
      model0.PRUNE_A_THRESHOLD = 1E-5;

      System.out.println("optimizer.SGD_BLOCK_SIZE = " + optimizer.SGD_BLOCK_SIZE);
      System.out.println("optimizer.step_eta0      = " + optimizer.step_eta0);
      System.out.println("optimizer.step_a         = " + optimizer.step_a);
      System.out.println("optimizer.step_gamma     = " + optimizer.step_gamma);
      System.out.println("model0.PRUNE_A_THRESHOLD = " + model0.PRUNE_A_THRESHOLD);

      optimizer.listener = new GPFLinearOptimization.IterationEventListener() {
        @Override
        public void iterationPerformed(final GPFLinearOptimization.IterationEvent e) {
          final int iterations_per_dataset = dataset.size() / optimizer.SGD_BLOCK_SIZE;
          if (optimizer.SGD_BLOCK_SIZE < dataset.size()) {
            if (e.iter < iterations_per_dataset) {
              return;
              //if (e.iter % (iterations_per_dataset / 20) != 0)
              //  return;
            } else { // e.iter >= iterations_per_dataset
              if (e.iter % (dataset.size() / optimizer.SGD_BLOCK_SIZE) != 0)
                return;
            }
          }

          final double model0_dist = Math.sqrt(model0.theta.l2(e.model.theta));
          double fullds_loglikelihood = e.fullds_loglikelihood;
          int fullds_nobservations_correct = e.fullds_nobservations_correct;
          if (fullds_loglikelihood == 0.) {
            final GPFLinearOptimization.DatasetGradientValue gradV = optimizer.evalDatasetGradientValue(e.model, dataset, false);
            fullds_loglikelihood = gradV.loglikelihood;
            fullds_nobservations_correct = gradV.nObservations;
          }
          double test_dataset_ll = 0;
          if (test_dataset != null)
            test_dataset_ll = optimizer.evalDatasetGradientValue(e.model, test_dataset, false).loglikelihood;
          System.out.println("" + (new Date()) +
                  "\t" + e.iter + "(" + (e.iter * optimizer.SGD_BLOCK_SIZE / dataset.size()) + "/" + (iteration_count * optimizer.SGD_BLOCK_SIZE / dataset.size()) + ")" +
                  "\tL=" + Math.exp(-fullds_loglikelihood) +
                  "\teta=" + e.step_size +
                  (test_dataset != null ? "\ttest_L=" + Math.exp(-test_dataset_ll) : "") +
                  "\tmodel0_dist=" + model0_dist +
                  (optimizer.do_ignore_improbable_sessions ? "" : "\timprobable_obs=" + (fullds_nobservations_all - fullds_nobservations_correct) + "(" + (fullds_nobservations_all - fullds_nobservations_correct)/(float)fullds_nobservations_all + ")") +
                  "\tL_partial=" + Math.exp(-e.loglikelihood) +
                  "\tgrad_norm=" + VecTools.norm(e.gradient) +
                  ""); //"\tgrad=[" + e.gradient + "]");
          if (e.iter % (iterations_per_dataset * 20) == 0)
            System.out.println(">>current model: " + e.model.explainTheta());
        }

        @Override
        public void backstepPerformed(final GPFLinearOptimization.IterationEvent e) {
          System.out.println("  L > last_L: " + Math.exp(-e.fullds_loglikelihood) + " > " + Math.exp(-e.loglikelihood) + ", go back and set a_m = " + optimizer.step_a_m);
        }
      };

      final GPFLinearModel model_optimized = optimizer.StochasticGradientDescent(model0, dataset, iteration_count);

      final long t3 = System.currentTimeMillis();
      System.out.println("time optimization: " + (t3-t2)/1000 + " sec");
      final double ll = Math.exp(-optimizer.evalDatasetGradientValue(model_optimized, dataset, false).loglikelihood);
      System.out.println("final loglikelihood:      " + ll);
      System.out.println("final theta: " + model_optimized.theta );
      System.out.println("final theta explain: " + model_optimized.explainTheta() );

      if (ll < best_ll) {
        best_ll = ll;
        test_ll = Math.exp(-optimizer.evalDatasetGradientValue(model_optimized, test_dataset, false).loglikelihood);
      }
    }

    System.out.println("" + new Date() + ": best ll: " + best_ll);
    assertEquals(5.2, best_ll, 0.1);
    assertEquals(4.9, test_ll, 0.1);
  }

  @Test
  public void testSERPProbs() throws IOException {
    final GPFLinearModel model = new GPFLinearModel();
    final List<Session<BlockV1>> dataset;
    try (InputStream is = new GZIPInputStream(WebLogV1GPFSession.class.getResourceAsStream("ses_100k_simple_rand1_h10k.dat.gz"))) {
      dataset = WebLogV1GPFSession.loadDatasetFromJSON(is, new GPFLinearModel(), 100);
    }

    // init model
    model.trainClickProbability(dataset);
    // optimized sort_clicks
    //String theta_str = "-1.702713106887966 0.6404247678125509 0.8839508435362965 0.21594343210697917 -0.7358391375584755 -0.8042641035860408 0.3583499027340962 -0.11674658767248532 0.14040130919303337 0.03769440360443547 0.03935260864525687 0.02853823412929953 2.9422529205133463 -2.874955306294313 3.9219531435872557 0.15268044240500608 -1.3913468238331568 0.7810782232327959 0.041232789657154746 -0.45027594953466205 -0.9911457338442456 -1.0436641653093275 -1.283091206075993 -1.2334707757320833 -2.0290071795725835 -1.2284048134884975 -0.8402670201797776 0.09780373481660343 -0.6956589612984125 -0.7010852279098979 0.39816008299399064 -0.03645514963018488 -0.7665757899838521 -0.44931334579482907 1.2404606430397838 2.1373765546696415 -2.3185767965067376 -0.3782845023765775";
    // optimized r602_2.out
    final String theta_str = "-0.9205664691357801 0.9041998193447492 1.0046610326248397 0.29671349018552656 -0.18053090095708907 0.1772697097979266 -0.20372762113889378 -0.7347344786004694 -0.590408428912083 -0.7299015246974587 -0.792449157275554 -0.7089522500922206 2.2627922543859196 -3.100817014916263 4.067342185744358 -2.5792603725334557 1.1895147789581328 1.3296377365812424 0.7446332963557005 0.1835711196264189 0.016013162804432185 -0.18441528045214423 -0.6162991227657141 -0.6939594938332577 1.0894364501659024 0.3579520755136945 0.496534915034393 0.4146067640917571 0.3836857168202354 -0.015704278848354097 0.0913408379926171 -0.04884275707431338 -0.12681530930644924 -0.30889371408471994 0.7818935938652342 2.008411165741512 -4.581704099106069 0.7613830127598948";
    final String[] theta_str_arr = theta_str.split(" ");
    final ArrayVec theta = new ArrayVec(model.NFEATS);
    for (int i = 0; i < theta.dim(); i++)
      theta.set(i, Double.parseDouble(theta_str_arr[i]));
    model.theta.assign(theta);

    // init session
    final Session session = new Session();
    final BlockV1[] blocks = new BlockV1[11];
    for (int i = 0; i < blocks.length; i++) {
      blocks[i] = new BlockV1(
              Session.BlockType.RESULT,
              i == 3 ? BlockV1.ResultType.IMAGES : BlockV1.ResultType.WEB,
              i,
              i <= 3 ? BlockV1.ResultGrade.RELEVANT_PLUS : BlockV1.ResultGrade.NOT_ASED);
    }
    final int[] clicks = new int[] {3, 2, 6, 10};
    WebLogV1GPFSession.setSessionData(session, blocks, clicks);

    System.out.println(model.explainTheta() + "\n");
    System.out.println("selected session");
    System.out.println(model.explainSessionProb(session));

    for (int i = 0; i < 5; i++) {
      System.out.println("\n\nsession #" + (i+1));
      System.out.println(model.explainSessionProb(dataset.get(i)));
    }
  }
}