RecommenderExample.java example

Explorer

RankSys-master
- RankSys-compression
  - src
    - main
      - java
        org
        ranksys
        compression
        codecs
        AbstractCODEC.java
        CODEC.java
        NullCODEC.java
        catena
        GroupVByteCODEC.java
        package-info.java
        dsi
        BitStreamCODEC.java
        EliasFanoBitStreamCODEC.java
        FixedLengthBitStreamCODEC.java
        GammaBitStreamCODEC.java
        RiceBitStreamCODEC.java
        ZetaBitStreamCODEC.java
        package-info.java
        lemire
        FORVBCODEC.java
        FastPFORVBCODEC.java
        IntegratedFORVBCODEC.java
        IntegratedVByteCODEC.java
        LemireCODEC.java
        NewPFDVBCODEC.java
        OptPFDVBCODEC.java
        Simple16CODEC.java
        VByteCODEC.java
        package-info.java
        package-info.java
        preferences
        AbstractCODECPreferenceData.java
        BinaryCODECPreferenceData.java
        RatingCODECPreferenceData.java
        package-info.java
        util
        Delta.java
        package-info.java
- RankSys-core
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        core
        Recommendation.java
        feature
        FeatureData.java
        SimpleFeatureData.java
        package-info.java
        index
        FeatureIndex.java
        ItemIndex.java
        UserIndex.java
        package-info.java
        model
        UserModel.java
        package-info.java
        package-info.java
        preference
        ConcatPreferenceData.java
        IdPref.java
        PreferenceData.java
        SimplePreferenceData.java
        package-info.java
        util
        FastStringSplitter.java
        Lazy.java
        Stats.java
        package-info.java
        topn
        AbstractTopN.java
        ObjectDoubleTopN.java
        TopN.java
        package-info.java
        org
        ranksys
        core
        index
        MutableItemIndex.java
        MutableUserIndex.java
        package-info.java
        preference
        MutablePreferenceData.java
        PointWisePreferenceData.java
        PreferenceSampler.java
        package-info.java
        util
        BinaryTree.java
        iterators
        ArrayDoubleIterator.java
        ArrayIntIterator.java
        StreamDoubleIterator.java
        StreamIntIterator.java
        package-info.java
        package-info.java
        sampling
        WeightedSampling.java
        package-info.java
        tuples
        Tuple2id.java
        Tuple2io.java
        Tuple2od.java
        Tuples.java
        package-info.java
- RankSys-diversity
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        diversity
        binom
        BinomialModel.java
        metrics
        BinomialCoverage.java
        BinomialDiversity.java
        BinomialMetric.java
        BinomialNonRedundancy.java
        package-info.java
        package-info.java
        reranking
        BinomialCoverageReranker.java
        BinomialDiversityReranker.java
        BinomialNonRedundancyReranker.java
        package-info.java
        distance
        metrics
        EILD.java
        package-info.java
        reranking
        MMR.java
        package-info.java
        intentaware
        AspectModel.java
        FeatureIntentModel.java
        IntentModel.java
        ScoresAspectModel.java
        ScoresRelevanceAspectModel.java
        metrics
        AlphaNDCG.java
        ERRIA.java
        package-info.java
        package-info.java
        reranking
        AlphaXQuAD.java
        XQuAD.java
        package-info.java
        other
        metrics
        SRecall.java
        package-info.java
        sales
        metrics
        AbstractSalesDiversityMetric.java
        AggregateDiversityMetric.java
        EIUDC.java
        EIUFD.java
        EIURD.java
        Entropy.java
        GiniIndex.java
        GiniSimpsonIndex.java
        IUD.java
        package-info.java
        org
        ranksys
        diversity
        intentaware
        CPLSAIAFactorizationModelFactory.java
        IAFactorizationModelFactory.java
        PLSAIAFactorizationModelFactory.java
        package-info.java
        prop
        metrics
        CPR.java
        package-info.java
        reranking
        PM.java
        package-info.java
    - test
      - java
        es
        uam
        eps
        ir
        ranksys
        diversity
        binom
        BinomialModelTest.java
- RankSys-examples
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        examples
        MetricExample.java
        RecommenderExample.java
        RerankerExample.java
        package-info.java
        org
        ranksys
        examples
        CPLSARecommenderExample.java
        CPLSARerankerExample.java
        CompressionExample.java
        package-info.java
- RankSys-fast
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        fast
        FastRecommendation.java
        feature
        AbstractFastFeatureData.java
        FastFeatureData.java
        SimpleFastFeatureData.java
        package-info.java
        index
        FastFeatureIndex.java
        FastItemIndex.java
        FastUserIndex.java
        SimpleFastFeatureIndex.java
        SimpleFastItemIndex.java
        SimpleFastUserIndex.java
        package-info.java
        package-info.java
        preference
        AbstractFastPreferenceData.java
        FastPreferenceData.java
        IdxPref.java
        SQLPreferenceData.java
        SimpleFastPreferenceData.java
        TransposedPreferenceData.java
        package-info.java
        utils
        IdxIndex.java
        package-info.java
        topn
        IntDoubleTopN.java
        package-info.java
        org
        ranksys
        fast
        preference
        AbstractFastPreferenceSampler.java
        FastPointWisePreferenceData.java
        FastPreferenceSampler.java
        IteratorsAbstractFastPreferenceData.java
        StreamsAbstractFastPreferenceData.java
        package-info.java
    - test
      - java
        es
        uam
        eps
        ir
        ranksys
        fast
        index
        SimpleFastFeatureIndexTest.java
        SimpleFastItemIndexTest.java
        SimpleFastUserIndexTest.java
        org
        ranksys
        fast
        preference
        IteratorsAbstractFastPreferenceDataTest.java
        SQLPreferenceDataTest.java
        StreamsAbstractFastPreferenceDataTest.java
- RankSys-fm
  - src
    - main
      - java
        org
        ranksys
        fm
        PreferenceFM.java
        data
        BPRPreferenceFMData.java
        OneClassPreferenceFMData.java
        package-info.java
        learner
        BPRLearner.java
        PreferenceFMLearner.java
        RMSELearner.java
        package-info.java
        package-info.java
        rec
        FMRecommender.java
        package-info.java
- RankSys-formats
  - src
    - main
      - java
        org
        ranksys
        formats
        factorization
        FMFormat.java
        FactorizationFormat.java
        SimpleFMFormat.java
        SimpleFactorizationFormat.java
        package-info.java
        feature
        FeaturesReader.java
        SimpleFeaturesReader.java
        package-info.java
        index
        FeatsReader.java
        ItemsReader.java
        UsersReader.java
        Utils.java
        package-info.java
        parsing
        Parser.java
        Parsers.java
        package-info.java
        preference
        CompressibleBinaryPreferencesFormat.java
        CompressibleRatingPreferencesFormat.java
        PreferencesReader.java
        SimpleBinaryPreferencesReader.java
        SimpleRatingPreferencesReader.java
        package-info.java
        rec
        MahoutRecommendationFormat.java
        RecommendationFormat.java
        SimpleRecommendationFormat.java
        TRECRecommendationFormat.java
        TuplesRecommendationFormat.java
        ZipRecommendationFormat.java
        package-info.java
- RankSys-lda
  - src
    - main
      - java
        org
        ranksys
        lda
        LDAModelEstimator.java
        LDARecommender.java
        package-info.java
- RankSys-metrics
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        metrics
        AbstractRecommendationMetric.java
        AbstractSystemMetric.java
        RecommendationMetric.java
        SystemMetric.java
        basic
        AveragePrecision.java
        AverageRecommendationMetric.java
        NDCG.java
        NumRetrieved.java
        Precision.java
        Recall.java
        ReciprocalRank.java
        Recommendability.java
        package-info.java
        package-info.java
        rank
        ExponentialDiscountModel.java
        LogarithmicDiscountModel.java
        NoDiscountModel.java
        RankingDiscountModel.java
        ReciprocalDiscountModel.java
        package-info.java
        rel
        BackgroundBinaryRelevanceModel.java
        BinaryRelevanceModel.java
        IdealRelevanceModel.java
        NoRelevanceModel.java
        RelevanceModel.java
        package-info.java
        org
        ranksys
        metrics
        basic
        FScore.java
        HarmonicMean.java
        KCall.java
        package-info.java
    - test
      - java
        es
        uam
        eps
        ir
        ranksys
        metrics
        basic
        AveragePrecisionTest.java
- RankSys-mf
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        mf
        Factorization.java
        Factorizer.java
        als
        ALSFactorizer.java
        HKVFactorizer.java
        PZTFactorizer.java
        package-info.java
        package-info.java
        plsa
        PLSAFactorizer.java
        package-info.java
        rec
        MFRecommender.java
        package-info.java
        org
        ranksys
        mf
        plsa
        CPLSAFactorizer.java
        package-info.java
    - test
      - java
        es
        uam
        eps
        ir
        ranksys
        mf
        rec
        MFRecommenderTest.java
- RankSys-nn
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        nn
        item
        ItemNeighborhoodRecommender.java
        neighborhood
        ItemNeighborhood.java
        ItemNeighborhoods.java
        package-info.java
        package-info.java
        sim
        ItemSimilarities.java
        ItemSimilarity.java
        package-info.java
        neighborhood
        CachedNeighborhood.java
        Neighborhood.java
        ThresholdNeighborhood.java
        TopKNeighborhood.java
        package-info.java
        sim
        SetSimilarity.java
        Similarities.java
        Similarity.java
        VectorSimilarity.java
        package-info.java
        user
        UserNeighborhoodRecommender.java
        neighborhood
        UserNeighborhood.java
        UserNeighborhoods.java
        package-info.java
        package-info.java
        sim
        UserSimilarities.java
        UserSimilarity.java
        package-info.java
- RankSys-novdiv
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        novdiv
        distance
        CosineFeatureItemDistanceModel.java
        FeatureItemDistanceModel.java
        ItemDistanceModel.java
        JaccardFeatureItemDistanceModel.java
        VectorFeatureItemDistanceModel.java
        package-info.java
        itemnovelty
        ItemNovelty.java
        metrics
        ItemNoveltyMetric.java
        package-info.java
        package-info.java
        reranking
        ItemNoveltyReranker.java
        package-info.java
        reranking
        GreedyReranker.java
        LambdaReranker.java
        NullReranker.java
        PermutationReranker.java
        RandomReranker.java
        Reranker.java
        RerankingRecommender.java
        package-info.java
        org
        ranksys
        novdiv
        reranking
        DitheringReranker.java
        package-info.java
- RankSys-novelty
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        novelty
        inverted
        br
        AlphaBayesRuleReranker.java
        BayesRuleReranker.java
        package-info.java
        neighborhood
        InvertedItemNeighborhood.java
        InvertedNeighborhood.java
        InvertedUserNeighborhood.java
        package-info.java
        longtail
        FDItemNovelty.java
        PCItemNovelty.java
        metrics
        EFD.java
        EPC.java
        package-info.java
        package-info.java
        reranking
        FDItemNoveltyReranker.java
        PCItemNoveltyReranker.java
        package-info.java
        sales
        ISDCItemNovelty.java
        metrics
        EISDC.java
        ISD.java
        package-info.java
        package-info.java
        reranking
        ISDCItemNoveltyReranker.java
        package-info.java
        temporal
        TDItemNovelty.java
        metrics
        ETD.java
        package-info.java
        package-info.java
        reranking
        TDItemNoveltyReranker.java
        package-info.java
        unexp
        PDItemNovelty.java
        metrics
        EPD.java
        package-info.java
        package-info.java
        reranking
        PDItemNoveltyReranker.java
        package-info.java
- RankSys-rec
  - src
    - main
      - java
        es
        uam
        eps
        ir
        ranksys
        rec
        AbstractRecommender.java
        Recommender.java
        fast
        AbstractFastRecommender.java
        FastRankingRecommender.java
        FastRecommender.java
        basic
        PopularityRecommender.java
        RandomRecommender.java
        package-info.java
        package-info.java
        package-info.java
        runner
        AbstractRecommenderRunner.java
        CandidatesRecommenderRunner.java
        FilterRecommenderRunner.java
        Filters.java
        RecommenderRunner.java
        fast
        FastFilterRecommenderRunner.java
        FastFilters.java
        package-info.java
        package-info.java
        org
        ranksys
        rec
        fast
        FastEnsembleRecommender.java
        package-info.java
    - test
      - java
        es
        uam
        eps
        ir
        ranksys
        rec
        fast
        AbstractFastRecommenderTest.java

/* 
 * Copyright (C) 2015 Information Retrieval Group at Universidad Autónoma
 * de Madrid, http://ir.ii.uam.es
 *
 * This Source Code Form is subject to the terms of the Mozilla Public
 * License, v. 2.0. If a copy of the MPL was not distributed with this
 * file, You can obtain one at http://mozilla.org/MPL/2.0/.
 */
package es.uam.eps.ir.ranksys.examples;

import cc.mallet.topics.ParallelTopicModel;
import es.uam.eps.ir.ranksys.fast.index.FastItemIndex;
import es.uam.eps.ir.ranksys.fast.index.FastUserIndex;
import es.uam.eps.ir.ranksys.fast.index.SimpleFastItemIndex;
import es.uam.eps.ir.ranksys.fast.index.SimpleFastUserIndex;
import es.uam.eps.ir.ranksys.fast.preference.FastPreferenceData;
import es.uam.eps.ir.ranksys.fast.preference.SimpleFastPreferenceData;
import es.uam.eps.ir.ranksys.mf.Factorization;
import es.uam.eps.ir.ranksys.mf.als.HKVFactorizer;
import es.uam.eps.ir.ranksys.mf.als.PZTFactorizer;
import es.uam.eps.ir.ranksys.mf.plsa.PLSAFactorizer;
import es.uam.eps.ir.ranksys.mf.rec.MFRecommender;
import es.uam.eps.ir.ranksys.nn.item.ItemNeighborhoodRecommender;
import es.uam.eps.ir.ranksys.nn.item.neighborhood.ItemNeighborhood;
import es.uam.eps.ir.ranksys.nn.item.neighborhood.ItemNeighborhoods;
import es.uam.eps.ir.ranksys.nn.item.sim.ItemSimilarities;
import es.uam.eps.ir.ranksys.nn.item.sim.ItemSimilarity;
import es.uam.eps.ir.ranksys.nn.user.UserNeighborhoodRecommender;
import es.uam.eps.ir.ranksys.nn.user.neighborhood.UserNeighborhood;
import es.uam.eps.ir.ranksys.nn.user.neighborhood.UserNeighborhoods;
import es.uam.eps.ir.ranksys.nn.user.sim.UserSimilarities;
import es.uam.eps.ir.ranksys.nn.user.sim.UserSimilarity;
import es.uam.eps.ir.ranksys.rec.Recommender;
import es.uam.eps.ir.ranksys.rec.fast.basic.PopularityRecommender;
import es.uam.eps.ir.ranksys.rec.fast.basic.RandomRecommender;
import es.uam.eps.ir.ranksys.rec.runner.RecommenderRunner;
import es.uam.eps.ir.ranksys.rec.runner.fast.FastFilterRecommenderRunner;
import es.uam.eps.ir.ranksys.rec.runner.fast.FastFilters;
import org.jooq.lambda.Unchecked;
import org.ranksys.fm.PreferenceFM;
import org.ranksys.fm.learner.BPRLearner;
import org.ranksys.fm.learner.RMSELearner;
import org.ranksys.fm.rec.FMRecommender;
import org.ranksys.formats.index.ItemsReader;
import org.ranksys.formats.index.UsersReader;
import org.ranksys.formats.preference.SimpleRatingPreferencesReader;
import org.ranksys.formats.rec.RecommendationFormat;
import org.ranksys.formats.rec.SimpleRecommendationFormat;
import org.ranksys.lda.LDAModelEstimator;
import org.ranksys.lda.LDARecommender;

import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.Set;
import java.util.function.DoubleUnaryOperator;
import java.util.function.Function;
import java.util.function.IntPredicate;
import java.util.function.Supplier;
import java.util.stream.Collectors;

import static org.ranksys.formats.parsing.Parsers.lp;

/**
 * Example main of recommendations.
 *
 * @author Saúl Vargas (saul.vargas@uam.es)
 * @author Pablo Castells (pablo.castells@uam.es)
 */
public class RecommenderExample {

    public static void main(String[] args) throws IOException {
        String userPath = args[0];
        String itemPath = args[1];
        String trainDataPath = args[2];
        String testDataPath = args[3];

        FastUserIndex<Long> userIndex = SimpleFastUserIndex.load(UsersReader.read(userPath, lp));
        FastItemIndex<Long> itemIndex = SimpleFastItemIndex.load(ItemsReader.read(itemPath, lp));
        FastPreferenceData<Long, Long> trainData = SimpleFastPreferenceData.load(SimpleRatingPreferencesReader.get().read(trainDataPath, lp, lp), userIndex, itemIndex);
        FastPreferenceData<Long, Long> testData = SimpleFastPreferenceData.load(SimpleRatingPreferencesReader.get().read(testDataPath, lp, lp), userIndex, itemIndex);

        //////////////////
        // RECOMMENDERS //
        //////////////////
        Map<String, Supplier<Recommender<Long, Long>>> recMap = new HashMap<>();

        // random recommendation
        recMap.put("rnd", () -> new RandomRecommender<>(trainData, trainData));

        // most-popular recommendation
        recMap.put("pop", () -> new PopularityRecommender<>(trainData));

        // user-based nearest neighbors
        recMap.put("ub", () -> {
            int k = 100;
            int q = 1;

            UserSimilarity<Long> sim = UserSimilarities.vectorCosine(trainData, true);
            UserNeighborhood<Long> neighborhood = UserNeighborhoods.topK(sim, k);

            return new UserNeighborhoodRecommender<>(trainData, neighborhood, q);
        });

        // item-based nearest neighbors
        recMap.put("ib", () -> {
            int k = 10;
            int q = 1;

            ItemSimilarity<Long> sim = ItemSimilarities.vectorCosine(trainData, true);
            ItemNeighborhood<Long> neighborhood = ItemNeighborhoods.cached(ItemNeighborhoods.topK(sim, k));

            return new ItemNeighborhoodRecommender<>(trainData, neighborhood, q);
        });

        // implicit matrix factorization of Hu et al. 2008
        recMap.put("hkv", () -> {
            int k = 50;
            double lambda = 0.1;
            double alpha = 1.0;
            DoubleUnaryOperator confidence = x -> 1 + alpha * x;
            int numIter = 20;

            Factorization<Long, Long> factorization = new HKVFactorizer<Long, Long>(lambda, confidence, numIter).factorize(k, trainData);

            return new MFRecommender<>(userIndex, itemIndex, factorization);
        });

        // implicit matrix factorization of Pilaszy et al. 2010
        recMap.put("pzt", () -> {
            int k = 50;
            double lambda = 0.1;
            double alpha = 1.0;
            DoubleUnaryOperator confidence = x -> 1 + alpha * x;
            int numIter = 20;

            Factorization<Long, Long> factorization = new PZTFactorizer<Long, Long>(lambda, confidence, numIter).factorize(k, trainData);

            return new MFRecommender<>(userIndex, itemIndex, factorization);
        });

        // probabilistic latent semantic analysis of Hofmann 2004
        recMap.put("plsa", () -> {
            int k = 50;
            int numIter = 100;

            Factorization<Long, Long> factorization = new PLSAFactorizer<Long, Long>(numIter).factorize(k, trainData);

            return new MFRecommender<>(userIndex, itemIndex, factorization);
        });

        // LDA topic modelling by Blei et al. 2003
        recMap.put("lda", Unchecked.supplier(() -> {
            int k = 50;
            double alpha = 1.0;
            double beta = 0.01;
            int numIter = 200;
            int burninPeriod = 50;

            ParallelTopicModel topicModel = LDAModelEstimator.estimate(trainData, k, alpha, beta, numIter, burninPeriod);

            return new LDARecommender<>(userIndex, itemIndex, topicModel);
        }));

        // Factorisation machine using a BRP-like loss
        recMap.put("fm-bpr", Unchecked.supplier(() -> {

            double learnRate = 0.01;
            int numIter = 200;
            double regW = 0.01;
            double regM = 0.01;
            int K = 100;
            double sdev = 0.1;

            PreferenceFM<Long, Long> prefFm = new BPRLearner<>(learnRate, numIter, regW, regM, userIndex, itemIndex).learn(trainData, testData, K, sdev);

            return new FMRecommender<>(prefFm);
        }));

        // Factorisation machine usinga RMSE-like loss with balanced sampling of negative
        // instances
        recMap.put("fm-rmse", Unchecked.supplier(() -> {

            double learnRate = 0.01;
            int numIter = 50;
            double regB = 0.01;
            double regW = 0.01;
            double regM = 0.01;
            double negativeProp = 2.0;
            int K = 100;
            double sdev = 0.1;
            
            PreferenceFM<Long, Long> prefFm = new RMSELearner<>(learnRate, numIter, regB, regW, regM, negativeProp, userIndex, itemIndex).learn(trainData, testData, K, sdev);

            return new FMRecommender<>(prefFm);
        }));

        ////////////////////////////////
        // GENERATING RECOMMENDATIONS //
        ////////////////////////////////
        Set<Long> targetUsers = testData.getUsersWithPreferences().collect(Collectors.toSet());
        RecommendationFormat<Long, Long> format = new SimpleRecommendationFormat<>(lp, lp);
        Function<Long, IntPredicate> filter = FastFilters.notInTrain(trainData);
        int maxLength = 100;
        RecommenderRunner<Long, Long> runner = new FastFilterRecommenderRunner<>(userIndex, itemIndex, targetUsers.stream(), filter, maxLength);

        recMap.forEach(Unchecked.biConsumer((name, recommender) -> {
            System.out.println("Running " + name);
            try (RecommendationFormat.Writer<Long, Long> writer = format.getWriter(name)) {
                runner.run(recommender.get(), writer);
            }
        }));
    }
}