TransactionDatabaseConverter.java example

Explorer

adc-wildner-master
- spmf
  - ca
    - pfv
      - spmf
        algorithms
        ArraysAlgos.java
        associationrules
        IGB
        AlgoIGB.java
        Indirect
        AlgoINDIRECT.java
        MNRRules
        AlgoMNRRules.java
        TopKRules_and_TNR
        AlgoTNR.java
        AlgoTopKRules.java
        Database.java
        RuleG.java
        Transaction.java
        agrawal94_association_rules
        AlgoAgrawalFaster94.java
        AssocRule.java
        AssocRules.java
        closedrules
        AlgoClosedRules.java
        fhsar
        AlgoFHSAR.java
        Rule.java
        Transaction.java
        classifiers
        decisiontree
        id3
        AlgoID3.java
        ClassNode.java
        DecisionNode.java
        DecisionTree.java
        Node.java
        clustering
        dbscan
        AlgoDBSCAN.java
        DoubleArrayDBS.java
        distanceFunctions
        DistanceCorrelation.java
        DistanceCosine.java
        DistanceEuclidian.java
        DistanceFunction.java
        DistanceJaccard.java
        DistanceManathan.java
        hierarchical_clustering
        AlgoHierarchicalClustering.java
        kmeans
        AlgoBisectingKMeans.java
        AlgoKMeans.java
        optics
        AlgoOPTICS.java
        DoubleArrayOPTICS.java
        MainTestOPTICS_extractClusterOrdering_saveToFile.java
        MainTestOPTICS_extractClusterOrdering_saveToMemory.java
        MainTestOPTICS_extractClusters_saveToFile.java
        MainTestOPTICS_extractDBScan_saveToFile.java
        MainTestOPTICS_extractDBScan_saveToMemory.java
        text_clusterer
        PorterStemmer.java
        Record.java
        SimilarRecords.java
        StopWordAnalyzer.java
        TextCluster.java
        TextClusterAlgo.java
        frequentpatterns
        MSApriori
        AlgoMSApriori.java
        apriori
        AlgoApriori.java
        aprioriTID
        AlgoAprioriTID.java
        AlgoAprioriTID_Bitset.java
        aprioriTIDClose
        AlgoAprioriTIDClose.java
        apriori_HT
        AlgoAprioriHT.java
        ItemsetHashTree.java
        apriori_close
        AlgoAprioriClose.java
        apriori_inverse
        AlgoAprioriInverse.java
        apriori_rare
        AlgoAprioriRare.java
        cfpgrowth
        AlgoCFPGrowth.java
        MISNode.java
        MISTree.java
        charm
        AlgoCharmMFI.java
        AlgoCharm_Bitset.java
        AlgoDCharm_Bitset.java
        HashTable.java
        clostream
        AlgoCloSteam.java
        cori
        AlgoCORI.java
        ItemsetCORI.java
        ItemsetsCORI.java
        dci_closed
        AlgoDCI_Closed.java
        dci_closed_optimized
        AlgoDCI_Closed_Optimized.java
        BitMatrix.java
        defme
        AlgoDefMe.java
        eclat
        AlgoDEclat.java
        AlgoDEclat_Bitset.java
        AlgoEclat.java
        AlgoEclat_Bitset.java
        estDec
        Algo_estDec.java
        Algo_estDecPlus.java
        CPTree.java
        CPTreeNode.java
        MainTest_estDec_saveToFile.java
        estNode.java
        estTree.java
        fin_prepost
        FIN.java
        PrePost.java
        fpgrowth
        AlgoFPClose.java
        AlgoFPGrowth.java
        AlgoFPMax.java
        CFINode.java
        CFITree.java
        FPNode.java
        FPTree.java
        MFINode.java
        MFITree.java
        fpgrowth_with_strings
        AlgoFPGrowth_Strings.java
        FPNode_Strings.java
        FPTree_Strings.java
        hmine
        AlgoHMine.java
        hui_miner
        AlgoFHM.java
        AlgoFHN.java
        AlgoHUIMiner.java
        Element.java
        ElementFHN.java
        UtilityList.java
        UtilityListFHN.java
        itemsettree
        AbstractItemsetTree.java
        AssociationRuleIT.java
        HashTableIT.java
        ItemsetTree.java
        ItemsetTreeNode.java
        MemoryEfficientItemsetTree.java
        lcm
        AlgoLCM.java
        Dataset.java
        MainTestLCMFreq_saveToMemory.java
        MainTestLCMMax_saveToFile.java
        MainTestLCMMax_saveToMemory.java
        MainTestLCM_saveToMemory.java
        Transaction.java
        pascal
        AlgoPASCAL.java
        ItemsetPascal.java
        relim
        AlgoRelim.java
        DatabaseStructureRelim.java
        two_phase
        AlgoHUINIVMine.java
        AlgoTwoPhase.java
        ItemUtility.java
        ItemsetTP.java
        ItemsetsTP.java
        TransactionTP.java
        UtilityTransactionDatabaseTP.java
        uapriori
        AlgoUApriori.java
        ItemUApriori.java
        ItemsetUApriori.java
        ItemsetsUApriori.java
        UncertainTransactionDatabase.java
        upgrowth_ihup
        AlgoIHUP.java
        AlgoUPGrowth.java
        IHUPTree.java
        Item.java
        Itemset.java
        UPNode.java
        UPTree.java
        upgrowthplus
        AlgoUPGrowthPlus.java
        Item.java
        Itemset.java
        UPNode.java
        UPTree.java
        vme
        AlgoVME.java
        zart
        AlgoZart.java
        TCTableCandidate.java
        TFTableFrequent.java
        TZTableClosed.java
        sequential_rules
        cmdeogun
        AlgoCMDeogun.java
        Rule.java
        Rules.java
        cmrules
        AlgoAprioriTID_forCMRules.java
        AlgoCMRules.java
        Rule.java
        Rules.java
        rulegen
        AlgoRuleGen.java
        rulegrowth
        AlgoERMiner.java
        AlgoRULEGROWTH.java
        ExpandLeftStore.java
        LeftEquivalenceClass.java
        LeftRule.java
        Occurence.java
        RightEquivalenceClass.java
        RightRule.java
        Rule.java
        SparseMatrix.java
        topseqrules_and_tns
        AlgoTNS.java
        AlgoTopSeqRules.java
        Rule.java
        trulegrowth
        AlgoTRuleGrowth.java
        Occurence.java
        trulegrowth_with_strings
        AlgoTRuleGrowth_withStrings.java
        Itemset.java
        Occurence.java
        sequentialpatterns
        BIDE_and_prefixspan
        AlgoBIDEPlus.java
        AlgoFEAT.java
        AlgoFSGP.java
        AlgoMaxSP.java
        AlgoPrefixSpan.java
        AlgoTSP_nonClosed.java
        Candidate.java
        Pair.java
        PairBIDE.java
        PseudoSequence.java
        PseudoSequenceBIDE.java
        SequentialPattern.java
        SequentialPatterns.java
        BIDE_and_prefixspan_with_strings
        AlgoBIDEPlus_withStrings.java
        AlgoPrefixSpan_with_Strings.java
        Itemset.java
        Pair.java
        PairBIDE.java
        PseudoSequence.java
        PseudoSequenceBIDE.java
        SequentialPattern.java
        SequentialPatterns.java
        clasp_AGP
        AlgoCM_ClaSP.java
        AlgoClaSP.java
        FrequentPatternEnumeration_ClaSP.java
        dataStructures
        Item.java
        Itemset.java
        RemoveStatics.java
        Sequence.java
        Sequences.java
        abstracciones
        Abstraction_Generic.java
        Abstraction_Qualitative.java
        ItemAbstractionPair.java
        creators
        AbstractionCreator.java
        AbstractionCreator_Qualitative.java
        ItemAbstractionPairCreator.java
        database
        ItemFactory.java
        SequenceDatabase.java
        patterns
        Pattern.java
        PatternCreator.java
        idlists
        IDList.java
        IDListStandard_Map.java
        Position.java
        creators
        IdListCreator.java
        IdListCreatorStandard_Map.java
        savers
        Saver.java
        SaverIntoFile.java
        SaverIntoMemory.java
        tries
        ShowTrie.java
        Trie.java
        TrieNode.java
        clospan_AGP
        AlgoCloSpan.java
        RecursionCloSpan.java
        items
        Item.java
        ItemFactory.java
        Itemset.java
        Pair.java
        PseudoSequence.java
        PseudoSequenceDatabase.java
        RemoveStatics.java
        Sequence.java
        SequenceDatabase.java
        Sequences.java
        abstractions
        Abstraction_Generic.java
        Abstraction_Qualitative.java
        ItemAbstractionPair.java
        creators
        AbstractionCreator.java
        AbstractionCreator_Qualitative.java
        ItemAbstractionPairCreator.java
        patterns
        Pattern.java
        PatternCreator.java
        trie
        Trie.java
        TrieNode.java
        savers
        Saver.java
        SaverIntoFile.java
        SaverIntoMemory.java
        fournier2008_seqdim
        AbstractAlgoPrefixSpan.java
        AlgoBIDEPlus.java
        AlgoFournierViger08.java
        AlgoPrefixSpanMDSPM.java
        ItemSimple.java
        ItemValued.java
        Itemset.java
        Pair.java
        PseudoSequence.java
        PseudoSequenceDatabase.java
        Sequence.java
        SequenceDatabase.java
        Sequences.java
        TestPseudoSequence.java
        kmeans_for_fournier08
        AlgoKMeansWithSupport.java
        AlgoKMeans_forFournier08.java
        Cluster.java
        multidimensionalpatterns
        AlgoDim.java
        MDPattern.java
        MDPatterns.java
        MDPatternsDatabase.java
        multidimensionalsequentialpatterns
        AlgoSeqDim.java
        MDSequence.java
        MDSequenceDatabase.java
        MDSequences.java
        goKrimp
        AlgoGoKrimp.java
        DataReader.java
        Event.java
        MyPattern.java
        SignTest.java
        gsp_AGP
        AlgoGSP.java
        CandidateGeneration.java
        SupportCounting.java
        items
        CandidateInSequenceFinder.java
        Item.java
        ItemFactory.java
        Itemset.java
        RemoveStatics.java
        Sequence.java
        SequenceDatabase.java
        Sequences.java
        abstractions
        Abstraction_Generic.java
        Abstraction_Qualitative.java
        ItemAbstractionPair.java
        creators
        AbstractionCreator.java
        AbstractionCreator_Qualitative.java
        ItemAbstractionPairCreator.java
        patterns
        Pattern.java
        PatternCreator.java
        lapin
        AlgoLAPIN_LCI.java
        IEPositionList.java
        PairWithList.java
        PositionVector.java
        Prefix.java
        SEPositionList.java
        Table.java
        prefixSpan_AGP
        AlgoPrefixSpan_AGP.java
        RecursionPrefixSpan_AGP.java
        items
        Item.java
        ItemFactory.java
        Itemset.java
        Pair.java
        PseudoSequence.java
        PseudoSequenceDatabase.java
        RemoveStatics.java
        Sequence.java
        SequenceDatabase.java
        Sequences.java
        abstractions
        Abstraction_Generic.java
        Abstraction_Qualitative.java
        ItemAbstractionPair.java
        creators
        AbstractionCreator.java
        AbstractionCreator_Qualitative.java
        ItemAbstractionPairCreator.java
        patterns
        Pattern.java
        PatternCreator.java
        savers
        Saver.java
        SaverIntoFile.java
        SaverIntoMemory.java
        spade_spam_AGP
        AlgoCMSPADE.java
        AlgoSPADE.java
        AlgoSPAM_AGP.java
        EquivalenceClass.java
        FrequentPatternEnumeration.java
        FrequentPatternEnumerationFacade.java
        FrequentPatternEnumeration_SPAM.java
        candidatePatternsGeneration
        CandidateGenerator.java
        CandidateGenerator_Qualitative.java
        dataStructures
        Item.java
        ItemFactory.java
        Itemset.java
        RemoveStatics.java
        Sequence.java
        Sequences.java
        abstractions
        Abstraction_Generic.java
        Abstraction_Qualitative.java
        ItemAbstractionPair.java
        creators
        AbstractionCreator.java
        AbstractionCreator_Qualitative.java
        ItemAbstractionPairCreator.java
        database
        SequenceDatabase.java
        patterns
        Pattern.java
        PatternCreator.java
        idLists
        IDList.java
        IDListBitmap.java
        IDListFatBitmap.java
        IDListStandard_Map.java
        creators
        IdListCreator.java
        IdListCreator_Bitmap.java
        IdListCreator_FatBitmap.java
        IdListCreator_StandardMap.java
        savers
        Saver.java
        SaverIntoFile.java
        SaverIntoMemory.java
        spam
        AlgoCMSPAM.java
        AlgoSPAM.java
        AlgoTKS.java
        AlgoVGEN.java
        AlgoVMSP.java
        Bitmap.java
        Candidate.java
        Pattern.java
        PatternVGEN.java
        PatternVMSP.java
        Prefix.java
        PrefixVGEN.java
        PrefixVMSP.java
        sort
        MainTestSelect.java
        MainTestSort.java
        Select.java
        Sort.java
        datastructures
        binarytree
        BinaryTree.java
        MainBinaryTree.java
        kdtree
        KDNode.java
        KDTree.java
        KNNPoint.java
        MainTestKDTree_KNearestNeighbors.java
        MainTestKDTree_NearestNeighboor.java
        MainTestKDTree_allPointsWithinEpsilonRadius.java
        redblacktree
        MainRedBlackTree.java
        RedBlackTree.java
        triangularmatrix
        AbstractTriangularMatrix.java
        SparseTriangularMatrix.java
        TriangularMatrix.java
        gui
        CommandProcessor.java
        Main.java
        MainWindow.java
        NotifyingThread.java
        PathsManager.java
        ResetPaths.java
        ThreadCompleteListener.java
        input
        sequence_database_array_integers
        Sequence.java
        SequenceDatabase.java
        sequence_database_list_integers
        Sequence.java
        SequenceDatabase.java
        sequence_database_list_strings
        Sequence.java
        SequenceDatabase.java
        transaction_database_list_integers
        TransactionDatabase.java
        patterns
        AbstractItemset.java
        AbstractOrderedItemset.java
        cluster
        Cluster.java
        ClusterWithMean.java
        DoubleArray.java
        itemset_array_integers_with_count
        Itemset.java
        Itemsets.java
        itemset_array_integers_with_tids
        Itemset.java
        Itemsets.java
        itemset_array_integers_with_tids_bitset
        Itemset.java
        Itemsets.java
        itemset_list_integers_without_support
        Itemset.java
        rule_itemset_array_integer_with_count
        Rule.java
        Rules.java
        test
        MainTestAllAssociationRules_CFPGrowth_saveToFile.java
        MainTestAllAssociationRules_CFPGrowth_saveToFile_withLift.java
        MainTestAllAssociationRules_CFPGrowth_saveToMemory.java
        MainTestAllAssociationRules_CFPGrowth_saveToMemory_with_lift.java
        MainTestAllAssociationRules_FPGrowth_saveToFile.java
        MainTestAllAssociationRules_FPGrowth_saveToFile_withLift.java
        MainTestAllAssociationRules_FPGrowth_saveToMemory.java
        MainTestAllAssociationRules_FPGrowth_saveToMemory_with_lift.java
        MainTestAllPerfectlySporadicAssociationRules_Apriori_saveToMemory.java
        MainTestAprioriClose_saveToFIle.java
        MainTestAprioriClose_saveToMemory.java
        MainTestAprioriHT_saveToFile.java
        MainTestAprioriInverse_saveToFile.java
        MainTestAprioriInverse_saveToMemory.java
        MainTestAprioriRare_saveToFile.java
        MainTestAprioriRare_saveToMemory.java
        MainTestAprioriTID.java
        MainTestAprioriTIDClose.java
        MainTestAprioriTID_bitset_saveToFile.java
        MainTestAprioriTID_saveToFile.java
        MainTestApriori_saveToFile.java
        MainTestApriori_saveToMemory.java
        MainTestBIDEPlus_saveToFile.java
        MainTestBIDEPlus_saveToFile_withStrings.java
        MainTestBIDEPlus_saveToMemory.java
        MainTestBisectingKMeans_saveToFile.java
        MainTestCFPGrowth_saveToFile.java
        MainTestCFPGrowth_saveToMemory.java
        MainTestCMClaSP_saveToFile.java
        MainTestCMClaSP_saveToMemory.java
        MainTestCMDEO.java
        MainTestCMRULES.java
        MainTestCMSPADE_saveToFile.java
        MainTestCMSPADE_saveToMemory.java
        MainTestCMSPAM_saveToFile.java
        MainTestCORI_saveToFile.java
        MainTestCORI_saveToMemory.java
        MainTestCharmMFI_saveToFile.java
        MainTestCharmMFI_saveToMemory.java
        MainTestCharm_bitset_saveToFile.java
        MainTestCharm_bitset_saveToMemory.java
        MainTestClaSP_saveToFile.java
        MainTestClaSP_saveToMemory.java
        MainTestCloSpan_saveToFile.java
        MainTestCloSpan_saveToMemory.java
        MainTestCloStream.java
        MainTestClosedAssociationRules_saveToFile.java
        MainTestClosedAssociationRules_saveToMemory.java
        MainTestConvertSeqDBToTransDB.java
        MainTestConvertSequenceDatabase.java
        MainTestConvertTransDBtoSeqDB.java
        MainTestConvertTransactionDatabaseCSVtoSPMF.java
        MainTestDBSCAN_saveToFile.java
        MainTestDBSCAN_saveToMemory.java
        MainTestDCI_Closed.java
        MainTestDCI_Closed_Optimized.java
        MainTestDCharm_bitset_saveToFile.java
        MainTestDCharm_bitset_saveToMemory.java
        MainTestDEclat_bitset_saveToFile.java
        MainTestDEclat_bitset_saveToMemory.java
        MainTestDEclat_saveToFile.java
        MainTestDEclat_saveToMemory.java
        MainTestDefMe_saveToFile.java
        MainTestDefMe_saveToMemory.java
        MainTestERMiner.java
        MainTestEclat_bitset_saveToFile.java
        MainTestEclat_saveToFile.java
        MainTestEclat_saveToMemory.java
        MainTestFEAT_saveToFile.java
        MainTestFEAT_saveToMemory.java
        MainTestFHM.java
        MainTestFHN_saveToFile.java
        MainTestFHSAR.java
        MainTestFIN.java
        MainTestFPClose_saveToFile.java
        MainTestFPClose_saveToMemory.java
        MainTestFPGrowth_saveToFile.java
        MainTestFPGrowth_saveToMemory.java
        MainTestFPGrowth_strings_saveToFile.java
        MainTestFPMax_saveToFile.java
        MainTestFPMax_saveToMemory.java
        MainTestFSGP_saveToFile.java
        MainTestFSGP_saveToMemory.java
        MainTestFixTransactionDatabase.java
        MainTestGSP_saveToFile.java
        MainTestGSP_saveToMemory.java
        MainTestGenerateSequenceDatabase.java
        MainTestGenerateSequenceDatabaseStats.java
        MainTestGenerateSequenceDatabaseWithTimeStamps.java
        MainTestGenerateTransactionDatabase.java
        MainTestGenerateTransactionDatabaseStats.java
        MainTestGoKrimp_printResultToConsole.java
        MainTestGoKrimp_saveToFile.java
        MainTestHMine.java
        MainTestHUIMiner.java
        MainTestHUINIVMine_saveToFile.java
        MainTestHUINIVMine_saveToMemory.java
        MainTestHierarchicalClustering_saveToFile.java
        MainTestHierarchicalClustering_saveToMemory.java
        MainTestID3.java
        MainTestIGB_saveToFile.java
        MainTestIGB_saveToMemory.java
        MainTestIHUP.java
        MainTestIndirectRules_saveToFile.java
        MainTestItemsetTree.java
        MainTestKMeans_saveToFile.java
        MainTestKMeans_saveToMemory.java
        MainTestLAPIN_saveToFile.java
        MainTestLCMFreq_saveToFile.java
        MainTestLCMFreq_saveToMemory.java
        MainTestLCM_saveToFile.java
        MainTestLCM_saveToMemory.java
        MainTestMNRRules_saveToFile.java
        MainTestMNRRules_saveToMemory.java
        MainTestMSApriori_saveToFile.java
        MainTestMaxSP_saveToFile.java
        MainTestMaxSP_saveToMemory.java
        MainTestMemoryEfficientItemsetTree.java
        MainTestMultiDimSequentialPatternMining.java
        MainTestMultiDimSequentialPatternMiningClosed.java
        MainTestOPTICS_extractClusterOrdering_saveToFile.java
        MainTestOPTICS_extractClusterOrdering_saveToMemory.java
        MainTestOPTICS_extractDBScan_saveToFile.java
        MainTestOPTICS_extractDBScan_saveToMemory.java
        MainTestPascal.java
        MainTestPrePost.java
        MainTestPrePostPlus.java
        MainTestPrefixSpan_AGP_saveToFile.java
        MainTestPrefixSpan_AGP_saveToMemory.java
        MainTestPrefixSpan_PostProcessingStepForClosedMining_saveToFile.java
        MainTestPrefixSpan_PostProcessingStepForClosedMining_saveToMemory.java
        MainTestPrefixSpan_WithStrings_saveToMemory.java
        MainTestPrefixSpan_saveToFile.java
        MainTestPrefixSpan_saveToMemory.java
        MainTestPrefixSpan_withString_saveToFile.java
        MainTestRelim.java
        MainTestRuleGen.java
        MainTestRuleGrowth.java
        MainTestSPADE_AGP_BitMap_saveToFile.java
        MainTestSPADE_AGP_BitMap_saveToMemory.java
        MainTestSPADE_AGP_EntryList_saveToFile.java
        MainTestSPADE_AGP_EntryList_saveToMemory.java
        MainTestSPADE_AGP_FatBitMap_saveToFile.java
        MainTestSPADE_AGP_FatBitMap_saveToMemory.java
        MainTestSPADE_AGP_Parallelized_BitMap_saveToFile.java
        MainTestSPADE_AGP_Parallelized_BitMap_saveToMemory.java
        MainTestSPADE_AGP_Parallelized_EntryList_saveToFile.java
        MainTestSPADE_AGP_Parallelized_EntryList_saveToMemory.java
        MainTestSPADE_AGP_Parallelized_FatBitMap_saveToFile.java
        MainTestSPADE_AGP_Parallelized_FatBitMap_saveToMemory.java
        MainTestSPAM_AGP_BitMap_saveToFile.java
        MainTestSPAM_AGP_BitMap_saveToMemory.java
        MainTestSPAM_AGP_EntryList_saveToFile.java
        MainTestSPAM_AGP_EntryList_saveToMemory.java
        MainTestSPAM_AGP_FatBitMap_saveToFile.java
        MainTestSPAM_AGP_FatBitMap_saveToMemory.java
        MainTestSPAM_AGP_PostProcessingStepForClosedMining_saveToFile.java
        MainTestSPAM_AGP_PostProcessingStepForClosedMining_saveToMemory.java
        MainTestSPAM_saveToFile.java
        MainTestSequentialPatternMining1_saveToFile.java
        MainTestSequentialPatternMining1_saveToMemory.java
        MainTestSequentialPatternMining2_saveToFile.java
        MainTestSequentialPatternMining2_saveToMemory.java
        MainTestSequentialPatternMining3_saveToFile.java
        MainTestSequentialPatternMining3_saveToMemory.java
        MainTestSequentialPatternMining4.java
        MainTestTKS.java
        MainTestTNR.java
        MainTestTNS.java
        MainTestTRuleGrowth.java
        MainTestTRuleGrowth_withStrings.java
        MainTestTSP_nonClosed.java
        MainTestTextClusterer.java
        MainTestTopKRules.java
        MainTestTopSeqRules.java
        MainTestTransactionDatabaseUtilityGenerator.java
        MainTestTwoPhaseAlgorithm_saveToFile.java
        MainTestTwoPhaseAlgorithm_saveToMemory.java
        MainTestUApriori_saveToFile.java
        MainTestUPGrowth.java
        MainTestUPGrowthPlus.java
        MainTestVGEN_saveToFile.java
        MainTestVGEN_saveToMemory.java
        MainTestVME.java
        MainTestVMSP_saveToFile.java
        MainTestVMSP_saveToMemory.java
        MainTestZart_saveToFile.java
        MainTestZart_saveToMemory.java
        MainTest_estDecPlus_saveToFile.java
        MainTest_estDecPlus_saveToMemory.java
        MainTest_estDec_saveToFile.java
        MainTest_estDec_saveToMemory.java
        tools
        MemoryLogger.java
        dataset_converter
        Formats.java
        MainTestConvertTransactionDatabaseARFFtoSPMF.java
        SequenceDatabaseConverter.java
        TransactionDatabaseConverter.java
        dataset_generator
        AddTimeStampsToSequenceDatabase.java
        MainTestAddTimeStampsToSequenceDatabase.java
        SequenceDatabaseGenerator.java
        TransactionDatabaseGenerator.java
        TransactionDatasetUtilityGenerator.java
        dataset_stats
        SequenceStatsGenerator.java
        TransactionStatsGenerator.java
        other_dataset_tools
        FixTransactionDatabaseTool.java
        resultConverter
        MainTestResultConverter.java
        ResultConverter.java
- src

package ca.pfv.spmf.tools.dataset_converter;

/* This file is copyright (c) 2008-2012 Philippe Fournier-Viger
* 
* This file is part of the SPMF DATA MINING SOFTWARE
* (http://www.philippe-fournier-viger.com/spmf).
* 
* SPMF is free software: you can redistribute it and/or modify it under the
* terms of the GNU General Public License as published by the Free Software
* Foundation, either version 3 of the License, or (at your option) any later
* version.
* SPMF is distributed in the hope that it will be useful, but WITHOUT ANY
* WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
* A PARTICULAR PURPOSE. See the GNU General Public License for more details.
* You should have received a copy of the GNU General Public License along with
* SPMF. If not, see <http://www.gnu.org/licenses/>.
*/

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Collections;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;

import ca.pfv.spmf.input.sequence_database_array_integers.Sequence;
import ca.pfv.spmf.input.sequence_database_array_integers.SequenceDatabase;

/**
* This class is for converting transaction databases from various formats
* to the SPMF format.

@see Formats
* @author Philippe Fournier-Viger
*/
public class TransactionDatabaseConverter {
	
	String input;  // the path of the input file
	String output; // the path of the file to be written to disk in SPMF format
	int lineCount =0; // the number of sequences in the input file

	/**
	 * This method converts a transaction database from a given format to the SPMF format.
	 * @param input  the path of the input file
	 * @param output the path of the file to be written to disk in SPMF format
	 * @param inputFileformat  the format of the input file
	 * @param lineCount  the number of lines from the input file that should be converted
	 * @throws IOException  an exception is thrown if there is an error reading/writing files Otherwise, null.
	 */
	public void convert(String input, String output, Formats inputFileformat, int lineCount) throws IOException {
		// we save the parameter in the class fields
		this.input = input;
		this.output = output;
		this.lineCount = lineCount;

		// we call the appropriate method for converting a database
		// according to the format of the input file
		if(inputFileformat.equals(Formats.CSV_INTEGER)){
			convertCSV();
		}else if(inputFileformat.equals(Formats.ARFF)){
			convertARFF(true, false);
			
		}else if(inputFileformat.equals(Formats.ARFF_WITH_MISSING_VALUES)){
			convertARFF(false, false);
		}else if(inputFileformat.equals(Formats.SPMF_SEQUENCE_DB)){
			convertSequenceDB();
		}

	}
	
	/**
	 * This method convert a transaction database in ARFF format to SPMF format and
	 * return a map of key = item id  value = corresponding attribute value. This 
	 * method is to be used by the GUI version of SPMF that need to keep the mapping
	 * between item IDs and attribute value in memory to avoid an extra database scan.
	 * @param inputFile the path of the file to be converted
	 * @param outputFile the path for saving the converted file
	 * @param lineCount the number of lines of the input file to be converted
	 * @return a map of entry (key : itemID, value: attribute-value) if the input format is ARFF.
	 * @throws IOException  if an error while reading/writing files
	 */
	public Map<Integer, String> convertARFFandReturnMap(String inputFile, String outputFile,
			int lineCount) throws IOException {
		// we save the parameter in the class fields
		this.input = inputFile;
		this.output = outputFile;
		this.lineCount = lineCount;
		return convertARFF(true, true);
	}
	
	/**
	 * This method convert a file from the ARFF format to the SPMF format.
	 * 
	 * @param returnMapItemIDValue
	 * @throws IOException  exception if error while reading/writing files.
	 * @return a map where an entry indicates for an item (key), the corresponding attribute value (value).
	 */
	private Map<Integer, String> convertARFF(boolean ignoreMissingValues, boolean returnMapItemIDValue) throws IOException {
		// This map will be used to store mapping from item id (key) to attribute value (value).
		// It is used only if returnMapItemIDValue is set to true.  This is used by the GUI of SPMF
		// which need to keep this information in memory to avoid an extra database scan after an algorithm
		// is applied.

		Map<Integer, String> mapItemsIDsToAttributeValues = null;
		if(returnMapItemIDValue){
			mapItemsIDsToAttributeValues = new HashMap<Integer, String>();
		}
		
		// object for writing the output file
		BufferedWriter writer = new BufferedWriter(new FileWriter(output)); 

		BufferedReader myInput = null;
		try {
			// Objects to read the file
			FileInputStream fin = new FileInputStream(new File(input));
			myInput = new BufferedReader(new InputStreamReader(fin));
			
			int count = 0; // to count the number of data instance lines
			int attributeCount =0; // to count the number fo attributes
			
			// the last item ID used in the output file
			int lastItemAdded =0;
			
			
			// A list that stores a map for each attribute.
			// An entry in the map is :
			//   key  =  String (attribute value)
			//   value = Integer (item id)
			List<Map<String, Integer>> mapAttributeValuesItemsID = null;
			
			List<String> listAttributeNames = new ArrayList<String>();
			
			String thisLine; // variable to read a line
			// we read the file line by line until the end of the file
			while ((thisLine = myInput.readLine()) != null) {
				// if the line is too short (e.g emptylines), skip it
				if(thisLine.length() <2){
					continue;
				}
				
				// if the line starts with a comment
				if(thisLine.startsWith("%")){
					continue;
				}
				
				// check if the line contains a comment later in the line
				int indexComment = thisLine.indexOf('%');
				// if yes, then remove it
				if(indexComment >=0){
					thisLine = thisLine.substring(0, indexComment);
				}
				
				// if the line is the relation name
				// (e.g. " @RELATION 'sunburn' ")
				if(thisLine.startsWith("@RELATION") || thisLine.startsWith("@relation")){
					String relationName = thisLine.split(" ")[1];
					// if the name is between quotes, we remove them
					if(relationName.contains("'")){
						relationName = relationName.split("'")[1];
					}
					if(returnMapItemIDValue == false){
						writer.write("@CONVERTED_FROM_ARFF");
						writer.newLine();
						writer.write("@RELATION_NAME=");
						writer.write(relationName + "=");
						writer.newLine();
					}
					continue;
				}
				
				// if the line is an attribute definition
				// For example:
				//     @ATTRIBUTE 'hair'   {blonde, brown, red}  
				//     @attribute   class {positive,negative}
				//     @attribute col_17 INTEGER
				//     @attribute col_18 {0,1,2,3,4,5}
				//     @ATTRIBUTE petalwidth   NUMERIC
				// @data
				// 
				if(thisLine.startsWith("@ATTRIBUTE") || thisLine.startsWith("@attribute") ){
					// increase the number of attributes
					attributeCount++;
					
					if(returnMapItemIDValue == false){
						writer.write("@ATTRIBUTE=");
					}
					
					// get the first position of the attribute name after the space before it
					int firstPositionOfAttributeName = thisLine.indexOf(' ') +1;
					// if the first character is a quote
					boolean useQuotes = false;
					if(thisLine.charAt(firstPositionOfAttributeName) == '\''){
						useQuotes = true;
						firstPositionOfAttributeName++;
					}
					// remove the part of the string before the attribute name
					thisLine = thisLine.substring(firstPositionOfAttributeName);
					
					// if there is extra spaces, we remove them just in case
					thisLine = thisLine.trim();
					
					// If quotes are use
					if(useQuotes){
						// get the position of the character just before the second quote
						int quotePosition = thisLine.indexOf('\'');
						// write attribute name
						String attributeName = thisLine.substring(0, quotePosition);
						if(returnMapItemIDValue == false){
							writer.write(attributeName + "=");
						}
						listAttributeNames.add(attributeName);
						// cut the string to remove the attribute name
						thisLine =  thisLine.substring(quotePosition+1);
					}else{
						// get the position of the character just before the space after the attribute name
						int spacePosition = thisLine.indexOf(' ');
						// write attribute name
						String attributeName = thisLine.substring(0, spacePosition);
						if(returnMapItemIDValue == false){
							writer.write(attributeName + "=");
						}
						listAttributeNames.add(attributeName);
						// cut the string to remove the attribute name
						thisLine =  thisLine.substring(spacePosition+1);
					}
						
					// remove spaces before or after what is remaining in this
					// line
					thisLine = thisLine.trim();
					
//					System.out.println(thisLine);
					
					// WRITE TYPE
					String type = thisLine;
					if(type.startsWith("{")){
						if(returnMapItemIDValue == false){
							writer.write("ENUMERATION=");
						}
						// Remove the brackets {}
						thisLine = thisLine.substring(1,thisLine.length()-1);
						
						
						// NEED TO READ THE ENUMERATION VALUES
						for (String token : thisLine.split(",")) {
							// remove spaces i they are some
							token = token.trim();
							// write the enumeration value
							if(returnMapItemIDValue == false){
								writer.write(token + "=");
							}
						}
					}else{
						// this is not an enumeration so we don't need
						// to write enumeration values.
						if(returnMapItemIDValue == false){
							writer.write(type + "=");
						}
					}
					if(returnMapItemIDValue == false){
						writer.newLine();
					}
					continue;
				}
				
				// if the line is the data separator
				if(thisLine.startsWith("@data") || thisLine.startsWith("@DATA")){
//					System.out.println("DATA");
					// initialize the map for storing attribute values
					//  by creating an empty hashmap for each attribute.

					mapAttributeValuesItemsID =
								new ArrayList<Map<String, Integer>>(attributeCount);
					for(int i=0; i< attributeCount; i++){
						mapAttributeValuesItemsID.add(new HashMap<String, Integer>());
					}
					continue;
				}
				
			
				// ===== NOW WE WILL PROCESS THE DATA INSTANCES IN THE FILE ====
				
				//Create a list to store the items of this transaction
				List<Integer> transaction = new ArrayList<Integer>();
				
				// Create a temporary StringBuilder for storing attributes
				// definition of attribute values that have not been seen before
				StringBuilder unseenAttributeValues = new StringBuilder();
				
				// IF SPARSE DATA
				// For example:
				//     {2 W, 4 "class B"}
				//   where each instance is a pair indicating the attribute number and the value.
				//  Ommitted values means the value 0
				//  Unknown values are represented by ?
				if(thisLine.startsWith("{")){
//					System.out.println(thisLine);
					// remove the brackets
					thisLine = thisLine.substring(1).trim();
					thisLine = thisLine.substring(0, thisLine.length()-1).trim();
//					System.out.println(thisLine);
					
					// we will use a HashSet<Integer> to remember which attribute
					// position are included and which one are not.
					// This is important because if an attribute is ommited, 
					// the value 0 should be used according to the ARFF specification.
					Set<Integer> positionProcessed = new HashSet<Integer>();
					

//					System.out.println(thisLine);
					
					// for each entry
					for(String entry : thisLine.split(",")){
						entry = entry.trim();
						// separate the entry into position + value
						int indexOfFirstSpace = entry.indexOf(' ');
						// extract the attribute number
						int i = Integer.parseInt(entry.substring(0, indexOfFirstSpace));
						// extract the attribute value
//						System.out.println(entry.substring(indexOfFirstSpace+1));
						String val = entry.substring(indexOfFirstSpace+1);
						
						positionProcessed.add(i);
						
						// if the user want to ignore missing values,
						// we skip the value
						if("?".equals(val) && ignoreMissingValues){
							continue;
						}
						
						// get the corresponding item id
						Map<String, Integer> mapValueToItemID = mapAttributeValuesItemsID.get(i);
						
						Integer itemID = mapValueToItemID.get(val);
						if(itemID == null){
							// if it is the first time that we see this attribute,
							// increase item ID.
							itemID = ++lastItemAdded; 
							// record the itemID that is given for this value
							mapValueToItemID.put(val, itemID);
							if(mapItemsIDsToAttributeValues != null){
								mapItemsIDsToAttributeValues.put(itemID, listAttributeNames.get(i) +
										"=" + val);
							}
							// add the unseen attribute value to the string for
							// unseen attribute values.
							unseenAttributeValues.append("@ITEM=" + itemID +"=" + listAttributeNames.get(i) +
									"=" + val + "\n");
						}
						
						// USE THE ITEM ID
						transaction.add(itemID);
					}
					
					// We will put the value 0 for all position that have not been
					// seen.
					for(int i=0; i< attributeCount; i++){
						// if the attriute i has not been processed yet
						if(positionProcessed.contains(i) == false){
							String val = "0";
							// if the user want to ignore missing values,
							// we skip the value
							if("?".equals(val) && ignoreMissingValues){
								continue;
							}
							
							// get the corresponding item id
							Map<String, Integer> mapValueToItemID = mapAttributeValuesItemsID.get(i);
							
							Integer itemID = mapValueToItemID.get(val);
							if(itemID == null){
								// if it is the first time that we see this attribute,
								// increase item ID.
								itemID = ++lastItemAdded; 
								// record the itemID that is given for this value
								mapValueToItemID.put(val, itemID);
								if(mapItemsIDsToAttributeValues != null){
									mapItemsIDsToAttributeValues.put(itemID, listAttributeNames.get(i) +
											"=" + val);
								}
								// add the unseen attribute value to the string for
								// unseen attribute values.
								unseenAttributeValues.append("@ITEM=" + itemID +"=" + listAttributeNames.get(i) +
										"=" + val + "\n");
							}
							
							// USE THE ITEM ID
							transaction.add(itemID);
						}
					}
					
					
				}else{
					// IF NOT SPARSE DATA
					// For example : 
					//    0, X, 0, Y, "class A"
					// Values are separated by "," and spaces
					// we split the line according to comma
					String[] split = thisLine.split(",");
					for(int i=0; i< attributeCount; i++){
						String val = split[i].trim();
						
						// if the user want to ignore missing values,
						// we skip the value
						if("?".equals(val) && ignoreMissingValues){
							continue;
						}
						
						// get the corresponding item id
						Map<String, Integer> mapValueToItemID = mapAttributeValuesItemsID.get(i);
						
						Integer itemID = mapValueToItemID.get(val);
						if(itemID == null){
							// if it is the first time that we see this attribute,
							// increase item ID.
							itemID = ++lastItemAdded; 
							// record the itemID that is given for this value
							mapValueToItemID.put(val, itemID);
							if(mapItemsIDsToAttributeValues != null){
								mapItemsIDsToAttributeValues.put(itemID, listAttributeNames.get(i) +
										"=" + val);
							}
							// add the unseen attribute value to the string for
							// unseen attribute values.
							unseenAttributeValues.append("@ITEM=" + itemID +"=" + listAttributeNames.get(i) +
									"=" + val + "\n");
						}
						
						// USE THE ITEM ID
						transaction.add(itemID);
					}
				}

//				// sort the transaction in lexical order
				Collections.sort(transaction);
				
//				if(returnMapItemIDValue == false){
					writer.write(unseenAttributeValues.toString());
	
					// for each item, we will output them
					for (int i=0; i<transaction.size(); i++) {
						if(i != transaction.size() -1){
							// if not the last item
							// write the item with an itemset separator
							writer.write(transaction.get(i) + " ");   
						}else{
							// if the last item
							// write the item
							writer.write(transaction.get(i) + "");   
						}
					}
					writer.newLine();
//				}
				
				count++; // increase the number of sequences
				// if we have read enough sequences, we stop.
				if(count == lineCount){
					break;
				}
			}
			// close output file
			writer.close();
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			if (myInput != null) {
				myInput.close();
			}
		}
		return mapItemsIDsToAttributeValues;	
	}

	/**
	 * This method convert a file from the CSV format to the SPMF format
	 */
	private void convertCSV() throws IOException {
		BufferedReader myInput = null;
		try {
			// we create an object for writing the output file
			BufferedWriter writer = new BufferedWriter(new FileWriter(output)); 
			
			// Objects to read the file
			FileInputStream fin = new FileInputStream(new File(input));
			myInput = new BufferedReader(new InputStreamReader(fin));
			
			int count = 0; // to count the number of line

			String thisLine; // variable to read a line
			// we read the file line by line until the end of the file
			while ((thisLine = myInput.readLine()) != null) {
				// if not the first line, we create a new line
				if(count !=0){
					writer.newLine(); // create new line
				}
				
				// we split the line according to spaces
				String[] split = thisLine.split(",");
				// we use a set to store the values to avoid duplicates
				// because they are not allowed in a transaction
				Set<Integer> values = new HashSet<Integer>();
				for(int i=0; i< split.length; i++){
					values.add(Integer.parseInt(split[i]));
				}
				
				// sort the transaction in lexical order
				List<Integer> listValues = new ArrayList<Integer>(values);
				Collections.sort(listValues);
				
				// for each item, we will output them
				for (int i=0; i<listValues.size(); i++) {
					if(i != listValues.size() -1){
						// if not the last item
						// write the item with an itemset separator
						writer.write(listValues.get(i) + " ");   
					}else{
						// if the last item
						// write the item
						writer.write(listValues.get(i) + "");   
					}
				}
				
				count++; // increase the number of sequences
				// if we have read enough sequences, we stop.
				if(count == lineCount){
					break;
				}
			}
			
			// close the output file
			writer.close();
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			if (myInput != null) {
				myInput.close();
			}
		}
	}

	/**
	 * This method convert a file from the SPMF sequence database format 
	 * to the SPMF transaction database format.
	 * Note that this code could be further optimized if performance is really an issue.
	 */
	private void convertSequenceDB() throws IOException {
		SequenceDatabase database = new SequenceDatabase();
		database.loadFile(input);
		
		BufferedReader myInput = null;
		try {
			// we create an object for writing the output file
			BufferedWriter writer = new BufferedWriter(new FileWriter(output)); 

			for(int i=0; i < database.getSequences().size(); i++) {
				Sequence sequence = database.getSequences().get(i);
				
				// ==== Read the sequence and keep all distinct items ======
				// Create a set to remember with items have been seen already
				Set<Integer> itemsInSequence = new HashSet<Integer>();
				// Create a list of integers to store the transaction corresponding to this sequence
				List<Integer> transaction = new ArrayList<Integer>();
				
				// for each itemset in this sequence
				for(Integer[] itemset : sequence.getItemsets()) {
					for(Integer item : itemset) {
						// if we have not seen this item yet, add it to the transaction
						if(itemsInSequence.contains(item) == false) {
							transaction.add(item);
							itemsInSequence.add(item);
						}
					}
				}
				
				// === Sort the set of items in lexical order
				Collections.sort(transaction);
				
				
				// ==== write the transaction
				for(int j=0; j < transaction.size(); j++) {
					writer.write(transaction.get(j) + " ");
				}

				// if we have read enough sequences, we stop.
				if(i+1 == lineCount){
					break;
				}
				
				// if not the last sequence, we move to next line
				if(i != database.size() -1) {
					writer.newLine();
				}
			}
			// close the output file
			writer.close();
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			if (myInput != null) {
				myInput.close();
			}
		}
	}


}