PopulateLuceneIndices.java example

Explorer

GeneDB-master
- Jogra
  - src
    - org
      - genedb
        jogra
        controller
        ImageFormBean.java
        ImageUtils.java
        domain
        BasicGene.java
        ExpressionZoneEditor.java
        FeatureCvTerm.java
        Gene.java
        GeneDBMessage.java
        Term.java
        drawing
        ApplicationClosingEvent.java
        ApplicationMode.java
        BaseForm.java
        ExtensionFileFilter.java
        ImagePanel.java
        Jogra.java
        JograBusiness.java
        JograBusinessImpl.java
        JograLogin.java
        JograLoginService.java
        JograPlugin.java
        JograProgressBar.java
        OpenWindowEvent.java
        Pair.java
        SplashWindow.java
        plugins
        ButtonChangeDocumentListener.java
        CCFrame.java
        CCPanel.java
        ConflictComponentFactory.java
        CvEditor.java
        GeneEditor.java
        GeneList.java
        GeneView.java
        GeneViewModel.java
        GeneViewTest.java
        GoFrame.java
        GoPanel.java
        NameNotePanel.java
        Notes.java
        OrganismEditor.java
        OrganismPanel.java
        OrganismTree.java
        TermRationaliser.java
        services
        BasicGeneService.java
        DatabaseLogin.java
        ExtendedOrganism.java
        ExtendedOrganismManager.java
        FilteringJList.java
        GeneService.java
        LockAndNotificationService.java
        LockStatus.java
        Message.java
        MessageService.java
        MethodResult.java
        NamedVector.java
        RationaliserJList.java
        RationaliserResult.java
        SqlGeneService.java
        SqlTermService.java
        TermService.java
- ng
  - src
    - org
      - genedb
        anttasks
        Password.java
        aop
        HazelcastAspect.java
        db
        adhoc
        PanGenomeManager.java
        PhylonodeManager.java
        Query.java
        analyzers
        AllNamesAnalyzer.java
        AlphaNumericAnalyzer.java
        AlphaNumericTokenizer.java
        audit
        ChangeSet.java
        ChangeTracker.java
        HibernateChangeSet.java
        HibernateChangeTracker.java
        dao
        AuditDao.java
        BaseDao.java
        CvDao.java
        GeneralDao.java
        OrganismDao.java
        PhylogenyDao.java
        PubDao.java
        SequenceDao.java
        domain
        hibernateImpls
        BasicGeneServiceImpl.java
        GeneServiceImpl.java
        LockAndNotificationServiceImpl.java
        MessageServiceImpl.java
        ProductServiceImpl.java
        luceneImpls
        BasicGeneServiceImpl.java
        misc
        GeneDBMessage.java
        GeneListReservations.java
        Message.java
        MethodResult.java
        SemanticLog.java
        objects
        BasicGene.java
        Chromosome.java
        CompoundLocatedFeature.java
        DatabasePolypeptideRegion.java
        Exon.java
        ExtendedOrganism.java
        ExtendedOrganismManager.java
        Gap.java
        Gene.java
        InterProHit.java
        LocatedFeature.java
        PolypeptideRegion.java
        PolypeptideRegionGroup.java
        Product.java
        SimplePolypeptideRegion.java
        SimpleRegionGroup.java
        Transcript.java
        TranscriptComponent.java
        UTR.java
        services
        BasicGeneService.java
        GeneService.java
        LockAndNotificationService.java
        LockStatus.java
        MessageService.java
        ProductService.java
        fixup
        FixResidues.java
        TypeCodes.java
        helpers
        LocationBridge.java
        NameLookup.java
        loading
        AGPLoader.java
        EmblFile.java
        EmblLoader.java
        EmblLocation.java
        FastaFile.java
        FastaLoader.java
        FeatureTable.java
        FeatureUtils.java
        FileProcessor.java
        GoEvidenceCode.java
        GoInstance.java
        LoadAGP.java
        LoadEmbl.java
        LoadFasta.java
        LoadOrthologues.java
        LoadPileups.java
        LoadSNPs.java
        LoadVulgar.java
        LoggingDataSource.java
        ParsingException.java
        RfamLoader.java
        Similarity.java
        SkipRetryAbort.java
        SynonymManager.java
        VulgarLoader.java
        auxiliary
        AddFeatureProperty.java
        Clear.java
        ClearDGPI.java
        ClearDomains.java
        ClearHTH.java
        ClearOPIReferences.java
        ClearPlasmoAP.java
        ClearRfam.java
        ClearSignalP.java
        ClearTMHMM.java
        ClonedGenomicInsertLoader.java
        DGPILoader.java
        DeleteRedundantGOTerms.java
        DomainFile.java
        DomainLoader.java
        GOALoader.java
        HTHLoader.java
        Load.java
        Loader.java
        LocationLoader.java
        OPIReferenceLoader.java
        PhosphopeptideLoader.java
        PlasmoAPLoader.java
        RenameFeature.java
        RfamLoader.java
        SignalPLoader.java
        SystemPropertyOverridingDataSource.java
        TMHMMLoader.java
        taxon
        TaxonNameType.java
        TaxonNode.java
        TaxonNodeArrayPropertyEditor.java
        TaxonNodeList.java
        TaxonNodeListFormatter.java
        TaxonNodeManager.java
        TaxonUtils.java
        io
        xstream
        MultiMapConvertor.java
        query
        AbstractQuery.java
        BasicQueryI.java
        Detailer.java
        NumberedQueryI.java
        Param.java
        QueryConstants.java
        QueryI.java
        QueryPlaceHolder.java
        QueryStringParser.java
        Result.java
        ResultCompatibility.java
        SimpleListResult.java
        StorageMethod.java
        bool
        BooleanOp.java
        BooleanQuery.java
        BooleanQueryNode.java
        compatability
        AlwaysTrueResultDataSetCompatibility.java
        IdentityResultCompatibility.java
        NullResultCompatibility.java
        ResultCompatibilityChain.java
        custom
        GenesByURI.java
        generation
        QueryAnnotationProcessor.java
        history
        History.java
        SimpleHistory.java
        hql
        HqlQueryTemplate.java
        jdbc
        JdbcQuery.java
        JdbcQueryTemplate.java
        params
        AbstractParam.java
        BooleanParam.java
        FloatParam.java
        IntParam.java
        ListConstraint.java
        SimpleListConstraintDelegate.java
        StringParam.java
        StringParamFromList.java
        parsing
        BasicQueryStringParser.java
        sql
        DataSourceAware.java
        SimpleJdbcTemplateAware.java
        SqlListConstraintDelegate.java
        SqlQuery.java
        querying
        core
        BooleanQuery.java
        BooleanQueryMode.java
        CachedParamDetails.java
        CopyOfLuceneQueryModsNotCompleted.java
        HqlQuery.java
        HtmlFormDetails.java
        LuceneIndex.java
        LuceneIndexFactory.java
        LuceneQuery.java
        NumericQueryVisibility.java
        PagedQuery.java
        Parameter.java
        Query.java
        QueryBeanGenerator.java
        QueryClass.java
        QueryDetails.java
        QueryException.java
        QueryFactory.java
        QueryParam.java
        QueryTemplate.java
        QueryUtils.java
        QueryVisibility.java
        history
        HistoryItem.java
        HistoryManager.java
        HistoryType.java
        QueryHistoryItem.java
        parsing
        ExprLexer.java
        ExprParser.java
        QueryLineParser.java
        tmpquery
        AdvancedQuery.java
        AdvancedSearchCategory.java
        AnnotationStatusQuery.java
        BrowseCategory.java
        ChangedGeneFeaturesQuery.java
        ControlledCurationQuery.java
        CurationQuery.java
        DateAndTypeQuery.java
        DateCountQuery.java
        DateQuery.java
        DbxrefQuery.java
        EcQuery.java
        GeneDetail.java
        GeneLocationQuery.java
        GeneSummary.java
        GeneSummaryMotif.java
        GeneTypeQuery.java
        GenesByDbQuery.java
        GoQuery.java
        IdsToGeneDetailQuery.java
        IdsToGeneSummaryQuery.java
        MotifQuery.java
        NameProductQuery.java
        OrganismHqlQuery.java
        OrganismLuceneQuery.java
        PfamQuery.java
        ProductQuery.java
        ProteinLengthQuery.java
        ProteinMassQuery.java
        ProteinMatchClusterOrthologueQuery.java
        ProteinNumTMQuery.java
        ProteinTargetingSeqQuery.java
        QuickSearchQuery.java
        SimpleNameQuery.java
        SuggestQuery.java
        TaxonQuery.java
        TopLevelFeaturesQuery.java
        smallapps
        WebImageGenerator.java
        util
        ColorUtils.java
        Counters.java
        DumpObject.java
        FontFactoryBean.java
        FontSize.java
        GeneDBFormattingConversionServiceFactoryBean.java
        IterableArray.java
        MD5Util.java
        MutableInteger.java
        Pair.java
        SequenceUtils.java
        SynchronizedTwoKeyMap.java
        TranslationException.java
        Translator.java
        Triplet.java
        TwoKeyMap.java
        web
        applications
        motifsearch
        FastaEntry.java
        FastaLoader.java
        filters
        UriSessionIdFilter.java
        gui
        AllocatedCompoundFeature.java
        ArtemisColours.java
        BdbDiagramCache.java
        ContextMapDiagram.java
        ContextMapWindowController.java
        ContextMapWindowServlet.java
        DiagramCache.java
        DiagramLayout.java
        ImageCreationException.java
        ImageMapSummary.java
        InitHeadlessToolkitServlet.java
        MakeTransparentPixel.java
        ProteinMapDiagram.java
        RenderedContextMap.java
        RenderedDiagram.java
        RenderedDiagramFactory.java
        RenderedProteinMap.java
        TrackedDiagram.java
        UnmodifiableBitSet.java
        filters
        ComboFeatureFilter.java
        NamedStrandedFeatureFilter.java
        RNAFilter.java
        menu
        CompositeMenu.java
        Menu.java
        SimpleMenu.java
        mvc
        controller
        AnnotationChangesRssController.java
        AnnotationChangesRssViewer.java
        ArtemisLaunchController.java
        BaseController.java
        BasketController.java
        BrowseBean.java
        BrowseBeanName.java
        BrowseCategoryController.java
        BrowseTermController.java
        ClassicCompatabilityController.java
        CommonUrlController.java
        ComplexQueryController.java
        ContextMapController.java
        DbController.java
        DbLinkRedirectController.java
        DbXRefListener.java
        FastaFile.java
        FeatureSequenceController.java
        FeedbackController.java
        GeneDBSessionListener.java
        GeneDBWebUtils.java
        GeneSection.java
        GeneUtils.java
        GmodRestControllerV1.java
        GoAssociationUtils.java
        GoLookup.java
        HazelCastServletContextListener.java
        HistoryController.java
        HistoryManagerFactory.java
        HomepageController.java
        HtmlUtils.java
        HttpSessionHistoryManager.java
        HttpSessionHistoryManagerFactory.java
        IdListController.java
        ImageController.java
        Message.java
        MiscPageController.java
        ModelBuilder.java
        NameLookup.java
        NamedFeatureController.java
        NewsItem.java
        NumberNameConverter.java
        OrganismChooserController.java
        OrganismTypeEditor.java
        OrthologsController.java
        PfamLookup.java
        QueryForm.java
        RegionCommand.java
        RestController.java
        ResultBean.java
        ResultCacheSessionListener.java
        ResultHit.java
        Results.java
        ResultsHolder.java
        RootController.java
        SearchHit.java
        SequenceDestination.java
        SequenceDistributorController.java
        SequenceType.java
        Strand.java
        TaxonManagerListener.java
        TracerController.java
        TranscriptFeatureController.java
        WebConstants.java
        WsQueryController.java
        analysis
        MotifSearchController.java
        MotifSearcher.java
        cgview
        CachedFile.java
        CachedFileFactory.java
        download
        AbstractGeneDBFormController.java
        BaseCachingController.java
        DownloadBean.java
        DownloadController.java
        DownloadProcess.java
        DownloadProcessUtil.java
        FeatureDTOAdaptor.java
        FormatBase.java
        FormatCSV.java
        FormatExcel.java
        FormatFASTA.java
        FormatHTML.java
        GeneDetailFieldValueExctractor.java
        OutputContent.java
        OutputDestination.java
        OutputFormat.java
        OutputManager.java
        OutputOption.java
        QueryController.java
        QueryListController.java
        QuickSearchQueryController.java
        ResultEntry.java
        ResultsController.java
        ResultsNavigatorController.java
        SequenceType.java
        WebUtils.java
        model
        AnnotationChangesRssContent.java
        BerkeleyMapFactory.java
        BmfComparison.java
        CacheDBHelper.java
        CacheSynchroniser.java
        ConfigurableGeneDBSessionFactoryBean.java
        DTOFactory.java
        DbXRefDTO.java
        DtoDb.java
        FeatureCvTermDTO.java
        FeatureDTO.java
        GeneDTO.java
        IndexSynchroniser.java
        IndexUpdater.java
        LuceneIndexBuilder.java
        LuceneIndicesComparison.java
        MembraneStructureComponentDTO.java
        MergeBerkeleyIndices.java
        MergeLuceneIndices.java
        PeriodicUpdater.java
        PolypeptideDTO.java
        PopulateCaches.java
        PopulateLuceneDictionary.java
        PopulateLuceneIndices.java
        ResultsCacheFactory.java
        SmallPopulateLuceneIndices.java
        TranscriptDTO.java
        TranscriptDTOAnalyzer.java
        TranscriptDTOAnalyzer2.java
        TranscriptDTOFactory.java
        load
        AbstractTranscriptLoader.java
        ClusterIdAndOrthologueNamesMapper.java
        DbxRefMapper.java
        FeatureCVTermPropMapper.java
        FeatureCvtermMapper.java
        FeatureMapper.java
        FeaturePropMapper.java
        FeatureRelationshipMapper.java
        FeatureTypeMapper.java
        GeneMapper.java
        OrganismMapper.java
        PolypeptideMapper.java
        PolypeptidePropertiesHelper.java
        PubNameMapper.java
        SynonymTypeMapper.java
        TimerHelper.java
        TopLevelFeatureMapper.java
        TranscriptFeatureCVTermLoader.java
        TranscriptFeaturePropLoader.java
        TranscriptLoader.java
        TranscriptMapper.java
        TranscriptRegionMapper.java
        TranscriptUpdater.java
        simple
        SimpleFeature.java
        SimpleFeatureMapper.java
        SimpleGene.java
        SimpleGeneMapper.java
        SimplePolypeptide.java
        SimplePolypeptideMapper.java
        SimpleTopLevelFeatureMapper.java
        SimpleTranscript.java
        SimpleTranscriptLoader.java
        SimpleTranscriptMapper.java
        types
        DBXRefType.java
        DtoObjectArrayField.java
        DtoStringArrayField.java
        FeatureCVTPropType.java
        FeatureCvtermType.java
        FeaturePropType.java
        PepRegionGroupType.java
        PeptidePropertiesType.java
        SynonymType.java
        TranscriptRegionType.java
        view
        FileCheckingFreemarkerViewResolver.java
        FileCheckingInternalResourceViewResolver.java
        PrefixViewResolver.java
        ServiceView.java
        UriSuffixServiceViewResolver.java
        tags
        bool
        QueryTreeWalker.java
        db
        AbstractHomepageTag.java
        BreadcrumbTag.java
        DbNameTag.java
        DbXRefLinkTag.java
        DisplayPhylogeny.java
        DisplaySimilarity.java
        FilteredPropertyLoopTag.java
        HomepageSelectTag.java
        HomepageTreeTag.java
        HyperlinkDbsInText.java
        ListStringTag.java
        OrganismNameTag.java
        PhylonodeHomePageListTag.java
        PropertyFilterTag.java
        QuickSearchMessageTag.java
        QuickSearchTaxonomicGraphTag.java
        SimpleSelectTag.java
        TableWrapper.java
        TaxonNameTag.java
        misc
        DebugTag.java
        DisplayDateTag.java
        FormatSequenceTag.java
        HistoryTag.java
        ListItemsTag.java
        SystematicNameFormatTag.java
        UrlTag.java
        utils
        DownloadUtils.java
        Gff3Utils.java
        Grep.java
      - gmod
        schema
        bulk
        AbstractIterator.java
        BulkProcessor.java
        DataIntegrityViolation.java
        DatabaseException.java
        ProcessingException.java
        TranscriptHandler.java
        TranscriptInfo.java
        cfg
        ChadoAnnotationConfiguration.java
        ChadoAnnotationException.java
        ChadoAnnotationSettingsFactory.java
        ChadoSessionFactoryBean.java
        FeatureType.java
        FeatureTypeUtils.java
        FilteringSessionFactory.java
        OrganismHeirachy.java
        feature
        AbstractExon.java
        AbstractGene.java
        AminoAcid.java
        ApicoplastChromosome.java
        BACEnd.java
        Centromere.java
        Chromosome.java
        CloneInsert.java
        ClonedGenomicInsert.java
        ConjugativeTransposon.java
        Contig.java
        CytoplasmicRegion.java
        DNATransposon.java
        Deletion.java
        DinucleotideRepeatMicrosatelliteFeature.java
        DirectRepeatRegion.java
        EST.java
        ESTMatch.java
        Exon.java
        ExtramembraneRegion.java
        FivePrimeUTR.java
        GPIAnchorCleavageSite.java
        Gap.java
        Gene.java
        GenomicIsland.java
        HelixTurnHelix.java
        Insertion.java
        IntegratedMobileGeneticElement.java
        IntegratedPlasmid.java
        IntramembraneRegion.java
        Intron.java
        InvertedRepeatRegion.java
        Junction.java
        LinearDoubleStrandedDNAChromosome.java
        LongTerminalRepeat.java
        MRNA.java
        Match.java
        MatchPart.java
        MembraneStructure.java
        MembraneStructureComponent.java
        Microsatellite.java
        MitochondrialChromosome.java
        MobileGeneticElement.java
        ModifiedAminoAcidFeature.java
        NcRNA.java
        NonCytoplasmicRegion.java
        NucleotideMatch.java
        PCRProduct.java
        Plasmid.java
        PolycistronicTranscript.java
        Polypeptide.java
        PolypeptideDomain.java
        PolypeptideMotif.java
        PolypeptideRegion.java
        PolypeptideStructuralMotif.java
        PrimaryTranscript.java
        ProductiveTranscript.java
        Promoter.java
        Prophage.java
        ProteinMatch.java
        Pseudogene.java
        PseudogenicExon.java
        PseudogenicTranscript.java
        RNApol_I_Promoter.java
        RRNA.java
        Read.java
        Reagent.java
        Region.java
        Remark.java
        RepeatRegion.java
        RepeatUnit.java
        SECISElement.java
        SNP.java
        ScRNA.java
        SequenceAlteration.java
        SequenceDifference.java
        SequenceVariant.java
        SignalPeptide.java
        SnRNA.java
        SnoRNA.java
        SpliceSite.java
        SplicedLeaderRNA.java
        Supercontig.java
        TRNA.java
        TandemRepeat.java
        TetraNucleotideRepeatMicrosatelliteFeature.java
        ThreePrimeUTR.java
        TopLevelFeature.java
        Transcript.java
        TranscriptRegion.java
        TransmembraneRegion.java
        TransposableElement.java
        TrinucleotideRepeatMicrosatelliteFeature.java
        UORF.java
        UTR.java
        mapped
        Analysis.java
        AnalysisFeature.java
        AnalysisProp.java
        Cv.java
        CvTerm.java
        CvTermDbXRef.java
        CvTermPath.java
        CvTermProp.java
        CvTermRelationship.java
        CvTermSynonym.java
        Db.java
        DbXRef.java
        DbXRefProp.java
        Feature.java
        FeatureCvTerm.java
        FeatureCvTermDbXRef.java
        FeatureCvTermProp.java
        FeatureCvTermPub.java
        FeatureDbXRef.java
        FeatureLoc.java
        FeatureLocPub.java
        FeatureProp.java
        FeaturePropPub.java
        FeaturePub.java
        FeatureRelationship.java
        FeatureRelationshipProp.java
        FeatureRelationshipPropPub.java
        FeatureRelationshipPub.java
        FeatureSynonym.java
        HasPubsAndDbXRefs.java
        Organism.java
        OrganismDbXRef.java
        OrganismProp.java
        Phylonode.java
        PhylonodeDbXRef.java
        PhylonodeOrganism.java
        PhylonodeProp.java
        PhylonodePub.java
        PhylonodeRelationship.java
        Phylotree.java
        PhylotreePub.java
        Project.java
        Pub.java
        PubAuthor.java
        PubDbXRef.java
        PubProp.java
        PubRelationship.java
        Synonym.java
        utils
        CollectionUtils.java
        CompoundLocation.java
        CountedName.java
        CvTermUtils.java
        GeneNameOrganism.java
        LocationUtils.java
        ObjectManager.java
        PeptideProperties.java
        Rankable.java
        RankableUtils.java
        SimilarityI.java
        SingleLocation.java
        Strand.java
        StrandedLocation.java
        propinterface
        PropertyI.java
  - test
    - org
      - genedb
        db
        audit
        HibernateChangeTrackerTest.java
        MockChangeSetImpl.java
        MockChangeTrackerImpl.java
        dao
        PhylogenyDaoTest.java
        domain
        test
        BasicGeneHelper.java
        MockBasicGeneService.java
        loading
        EmblFileTest.java
        EmblLoaderBergheiTest.java
        EmblLoaderMansoniTest.java
        EmblLoaderReloadTest.java
        EmblLoaderSyntheticTest.java
        EmblLoaderTestHelper.java
        EmblLocationTest.java
        FastaFileTest.java
        FastaLoaderTest.java
        FeatureTester.java
        OrthologueLoaderClusteredTest.java
        OrthologueLoaderImplicitClusterTest.java
        OrthologueLoaderUnclusteredTest.java
        OrthologueTester.java
        TestLogger.java
        auxiliary
        DomainLoaderTest.java
        HTHLoaderTest.java
        RfamLoaderTest.java
        test
        tools
        BuildTestDatabase.java
        querying
        tmpquery
        HibernateTest.java
        MockProteinLengthQuery.java
        ProteinLengthQueryTest.java
        QuickSearchQueryTest.java
        SimpleNameQueryTest.java
        util
        CountersTest.java
        IterableArrayTest.java
        web
        gui
        ContextMapDiagramTest.java
        DiagramLayoutTest.java
        mvc
        controller
        download
        DownloadTest.java
        model
        CacheSynchTestDelegate.java
        TestAbstractUpdater.java
      - gmod
        schema
        mapped
        MockChromosome.java
        MockTranscript.java
        test
        HibernateTest.java

package org.genedb.web.mvc.model;

import org.genedb.db.audit.ChangeSet;

import org.gmod.schema.feature.AbstractGene;
import org.gmod.schema.feature.Gap;
import org.gmod.schema.feature.Gene;
import org.gmod.schema.feature.Polypeptide;
import org.gmod.schema.feature.ProductiveTranscript;
import org.gmod.schema.feature.Transcript;
import org.gmod.schema.mapped.Feature;

import org.apache.log4j.Logger;
import org.apache.log4j.PropertyConfigurator;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.hibernate.CacheMode;
import org.hibernate.FlushMode;
import org.hibernate.Query;
import org.hibernate.Session;
import org.hibernate.SessionFactory;
import org.hibernate.Transaction;
import org.hibernate.search.FullTextSession;
import org.hibernate.search.Search;
import org.hibernate.search.SearchFactory;
import org.hibernate.search.reader.ReaderProvider;
import org.hibernate.search.store.DirectoryProvider;
import org.springframework.context.ConfigurableApplicationContext;
import org.springframework.context.support.ClassPathXmlApplicationContext;
import org.springframework.transaction.annotation.Transactional;
import org.springframework.util.StringUtils;

import uk.co.flamingpenguin.jewel.cli.ArgumentValidationException;
import uk.co.flamingpenguin.jewel.cli.Cli;
import uk.co.flamingpenguin.jewel.cli.CliFactory;
import uk.co.flamingpenguin.jewel.cli.Option;

import java.io.Console;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collection;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

import com.google.common.collect.Sets;


/**
 * Create Lucene indices.
 * <p>
 * The way it works is as follows:
 * A list of feature_ids is generated that must be deleted and/or updated. This can be done by:
 *    (i)  Indexing by type. Each indexed feature type is treated in turn; currently
 *         the classes <code>AbstractGene</code>, <code>Transcript</code> and
 *         <code>Gap</code> are indexed (in that order). For each type, all features of that type
 *         are listed
 *    (ii) The first option can be limited by a given organism
 *   (iii) A list of features can be provided through a <code>ChangeSet</code>
 *
 * Given this list, the features are loaded and indexed in batches of 10.
 * If an exception is thrown while indexing a particular feature, the exception is caught and
 * the whole batch will fail.
 * The members of the failed batch are then put into a queue. When all batches of the relevant type
 * have been processed, the queued members of failed batches are indexed individually. If a feature
 * fails this time, that means it cannot be indexed (due to bad data, or a bug in the code).
 * An error is logged.
 *
 * @author rh11
 */
public class PopulateLuceneIndices implements IndexUpdater {
    @Override
    public int updateTranscriptCache(ChangeSet changeSet) throws Exception {
        // TODO Auto-generated method stub
        return 0;
    }

    private static Logger logger = Logger.getLogger(PopulateLuceneIndices.class);

    /**
     * The number of features to be processed in a single batch. If it's set too
     * high, we run out of heap space.
     */
    private static final int DEFAULT_BATCH_SIZE = 10;

    private int batchSize = DEFAULT_BATCH_SIZE;

    /**
     * Which types of feature to index.
     */
    private static final Collection<Class<? extends Feature>> INDEXED_CLASSES
    = new ArrayList<Class<? extends Feature>>();
    static {
        INDEXED_CLASSES.add(Gap.class);
        // Add feature types here, if a new type of feature should be indexed.
        // Don't forget to update the class doc comment!
    }

    private boolean failFast = false;

    private ConfigurableGeneDBSessionFactoryBean configurableGeneDBSessionFactoryBean;

    public ConfigurableGeneDBSessionFactoryBean getConfigurableGeneDBSessionFactoryBean() {
        return configurableGeneDBSessionFactoryBean;
    }

    public void setConfigurableGeneDBSessionFactoryBean(
            ConfigurableGeneDBSessionFactoryBean configurableGeneDBSessionFactoryBean) {
        this.configurableGeneDBSessionFactoryBean = configurableGeneDBSessionFactoryBean;
    }

    private String indexBaseDirectory;
    private String organism;
    private int numBatches = -1;

    private int featureStart = -1;
    private int featureEnd;

    private String hibernateDialect = "org.hibernate.dialect.PostgreSQLDialect";
    private String hibernateDriverClass = "org.postgresql.Driver";

    public PopulateLuceneIndices() {
        // Default constructor
    }

    /**
     * Create a new FullTextSession, configured with the supplied sessionFactory.
     *
     * @param batchSize
     * @return
     * @throws Exception
     */
    private FullTextSession newSession(int batchSize) {
        SessionFactory sessionFactory = null;
        try {
            sessionFactory = configurableGeneDBSessionFactoryBean.createFullTextSessionFactory(indexBaseDirectory, batchSize);
        } catch (Exception exp) {
            exp.printStackTrace();
            System.exit(65);
        }
        logger.info("sessionFactory is "+sessionFactory);
        Session basicSession = sessionFactory.openSession();
        FullTextSession session = Search.getFullTextSession(basicSession);
        session.setFlushMode(FlushMode.MANUAL);
        session.setCacheMode(CacheMode.IGNORE);
        logger.info(String.format("Just made. The value of session is '%s' and it is '%s'", session, session.isConnected()));

        return session;
    }

    /**
     * Index features of the specified class. First of all indexes the features
     * in batches, and then retries the failures one-by-one.
     *
     * @param featureClass
     * @param numBatches
     */
    public void indexFeatures(Class<? extends Feature> featureClass, int numBatches, FullTextSession session) {
        //Transaction transaction = session.beginTransaction();
        Set<Integer> failed = batchIndexFeatures(featureClass, numBatches, session);
        //transaction.commit();
        //session.close();

        if (failed.size() > 0) {
            reindexFailedFeatures(failed);
        }
        logger.trace("Leaving indexFeatures ("+featureClass+")");
    }

    public void indexFeatures() {
        FullTextSession session = newSession(batchSize);

        indexGenes(session);

        for (Class<? extends Feature> featureClass: INDEXED_CLASSES) {
            indexFeatures(featureClass, numBatches, session);
        }
        session.close();
        logger.trace("Leaving indexFeatures");
    }

    private Set<Integer> indexGenes(FullTextSession session) {

        Set<Integer> failedToLoad = new HashSet<Integer>();

        String hql = "select featureId from AbstractGene where obsolete=false";

        if (featureStart > 0) {
            hql += " and featureId >= "+featureStart;
        }
        if (featureEnd > 0) {
            hql += " and featureId < "+featureEnd;
        }

        if (organism != null) {
            hql += " and organism.commonName = '"+organism +"'";
        }
        Query idQuery = session.createQuery(hql);


        logger.info("Indexing AbstractGenes");

        @SuppressWarnings("unchecked")
        List<Integer> allIds = idQuery.list();

        int batchCount = 0;
        int start = 0;
        int end = start + batchSize;
        //long startTime = new Date().getTime();

        while (start < allIds.size()) {
            if (end > allIds.size()) {
                end = allIds.size();
            }
            
            Transaction transaction = session.beginTransaction();

            List<Integer> thisBatch = allIds.subList(start, end);

            String ids = StringUtils.collectionToCommaDelimitedString(thisBatch);
            logger.debug(String.format("The list of ids being looked up is '%s'", ids));

            Query featureQuery = session.createQuery("from Feature where featureId in ("+ids+")");

            if (numBatches > 0) {
                featureQuery.setMaxResults(numBatches * batchSize);
            }
            //featureQuery.setMaxResults(BATCH_SIZE);

            @SuppressWarnings("unchecked")
            List<AbstractGene> genes = featureQuery.list();

            boolean failed = false;
            int i=0;

            for (AbstractGene gene : genes) {
                i++;
                try {
                    logger.info(String.format("Indexing '%s' (%s)", gene.getUniqueName(), gene.getClass()));
                    session.index(gene);

                    for (Transcript transcript : gene.getTranscripts()) {
                    	
                    	if (transcript.isObsolete()) {
                        	continue;
                        }
                    	
                        logger.info(String.format("-Indexing '%s' (%s)", transcript.getUniqueName(), transcript.getClass()));
                        session.index(transcript);
                        
                        if (transcript instanceof ProductiveTranscript) {
                            ProductiveTranscript productiveTranscript = (ProductiveTranscript) transcript;
                            Polypeptide protein = productiveTranscript.getProtein();
                            if (protein != null) {
                                logger.info(String.format("--Indexing '%s' (%s)", protein.getUniqueName(), protein.getClass()));
                                session.index(protein);
                            }
                        }

                    }

                } catch (Exception exp) {
                    logger.error("Batch failed", exp);
                    failed = true;
                }
                if ((i % 10) == 0) {
                    logger.debug('.');
                }
             }

            batchCount++;
            //logger.info(String.format("Indexed '%d'pc ('%d' of '%d'), %d hours, %d mins left", (batchCount*batchSize)*100/allIds.size(),batchCount*batchSize, allIds.size(), hours, mins));
            logger.debug(String.format("Indexed '%d' percent ('%d' of '%d')", (batchCount*batchSize)*100/allIds.size(),batchCount*batchSize, allIds.size()));
            if (failed) {
                failedToLoad.addAll(thisBatch);
            } else {
                try {
                    session.flushToIndexes();
                }
                catch (Exception exp) {
                    exp.printStackTrace(System.err);
                    System.exit(1);
                }
            }
            session.clear();

            start = end;
            end = start + batchSize;
            transaction.commit();
        }

        logger.trace("Leaving batchIndexFeatures");
        return failedToLoad;
    }


    /**
     * Attempt to index features in batches. Returns identifiers of the features
     * that failed to be indexed. (An exception processing a feature will cause
     * the whole batch to fail, so it's worth trying to reindex failed features
     * one-by-one.)
     *
     * @param featureClass the class of features to index
     * @param numBatches the number of batches to process. If zero or negative,
     *                process all
     * @param session
     * @return a set of featureIds of the features that failed to be indexed
     */
    @Transactional
    private Set<Integer> batchIndexFeatures(Class<? extends Feature> featureClass,
            int numBatches, FullTextSession session) {

        Set<Integer> failedToLoad = new HashSet<Integer>();

        String hql = "select featureId from "+featureClass.getName()+" where obsolete=false";

        if (organism != null) {
            hql += " and organism.commonName = '"+organism +"'";
        }
        Query idQuery = session.createQuery(hql);

        //if (numBatches > 0) {
        //    q.setMaxResults(numBatches * BATCH_SIZE);
        //}
        //q.setMaxResults(BATCH_SIZE);

        logger.info(String.format("Indexing %s", featureClass));

        @SuppressWarnings("unchecked") List<Integer> allIds = idQuery.list();

        int batchCount = 0;
        int start = 0;
        int end = start + batchSize;

        while (start < allIds.size()) {
            if (end > allIds.size()) {
                end = allIds.size();
            }

            List<Integer> thisBatch = allIds.subList(start, end);

            String ids = StringUtils.collectionToCommaDelimitedString(thisBatch);

            Query featureQuery = session.createQuery("from "+featureClass.getName()+" where featureId in ("+ids+")");

            @SuppressWarnings("unchecked") List<Feature> features = featureQuery.list();

            boolean failed = false;
            int i=0;
            for (Feature feature : features) {
                i++;
                try {
                    logger.debug(String.format("Indexing '%s' (%s)", feature.getUniqueName(), feature.getClass()));
                    session.index(feature);
                    batchCount++;
                    logger.debug(String.format("Indexed '%d' ('%d' of '%d') of type '%s'", (batchCount*batchSize)*100/allIds.size(),batchCount*batchSize, allIds.size(), featureClass));
                } catch (Exception exp) {
                    //System.err.println(exp);
                    logger.error("Batch failed", exp);
                    failed = true;
                }
                if ((i % 10) == 0) {
                    logger.warn('.');
                }
             }

            if (failed) {
                logger.warn("Adding failed to batch");
                failedToLoad.addAll(thisBatch);
            } else {
                logger.debug("About to flush to indices");
                try {
                    session.flushToIndexes();
                }
                catch (Exception exp) {
                    exp.printStackTrace(System.err);
                    System.exit(1);
                }
                logger.debug("Just flushed to indices");
            }
            logger.debug("About to clear session");
            session.clear();
            logger.debug("Just cleared session");

            start = end;
            end = start + batchSize;
        }

        logger.trace("Leaving batchIndexFeatures");
        return failedToLoad;
    }


    /**
     * Attempt to index the provided features individually
     * (i.e. in batches of one). Used to reindex failures
     * from a batch indexing run.
     *
     * @param failed a set of features to reindex
     * @throws Exception
     */
    private void reindexFailedFeatures(Set<Integer> failed) {
        logger.info("Attempting to reindex failed features");
        FullTextSession session = newSession(1);
        Transaction transaction = session.beginTransaction();
        for (int featureId : failed) {
            logger.debug(String.format("Attempting to index feature %d", featureId));
            Feature feature = (Feature) session.load(Feature.class, featureId);
            logger.debug(String.format("Loaded feature '%s'", feature.getUniqueName()));
            try {
                session.index(feature);
                logger.debug("Feature successfully indexed");
            } catch (Exception exp) {
                String msg = String.format("Failed to index feature '%s' on the second attempt", feature.getUniqueName());
                if (failFast) {
                    throw new RuntimeException(msg, exp);
                }
                logger.info(msg, exp);
            }
            session.clear();
        }
        transaction.commit();
        session.close();
    }









    public void indexFeatures(List<Integer> featureIds) {
        FullTextSession session = newSession(batchSize);
        //Transaction transaction = session.beginTransaction();
        Set<Integer> failed = batchIndexFeatures(featureIds, session);
        //transaction.commit();
        session.close();

        if (failed.size() > 0) {
            reindexFailedFeatures(failed);
        }
        logger.trace("Leaving indexFeatures");
    }




    public boolean updateAllCaches(ChangeSet changeSet) {
        // Ignore changes to top level feature

        try {
            // Let's process deletes first
            Set<Integer> deletedIds = Sets.newHashSet();
            deletedIds.addAll(changeSet.deletedFeatureIds(Gene.class));
            deletedIds.addAll(changeSet.deletedFeatureIds(Transcript.class));
            deletedIds.addAll(changeSet.deletedFeatureIds(Polypeptide.class));
            deletedIds.addAll(changeSet.deletedFeatureIds(Gap.class));
            deleteFromIndex(deletedIds);

            // Now adds and updates
            Set<Integer> alteredIds = Sets.newHashSet();
            alteredIds.addAll(changeSet.newFeatureIds(Gene.class));
            alteredIds.addAll(changeSet.changedFeatureIds(Gene.class));
            alteredIds.addAll(changeSet.newFeatureIds(Transcript.class));
            alteredIds.addAll(changeSet.changedFeatureIds(Transcript.class));
            alteredIds.addAll(changeSet.newFeatureIds(Polypeptide.class));
            alteredIds.addAll(changeSet.changedFeatureIds(Polypeptide.class));
            alteredIds.addAll(changeSet.newFeatureIds(Gap.class));
            alteredIds.addAll(changeSet.changedFeatureIds(Gap.class));

            FullTextSession session = newSession(batchSize);
            //Transaction transaction = session.beginTransaction();

            Set<Integer> failed = batchIndexFeatures(alteredIds, session);
            //transaction.commit();
            session.close();

            if (failed.size() > 0) {
                reindexFailedFeatures(failed);
            }
        }
        catch (IOException exp) {
            logger.error("Failed to update Lucene indices", exp);
            return false;
        }
        return true;
    }

    /**
     * Delete all the given ids from the index
     *
     * @param ids the list of feature ids
     * @throws IOException
     */
    private void deleteFromIndex(Collection<Integer> ids) throws IOException {
        FullTextSession session = newSession(10);
        SearchFactory searchFactory = session.getSearchFactory();
        ReaderProvider rp = searchFactory.getReaderProvider();
        DirectoryProvider<?>[] directoryProviders = searchFactory.getDirectoryProviders(Feature.class);
        if (directoryProviders ==  null || directoryProviders.length < 1) {
            throw new RuntimeException("Unable to open a directory provider");
        }
        IndexReader reader = rp.openReader(directoryProviders);

        for (Integer id : ids) {
            reader.deleteDocuments(new Term("featureId", Integer.toString(id)));
        }

        rp.closeReader(reader);
        session.close();
    }


    /**
     * Attempt to index features in batches. Returns identifiers of the features
     * that failed to be indexed. (An exception processing a feature will cause
     * the whole batch to fail, so it's worth trying to reindex failed features
     * one-by-one.)
     *
     * @param featureClass the class of features to index
     * @param numBatches the number of batches to process. If zero or negative,
     *                process all
     * @param session
     * @return a set of featureIds of the features that failed to be indexed
     */
    @Transactional
    private Set<Integer> batchIndexFeatures(Collection<Integer> featureIds,
            FullTextSession session) {

        logger.info(String.format("C. The value of session is '%s' and it is '%s'", session, session.isConnected()));
        Set<Integer> failedToLoad = new HashSet<Integer>();

        int thisBatchCount = 0;
        Set<Integer> thisBatch = new HashSet<Integer>();

        int i = 0;
        for (Integer featureId : featureIds) {
            Feature feature = (Feature) session.load(Feature.class, featureId);
            thisBatch.add(featureId);

            boolean failed = false;
            try {
                logger.debug(String.format("Indexing '%s' (%s)", feature.getUniqueName(),
                        feature.getClass()));
                session.index(feature);
            } catch (Exception exp) {
                logger.error("Batch failed", exp);
                failed = true;
            }

            if (failed || ++thisBatchCount == batchSize) {
                logger.debug(String.format("Indexed %d of %d", i, featureIds.size()));
                session.clear();
                thisBatchCount = 0;
                if (failed) {
                    failedToLoad.addAll(thisBatch);
                }
                thisBatch = new HashSet<Integer>();
            }
            i++;
        }
        logger.info(String.format("C. The value of session is '%s' and it is '%s'", session, session.isConnected()));
        return failedToLoad;
    }


    /* Accessors */

    public void setFailFast(boolean failFast) {
        this.failFast = failFast;
    }

    public int getNumBatches() {
        return numBatches;
    }

    public void setNumBatches(int numBatches) {
        this.numBatches = numBatches;
    }

    private void setOrganism(String organism) {
        this.organism = organism;
    }


    public static String promptForPassword(String databaseUrl, String databaseUsername) {
        Console console = System.console();
        if (console == null) {
            System.err.println("No password has been supplied, and no console found\n");
            System.exit(1);
            return ""; // Dummy to prevent null warning
        }

        char[] password = null;
        while (password == null) {
            password = console.readPassword("Password for %s@%s: ", databaseUsername, databaseUrl);
        }
        return new String(password);
    }

    interface PopulateLuceneIndicesArgs {

        /* Testing */

        @Option(shortName="n", description="Number of batches - only useful for quick-and-dirty testing")
        int getNumBatches();
        void setNumBatches(int numBatches);
        boolean isNumBatches();

        @Option(shortName="f", longName="failFast", description="Fail on second try if there's a problem")
        boolean getFailFast();
        void setFailFast(boolean failFast);
        boolean isFailFast();

        /* What exactly to index */
        @Option(shortName="o", description="Only index this organism")
        String getOrganism();
        void setOrganism(String organism);
        boolean isOrganism();

        /* Index location */
        @Option(shortName="i", longName="index", description="Directory where the indices are stored")
        String getIndexDirectory();

        /* Batch size */
        @Option(shortName="b", description="(Optional) batch size")
        int getBatchSize();
        void setBatchSize(int batchSize);
        boolean isBatchSize();

        /* Feature start */
        @Option(shortName="s", description="(Optional) featureId start")
        int getFeatureStart();
        void setFeatureStart(int featureStart);
        boolean isFeatureStart();

        /* Feature end */
        @Option(shortName="e", description="(Optional) featureId end")
        int getFeatureEnd();
        void setFeatureEnd(int featureEnd);
        boolean isFeatureEnd();
    }


    public String getIndexBaseDirectory() {
        return indexBaseDirectory;
    }

    public void setIndexBaseDirectory(String indexBaseDirectory) {
        this.indexBaseDirectory = indexBaseDirectory;
    }

    public String getHibernateDialect() {
        return hibernateDialect;
    }

    public void setHibernateDialect(String hibernateDialect) {
        this.hibernateDialect = hibernateDialect;
    }

    public String getHibernateDriverClass() {
        return hibernateDriverClass;
    }

    public void setHibernateDriverClass(String hibernateDriverClass) {
        this.hibernateDriverClass = hibernateDriverClass;
    }

    public void setBatchSize(int batchSize) {
        this.batchSize = batchSize;
    }

    public static void main(String[] args) {
    	PropertyConfigurator.configure("resources/classpath/log4j.index.properties");
    	
        Cli<PopulateLuceneIndicesArgs> cli = CliFactory.createCli(PopulateLuceneIndicesArgs.class);
        PopulateLuceneIndicesArgs iga = null;
        try {
            iga = cli.parseArguments(args);
        }
        catch(ArgumentValidationException exp) {
            System.err.println("Unable to run:");
            System.err.println(cli.getHelpMessage());
            exp.printStackTrace();
            return;
        }

        ConfigurableApplicationContext ctx = new ClassPathXmlApplicationContext(
                new String[] {"classpath:applicationContext.xml"});
        PopulateLuceneIndices indexer = ctx.getBean("populateLuceneIndices", PopulateLuceneIndices.class);

        if (iga.isOrganism()) {
            indexer.setOrganism(iga.getOrganism());
        }

        indexer.setFailFast(iga.getFailFast());

        if  (iga.isNumBatches()) {
            indexer.setNumBatches(iga.getNumBatches());
        }

        if (iga.isBatchSize()) {
            indexer.setBatchSize(iga.getBatchSize());
        }

        if (iga.isFeatureStart()) {
            indexer.setFeatureStart(iga.getFeatureStart());
        }

        if (iga.isFeatureEnd()) {
            indexer.setFeatureEnd(iga.getFeatureEnd());
        }

        indexer.setIndexBaseDirectory(iga.getIndexDirectory());

        indexer.indexFeatures();
        logger.trace("Leaving main");
        System.exit(0);
    }

    public void setFeatureStart(int featureStart) {
        this.featureStart = featureStart;
    }

    public void setFeatureEnd(int featureEnd) {
        this.featureEnd = featureEnd;
    }

}