ShingleFilter.java example

Explorer

PartyDJ-master
- lib
  - org.apache.lucene
    - lucene-3.0.3
      - contrib
        analyzers
        common
        src
        java
        org
        apache
        lucene
        analysis
        ar
        ArabicAnalyzer.java
        ArabicLetterTokenizer.java
        ArabicNormalizationFilter.java
        ArabicNormalizer.java
        ArabicStemFilter.java
        ArabicStemmer.java
        br
        BrazilianAnalyzer.java
        BrazilianStemFilter.java
        BrazilianStemmer.java
        cjk
        CJKAnalyzer.java
        CJKTokenizer.java
        cn
        ChineseAnalyzer.java
        ChineseFilter.java
        ChineseTokenizer.java
        compound
        CompoundWordTokenFilterBase.java
        DictionaryCompoundWordTokenFilter.java
        HyphenationCompoundWordTokenFilter.java
        hyphenation
        ByteVector.java
        CharVector.java
        Hyphen.java
        Hyphenation.java
        HyphenationException.java
        HyphenationTree.java
        PatternConsumer.java
        PatternParser.java
        TernaryTree.java
        cz
        CzechAnalyzer.java
        de
        GermanAnalyzer.java
        GermanStemFilter.java
        GermanStemmer.java
        el
        GreekAnalyzer.java
        GreekLowerCaseFilter.java
        fa
        PersianAnalyzer.java
        PersianNormalizationFilter.java
        PersianNormalizer.java
        fr
        ElisionFilter.java
        FrenchAnalyzer.java
        FrenchStemFilter.java
        FrenchStemmer.java
        miscellaneous
        EmptyTokenStream.java
        PatternAnalyzer.java
        PrefixAndSuffixAwareTokenFilter.java
        PrefixAwareTokenFilter.java
        SingleTokenTokenStream.java
        ngram
        EdgeNGramTokenFilter.java
        EdgeNGramTokenizer.java
        NGramTokenFilter.java
        NGramTokenizer.java
        nl
        DutchAnalyzer.java
        DutchStemFilter.java
        DutchStemmer.java
        payloads
        AbstractEncoder.java
        DelimitedPayloadTokenFilter.java
        FloatEncoder.java
        IdentityEncoder.java
        IntegerEncoder.java
        NumericPayloadTokenFilter.java
        PayloadEncoder.java
        PayloadHelper.java
        TokenOffsetPayloadTokenFilter.java
        TypeAsPayloadTokenFilter.java
        position
        PositionFilter.java
        query
        QueryAutoStopWordAnalyzer.java
        reverse
        ReverseStringFilter.java
        ru
        RussianAnalyzer.java
        RussianLetterTokenizer.java
        RussianLowerCaseFilter.java
        RussianStemFilter.java
        RussianStemmer.java
        shingle
        ShingleAnalyzerWrapper.java
        ShingleFilter.java
        ShingleMatrixFilter.java
        sinks
        DateRecognizerSinkFilter.java
        TokenRangeSinkFilter.java
        TokenTypeSinkFilter.java
        th
        ThaiAnalyzer.java
        ThaiWordFilter.java
        test
        org
        apache
        lucene
        analysis
        ar
        TestArabicAnalyzer.java
        TestArabicNormalizationFilter.java
        TestArabicStemFilter.java
        br
        TestBrazilianStemmer.java
        cjk
        TestCJKTokenizer.java
        cn
        TestChineseTokenizer.java
        compound
        TestCompoundWordTokenFilter.java
        cz
        TestCzechAnalyzer.java
        de
        TestGermanStemFilter.java
        el
        GreekAnalyzerTest.java
        fa
        TestPersianAnalyzer.java
        TestPersianNormalizationFilter.java
        fr
        TestElision.java
        TestFrenchAnalyzer.java
        miscellaneous
        PatternAnalyzerTest.java
        TestEmptyTokenStream.java
        TestPrefixAndSuffixAwareTokenFilter.java
        TestPrefixAwareTokenFilter.java
        TestSingleTokenTokenFilter.java
        ngram
        EdgeNGramTokenFilterTest.java
        EdgeNGramTokenizerTest.java
        NGramTokenFilterTest.java
        NGramTokenizerTest.java
        nl
        TestDutchStemmer.java
        payloads
        DelimitedPayloadTokenFilterTest.java
        NumericPayloadTokenFilterTest.java
        TokenOffsetPayloadTokenFilterTest.java
        TypeAsPayloadTokenFilterTest.java
        position
        PositionFilterTest.java
        query
        QueryAutoStopWordAnalyzerTest.java
        reverse
        TestReverseStringFilter.java
        ru
        TestRussianAnalyzer.java
        TestRussianStem.java
        shingle
        ShingleAnalyzerWrapperTest.java
        ShingleFilterTest.java
        TestShingleMatrixFilter.java
        sinks
        DateRecognizerSinkTokenizerTest.java
        TokenRangeSinkTokenizerTest.java
        TokenTypeSinkTokenizerTest.java
        th
        TestThaiAnalyzer.java
        smartcn
        src
        java
        org
        apache
        lucene
        analysis
        cn
        smart
        AnalyzerProfile.java
        CharType.java
        SentenceTokenizer.java
        SmartChineseAnalyzer.java
        Utility.java
        WordSegmenter.java
        WordTokenFilter.java
        WordType.java
        hhmm
        AbstractDictionary.java
        BiSegGraph.java
        BigramDictionary.java
        HHMMSegmenter.java
        PathNode.java
        SegGraph.java
        SegToken.java
        SegTokenFilter.java
        SegTokenPair.java
        WordDictionary.java
        test
        org
        apache
        lucene
        analysis
        cn
        smart
        TestSmartChineseAnalyzer.java
        ant
        src
        java
        org
        apache
        lucene
        ant
        ConfigurableDocumentHandler.java
        DocumentHandler.java
        DocumentHandlerException.java
        FileExtensionDocumentHandler.java
        HtmlDocument.java
        IndexTask.java
        TextDocument.java
        test
        org
        apache
        lucene
        ant
        DocumentTestCase.java
        HtmlDocumentTest.java
        IndexTaskTest.java
        TextDocumentTest.java
        benchmark
        src
        java
        org
        apache
        lucene
        benchmark
        Constants.java
        byTask
        Benchmark.java
        PerfRunData.java
        feeds
        AbstractQueryMaker.java
        ContentSource.java
        DemoHTMLParser.java
        DirContentSource.java
        DocData.java
        DocMaker.java
        EnwikiContentSource.java
        EnwikiQueryMaker.java
        FileBasedQueryMaker.java
        HTMLParser.java
        LineDocSource.java
        NoMoreDataException.java
        QueryMaker.java
        ReutersContentSource.java
        ReutersQueryMaker.java
        SimpleQueryMaker.java
        SimpleSloppyPhraseQueryMaker.java
        SingleDocSource.java
        SortableSingleDocSource.java
        TrecContentSource.java
        programmatic
        Sample.java
        stats
        Points.java
        Report.java
        TaskStats.java
        tasks
        AddDocTask.java
        BenchmarkHighlighter.java
        ClearStatsTask.java
        CloseIndexTask.java
        CloseReaderTask.java
        CommitIndexTask.java
        ConsumeContentSourceTask.java
        CreateIndexTask.java
        DeleteByPercentTask.java
        DeleteDocTask.java
        FlushReaderTask.java
        NearRealtimeReaderTask.java
        NewAnalyzerTask.java
        NewRoundTask.java
        OpenIndexTask.java
        OpenReaderTask.java
        OptimizeTask.java
        PerfTask.java
        PrintReaderTask.java
        ReadTask.java
        ReadTokensTask.java
        ReopenReaderTask.java
        RepAllTask.java
        RepSelectByPrefTask.java
        RepSumByNameRoundTask.java
        RepSumByNameTask.java
        RepSumByPrefRoundTask.java
        RepSumByPrefTask.java
        ReportTask.java
        ResetInputsTask.java
        ResetSystemEraseTask.java
        ResetSystemSoftTask.java
        RollbackIndexTask.java
        SearchTask.java
        SearchTravRetHighlightTask.java
        SearchTravRetLoadFieldSelectorTask.java
        SearchTravRetTask.java
        SearchTravRetVectorHighlightTask.java
        SearchTravTask.java
        SearchWithSortTask.java
        SetPropTask.java
        TaskSequence.java
        UpdateDocTask.java
        WaitTask.java
        WarmTask.java
        WriteLineDocTask.java
        utils
        Algorithm.java
        Config.java
        FileUtils.java
        Format.java
        StringBufferReader.java
        quality
        Judge.java
        QualityBenchmark.java
        QualityQuery.java
        QualityQueryParser.java
        QualityStats.java
        trec
        QueryDriver.java
        Trec1MQReader.java
        TrecJudge.java
        TrecTopicsReader.java
        utils
        DocNameExtractor.java
        QualityQueriesFinder.java
        SimpleQQParser.java
        SubmissionReport.java
        stats
        MemUsage.java
        QueryData.java
        TestData.java
        TestRunData.java
        TimeData.java
        utils
        ExtractReuters.java
        ExtractWikipedia.java
        NoDeletionPolicy.java
        test
        org
        apache
        lucene
        benchmark
        BenchmarkTestCase.java
        byTask
        TestPerfTasksLogic.java
        TestPerfTasksParse.java
        feeds
        DocMakerTest.java
        LineDocSourceTest.java
        TrecContentSourceTest.java
        tasks
        CountingHighlighterTestTask.java
        CountingSearchTestTask.java
        CreateIndexTaskTest.java
        PerfTaskTest.java
        WriteLineDocTaskTest.java
        quality
        TestQualityRun.java
        collation
        src
        java
        org
        apache
        lucene
        collation
        CollationKeyAnalyzer.java
        CollationKeyFilter.java
        ICUCollationKeyAnalyzer.java
        ICUCollationKeyFilter.java
        test
        org
        apache
        lucene
        collation
        CollationTestBase.java
        TestCollationKeyAnalyzer.java
        TestCollationKeyFilter.java
        TestICUCollationKeyAnalyzer.java
        TestICUCollationKeyFilter.java
        db
        bdb
        src
        java
        com
        sleepycat
        db
        DbHandleExtractor.java
        org
        apache
        lucene
        store
        db
        Block.java
        DbDirectory.java
        DbIndexInput.java
        DbIndexOutput.java
        DbLock.java
        File.java
        test
        org
        apache
        lucene
        store
        db
        DbStoreTest.java
        SanityLoadLibrary.java
        bdb-je
        src
        java
        org
        apache
        lucene
        store
        je
        Block.java
        File.java
        JEDirectory.java
        JEIndexInput.java
        JEIndexOutput.java
        JELock.java
        test
        org
        apache
        lucene
        store
        je
        JEStoreTest.java
        fast-vector-highlighter
        src
        java
        org
        apache
        lucene
        search
        vectorhighlight
        BaseFragmentsBuilder.java
        FastVectorHighlighter.java
        FieldFragList.java
        FieldPhraseList.java
        FieldQuery.java
        FieldTermStack.java
        FragListBuilder.java
        FragmentsBuilder.java
        ScoreOrderFragmentsBuilder.java
        SimpleFragListBuilder.java
        SimpleFragmentsBuilder.java
        test
        org
        apache
        lucene
        search
        vectorhighlight
        AbstractTestCase.java
        FieldPhraseListTest.java
        FieldQueryTest.java
        FieldTermStackTest.java
        IndexTimeSynonymTest.java
        ScoreOrderFragmentsBuilderTest.java
        SimpleFragListBuilderTest.java
        SimpleFragmentsBuilderTest.java
        highlighter
        src
        java
        org
        apache
        lucene
        search
        highlight
        DefaultEncoder.java
        Encoder.java
        Formatter.java
        Fragmenter.java
        GradientFormatter.java
        Highlighter.java
        InvalidTokenOffsetsException.java
        NullFragmenter.java
        QueryScorer.java
        QueryTermExtractor.java
        QueryTermScorer.java
        Scorer.java
        SimpleFragmenter.java
        SimpleHTMLEncoder.java
        SimpleHTMLFormatter.java
        SimpleSpanFragmenter.java
        SpanGradientFormatter.java
        TextFragment.java
        TokenGroup.java
        TokenSources.java
        WeightedSpanTerm.java
        WeightedSpanTermExtractor.java
        WeightedTerm.java
        test
        org
        apache
        lucene
        search
        highlight
        HighlighterTest.java
        instantiated
        src
        java
        org
        apache
        lucene
        store
        instantiated
        FieldSetting.java
        FieldSettings.java
        InstantiatedAllTermDocs.java
        InstantiatedDocument.java
        InstantiatedIndex.java
        InstantiatedIndexReader.java
        InstantiatedIndexWriter.java
        InstantiatedTerm.java
        InstantiatedTermDocs.java
        InstantiatedTermDocumentInformation.java
        InstantiatedTermEnum.java
        InstantiatedTermFreqVector.java
        InstantiatedTermPositionVector.java
        InstantiatedTermPositions.java
        test
        org
        apache
        lucene
        store
        instantiated
        TestEmptyIndex.java
        TestIndicesEquals.java
        TestRealTime.java
        TestSerialization.java
        TestUnoptimizedReaderOnConstructor.java
        lucli
        src
        java
        lucli
        LuceneMethods.java
        Lucli.java
        memory
        src
        java
        org
        apache
        lucene
        index
        memory
        MemoryIndex.java
        test
        org
        apache
        lucene
        index
        memory
        MemoryIndexTest.java
        misc
        src
        java
        org
        apache
        lucene
        index
        BalancedSegmentMergePolicy.java
        FieldNormModifier.java
        IndexSplitter.java
        MultiPassIndexSplitter.java
        TermVectorAccessor.java
        misc
        ChainedFilter.java
        HighFreqTerms.java
        IndexMergeTool.java
        SweetSpotSimilarity.java
        queryParser
        analyzing
        AnalyzingQueryParser.java
        complexPhrase
        ComplexPhraseQueryParser.java
        precedence
        CharStream.java
        FastCharStream.java
        ParseException.java
        PrecedenceQueryParser.java
        PrecedenceQueryParserConstants.java
        PrecedenceQueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        test
        org
        apache
        lucene
        index
        TestFieldNormModifier.java
        TestIndexSplitter.java
        TestMultiPassIndexSplitter.java
        TestTermVectorAccessor.java
        misc
        ChainedFilterTest.java
        SweetSpotSimilarityTest.java
        TestLengthNormModifier.java
        queryParser
        analyzing
        TestAnalyzingQueryParser.java
        complexPhrase
        TestComplexPhraseQuery.java
        precedence
        TestPrecedenceQueryParser.java
        queries
        src
        java
        org
        apache
        lucene
        search
        BooleanFilter.java
        BoostingQuery.java
        DuplicateFilter.java
        FilterClause.java
        FuzzyLikeThisQuery.java
        TermsFilter.java
        similar
        MoreLikeThis.java
        MoreLikeThisQuery.java
        SimilarityQueries.java
        test
        org
        apache
        lucene
        search
        BooleanFilterTest.java
        BoostingQueryTest.java
        DuplicateFilterTest.java
        FuzzyLikeThisQueryTest.java
        TermsFilterTest.java
        similar
        TestMoreLikeThis.java
        queryparser
        src
        java
        org
        apache
        lucene
        queryParser
        core
        QueryNodeError.java
        QueryNodeException.java
        QueryNodeParseException.java
        QueryParserHelper.java
        builders
        QueryBuilder.java
        QueryTreeBuilder.java
        config
        FieldConfig.java
        FieldConfigListener.java
        QueryConfigHandler.java
        messages
        QueryParserMessages.java
        nodes
        AndQueryNode.java
        AnyQueryNode.java
        BooleanQueryNode.java
        BoostQueryNode.java
        DeletedQueryNode.java
        FieldQueryNode.java
        FieldableNode.java
        FuzzyQueryNode.java
        GroupQueryNode.java
        MatchAllDocsQueryNode.java
        MatchNoDocsQueryNode.java
        ModifierQueryNode.java
        NoTokenFoundQueryNode.java
        OpaqueQueryNode.java
        OrQueryNode.java
        ParametricQueryNode.java
        ParametricRangeQueryNode.java
        PathQueryNode.java
        PhraseSlopQueryNode.java
        ProximityQueryNode.java
        QueryNode.java
        QueryNodeImpl.java
        QuotedFieldQueryNode.java
        SlopQueryNode.java
        TextableQueryNode.java
        TokenizedPhraseQueryNode.java
        parser
        EscapeQuerySyntax.java
        SyntaxParser.java
        processors
        NoChildOptimizationQueryNodeProcessor.java
        QueryNodeProcessor.java
        QueryNodeProcessorImpl.java
        QueryNodeProcessorPipeline.java
        RemoveDeletedQueryNodesProcessor.java
        util
        QueryNodeOperation.java
        UnescapedCharSequence.java
        standard
        MultiFieldQueryParserWrapper.java
        QueryParserUtil.java
        QueryParserWrapper.java
        StandardQueryParser.java
        builders
        AnyQueryNodeBuilder.java
        BooleanQueryNodeBuilder.java
        BoostQueryNodeBuilder.java
        FieldQueryNodeBuilder.java
        FuzzyQueryNodeBuilder.java
        GroupQueryNodeBuilder.java
        MatchAllDocsQueryNodeBuilder.java
        MatchNoDocsQueryNodeBuilder.java
        ModifierQueryNodeBuilder.java
        MultiPhraseQueryNodeBuilder.java
        PhraseQueryNodeBuilder.java
        PrefixWildcardQueryNodeBuilder.java
        RangeQueryNodeBuilder.java
        SlopQueryNodeBuilder.java
        StandardBooleanQueryNodeBuilder.java
        StandardQueryBuilder.java
        StandardQueryTreeBuilder.java
        WildcardQueryNodeBuilder.java
        config
        AllowLeadingWildcardAttribute.java
        AllowLeadingWildcardAttributeImpl.java
        AnalyzerAttribute.java
        AnalyzerAttributeImpl.java
        BoostAttribute.java
        BoostAttributeImpl.java
        DateResolutionAttribute.java
        DateResolutionAttributeImpl.java
        DefaultOperatorAttribute.java
        DefaultOperatorAttributeImpl.java
        DefaultPhraseSlopAttribute.java
        DefaultPhraseSlopAttributeImpl.java
        FieldBoostMapAttribute.java
        FieldBoostMapAttributeImpl.java
        FieldBoostMapFCListener.java
        FieldDateResolutionFCListener.java
        FieldDateResolutionMapAttribute.java
        FieldDateResolutionMapAttributeImpl.java
        FuzzyAttribute.java
        FuzzyAttributeImpl.java
        LocaleAttribute.java
        LocaleAttributeImpl.java
        LowercaseExpandedTermsAttribute.java
        LowercaseExpandedTermsAttributeImpl.java
        MultiFieldAttribute.java
        MultiFieldAttributeImpl.java
        MultiTermRewriteMethodAttribute.java
        MultiTermRewriteMethodAttributeImpl.java
        PositionIncrementsAttribute.java
        PositionIncrementsAttributeImpl.java
        RangeCollatorAttribute.java
        RangeCollatorAttributeImpl.java
        StandardQueryConfigHandler.java
        nodes
        BooleanModifierNode.java
        MultiPhraseQueryNode.java
        PrefixWildcardQueryNode.java
        RangeQueryNode.java
        StandardBooleanQueryNode.java
        WildcardQueryNode.java
        parser
        EscapeQuerySyntaxImpl.java
        JavaCharStream.java
        ParseException.java
        StandardSyntaxParser.java
        StandardSyntaxParserConstants.java
        StandardSyntaxParserTokenManager.java
        Token.java
        TokenMgrError.java
        processors
        AllowLeadingWildcardProcessor.java
        AnalyzerQueryNodeProcessor.java
        BooleanSingleChildOptimizationQueryNodeProcessor.java
        BoostQueryNodeProcessor.java
        DefaultPhraseSlopQueryNodeProcessor.java
        FuzzyQueryNodeProcessor.java
        GroupQueryNodeProcessor.java
        LowercaseExpandedTermsQueryNodeProcessor.java
        MatchAllDocsQueryNodeProcessor.java
        MultiFieldQueryNodeProcessor.java
        MultiTermRewriteMethodProcessor.java
        ParametricRangeQueryNodeProcessor.java
        PhraseSlopQueryNodeProcessor.java
        RemoveEmptyNonLeafQueryNodeProcessor.java
        StandardQueryNodeProcessorPipeline.java
        WildcardQueryNodeProcessor.java
        test
        org
        apache
        lucene
        queryParser
        core
        nodes
        TestQueryNode.java
        spans
        SpanOrQueryNodeBuilder.java
        SpanTermQueryNodeBuilder.java
        SpansQueryConfigHandler.java
        SpansQueryTreeBuilder.java
        SpansValidatorQueryNodeProcessor.java
        TestSpanQueryParser.java
        TestSpanQueryParserSimpleSample.java
        UniqueFieldAttribute.java
        UniqueFieldAttributeImpl.java
        UniqueFieldQueryNodeProcessor.java
        standard
        TestMultiAnalyzerQPHelper.java
        TestMultiAnalyzerWrapper.java
        TestMultiFieldQPHelper.java
        TestMultiFieldQueryParserWrapper.java
        TestQPHelper.java
        TestQueryParserWrapper.java
        regex
        src
        java
        org
        apache
        lucene
        search
        regex
        JakartaRegexpCapabilities.java
        JavaUtilRegexCapabilities.java
        RegexCapabilities.java
        RegexQuery.java
        RegexQueryCapable.java
        RegexTermEnum.java
        SpanRegexQuery.java
        regexp
        RegexpTunnel.java
        test
        org
        apache
        lucene
        search
        regex
        TestRegexQuery.java
        TestSpanRegexQuery.java
        remote
        src
        java
        org
        apache
        lucene
        search
        RMIRemoteSearchable.java
        RemoteCachingWrapperFilter.java
        RemoteSearchable.java
        test
        org
        apache
        lucene
        search
        RemoteCachingWrapperFilterHelper.java
        TestRemoteCachingWrapperFilter.java
        TestRemoteSearchable.java
        TestRemoteSort.java
        snowball
        src
        java
        org
        apache
        lucene
        analysis
        snowball
        SnowballAnalyzer.java
        SnowballFilter.java
        tartarus
        snowball
        Among.java
        SnowballProgram.java
        TestApp.java
        ext
        DanishStemmer.java
        DutchStemmer.java
        EnglishStemmer.java
        FinnishStemmer.java
        FrenchStemmer.java
        German2Stemmer.java
        GermanStemmer.java
        HungarianStemmer.java
        ItalianStemmer.java
        KpStemmer.java
        LovinsStemmer.java
        NorwegianStemmer.java
        PorterStemmer.java
        PortugueseStemmer.java
        RomanianStemmer.java
        RussianStemmer.java
        SpanishStemmer.java
        SwedishStemmer.java
        TurkishStemmer.java
        test
        org
        apache
        lucene
        analysis
        snowball
        TestSnowball.java
        spatial
        src
        java
        org
        apache
        lucene
        spatial
        geohash
        GeoHashDistanceFilter.java
        GeoHashUtils.java
        geometry
        CartesianPoint.java
        DistanceUnits.java
        FixedLatLng.java
        FloatLatLng.java
        LatLng.java
        shape
        DistanceApproximation.java
        Ellipse.java
        Geometry2D.java
        IntersectCase.java
        LLRect.java
        LineSegment.java
        Point2D.java
        Rectangle.java
        Vector2D.java
        tier
        CartesianPolyFilterBuilder.java
        CartesianShapeFilter.java
        DistanceFieldComparatorSource.java
        DistanceFilter.java
        DistanceHandler.java
        DistanceQueryBuilder.java
        DistanceUtils.java
        InvalidGeoException.java
        LatLongDistanceFilter.java
        Shape.java
        projections
        CartesianTierPlotter.java
        IProjector.java
        SinusoidalProjector.java
        test
        org
        apache
        lucene
        spatial
        tier
        DistanceCheck.java
        PolyShape.java
        TestCartesian.java
        TestCartesianShapeFilter.java
        TestDistance.java
        spellchecker
        src
        java
        org
        apache
        lucene
        search
        spell
        Dictionary.java
        JaroWinklerDistance.java
        LevensteinDistance.java
        LuceneDictionary.java
        NGramDistance.java
        PlainTextDictionary.java
        SpellChecker.java
        StringDistance.java
        SuggestWord.java
        SuggestWordQueue.java
        test
        org
        apache
        lucene
        search
        spell
        TestJaroWinklerDistance.java
        TestLevenshteinDistance.java
        TestLuceneDictionary.java
        TestNGramDistance.java
        TestPlainTextDictionary.java
        TestSpellChecker.java
        surround
        src
        java
        org
        apache
        lucene
        queryParser
        surround
        parser
        CharStream.java
        FastCharStream.java
        ParseException.java
        QueryParser.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        query
        AndQuery.java
        BasicQueryFactory.java
        ComposedQuery.java
        DistanceQuery.java
        DistanceSubQuery.java
        FieldsQuery.java
        NotQuery.java
        OrQuery.java
        SimpleTerm.java
        SpanNearClauseFactory.java
        SrndBooleanQuery.java
        SrndPrefixQuery.java
        SrndQuery.java
        SrndTermQuery.java
        SrndTruncQuery.java
        TooManyBasicQueries.java
        test
        org
        apache
        lucene
        queryParser
        surround
        query
        BooleanQueryTst.java
        ExceptionQueryTst.java
        SingleFieldTestDb.java
        Test01Exceptions.java
        Test02Boolean.java
        Test03Distance.java
        swing
        src
        java
        org
        apache
        lucene
        swing
        models
        ListSearcher.java
        TableSearcher.java
        test
        org
        apache
        lucene
        swing
        models
        BaseListModel.java
        BaseTableModel.java
        DataStore.java
        ListSearcherSimulator.java
        RestaurantInfo.java
        TableSearcherSimulator.java
        TestBasicList.java
        TestBasicTable.java
        TestSearchingList.java
        TestSearchingTable.java
        TestUpdatingList.java
        TestUpdatingTable.java
        wikipedia
        src
        java
        org
        apache
        lucene
        wikipedia
        analysis
        WikipediaTokenizer.java
        WikipediaTokenizerImpl.java
        test
        org
        apache
        lucene
        wikipedia
        analysis
        WikipediaTokenizerTest.java
        wordnet
        src
        java
        org
        apache
        lucene
        wordnet
        AnalyzerUtil.java
        SynExpand.java
        SynLookup.java
        SynonymMap.java
        SynonymTokenFilter.java
        Syns2Index.java
        test
        org
        apache
        lucene
        wordnet
        TestSynonymTokenFilter.java
        TestWordnet.java
        xml-query-parser
        src
        demo
        java
        org
        apache
        lucene
        xmlparser
        webdemo
        FormBasedXmlQueryDemo.java
        java
        org
        apache
        lucene
        xmlparser
        CoreParser.java
        CorePlusExtensionsParser.java
        DOMUtils.java
        FilterBuilder.java
        FilterBuilderFactory.java
        ParserException.java
        QueryBuilder.java
        QueryBuilderFactory.java
        QueryTemplateManager.java
        builders
        BooleanFilterBuilder.java
        BooleanQueryBuilder.java
        BoostingQueryBuilder.java
        BoostingTermBuilder.java
        CachedFilterBuilder.java
        ConstantScoreQueryBuilder.java
        DuplicateFilterBuilder.java
        FilteredQueryBuilder.java
        FuzzyLikeThisQueryBuilder.java
        LikeThisQueryBuilder.java
        MatchAllDocsQueryBuilder.java
        RangeFilterBuilder.java
        SpanBuilderBase.java
        SpanFirstBuilder.java
        SpanNearBuilder.java
        SpanNotBuilder.java
        SpanOrBuilder.java
        SpanOrTermsBuilder.java
        SpanQueryBuilder.java
        SpanQueryBuilderFactory.java
        SpanTermBuilder.java
        TermQueryBuilder.java
        TermsFilterBuilder.java
        TermsQueryBuilder.java
        UserInputQueryBuilder.java
        test
        org
        apache
        lucene
        xmlparser
        TestParser.java
        TestQueryTemplateManager.java
      - src
        demo
        org
        apache
        lucene
        demo
        DeleteFiles.java
        FileDocument.java
        HTMLDocument.java
        IndexFiles.java
        IndexHTML.java
        SearchFiles.java
        html
        Entities.java
        HTMLParser.java
        HTMLParserConstants.java
        HTMLParserTokenManager.java
        ParseException.java
        ParserThread.java
        SimpleCharStream.java
        Tags.java
        Test.java
        Token.java
        TokenMgrError.java
        java
        org
        apache
        lucene
        LucenePackage.java
        analysis
        ASCIIFoldingFilter.java
        Analyzer.java
        BaseCharFilter.java
        CachingTokenFilter.java
        CharArraySet.java
        CharFilter.java
        CharReader.java
        CharStream.java
        CharTokenizer.java
        ISOLatin1AccentFilter.java
        KeywordAnalyzer.java
        KeywordTokenizer.java
        LengthFilter.java
        LetterTokenizer.java
        LowerCaseFilter.java
        LowerCaseTokenizer.java
        MappingCharFilter.java
        NormalizeCharMap.java
        NumericTokenStream.java
        PerFieldAnalyzerWrapper.java
        PorterStemFilter.java
        PorterStemmer.java
        SimpleAnalyzer.java
        StopAnalyzer.java
        StopFilter.java
        TeeSinkTokenFilter.java
        Token.java
        TokenFilter.java
        TokenStream.java
        Tokenizer.java
        WhitespaceAnalyzer.java
        WhitespaceTokenizer.java
        WordlistLoader.java
        standard
        StandardAnalyzer.java
        StandardFilter.java
        StandardTokenizer.java
        StandardTokenizerImpl.java
        tokenattributes
        FlagsAttribute.java
        FlagsAttributeImpl.java
        OffsetAttribute.java
        OffsetAttributeImpl.java
        PayloadAttribute.java
        PayloadAttributeImpl.java
        PositionIncrementAttribute.java
        PositionIncrementAttributeImpl.java
        TermAttribute.java
        TermAttributeImpl.java
        TypeAttribute.java
        TypeAttributeImpl.java
        document
        AbstractField.java
        CompressionTools.java
        DateField.java
        DateTools.java
        Document.java
        Field.java
        FieldSelector.java
        FieldSelectorResult.java
        Fieldable.java
        LoadFirstFieldSelector.java
        MapFieldSelector.java
        NumberTools.java
        NumericField.java
        SetBasedFieldSelector.java
        index
        AbstractAllTermDocs.java
        AllTermDocs.java
        BufferedDeletes.java
        ByteBlockPool.java
        ByteSliceReader.java
        ByteSliceWriter.java
        CharBlockPool.java
        CheckIndex.java
        CompoundFileReader.java
        CompoundFileWriter.java
        ConcurrentMergeScheduler.java
        CorruptIndexException.java
        DefaultSkipListReader.java
        DefaultSkipListWriter.java
        DirectoryReader.java
        DocConsumer.java
        DocConsumerPerThread.java
        DocFieldConsumer.java
        DocFieldConsumerPerField.java
        DocFieldConsumerPerThread.java
        DocFieldConsumers.java
        DocFieldConsumersPerField.java
        DocFieldConsumersPerThread.java
        DocFieldProcessor.java
        DocFieldProcessorPerField.java
        DocFieldProcessorPerThread.java
        DocInverter.java
        DocInverterPerField.java
        DocInverterPerThread.java
        DocumentsWriter.java
        DocumentsWriterThreadState.java
        FieldInfo.java
        FieldInfos.java
        FieldInvertState.java
        FieldReaderException.java
        FieldSortedTermVectorMapper.java
        FieldsReader.java
        FieldsWriter.java
        FilterIndexReader.java
        FormatPostingsDocsConsumer.java
        FormatPostingsDocsWriter.java
        FormatPostingsFieldsConsumer.java
        FormatPostingsFieldsWriter.java
        FormatPostingsPositionsConsumer.java
        FormatPostingsPositionsWriter.java
        FormatPostingsTermsConsumer.java
        FormatPostingsTermsWriter.java
        FreqProxFieldMergeState.java
        FreqProxTermsWriter.java
        FreqProxTermsWriterPerField.java
        FreqProxTermsWriterPerThread.java
        IndexCommit.java
        IndexDeletionPolicy.java
        IndexFileDeleter.java
        IndexFileNameFilter.java
        IndexFileNames.java
        IndexReader.java
        IndexWriter.java
        IntBlockPool.java
        InvertedDocConsumer.java
        InvertedDocConsumerPerField.java
        InvertedDocConsumerPerThread.java
        InvertedDocEndConsumer.java
        InvertedDocEndConsumerPerField.java
        InvertedDocEndConsumerPerThread.java
        KeepOnlyLastCommitDeletionPolicy.java
        LogByteSizeMergePolicy.java
        LogDocMergePolicy.java
        LogMergePolicy.java
        MergeDocIDRemapper.java
        MergePolicy.java
        MergeScheduler.java
        MultiLevelSkipListReader.java
        MultiLevelSkipListWriter.java
        MultiReader.java
        MultipleTermPositions.java
        NormsWriter.java
        NormsWriterPerField.java
        NormsWriterPerThread.java
        ParallelReader.java
        Payload.java
        PositionBasedTermVectorMapper.java
        RawPostingList.java
        ReadOnlyDirectoryReader.java
        ReadOnlySegmentReader.java
        ReusableStringReader.java
        SegmentInfo.java
        SegmentInfos.java
        SegmentMergeInfo.java
        SegmentMergeQueue.java
        SegmentMerger.java
        SegmentReader.java
        SegmentTermDocs.java
        SegmentTermEnum.java
        SegmentTermPositionVector.java
        SegmentTermPositions.java
        SegmentTermVector.java
        SegmentWriteState.java
        SerialMergeScheduler.java
        SnapshotDeletionPolicy.java
        SortedTermVectorMapper.java
        StaleReaderException.java
        StoredFieldsWriter.java
        StoredFieldsWriterPerThread.java
        Term.java
        TermBuffer.java
        TermDocs.java
        TermEnum.java
        TermFreqVector.java
        TermInfo.java
        TermInfosReader.java
        TermInfosWriter.java
        TermPositionVector.java
        TermPositions.java
        TermVectorEntry.java
        TermVectorEntryFreqSortedComparator.java
        TermVectorMapper.java
        TermVectorOffsetInfo.java
        TermVectorsReader.java
        TermVectorsTermsWriter.java
        TermVectorsTermsWriterPerField.java
        TermVectorsTermsWriterPerThread.java
        TermVectorsWriter.java
        TermsHash.java
        TermsHashConsumer.java
        TermsHashConsumerPerField.java
        TermsHashConsumerPerThread.java
        TermsHashPerField.java
        TermsHashPerThread.java
        messages
        Message.java
        MessageImpl.java
        NLS.java
        NLSException.java
        queryParser
        CharStream.java
        FastCharStream.java
        MultiFieldQueryParser.java
        ParseException.java
        QueryParser.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        search
        BooleanClause.java
        BooleanQuery.java
        BooleanScorer.java
        BooleanScorer2.java
        CachingSpanFilter.java
        CachingWrapperFilter.java
        Collector.java
        ComplexExplanation.java
        ConjunctionScorer.java
        ConstantScoreQuery.java
        DefaultSimilarity.java
        DisjunctionMaxQuery.java
        DisjunctionMaxScorer.java
        DisjunctionSumScorer.java
        DocIdSet.java
        DocIdSetIterator.java
        ExactPhraseScorer.java
        Explanation.java
        FieldCache.java
        FieldCacheImpl.java
        FieldCacheRangeFilter.java
        FieldCacheTermsFilter.java
        FieldComparator.java
        FieldComparatorSource.java
        FieldDoc.java
        FieldDocSortedHitQueue.java
        FieldValueHitQueue.java
        Filter.java
        FilterManager.java
        FilteredDocIdSet.java
        FilteredDocIdSetIterator.java
        FilteredQuery.java
        FilteredTermEnum.java
        FuzzyQuery.java
        FuzzyTermEnum.java
        HitQueue.java
        IndexSearcher.java
        MatchAllDocsQuery.java
        MultiPhraseQuery.java
        MultiSearcher.java
        MultiTermQuery.java
        MultiTermQueryWrapperFilter.java
        NumericRangeFilter.java
        NumericRangeQuery.java
        ParallelMultiSearcher.java
        PhrasePositions.java
        PhraseQuery.java
        PhraseQueue.java
        PhraseScorer.java
        PositiveScoresOnlyCollector.java
        PrefixFilter.java
        PrefixQuery.java
        PrefixTermEnum.java
        Query.java
        QueryTermVector.java
        QueryWrapperFilter.java
        ReqExclScorer.java
        ReqOptSumScorer.java
        ScoreCachingWrappingScorer.java
        ScoreDoc.java
        Scorer.java
        Searchable.java
        Searcher.java
        Similarity.java
        SimilarityDelegator.java
        SingleTermEnum.java
        SloppyPhraseScorer.java
        Sort.java
        SortField.java
        SpanFilter.java
        SpanFilterResult.java
        SpanQueryFilter.java
        TermQuery.java
        TermRangeFilter.java
        TermRangeQuery.java
        TermRangeTermEnum.java
        TermScorer.java
        TimeLimitingCollector.java
        TopDocs.java
        TopDocsCollector.java
        TopFieldCollector.java
        TopFieldDocs.java
        TopScoreDocCollector.java
        Weight.java
        WildcardQuery.java
        WildcardTermEnum.java
        function
        ByteFieldSource.java
        CustomScoreProvider.java
        CustomScoreQuery.java
        DocValues.java
        FieldCacheSource.java
        FieldScoreQuery.java
        FloatFieldSource.java
        IntFieldSource.java
        OrdFieldSource.java
        ReverseOrdFieldSource.java
        ShortFieldSource.java
        ValueSource.java
        ValueSourceQuery.java
        payloads
        AveragePayloadFunction.java
        MaxPayloadFunction.java
        MinPayloadFunction.java
        PayloadFunction.java
        PayloadNearQuery.java
        PayloadSpanUtil.java
        PayloadTermQuery.java
        spans
        FieldMaskingSpanQuery.java
        NearSpansOrdered.java
        NearSpansUnordered.java
        SpanFirstQuery.java
        SpanNearQuery.java
        SpanNotQuery.java
        SpanOrQuery.java
        SpanQuery.java
        SpanScorer.java
        SpanTermQuery.java
        SpanWeight.java
        Spans.java
        TermSpans.java
        store
        AlreadyClosedException.java
        BufferedIndexInput.java
        BufferedIndexOutput.java
        ChecksumIndexInput.java
        ChecksumIndexOutput.java
        Directory.java
        FSDirectory.java
        FSLockFactory.java
        FileSwitchDirectory.java
        IndexInput.java
        IndexOutput.java
        Lock.java
        LockFactory.java
        LockObtainFailedException.java
        LockReleaseFailedException.java
        LockStressTest.java
        LockVerifyServer.java
        MMapDirectory.java
        NIOFSDirectory.java
        NativeFSLockFactory.java
        NoLockFactory.java
        NoSuchDirectoryException.java
        RAMDirectory.java
        RAMFile.java
        RAMInputStream.java
        RAMOutputStream.java
        SimpleFSDirectory.java
        SimpleFSLockFactory.java
        SingleInstanceLockFactory.java
        VerifyingLockFactory.java
        util
        ArrayUtil.java
        Attribute.java
        AttributeImpl.java
        AttributeSource.java
        AverageGuessMemoryModel.java
        BitUtil.java
        BitVector.java
        CloseableThreadLocal.java
        Constants.java
        DocIdBitSet.java
        DummyConcurrentLock.java
        FieldCacheSanityChecker.java
        IndexableBinaryStringTools.java
        MapOfSets.java
        MemoryModel.java
        NamedThreadFactory.java
        NumericUtils.java
        OpenBitSet.java
        OpenBitSetDISI.java
        OpenBitSetIterator.java
        Parameter.java
        PriorityQueue.java
        RamUsageEstimator.java
        ReaderUtil.java
        ScorerDocQueue.java
        SimpleStringInterner.java
        SmallFloat.java
        SortedVIntList.java
        SorterTemplate.java
        StringHelper.java
        StringInterner.java
        ThreadInterruptedException.java
        ToStringUtils.java
        UnicodeUtil.java
        Version.java
        cache
        Cache.java
        SimpleLRUCache.java
        SimpleMapCache.java
        test
        org
        apache
        lucene
        TestDemo.java
        TestMergeSchedulerExternal.java
        TestSearch.java
        TestSearchForDuplicates.java
        analysis
        BaseTokenStreamTestCase.java
        TestASCIIFoldingFilter.java
        TestAnalyzers.java
        TestCachingTokenFilter.java
        TestCharArraySet.java
        TestCharFilter.java
        TestISOLatin1AccentFilter.java
        TestKeywordAnalyzer.java
        TestLengthFilter.java
        TestMappingCharFilter.java
        TestNumericTokenStream.java
        TestPerFieldAnalzyerWrapper.java
        TestStandardAnalyzer.java
        TestStopAnalyzer.java
        TestStopFilter.java
        TestTeeSinkTokenFilter.java
        TestToken.java
        tokenattributes
        TestSimpleAttributeImpls.java
        TestTermAttributeImpl.java
        document
        TestBinaryDocument.java
        TestDateTools.java
        TestDocument.java
        TestNumberTools.java
        index
        DocHelper.java
        MockIndexInput.java
        TestAddIndexesNoOptimize.java
        TestAtomicUpdate.java
        TestBackwardsCompatibility.java
        TestByteSlices.java
        TestCheckIndex.java
        TestCompoundFile.java
        TestConcurrentMergeScheduler.java
        TestCrash.java
        TestDeletionPolicy.java
        TestDirectoryReader.java
        TestDoc.java
        TestDocumentWriter.java
        TestFieldInfos.java
        TestFieldsReader.java
        TestFilterIndexReader.java
        TestIndexCommit.java
        TestIndexFileDeleter.java
        TestIndexInput.java
        TestIndexReader.java
        TestIndexReaderClone.java
        TestIndexReaderCloneNorms.java
        TestIndexReaderReopen.java
        TestIndexWriter.java
        TestIndexWriterDelete.java
        TestIndexWriterExceptions.java
        TestIndexWriterLockRelease.java
        TestIndexWriterMergePolicy.java
        TestIndexWriterMerging.java
        TestIndexWriterReader.java
        TestIsCurrent.java
        TestLazyBug.java
        TestLazyProxSkipping.java
        TestMultiLevelSkipList.java
        TestMultiReader.java
        TestNRTReaderWithThreads.java
        TestNewestSegment.java
        TestNorms.java
        TestOmitTf.java
        TestParallelReader.java
        TestParallelReaderEmptyIndex.java
        TestParallelTermEnum.java
        TestPayloads.java
        TestPositionBasedTermVectorMapper.java
        TestRollback.java
        TestSegmentMerger.java
        TestSegmentReader.java
        TestSegmentTermDocs.java
        TestSegmentTermEnum.java
        TestSnapshotDeletionPolicy.java
        TestStressIndexing.java
        TestStressIndexing2.java
        TestTerm.java
        TestTermVectorsReader.java
        TestTermdocPerf.java
        TestThreadedOptimize.java
        TestTransactionRollback.java
        TestTransactions.java
        TestWordlistLoader.java
        messages
        MessagesTestBundle.java
        TestNLS.java
        queryParser
        TestMultiAnalyzer.java
        TestMultiFieldQueryParser.java
        TestQueryParser.java
        search
        BaseTestRangeFilter.java
        CachingWrapperFilterHelper.java
        CheckHits.java
        JustCompileSearch.java
        MockFilter.java
        QueryUtils.java
        SingleDocTestFilter.java
        TestBoolean2.java
        TestBooleanMinShouldMatch.java
        TestBooleanOr.java
        TestBooleanPrefixQuery.java
        TestBooleanQuery.java
        TestBooleanScorer.java
        TestCachingSpanFilter.java
        TestCachingWrapperFilter.java
        TestComplexExplanations.java
        TestComplexExplanationsOfNonMatches.java
        TestCustomSearcherSort.java
        TestDateFilter.java
        TestDateSort.java
        TestDisjunctionMaxQuery.java
        TestDocBoost.java
        TestDocIdSet.java
        TestElevationComparator.java
        TestExplanations.java
        TestFieldCache.java
        TestFieldCacheRangeFilter.java
        TestFieldCacheTermsFilter.java
        TestFilteredQuery.java
        TestFilteredSearch.java
        TestFuzzyQuery.java
        TestMatchAllDocsQuery.java
        TestMultiPhraseQuery.java
        TestMultiSearcher.java
        TestMultiSearcherRanking.java
        TestMultiTermConstantScore.java
        TestMultiThreadTermVectors.java
        TestMultiValuedNumericRangeQuery.java
        TestNot.java
        TestNumericRangeQuery32.java
        TestNumericRangeQuery64.java
        TestParallelMultiSearcher.java
        TestPhrasePrefixQuery.java
        TestPhraseQuery.java
        TestPositionIncrement.java
        TestPositiveScoresOnlyCollector.java
        TestPrefixFilter.java
        TestPrefixInBooleanQuery.java
        TestPrefixQuery.java
        TestQueryTermVector.java
        TestQueryWrapperFilter.java
        TestScoreCachingWrappingScorer.java
        TestScorerPerf.java
        TestSetNorm.java
        TestSimilarity.java
        TestSimpleExplanations.java
        TestSimpleExplanationsOfNonMatches.java
        TestSloppyPhraseQuery.java
        TestSort.java
        TestSpanQueryFilter.java
        TestTermRangeFilter.java
        TestTermRangeQuery.java
        TestTermScorer.java
        TestTermVectors.java
        TestThreadSafe.java
        TestTimeLimitingCollector.java
        TestTopDocsCollector.java
        TestTopScoreDocCollector.java
        TestWildcard.java
        function
        FunctionTestSetup.java
        JustCompileSearchSpans.java
        TestCustomScoreQuery.java
        TestDocValues.java
        TestFieldScoreQuery.java
        TestOrdValues.java
        payloads
        PayloadHelper.java
        TestPayloadNearQuery.java
        TestPayloadTermQuery.java
        spans
        JustCompileSearchSpans.java
        TestBasics.java
        TestFieldMaskingSpanQuery.java
        TestNearSpansOrdered.java
        TestPayloadSpans.java
        TestSpanExplanations.java
        TestSpanExplanationsOfNonMatches.java
        TestSpans.java
        TestSpansAdvanced.java
        TestSpansAdvanced2.java
        store
        MockRAMDirectory.java
        MockRAMInputStream.java
        MockRAMOutputStream.java
        TestBufferedIndexInput.java
        TestDirectory.java
        TestFileSwitchDirectory.java
        TestHugeRamFile.java
        TestLock.java
        TestLockFactory.java
        TestMultiMMap.java
        TestRAMDirectory.java
        TestWindowsMMap.java
        _TestHelper.java
        util
        ArrayUtilTest.java
        English.java
        LocalizedTestCase.java
        LuceneTestCase.java
        TestAttributeSource.java
        TestBitVector.java
        TestCloseableThreadLocal.java
        TestFieldCacheSanityChecker.java
        TestIndexableBinaryStringTools.java
        TestNumericUtils.java
        TestOpenBitSet.java
        TestPriorityQueue.java
        TestRamUsageEstimator.java
        TestSmallFloat.java
        TestSortedVIntList.java
        TestStringHelper.java
        TestStringIntern.java
        TestVersion.java
        _TestUtil.java
        cache
        TestSimpleLRUCache.java
- source
  - com
    - partydj
  - org
    - cmc
      - music
        clean
        Diacriticals.java
        MetadataCleanup.java
        NameReversalFilter.java
        RenamingFileFilter.java
        common
        ID3Exception.java
        ID3FrameType.java
        ID3ReadException.java
        ID3WriteException.java
        ID3v1Genre.java
        fs
        ParsedFilename.java
        SongFilenameParser.java
        metadata
        IMusicMetadata.java
        ImageData.java
        MusicMetadata.java
        MusicMetadataAttribute.java
        MusicMetadataConstants.java
        MusicMetadataSet.java
        UnknownUserTextValue.java
        myid3
        ID3Tag.java
        MyID3.java
        MyID3Listener.java
        TagFormat.java
        UnicodeMetrics.java
        examples
        ListenerAndFilterExample.java
        SampleUsage.java
        id3v1
        MyID3v1.java
        MyID3v1Constants.java
        id3v2
        ID3v2FrameFlags.java
        ID3v2FrameTranslation.java
        ID3v2OutputFrame.java
        IFrameFactory.java
        MyID3v2.java
        MyID3v2Constants.java
        MyID3v2Frame.java
        MyID3v2FrameData.java
        MyID3v2FrameImage.java
        MyID3v2FrameText.java
        MyID3v2Read.java
        MyID3v2Write.java
        util
        BasicConstants.java
        Debug.java
        FSTraversal.java
        FileComparator.java
        FileFilter.java
        FileIO.java
        FileUtils.java
        MyComparator.java
        MyFileSystem.java
        MyMap.java
        SimpleMap.java
        TextUtils.java

package org.apache.lucene.analysis.shingle;

/**
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

import java.io.IOException;
import java.util.Iterator;
import java.util.LinkedList;

import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenFilter;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.OffsetAttribute;
import org.apache.lucene.analysis.tokenattributes.PositionIncrementAttribute;
import org.apache.lucene.analysis.tokenattributes.TermAttribute;
import org.apache.lucene.analysis.tokenattributes.TypeAttribute;
import org.apache.lucene.util.AttributeSource;
import org.apache.lucene.util.AttributeSource.State;

/**
 * <p>A ShingleFilter constructs shingles (token n-grams) from a token stream.
 * In other words, it creates combinations of tokens as a single token.
 *
 * <p>For example, the sentence "please divide this sentence into shingles"
 * might be tokenized into shingles "please divide", "divide this",
 * "this sentence", "sentence into", and "into shingles".
 *
 * <p>This filter handles position increments > 1 by inserting filler tokens
 * (tokens with termtext "_"). It does not handle a position increment of 0.
 */
public final class ShingleFilter extends TokenFilter {

  private LinkedList<State> shingleBuf = new LinkedList<State>();
  private StringBuilder[] shingles;
  private String tokenType = "shingle";

  /**
   * filler token for when positionIncrement is more than 1
   */
  public static final char[] FILLER_TOKEN = { '_' };


  /**
   * default maximum shingle size is 2.
   */
  public static final int DEFAULT_MAX_SHINGLE_SIZE = 2;

  /**
   * The string to use when joining adjacent tokens to form a shingle
   */
  public static final String TOKEN_SEPARATOR = " ";

  /**
   * By default, we output unigrams (individual tokens) as well as shingles
   * (token n-grams).
   */
  private boolean outputUnigrams = true;

  /**
   * maximum shingle size (number of tokens)
   */
  private int maxShingleSize;

  /**
   * Constructs a ShingleFilter with the specified single size from the
   * {@link TokenStream} <code>input</code>
   *
   * @param input input stream
   * @param maxShingleSize maximum shingle size produced by the filter.
   */
  public ShingleFilter(TokenStream input, int maxShingleSize) {
    super(input);
    setMaxShingleSize(maxShingleSize);
    this.termAtt = addAttribute(TermAttribute.class);
    this.offsetAtt = addAttribute(OffsetAttribute.class);
    this.posIncrAtt = addAttribute(PositionIncrementAttribute.class);
    this.typeAtt = addAttribute(TypeAttribute.class);
  }

  /**
   * Construct a ShingleFilter with default shingle size.
   *
   * @param input input stream
   */
  public ShingleFilter(TokenStream input) {
    this(input, DEFAULT_MAX_SHINGLE_SIZE);
  }

  /**
   * Construct a ShingleFilter with the specified token type for shingle tokens.
   *
   * @param input input stream
   * @param tokenType token type for shingle tokens
   */
  public ShingleFilter(TokenStream input, String tokenType) {
    this(input, DEFAULT_MAX_SHINGLE_SIZE);
    setTokenType(tokenType);
  }

  /**
   * Set the type of the shingle tokens produced by this filter.
   * (default: "shingle")
   *
   * @param tokenType token tokenType
   */
  public void setTokenType(String tokenType) {
    this.tokenType = tokenType;
  }

  /**
   * Shall the output stream contain the input tokens (unigrams) as well as
   * shingles? (default: true.)
   *
   * @param outputUnigrams Whether or not the output stream shall contain
   * the input tokens (unigrams)
   */
  public void setOutputUnigrams(boolean outputUnigrams) {
    this.outputUnigrams = outputUnigrams;
  }

  /**
   * Set the max shingle size (default: 2)
   *
   * @param maxShingleSize max size of output shingles
   */
  public void setMaxShingleSize(int maxShingleSize) {
    if (maxShingleSize < 2) {
      throw new IllegalArgumentException("Max shingle size must be >= 2");
    }
    shingles = new StringBuilder[maxShingleSize];
    for (int i = 0; i < shingles.length; i++) {
      shingles[i] = new StringBuilder();
    }
    this.maxShingleSize = maxShingleSize;
  }

  /**
   * Clear the StringBuilders that are used for storing the output shingles.
   */
  private void clearShingles() {
    for (int i = 0; i < shingles.length; i++) {
      shingles[i].setLength(0);
    }
  }
  
  private AttributeSource.State nextToken;
  private int shingleBufferPosition;
  private int[] endOffsets;

  /* (non-Javadoc)
   * @see org.apache.lucene.analysis.TokenStream#next()
   */
  @Override
  public final boolean incrementToken() throws IOException {
    while (true) {
      if (nextToken == null) {
        if (!fillShingleBuffer()) {
          return false;
        }
      }
      
      nextToken = shingleBuf.getFirst();
      
      if (outputUnigrams) {
        if (shingleBufferPosition == 0) {
          restoreState(nextToken);
          posIncrAtt.setPositionIncrement(1);
          shingleBufferPosition++;
          return true;
        }
      } else if (shingleBufferPosition % this.maxShingleSize == 0){
        shingleBufferPosition++;
      }
  
      if (shingleBufferPosition < shingleBuf.size()) {
        restoreState(nextToken);
        typeAtt.setType(tokenType);
        offsetAtt.setOffset(offsetAtt.startOffset(), endOffsets[shingleBufferPosition]);
        StringBuilder buf = shingles[shingleBufferPosition];
        int termLength = buf.length();
        char[] termBuffer = termAtt.termBuffer();
        if (termBuffer.length < termLength)
          termBuffer = termAtt.resizeTermBuffer(termLength);
        buf.getChars(0, termLength, termBuffer, 0);
        termAtt.setTermLength(termLength);
        if ((! outputUnigrams) && shingleBufferPosition % this.maxShingleSize == 1) {
          posIncrAtt.setPositionIncrement(1);
        } else {
          posIncrAtt.setPositionIncrement(0);
        }
        shingleBufferPosition++;
        if (shingleBufferPosition == shingleBuf.size()) {
          nextToken = null;
          shingleBufferPosition = 0;
        }
        return true;
      } else {
        nextToken = null;
        shingleBufferPosition = 0;
      }
    }
  }
  
  private int numFillerTokensToInsert;
  private AttributeSource.State currentToken;
  private boolean hasCurrentToken;
   
  private TermAttribute termAtt;
  private OffsetAttribute offsetAtt;
  private PositionIncrementAttribute posIncrAtt;
  private TypeAttribute typeAtt;
  
  /**
   * Get the next token from the input stream and push it on the token buffer.
   * If we encounter a token with position increment > 1, we put filler tokens
   * on the token buffer.
   * <p/>
   * Returns null when the end of the input stream is reached.
   * @return the next token, or null if at end of input stream
   * @throws IOException if the input stream has a problem
   */
  private boolean getNextToken() throws IOException {
    
    while (true) {
  	  if (numFillerTokensToInsert > 0) {
  	    if (currentToken == null) {
  	      currentToken = captureState();
  	    } else {
  	      restoreState(currentToken);
  	    }
  	    numFillerTokensToInsert--;
        // A filler token occupies no space
  	    offsetAtt.setOffset(offsetAtt.startOffset(), offsetAtt.startOffset());
  	    termAtt.setTermBuffer(FILLER_TOKEN, 0, FILLER_TOKEN.length);
        return true;
  	  } 
  	  
  	  if (hasCurrentToken) {
  	    if (currentToken != null) {
  	      restoreState(currentToken);
  	      currentToken = null;
  	    }
  	    hasCurrentToken = false;
  	    return true;
  	  }
  	  
  	  if (!input.incrementToken()) return false;
  	  hasCurrentToken = true;
  	  
  	  if (posIncrAtt.getPositionIncrement() > 1) {
  	    numFillerTokensToInsert = posIncrAtt.getPositionIncrement() - 1;
  	  }
    }
	}

  /**
   * Fill the output buffer with new shingles.
   *
   * @throws IOException if there's a problem getting the next token
   */
  private boolean fillShingleBuffer() throws IOException {
    boolean addedToken = false;
    /*
     * Try to fill the shingle buffer.
     */
    do {
      if (getNextToken()) {
        shingleBuf.add(captureState());
        if (shingleBuf.size() > maxShingleSize)
        {
          shingleBuf.removeFirst();
        }
        addedToken = true;
      } else {
        break;
      }
    } while (shingleBuf.size() < maxShingleSize);

    if (shingleBuf.isEmpty()) {
      return false;
    }
    
    /*
     * If no new token could be added to the shingle buffer, we have reached
     * the end of the input stream and have to discard the least recent token.
     */
    if (! addedToken) {
      shingleBuf.removeFirst();
    }
    
    if (shingleBuf.isEmpty()) {
      return false;
    }

    clearShingles();

    endOffsets = new int[shingleBuf.size()];
    for (int i = 0; i < endOffsets.length; i++) {
      endOffsets[i] = 0;
    }

    int i = 0;
    for (Iterator<State> it = shingleBuf.iterator(); it.hasNext(); ) {
      restoreState(it.next());
      for (int j = i; j < shingles.length; j++) {
        if (shingles[j].length() != 0) {
          shingles[j].append(TOKEN_SEPARATOR);
        }
        shingles[j].append(termAtt.termBuffer(), 0, termAtt.termLength());
      }

      endOffsets[i] = offsetAtt.endOffset();
      i++;
    }
    
    return true;
  }

  @Override
  public void reset() throws IOException {
    super.reset();
    nextToken = null;
    shingleBufferPosition = 0;
    shingleBuf.clear();
    numFillerTokensToInsert = 0;
    currentToken = null;
    hasCurrentToken = false;
  }
}