MoreLikeThis.java example

Explorer

PartyDJ-master
- lib
  - org.apache.lucene
    - lucene-3.0.3
      - contrib
        analyzers
        common
        src
        java
        org
        apache
        lucene
        analysis
        ar
        ArabicAnalyzer.java
        ArabicLetterTokenizer.java
        ArabicNormalizationFilter.java
        ArabicNormalizer.java
        ArabicStemFilter.java
        ArabicStemmer.java
        br
        BrazilianAnalyzer.java
        BrazilianStemFilter.java
        BrazilianStemmer.java
        cjk
        CJKAnalyzer.java
        CJKTokenizer.java
        cn
        ChineseAnalyzer.java
        ChineseFilter.java
        ChineseTokenizer.java
        compound
        CompoundWordTokenFilterBase.java
        DictionaryCompoundWordTokenFilter.java
        HyphenationCompoundWordTokenFilter.java
        hyphenation
        ByteVector.java
        CharVector.java
        Hyphen.java
        Hyphenation.java
        HyphenationException.java
        HyphenationTree.java
        PatternConsumer.java
        PatternParser.java
        TernaryTree.java
        cz
        CzechAnalyzer.java
        de
        GermanAnalyzer.java
        GermanStemFilter.java
        GermanStemmer.java
        el
        GreekAnalyzer.java
        GreekLowerCaseFilter.java
        fa
        PersianAnalyzer.java
        PersianNormalizationFilter.java
        PersianNormalizer.java
        fr
        ElisionFilter.java
        FrenchAnalyzer.java
        FrenchStemFilter.java
        FrenchStemmer.java
        miscellaneous
        EmptyTokenStream.java
        PatternAnalyzer.java
        PrefixAndSuffixAwareTokenFilter.java
        PrefixAwareTokenFilter.java
        SingleTokenTokenStream.java
        ngram
        EdgeNGramTokenFilter.java
        EdgeNGramTokenizer.java
        NGramTokenFilter.java
        NGramTokenizer.java
        nl
        DutchAnalyzer.java
        DutchStemFilter.java
        DutchStemmer.java
        payloads
        AbstractEncoder.java
        DelimitedPayloadTokenFilter.java
        FloatEncoder.java
        IdentityEncoder.java
        IntegerEncoder.java
        NumericPayloadTokenFilter.java
        PayloadEncoder.java
        PayloadHelper.java
        TokenOffsetPayloadTokenFilter.java
        TypeAsPayloadTokenFilter.java
        position
        PositionFilter.java
        query
        QueryAutoStopWordAnalyzer.java
        reverse
        ReverseStringFilter.java
        ru
        RussianAnalyzer.java
        RussianLetterTokenizer.java
        RussianLowerCaseFilter.java
        RussianStemFilter.java
        RussianStemmer.java
        shingle
        ShingleAnalyzerWrapper.java
        ShingleFilter.java
        ShingleMatrixFilter.java
        sinks
        DateRecognizerSinkFilter.java
        TokenRangeSinkFilter.java
        TokenTypeSinkFilter.java
        th
        ThaiAnalyzer.java
        ThaiWordFilter.java
        test
        org
        apache
        lucene
        analysis
        ar
        TestArabicAnalyzer.java
        TestArabicNormalizationFilter.java
        TestArabicStemFilter.java
        br
        TestBrazilianStemmer.java
        cjk
        TestCJKTokenizer.java
        cn
        TestChineseTokenizer.java
        compound
        TestCompoundWordTokenFilter.java
        cz
        TestCzechAnalyzer.java
        de
        TestGermanStemFilter.java
        el
        GreekAnalyzerTest.java
        fa
        TestPersianAnalyzer.java
        TestPersianNormalizationFilter.java
        fr
        TestElision.java
        TestFrenchAnalyzer.java
        miscellaneous
        PatternAnalyzerTest.java
        TestEmptyTokenStream.java
        TestPrefixAndSuffixAwareTokenFilter.java
        TestPrefixAwareTokenFilter.java
        TestSingleTokenTokenFilter.java
        ngram
        EdgeNGramTokenFilterTest.java
        EdgeNGramTokenizerTest.java
        NGramTokenFilterTest.java
        NGramTokenizerTest.java
        nl
        TestDutchStemmer.java
        payloads
        DelimitedPayloadTokenFilterTest.java
        NumericPayloadTokenFilterTest.java
        TokenOffsetPayloadTokenFilterTest.java
        TypeAsPayloadTokenFilterTest.java
        position
        PositionFilterTest.java
        query
        QueryAutoStopWordAnalyzerTest.java
        reverse
        TestReverseStringFilter.java
        ru
        TestRussianAnalyzer.java
        TestRussianStem.java
        shingle
        ShingleAnalyzerWrapperTest.java
        ShingleFilterTest.java
        TestShingleMatrixFilter.java
        sinks
        DateRecognizerSinkTokenizerTest.java
        TokenRangeSinkTokenizerTest.java
        TokenTypeSinkTokenizerTest.java
        th
        TestThaiAnalyzer.java
        smartcn
        src
        java
        org
        apache
        lucene
        analysis
        cn
        smart
        AnalyzerProfile.java
        CharType.java
        SentenceTokenizer.java
        SmartChineseAnalyzer.java
        Utility.java
        WordSegmenter.java
        WordTokenFilter.java
        WordType.java
        hhmm
        AbstractDictionary.java
        BiSegGraph.java
        BigramDictionary.java
        HHMMSegmenter.java
        PathNode.java
        SegGraph.java
        SegToken.java
        SegTokenFilter.java
        SegTokenPair.java
        WordDictionary.java
        test
        org
        apache
        lucene
        analysis
        cn
        smart
        TestSmartChineseAnalyzer.java
        ant
        src
        java
        org
        apache
        lucene
        ant
        ConfigurableDocumentHandler.java
        DocumentHandler.java
        DocumentHandlerException.java
        FileExtensionDocumentHandler.java
        HtmlDocument.java
        IndexTask.java
        TextDocument.java
        test
        org
        apache
        lucene
        ant
        DocumentTestCase.java
        HtmlDocumentTest.java
        IndexTaskTest.java
        TextDocumentTest.java
        benchmark
        src
        java
        org
        apache
        lucene
        benchmark
        Constants.java
        byTask
        Benchmark.java
        PerfRunData.java
        feeds
        AbstractQueryMaker.java
        ContentSource.java
        DemoHTMLParser.java
        DirContentSource.java
        DocData.java
        DocMaker.java
        EnwikiContentSource.java
        EnwikiQueryMaker.java
        FileBasedQueryMaker.java
        HTMLParser.java
        LineDocSource.java
        NoMoreDataException.java
        QueryMaker.java
        ReutersContentSource.java
        ReutersQueryMaker.java
        SimpleQueryMaker.java
        SimpleSloppyPhraseQueryMaker.java
        SingleDocSource.java
        SortableSingleDocSource.java
        TrecContentSource.java
        programmatic
        Sample.java
        stats
        Points.java
        Report.java
        TaskStats.java
        tasks
        AddDocTask.java
        BenchmarkHighlighter.java
        ClearStatsTask.java
        CloseIndexTask.java
        CloseReaderTask.java
        CommitIndexTask.java
        ConsumeContentSourceTask.java
        CreateIndexTask.java
        DeleteByPercentTask.java
        DeleteDocTask.java
        FlushReaderTask.java
        NearRealtimeReaderTask.java
        NewAnalyzerTask.java
        NewRoundTask.java
        OpenIndexTask.java
        OpenReaderTask.java
        OptimizeTask.java
        PerfTask.java
        PrintReaderTask.java
        ReadTask.java
        ReadTokensTask.java
        ReopenReaderTask.java
        RepAllTask.java
        RepSelectByPrefTask.java
        RepSumByNameRoundTask.java
        RepSumByNameTask.java
        RepSumByPrefRoundTask.java
        RepSumByPrefTask.java
        ReportTask.java
        ResetInputsTask.java
        ResetSystemEraseTask.java
        ResetSystemSoftTask.java
        RollbackIndexTask.java
        SearchTask.java
        SearchTravRetHighlightTask.java
        SearchTravRetLoadFieldSelectorTask.java
        SearchTravRetTask.java
        SearchTravRetVectorHighlightTask.java
        SearchTravTask.java
        SearchWithSortTask.java
        SetPropTask.java
        TaskSequence.java
        UpdateDocTask.java
        WaitTask.java
        WarmTask.java
        WriteLineDocTask.java
        utils
        Algorithm.java
        Config.java
        FileUtils.java
        Format.java
        StringBufferReader.java
        quality
        Judge.java
        QualityBenchmark.java
        QualityQuery.java
        QualityQueryParser.java
        QualityStats.java
        trec
        QueryDriver.java
        Trec1MQReader.java
        TrecJudge.java
        TrecTopicsReader.java
        utils
        DocNameExtractor.java
        QualityQueriesFinder.java
        SimpleQQParser.java
        SubmissionReport.java
        stats
        MemUsage.java
        QueryData.java
        TestData.java
        TestRunData.java
        TimeData.java
        utils
        ExtractReuters.java
        ExtractWikipedia.java
        NoDeletionPolicy.java
        test
        org
        apache
        lucene
        benchmark
        BenchmarkTestCase.java
        byTask
        TestPerfTasksLogic.java
        TestPerfTasksParse.java
        feeds
        DocMakerTest.java
        LineDocSourceTest.java
        TrecContentSourceTest.java
        tasks
        CountingHighlighterTestTask.java
        CountingSearchTestTask.java
        CreateIndexTaskTest.java
        PerfTaskTest.java
        WriteLineDocTaskTest.java
        quality
        TestQualityRun.java
        collation
        src
        java
        org
        apache
        lucene
        collation
        CollationKeyAnalyzer.java
        CollationKeyFilter.java
        ICUCollationKeyAnalyzer.java
        ICUCollationKeyFilter.java
        test
        org
        apache
        lucene
        collation
        CollationTestBase.java
        TestCollationKeyAnalyzer.java
        TestCollationKeyFilter.java
        TestICUCollationKeyAnalyzer.java
        TestICUCollationKeyFilter.java
        db
        bdb
        src
        java
        com
        sleepycat
        db
        DbHandleExtractor.java
        org
        apache
        lucene
        store
        db
        Block.java
        DbDirectory.java
        DbIndexInput.java
        DbIndexOutput.java
        DbLock.java
        File.java
        test
        org
        apache
        lucene
        store
        db
        DbStoreTest.java
        SanityLoadLibrary.java
        bdb-je
        src
        java
        org
        apache
        lucene
        store
        je
        Block.java
        File.java
        JEDirectory.java
        JEIndexInput.java
        JEIndexOutput.java
        JELock.java
        test
        org
        apache
        lucene
        store
        je
        JEStoreTest.java
        fast-vector-highlighter
        src
        java
        org
        apache
        lucene
        search
        vectorhighlight
        BaseFragmentsBuilder.java
        FastVectorHighlighter.java
        FieldFragList.java
        FieldPhraseList.java
        FieldQuery.java
        FieldTermStack.java
        FragListBuilder.java
        FragmentsBuilder.java
        ScoreOrderFragmentsBuilder.java
        SimpleFragListBuilder.java
        SimpleFragmentsBuilder.java
        test
        org
        apache
        lucene
        search
        vectorhighlight
        AbstractTestCase.java
        FieldPhraseListTest.java
        FieldQueryTest.java
        FieldTermStackTest.java
        IndexTimeSynonymTest.java
        ScoreOrderFragmentsBuilderTest.java
        SimpleFragListBuilderTest.java
        SimpleFragmentsBuilderTest.java
        highlighter
        src
        java
        org
        apache
        lucene
        search
        highlight
        DefaultEncoder.java
        Encoder.java
        Formatter.java
        Fragmenter.java
        GradientFormatter.java
        Highlighter.java
        InvalidTokenOffsetsException.java
        NullFragmenter.java
        QueryScorer.java
        QueryTermExtractor.java
        QueryTermScorer.java
        Scorer.java
        SimpleFragmenter.java
        SimpleHTMLEncoder.java
        SimpleHTMLFormatter.java
        SimpleSpanFragmenter.java
        SpanGradientFormatter.java
        TextFragment.java
        TokenGroup.java
        TokenSources.java
        WeightedSpanTerm.java
        WeightedSpanTermExtractor.java
        WeightedTerm.java
        test
        org
        apache
        lucene
        search
        highlight
        HighlighterTest.java
        instantiated
        src
        java
        org
        apache
        lucene
        store
        instantiated
        FieldSetting.java
        FieldSettings.java
        InstantiatedAllTermDocs.java
        InstantiatedDocument.java
        InstantiatedIndex.java
        InstantiatedIndexReader.java
        InstantiatedIndexWriter.java
        InstantiatedTerm.java
        InstantiatedTermDocs.java
        InstantiatedTermDocumentInformation.java
        InstantiatedTermEnum.java
        InstantiatedTermFreqVector.java
        InstantiatedTermPositionVector.java
        InstantiatedTermPositions.java
        test
        org
        apache
        lucene
        store
        instantiated
        TestEmptyIndex.java
        TestIndicesEquals.java
        TestRealTime.java
        TestSerialization.java
        TestUnoptimizedReaderOnConstructor.java
        lucli
        src
        java
        lucli
        LuceneMethods.java
        Lucli.java
        memory
        src
        java
        org
        apache
        lucene
        index
        memory
        MemoryIndex.java
        test
        org
        apache
        lucene
        index
        memory
        MemoryIndexTest.java
        misc
        src
        java
        org
        apache
        lucene
        index
        BalancedSegmentMergePolicy.java
        FieldNormModifier.java
        IndexSplitter.java
        MultiPassIndexSplitter.java
        TermVectorAccessor.java
        misc
        ChainedFilter.java
        HighFreqTerms.java
        IndexMergeTool.java
        SweetSpotSimilarity.java
        queryParser
        analyzing
        AnalyzingQueryParser.java
        complexPhrase
        ComplexPhraseQueryParser.java
        precedence
        CharStream.java
        FastCharStream.java
        ParseException.java
        PrecedenceQueryParser.java
        PrecedenceQueryParserConstants.java
        PrecedenceQueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        test
        org
        apache
        lucene
        index
        TestFieldNormModifier.java
        TestIndexSplitter.java
        TestMultiPassIndexSplitter.java
        TestTermVectorAccessor.java
        misc
        ChainedFilterTest.java
        SweetSpotSimilarityTest.java
        TestLengthNormModifier.java
        queryParser
        analyzing
        TestAnalyzingQueryParser.java
        complexPhrase
        TestComplexPhraseQuery.java
        precedence
        TestPrecedenceQueryParser.java
        queries
        src
        java
        org
        apache
        lucene
        search
        BooleanFilter.java
        BoostingQuery.java
        DuplicateFilter.java
        FilterClause.java
        FuzzyLikeThisQuery.java
        TermsFilter.java
        similar
        MoreLikeThis.java
        MoreLikeThisQuery.java
        SimilarityQueries.java
        test
        org
        apache
        lucene
        search
        BooleanFilterTest.java
        BoostingQueryTest.java
        DuplicateFilterTest.java
        FuzzyLikeThisQueryTest.java
        TermsFilterTest.java
        similar
        TestMoreLikeThis.java
        queryparser
        src
        java
        org
        apache
        lucene
        queryParser
        core
        QueryNodeError.java
        QueryNodeException.java
        QueryNodeParseException.java
        QueryParserHelper.java
        builders
        QueryBuilder.java
        QueryTreeBuilder.java
        config
        FieldConfig.java
        FieldConfigListener.java
        QueryConfigHandler.java
        messages
        QueryParserMessages.java
        nodes
        AndQueryNode.java
        AnyQueryNode.java
        BooleanQueryNode.java
        BoostQueryNode.java
        DeletedQueryNode.java
        FieldQueryNode.java
        FieldableNode.java
        FuzzyQueryNode.java
        GroupQueryNode.java
        MatchAllDocsQueryNode.java
        MatchNoDocsQueryNode.java
        ModifierQueryNode.java
        NoTokenFoundQueryNode.java
        OpaqueQueryNode.java
        OrQueryNode.java
        ParametricQueryNode.java
        ParametricRangeQueryNode.java
        PathQueryNode.java
        PhraseSlopQueryNode.java
        ProximityQueryNode.java
        QueryNode.java
        QueryNodeImpl.java
        QuotedFieldQueryNode.java
        SlopQueryNode.java
        TextableQueryNode.java
        TokenizedPhraseQueryNode.java
        parser
        EscapeQuerySyntax.java
        SyntaxParser.java
        processors
        NoChildOptimizationQueryNodeProcessor.java
        QueryNodeProcessor.java
        QueryNodeProcessorImpl.java
        QueryNodeProcessorPipeline.java
        RemoveDeletedQueryNodesProcessor.java
        util
        QueryNodeOperation.java
        UnescapedCharSequence.java
        standard
        MultiFieldQueryParserWrapper.java
        QueryParserUtil.java
        QueryParserWrapper.java
        StandardQueryParser.java
        builders
        AnyQueryNodeBuilder.java
        BooleanQueryNodeBuilder.java
        BoostQueryNodeBuilder.java
        FieldQueryNodeBuilder.java
        FuzzyQueryNodeBuilder.java
        GroupQueryNodeBuilder.java
        MatchAllDocsQueryNodeBuilder.java
        MatchNoDocsQueryNodeBuilder.java
        ModifierQueryNodeBuilder.java
        MultiPhraseQueryNodeBuilder.java
        PhraseQueryNodeBuilder.java
        PrefixWildcardQueryNodeBuilder.java
        RangeQueryNodeBuilder.java
        SlopQueryNodeBuilder.java
        StandardBooleanQueryNodeBuilder.java
        StandardQueryBuilder.java
        StandardQueryTreeBuilder.java
        WildcardQueryNodeBuilder.java
        config
        AllowLeadingWildcardAttribute.java
        AllowLeadingWildcardAttributeImpl.java
        AnalyzerAttribute.java
        AnalyzerAttributeImpl.java
        BoostAttribute.java
        BoostAttributeImpl.java
        DateResolutionAttribute.java
        DateResolutionAttributeImpl.java
        DefaultOperatorAttribute.java
        DefaultOperatorAttributeImpl.java
        DefaultPhraseSlopAttribute.java
        DefaultPhraseSlopAttributeImpl.java
        FieldBoostMapAttribute.java
        FieldBoostMapAttributeImpl.java
        FieldBoostMapFCListener.java
        FieldDateResolutionFCListener.java
        FieldDateResolutionMapAttribute.java
        FieldDateResolutionMapAttributeImpl.java
        FuzzyAttribute.java
        FuzzyAttributeImpl.java
        LocaleAttribute.java
        LocaleAttributeImpl.java
        LowercaseExpandedTermsAttribute.java
        LowercaseExpandedTermsAttributeImpl.java
        MultiFieldAttribute.java
        MultiFieldAttributeImpl.java
        MultiTermRewriteMethodAttribute.java
        MultiTermRewriteMethodAttributeImpl.java
        PositionIncrementsAttribute.java
        PositionIncrementsAttributeImpl.java
        RangeCollatorAttribute.java
        RangeCollatorAttributeImpl.java
        StandardQueryConfigHandler.java
        nodes
        BooleanModifierNode.java
        MultiPhraseQueryNode.java
        PrefixWildcardQueryNode.java
        RangeQueryNode.java
        StandardBooleanQueryNode.java
        WildcardQueryNode.java
        parser
        EscapeQuerySyntaxImpl.java
        JavaCharStream.java
        ParseException.java
        StandardSyntaxParser.java
        StandardSyntaxParserConstants.java
        StandardSyntaxParserTokenManager.java
        Token.java
        TokenMgrError.java
        processors
        AllowLeadingWildcardProcessor.java
        AnalyzerQueryNodeProcessor.java
        BooleanSingleChildOptimizationQueryNodeProcessor.java
        BoostQueryNodeProcessor.java
        DefaultPhraseSlopQueryNodeProcessor.java
        FuzzyQueryNodeProcessor.java
        GroupQueryNodeProcessor.java
        LowercaseExpandedTermsQueryNodeProcessor.java
        MatchAllDocsQueryNodeProcessor.java
        MultiFieldQueryNodeProcessor.java
        MultiTermRewriteMethodProcessor.java
        ParametricRangeQueryNodeProcessor.java
        PhraseSlopQueryNodeProcessor.java
        RemoveEmptyNonLeafQueryNodeProcessor.java
        StandardQueryNodeProcessorPipeline.java
        WildcardQueryNodeProcessor.java
        test
        org
        apache
        lucene
        queryParser
        core
        nodes
        TestQueryNode.java
        spans
        SpanOrQueryNodeBuilder.java
        SpanTermQueryNodeBuilder.java
        SpansQueryConfigHandler.java
        SpansQueryTreeBuilder.java
        SpansValidatorQueryNodeProcessor.java
        TestSpanQueryParser.java
        TestSpanQueryParserSimpleSample.java
        UniqueFieldAttribute.java
        UniqueFieldAttributeImpl.java
        UniqueFieldQueryNodeProcessor.java
        standard
        TestMultiAnalyzerQPHelper.java
        TestMultiAnalyzerWrapper.java
        TestMultiFieldQPHelper.java
        TestMultiFieldQueryParserWrapper.java
        TestQPHelper.java
        TestQueryParserWrapper.java
        regex
        src
        java
        org
        apache
        lucene
        search
        regex
        JakartaRegexpCapabilities.java
        JavaUtilRegexCapabilities.java
        RegexCapabilities.java
        RegexQuery.java
        RegexQueryCapable.java
        RegexTermEnum.java
        SpanRegexQuery.java
        regexp
        RegexpTunnel.java
        test
        org
        apache
        lucene
        search
        regex
        TestRegexQuery.java
        TestSpanRegexQuery.java
        remote
        src
        java
        org
        apache
        lucene
        search
        RMIRemoteSearchable.java
        RemoteCachingWrapperFilter.java
        RemoteSearchable.java
        test
        org
        apache
        lucene
        search
        RemoteCachingWrapperFilterHelper.java
        TestRemoteCachingWrapperFilter.java
        TestRemoteSearchable.java
        TestRemoteSort.java
        snowball
        src
        java
        org
        apache
        lucene
        analysis
        snowball
        SnowballAnalyzer.java
        SnowballFilter.java
        tartarus
        snowball
        Among.java
        SnowballProgram.java
        TestApp.java
        ext
        DanishStemmer.java
        DutchStemmer.java
        EnglishStemmer.java
        FinnishStemmer.java
        FrenchStemmer.java
        German2Stemmer.java
        GermanStemmer.java
        HungarianStemmer.java
        ItalianStemmer.java
        KpStemmer.java
        LovinsStemmer.java
        NorwegianStemmer.java
        PorterStemmer.java
        PortugueseStemmer.java
        RomanianStemmer.java
        RussianStemmer.java
        SpanishStemmer.java
        SwedishStemmer.java
        TurkishStemmer.java
        test
        org
        apache
        lucene
        analysis
        snowball
        TestSnowball.java
        spatial
        src
        java
        org
        apache
        lucene
        spatial
        geohash
        GeoHashDistanceFilter.java
        GeoHashUtils.java
        geometry
        CartesianPoint.java
        DistanceUnits.java
        FixedLatLng.java
        FloatLatLng.java
        LatLng.java
        shape
        DistanceApproximation.java
        Ellipse.java
        Geometry2D.java
        IntersectCase.java
        LLRect.java
        LineSegment.java
        Point2D.java
        Rectangle.java
        Vector2D.java
        tier
        CartesianPolyFilterBuilder.java
        CartesianShapeFilter.java
        DistanceFieldComparatorSource.java
        DistanceFilter.java
        DistanceHandler.java
        DistanceQueryBuilder.java
        DistanceUtils.java
        InvalidGeoException.java
        LatLongDistanceFilter.java
        Shape.java
        projections
        CartesianTierPlotter.java
        IProjector.java
        SinusoidalProjector.java
        test
        org
        apache
        lucene
        spatial
        tier
        DistanceCheck.java
        PolyShape.java
        TestCartesian.java
        TestCartesianShapeFilter.java
        TestDistance.java
        spellchecker
        src
        java
        org
        apache
        lucene
        search
        spell
        Dictionary.java
        JaroWinklerDistance.java
        LevensteinDistance.java
        LuceneDictionary.java
        NGramDistance.java
        PlainTextDictionary.java
        SpellChecker.java
        StringDistance.java
        SuggestWord.java
        SuggestWordQueue.java
        test
        org
        apache
        lucene
        search
        spell
        TestJaroWinklerDistance.java
        TestLevenshteinDistance.java
        TestLuceneDictionary.java
        TestNGramDistance.java
        TestPlainTextDictionary.java
        TestSpellChecker.java
        surround
        src
        java
        org
        apache
        lucene
        queryParser
        surround
        parser
        CharStream.java
        FastCharStream.java
        ParseException.java
        QueryParser.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        query
        AndQuery.java
        BasicQueryFactory.java
        ComposedQuery.java
        DistanceQuery.java
        DistanceSubQuery.java
        FieldsQuery.java
        NotQuery.java
        OrQuery.java
        SimpleTerm.java
        SpanNearClauseFactory.java
        SrndBooleanQuery.java
        SrndPrefixQuery.java
        SrndQuery.java
        SrndTermQuery.java
        SrndTruncQuery.java
        TooManyBasicQueries.java
        test
        org
        apache
        lucene
        queryParser
        surround
        query
        BooleanQueryTst.java
        ExceptionQueryTst.java
        SingleFieldTestDb.java
        Test01Exceptions.java
        Test02Boolean.java
        Test03Distance.java
        swing
        src
        java
        org
        apache
        lucene
        swing
        models
        ListSearcher.java
        TableSearcher.java
        test
        org
        apache
        lucene
        swing
        models
        BaseListModel.java
        BaseTableModel.java
        DataStore.java
        ListSearcherSimulator.java
        RestaurantInfo.java
        TableSearcherSimulator.java
        TestBasicList.java
        TestBasicTable.java
        TestSearchingList.java
        TestSearchingTable.java
        TestUpdatingList.java
        TestUpdatingTable.java
        wikipedia
        src
        java
        org
        apache
        lucene
        wikipedia
        analysis
        WikipediaTokenizer.java
        WikipediaTokenizerImpl.java
        test
        org
        apache
        lucene
        wikipedia
        analysis
        WikipediaTokenizerTest.java
        wordnet
        src
        java
        org
        apache
        lucene
        wordnet
        AnalyzerUtil.java
        SynExpand.java
        SynLookup.java
        SynonymMap.java
        SynonymTokenFilter.java
        Syns2Index.java
        test
        org
        apache
        lucene
        wordnet
        TestSynonymTokenFilter.java
        TestWordnet.java
        xml-query-parser
        src
        demo
        java
        org
        apache
        lucene
        xmlparser
        webdemo
        FormBasedXmlQueryDemo.java
        java
        org
        apache
        lucene
        xmlparser
        CoreParser.java
        CorePlusExtensionsParser.java
        DOMUtils.java
        FilterBuilder.java
        FilterBuilderFactory.java
        ParserException.java
        QueryBuilder.java
        QueryBuilderFactory.java
        QueryTemplateManager.java
        builders
        BooleanFilterBuilder.java
        BooleanQueryBuilder.java
        BoostingQueryBuilder.java
        BoostingTermBuilder.java
        CachedFilterBuilder.java
        ConstantScoreQueryBuilder.java
        DuplicateFilterBuilder.java
        FilteredQueryBuilder.java
        FuzzyLikeThisQueryBuilder.java
        LikeThisQueryBuilder.java
        MatchAllDocsQueryBuilder.java
        RangeFilterBuilder.java
        SpanBuilderBase.java
        SpanFirstBuilder.java
        SpanNearBuilder.java
        SpanNotBuilder.java
        SpanOrBuilder.java
        SpanOrTermsBuilder.java
        SpanQueryBuilder.java
        SpanQueryBuilderFactory.java
        SpanTermBuilder.java
        TermQueryBuilder.java
        TermsFilterBuilder.java
        TermsQueryBuilder.java
        UserInputQueryBuilder.java
        test
        org
        apache
        lucene
        xmlparser
        TestParser.java
        TestQueryTemplateManager.java
      - src
        demo
        org
        apache
        lucene
        demo
        DeleteFiles.java
        FileDocument.java
        HTMLDocument.java
        IndexFiles.java
        IndexHTML.java
        SearchFiles.java
        html
        Entities.java
        HTMLParser.java
        HTMLParserConstants.java
        HTMLParserTokenManager.java
        ParseException.java
        ParserThread.java
        SimpleCharStream.java
        Tags.java
        Test.java
        Token.java
        TokenMgrError.java
        java
        org
        apache
        lucene
        LucenePackage.java
        analysis
        ASCIIFoldingFilter.java
        Analyzer.java
        BaseCharFilter.java
        CachingTokenFilter.java
        CharArraySet.java
        CharFilter.java
        CharReader.java
        CharStream.java
        CharTokenizer.java
        ISOLatin1AccentFilter.java
        KeywordAnalyzer.java
        KeywordTokenizer.java
        LengthFilter.java
        LetterTokenizer.java
        LowerCaseFilter.java
        LowerCaseTokenizer.java
        MappingCharFilter.java
        NormalizeCharMap.java
        NumericTokenStream.java
        PerFieldAnalyzerWrapper.java
        PorterStemFilter.java
        PorterStemmer.java
        SimpleAnalyzer.java
        StopAnalyzer.java
        StopFilter.java
        TeeSinkTokenFilter.java
        Token.java
        TokenFilter.java
        TokenStream.java
        Tokenizer.java
        WhitespaceAnalyzer.java
        WhitespaceTokenizer.java
        WordlistLoader.java
        standard
        StandardAnalyzer.java
        StandardFilter.java
        StandardTokenizer.java
        StandardTokenizerImpl.java
        tokenattributes
        FlagsAttribute.java
        FlagsAttributeImpl.java
        OffsetAttribute.java
        OffsetAttributeImpl.java
        PayloadAttribute.java
        PayloadAttributeImpl.java
        PositionIncrementAttribute.java
        PositionIncrementAttributeImpl.java
        TermAttribute.java
        TermAttributeImpl.java
        TypeAttribute.java
        TypeAttributeImpl.java
        document
        AbstractField.java
        CompressionTools.java
        DateField.java
        DateTools.java
        Document.java
        Field.java
        FieldSelector.java
        FieldSelectorResult.java
        Fieldable.java
        LoadFirstFieldSelector.java
        MapFieldSelector.java
        NumberTools.java
        NumericField.java
        SetBasedFieldSelector.java
        index
        AbstractAllTermDocs.java
        AllTermDocs.java
        BufferedDeletes.java
        ByteBlockPool.java
        ByteSliceReader.java
        ByteSliceWriter.java
        CharBlockPool.java
        CheckIndex.java
        CompoundFileReader.java
        CompoundFileWriter.java
        ConcurrentMergeScheduler.java
        CorruptIndexException.java
        DefaultSkipListReader.java
        DefaultSkipListWriter.java
        DirectoryReader.java
        DocConsumer.java
        DocConsumerPerThread.java
        DocFieldConsumer.java
        DocFieldConsumerPerField.java
        DocFieldConsumerPerThread.java
        DocFieldConsumers.java
        DocFieldConsumersPerField.java
        DocFieldConsumersPerThread.java
        DocFieldProcessor.java
        DocFieldProcessorPerField.java
        DocFieldProcessorPerThread.java
        DocInverter.java
        DocInverterPerField.java
        DocInverterPerThread.java
        DocumentsWriter.java
        DocumentsWriterThreadState.java
        FieldInfo.java
        FieldInfos.java
        FieldInvertState.java
        FieldReaderException.java
        FieldSortedTermVectorMapper.java
        FieldsReader.java
        FieldsWriter.java
        FilterIndexReader.java
        FormatPostingsDocsConsumer.java
        FormatPostingsDocsWriter.java
        FormatPostingsFieldsConsumer.java
        FormatPostingsFieldsWriter.java
        FormatPostingsPositionsConsumer.java
        FormatPostingsPositionsWriter.java
        FormatPostingsTermsConsumer.java
        FormatPostingsTermsWriter.java
        FreqProxFieldMergeState.java
        FreqProxTermsWriter.java
        FreqProxTermsWriterPerField.java
        FreqProxTermsWriterPerThread.java
        IndexCommit.java
        IndexDeletionPolicy.java
        IndexFileDeleter.java
        IndexFileNameFilter.java
        IndexFileNames.java
        IndexReader.java
        IndexWriter.java
        IntBlockPool.java
        InvertedDocConsumer.java
        InvertedDocConsumerPerField.java
        InvertedDocConsumerPerThread.java
        InvertedDocEndConsumer.java
        InvertedDocEndConsumerPerField.java
        InvertedDocEndConsumerPerThread.java
        KeepOnlyLastCommitDeletionPolicy.java
        LogByteSizeMergePolicy.java
        LogDocMergePolicy.java
        LogMergePolicy.java
        MergeDocIDRemapper.java
        MergePolicy.java
        MergeScheduler.java
        MultiLevelSkipListReader.java
        MultiLevelSkipListWriter.java
        MultiReader.java
        MultipleTermPositions.java
        NormsWriter.java
        NormsWriterPerField.java
        NormsWriterPerThread.java
        ParallelReader.java
        Payload.java
        PositionBasedTermVectorMapper.java
        RawPostingList.java
        ReadOnlyDirectoryReader.java
        ReadOnlySegmentReader.java
        ReusableStringReader.java
        SegmentInfo.java
        SegmentInfos.java
        SegmentMergeInfo.java
        SegmentMergeQueue.java
        SegmentMerger.java
        SegmentReader.java
        SegmentTermDocs.java
        SegmentTermEnum.java
        SegmentTermPositionVector.java
        SegmentTermPositions.java
        SegmentTermVector.java
        SegmentWriteState.java
        SerialMergeScheduler.java
        SnapshotDeletionPolicy.java
        SortedTermVectorMapper.java
        StaleReaderException.java
        StoredFieldsWriter.java
        StoredFieldsWriterPerThread.java
        Term.java
        TermBuffer.java
        TermDocs.java
        TermEnum.java
        TermFreqVector.java
        TermInfo.java
        TermInfosReader.java
        TermInfosWriter.java
        TermPositionVector.java
        TermPositions.java
        TermVectorEntry.java
        TermVectorEntryFreqSortedComparator.java
        TermVectorMapper.java
        TermVectorOffsetInfo.java
        TermVectorsReader.java
        TermVectorsTermsWriter.java
        TermVectorsTermsWriterPerField.java
        TermVectorsTermsWriterPerThread.java
        TermVectorsWriter.java
        TermsHash.java
        TermsHashConsumer.java
        TermsHashConsumerPerField.java
        TermsHashConsumerPerThread.java
        TermsHashPerField.java
        TermsHashPerThread.java
        messages
        Message.java
        MessageImpl.java
        NLS.java
        NLSException.java
        queryParser
        CharStream.java
        FastCharStream.java
        MultiFieldQueryParser.java
        ParseException.java
        QueryParser.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        search
        BooleanClause.java
        BooleanQuery.java
        BooleanScorer.java
        BooleanScorer2.java
        CachingSpanFilter.java
        CachingWrapperFilter.java
        Collector.java
        ComplexExplanation.java
        ConjunctionScorer.java
        ConstantScoreQuery.java
        DefaultSimilarity.java
        DisjunctionMaxQuery.java
        DisjunctionMaxScorer.java
        DisjunctionSumScorer.java
        DocIdSet.java
        DocIdSetIterator.java
        ExactPhraseScorer.java
        Explanation.java
        FieldCache.java
        FieldCacheImpl.java
        FieldCacheRangeFilter.java
        FieldCacheTermsFilter.java
        FieldComparator.java
        FieldComparatorSource.java
        FieldDoc.java
        FieldDocSortedHitQueue.java
        FieldValueHitQueue.java
        Filter.java
        FilterManager.java
        FilteredDocIdSet.java
        FilteredDocIdSetIterator.java
        FilteredQuery.java
        FilteredTermEnum.java
        FuzzyQuery.java
        FuzzyTermEnum.java
        HitQueue.java
        IndexSearcher.java
        MatchAllDocsQuery.java
        MultiPhraseQuery.java
        MultiSearcher.java
        MultiTermQuery.java
        MultiTermQueryWrapperFilter.java
        NumericRangeFilter.java
        NumericRangeQuery.java
        ParallelMultiSearcher.java
        PhrasePositions.java
        PhraseQuery.java
        PhraseQueue.java
        PhraseScorer.java
        PositiveScoresOnlyCollector.java
        PrefixFilter.java
        PrefixQuery.java
        PrefixTermEnum.java
        Query.java
        QueryTermVector.java
        QueryWrapperFilter.java
        ReqExclScorer.java
        ReqOptSumScorer.java
        ScoreCachingWrappingScorer.java
        ScoreDoc.java
        Scorer.java
        Searchable.java
        Searcher.java
        Similarity.java
        SimilarityDelegator.java
        SingleTermEnum.java
        SloppyPhraseScorer.java
        Sort.java
        SortField.java
        SpanFilter.java
        SpanFilterResult.java
        SpanQueryFilter.java
        TermQuery.java
        TermRangeFilter.java
        TermRangeQuery.java
        TermRangeTermEnum.java
        TermScorer.java
        TimeLimitingCollector.java
        TopDocs.java
        TopDocsCollector.java
        TopFieldCollector.java
        TopFieldDocs.java
        TopScoreDocCollector.java
        Weight.java
        WildcardQuery.java
        WildcardTermEnum.java
        function
        ByteFieldSource.java
        CustomScoreProvider.java
        CustomScoreQuery.java
        DocValues.java
        FieldCacheSource.java
        FieldScoreQuery.java
        FloatFieldSource.java
        IntFieldSource.java
        OrdFieldSource.java
        ReverseOrdFieldSource.java
        ShortFieldSource.java
        ValueSource.java
        ValueSourceQuery.java
        payloads
        AveragePayloadFunction.java
        MaxPayloadFunction.java
        MinPayloadFunction.java
        PayloadFunction.java
        PayloadNearQuery.java
        PayloadSpanUtil.java
        PayloadTermQuery.java
        spans
        FieldMaskingSpanQuery.java
        NearSpansOrdered.java
        NearSpansUnordered.java
        SpanFirstQuery.java
        SpanNearQuery.java
        SpanNotQuery.java
        SpanOrQuery.java
        SpanQuery.java
        SpanScorer.java
        SpanTermQuery.java
        SpanWeight.java
        Spans.java
        TermSpans.java
        store
        AlreadyClosedException.java
        BufferedIndexInput.java
        BufferedIndexOutput.java
        ChecksumIndexInput.java
        ChecksumIndexOutput.java
        Directory.java
        FSDirectory.java
        FSLockFactory.java
        FileSwitchDirectory.java
        IndexInput.java
        IndexOutput.java
        Lock.java
        LockFactory.java
        LockObtainFailedException.java
        LockReleaseFailedException.java
        LockStressTest.java
        LockVerifyServer.java
        MMapDirectory.java
        NIOFSDirectory.java
        NativeFSLockFactory.java
        NoLockFactory.java
        NoSuchDirectoryException.java
        RAMDirectory.java
        RAMFile.java
        RAMInputStream.java
        RAMOutputStream.java
        SimpleFSDirectory.java
        SimpleFSLockFactory.java
        SingleInstanceLockFactory.java
        VerifyingLockFactory.java
        util
        ArrayUtil.java
        Attribute.java
        AttributeImpl.java
        AttributeSource.java
        AverageGuessMemoryModel.java
        BitUtil.java
        BitVector.java
        CloseableThreadLocal.java
        Constants.java
        DocIdBitSet.java
        DummyConcurrentLock.java
        FieldCacheSanityChecker.java
        IndexableBinaryStringTools.java
        MapOfSets.java
        MemoryModel.java
        NamedThreadFactory.java
        NumericUtils.java
        OpenBitSet.java
        OpenBitSetDISI.java
        OpenBitSetIterator.java
        Parameter.java
        PriorityQueue.java
        RamUsageEstimator.java
        ReaderUtil.java
        ScorerDocQueue.java
        SimpleStringInterner.java
        SmallFloat.java
        SortedVIntList.java
        SorterTemplate.java
        StringHelper.java
        StringInterner.java
        ThreadInterruptedException.java
        ToStringUtils.java
        UnicodeUtil.java
        Version.java
        cache
        Cache.java
        SimpleLRUCache.java
        SimpleMapCache.java
        test
        org
        apache
        lucene
        TestDemo.java
        TestMergeSchedulerExternal.java
        TestSearch.java
        TestSearchForDuplicates.java
        analysis
        BaseTokenStreamTestCase.java
        TestASCIIFoldingFilter.java
        TestAnalyzers.java
        TestCachingTokenFilter.java
        TestCharArraySet.java
        TestCharFilter.java
        TestISOLatin1AccentFilter.java
        TestKeywordAnalyzer.java
        TestLengthFilter.java
        TestMappingCharFilter.java
        TestNumericTokenStream.java
        TestPerFieldAnalzyerWrapper.java
        TestStandardAnalyzer.java
        TestStopAnalyzer.java
        TestStopFilter.java
        TestTeeSinkTokenFilter.java
        TestToken.java
        tokenattributes
        TestSimpleAttributeImpls.java
        TestTermAttributeImpl.java
        document
        TestBinaryDocument.java
        TestDateTools.java
        TestDocument.java
        TestNumberTools.java
        index
        DocHelper.java
        MockIndexInput.java
        TestAddIndexesNoOptimize.java
        TestAtomicUpdate.java
        TestBackwardsCompatibility.java
        TestByteSlices.java
        TestCheckIndex.java
        TestCompoundFile.java
        TestConcurrentMergeScheduler.java
        TestCrash.java
        TestDeletionPolicy.java
        TestDirectoryReader.java
        TestDoc.java
        TestDocumentWriter.java
        TestFieldInfos.java
        TestFieldsReader.java
        TestFilterIndexReader.java
        TestIndexCommit.java
        TestIndexFileDeleter.java
        TestIndexInput.java
        TestIndexReader.java
        TestIndexReaderClone.java
        TestIndexReaderCloneNorms.java
        TestIndexReaderReopen.java
        TestIndexWriter.java
        TestIndexWriterDelete.java
        TestIndexWriterExceptions.java
        TestIndexWriterLockRelease.java
        TestIndexWriterMergePolicy.java
        TestIndexWriterMerging.java
        TestIndexWriterReader.java
        TestIsCurrent.java
        TestLazyBug.java
        TestLazyProxSkipping.java
        TestMultiLevelSkipList.java
        TestMultiReader.java
        TestNRTReaderWithThreads.java
        TestNewestSegment.java
        TestNorms.java
        TestOmitTf.java
        TestParallelReader.java
        TestParallelReaderEmptyIndex.java
        TestParallelTermEnum.java
        TestPayloads.java
        TestPositionBasedTermVectorMapper.java
        TestRollback.java
        TestSegmentMerger.java
        TestSegmentReader.java
        TestSegmentTermDocs.java
        TestSegmentTermEnum.java
        TestSnapshotDeletionPolicy.java
        TestStressIndexing.java
        TestStressIndexing2.java
        TestTerm.java
        TestTermVectorsReader.java
        TestTermdocPerf.java
        TestThreadedOptimize.java
        TestTransactionRollback.java
        TestTransactions.java
        TestWordlistLoader.java
        messages
        MessagesTestBundle.java
        TestNLS.java
        queryParser
        TestMultiAnalyzer.java
        TestMultiFieldQueryParser.java
        TestQueryParser.java
        search
        BaseTestRangeFilter.java
        CachingWrapperFilterHelper.java
        CheckHits.java
        JustCompileSearch.java
        MockFilter.java
        QueryUtils.java
        SingleDocTestFilter.java
        TestBoolean2.java
        TestBooleanMinShouldMatch.java
        TestBooleanOr.java
        TestBooleanPrefixQuery.java
        TestBooleanQuery.java
        TestBooleanScorer.java
        TestCachingSpanFilter.java
        TestCachingWrapperFilter.java
        TestComplexExplanations.java
        TestComplexExplanationsOfNonMatches.java
        TestCustomSearcherSort.java
        TestDateFilter.java
        TestDateSort.java
        TestDisjunctionMaxQuery.java
        TestDocBoost.java
        TestDocIdSet.java
        TestElevationComparator.java
        TestExplanations.java
        TestFieldCache.java
        TestFieldCacheRangeFilter.java
        TestFieldCacheTermsFilter.java
        TestFilteredQuery.java
        TestFilteredSearch.java
        TestFuzzyQuery.java
        TestMatchAllDocsQuery.java
        TestMultiPhraseQuery.java
        TestMultiSearcher.java
        TestMultiSearcherRanking.java
        TestMultiTermConstantScore.java
        TestMultiThreadTermVectors.java
        TestMultiValuedNumericRangeQuery.java
        TestNot.java
        TestNumericRangeQuery32.java
        TestNumericRangeQuery64.java
        TestParallelMultiSearcher.java
        TestPhrasePrefixQuery.java
        TestPhraseQuery.java
        TestPositionIncrement.java
        TestPositiveScoresOnlyCollector.java
        TestPrefixFilter.java
        TestPrefixInBooleanQuery.java
        TestPrefixQuery.java
        TestQueryTermVector.java
        TestQueryWrapperFilter.java
        TestScoreCachingWrappingScorer.java
        TestScorerPerf.java
        TestSetNorm.java
        TestSimilarity.java
        TestSimpleExplanations.java
        TestSimpleExplanationsOfNonMatches.java
        TestSloppyPhraseQuery.java
        TestSort.java
        TestSpanQueryFilter.java
        TestTermRangeFilter.java
        TestTermRangeQuery.java
        TestTermScorer.java
        TestTermVectors.java
        TestThreadSafe.java
        TestTimeLimitingCollector.java
        TestTopDocsCollector.java
        TestTopScoreDocCollector.java
        TestWildcard.java
        function
        FunctionTestSetup.java
        JustCompileSearchSpans.java
        TestCustomScoreQuery.java
        TestDocValues.java
        TestFieldScoreQuery.java
        TestOrdValues.java
        payloads
        PayloadHelper.java
        TestPayloadNearQuery.java
        TestPayloadTermQuery.java
        spans
        JustCompileSearchSpans.java
        TestBasics.java
        TestFieldMaskingSpanQuery.java
        TestNearSpansOrdered.java
        TestPayloadSpans.java
        TestSpanExplanations.java
        TestSpanExplanationsOfNonMatches.java
        TestSpans.java
        TestSpansAdvanced.java
        TestSpansAdvanced2.java
        store
        MockRAMDirectory.java
        MockRAMInputStream.java
        MockRAMOutputStream.java
        TestBufferedIndexInput.java
        TestDirectory.java
        TestFileSwitchDirectory.java
        TestHugeRamFile.java
        TestLock.java
        TestLockFactory.java
        TestMultiMMap.java
        TestRAMDirectory.java
        TestWindowsMMap.java
        _TestHelper.java
        util
        ArrayUtilTest.java
        English.java
        LocalizedTestCase.java
        LuceneTestCase.java
        TestAttributeSource.java
        TestBitVector.java
        TestCloseableThreadLocal.java
        TestFieldCacheSanityChecker.java
        TestIndexableBinaryStringTools.java
        TestNumericUtils.java
        TestOpenBitSet.java
        TestPriorityQueue.java
        TestRamUsageEstimator.java
        TestSmallFloat.java
        TestSortedVIntList.java
        TestStringHelper.java
        TestStringIntern.java
        TestVersion.java
        _TestUtil.java
        cache
        TestSimpleLRUCache.java
- source
  - com
    - partydj
  - org
    - cmc
      - music
        clean
        Diacriticals.java
        MetadataCleanup.java
        NameReversalFilter.java
        RenamingFileFilter.java
        common
        ID3Exception.java
        ID3FrameType.java
        ID3ReadException.java
        ID3WriteException.java
        ID3v1Genre.java
        fs
        ParsedFilename.java
        SongFilenameParser.java
        metadata
        IMusicMetadata.java
        ImageData.java
        MusicMetadata.java
        MusicMetadataAttribute.java
        MusicMetadataConstants.java
        MusicMetadataSet.java
        UnknownUserTextValue.java
        myid3
        ID3Tag.java
        MyID3.java
        MyID3Listener.java
        TagFormat.java
        UnicodeMetrics.java
        examples
        ListenerAndFilterExample.java
        SampleUsage.java
        id3v1
        MyID3v1.java
        MyID3v1Constants.java
        id3v2
        ID3v2FrameFlags.java
        ID3v2FrameTranslation.java
        ID3v2OutputFrame.java
        IFrameFactory.java
        MyID3v2.java
        MyID3v2Constants.java
        MyID3v2Frame.java
        MyID3v2FrameData.java
        MyID3v2FrameImage.java
        MyID3v2FrameText.java
        MyID3v2Read.java
        MyID3v2Write.java
        util
        BasicConstants.java
        Debug.java
        FSTraversal.java
        FileComparator.java
        FileFilter.java
        FileIO.java
        FileUtils.java
        MyComparator.java
        MyFileSystem.java
        MyMap.java
        SimpleMap.java
        TextUtils.java

/**
 * Copyright 2004-2005 The Apache Software Foundation.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.apache.lucene.search.similar;

import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintStream;
import java.io.Reader;
import java.io.StringReader;
import java.net.URL;
import java.util.ArrayList;
import java.util.Collection;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.Set;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.tokenattributes.TermAttribute;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.index.TermFreqVector;
import org.apache.lucene.search.BooleanClause;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.DefaultSimilarity;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Similarity;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.PriorityQueue;
import org.apache.lucene.util.Version;


/**
 * Generate "more like this" similarity queries. 
 * Based on this mail:
 * <code><pre>
 * Lucene does let you access the document frequency of terms, with IndexReader.docFreq().
 * Term frequencies can be computed by re-tokenizing the text, which, for a single document,
 * is usually fast enough.  But looking up the docFreq() of every term in the document is
 * probably too slow.
 * 
 * You can use some heuristics to prune the set of terms, to avoid calling docFreq() too much,
 * or at all.  Since you're trying to maximize a tf*idf score, you're probably most interested
 * in terms with a high tf. Choosing a tf threshold even as low as two or three will radically
 * reduce the number of terms under consideration.  Another heuristic is that terms with a
 * high idf (i.e., a low df) tend to be longer.  So you could threshold the terms by the
 * number of characters, not selecting anything less than, e.g., six or seven characters.
 * With these sorts of heuristics you can usually find small set of, e.g., ten or fewer terms
 * that do a pretty good job of characterizing a document.
 * 
 * It all depends on what you're trying to do.  If you're trying to eek out that last percent
 * of precision and recall regardless of computational difficulty so that you can win a TREC
 * competition, then the techniques I mention above are useless.  But if you're trying to
 * provide a "more like this" button on a search results page that does a decent job and has
 * good performance, such techniques might be useful.
 * 
 * An efficient, effective "more-like-this" query generator would be a great contribution, if
 * anyone's interested.  I'd imagine that it would take a Reader or a String (the document's
 * text), analyzer Analyzer, and return a set of representative terms using heuristics like those
 * above.  The frequency and length thresholds could be parameters, etc.
 * 
 * Doug
 * </pre></code>
 *
 *
 * <p>
 * <h3>Initial Usage</h3>
 *
 * This class has lots of options to try to make it efficient and flexible.
 * See the body of {@link #main main()} below in the source for real code, or
 * if you want pseudo code, the simplest possible usage is as follows. The bold
 * fragment is specific to this class.
 *
 * <code><pre>
 *
 * IndexReader ir = ...
 * IndexSearcher is = ...
 * <b>
 * MoreLikeThis mlt = new MoreLikeThis(ir);
 * Reader target = ... </b><em>// orig source of doc you want to find similarities to</em><b>
 * Query query = mlt.like( target);
 * </b>
 * Hits hits = is.search(query);
 * <em>// now the usual iteration thru 'hits' - the only thing to watch for is to make sure
 * you ignore the doc if it matches your 'target' document, as it should be similar to itself </em>
 *
 * </pre></code>
 *
 * Thus you:
 * <ol>
 * <li> do your normal, Lucene setup for searching,
 * <li> create a MoreLikeThis,
 * <li> get the text of the doc you want to find similarities to
 * <li> then call one of the like() calls to generate a similarity query
 * <li> call the searcher to find the similar docs
 * </ol>
 *
 * <h3>More Advanced Usage</h3>
 *
 * You may want to use {@link #setFieldNames setFieldNames(...)} so you can examine
 * multiple fields (e.g. body and title) for similarity.
 * <p>
 *
 * Depending on the size of your index and the size and makeup of your documents you
 * may want to call the other set methods to control how the similarity queries are
 * generated:
 * <ul>
 * <li> {@link #setMinTermFreq setMinTermFreq(...)}
 * <li> {@link #setMinDocFreq setMinDocFreq(...)}
 * <li> {@link #setMaxDocFreq setMaxDocFreq(...)}
 * <li> {@link #setMaxDocFreqPct setMaxDocFreqPct(...)}
 * <li> {@link #setMinWordLen setMinWordLen(...)}
 * <li> {@link #setMaxWordLen setMaxWordLen(...)}
 * <li> {@link #setMaxQueryTerms setMaxQueryTerms(...)}
 * <li> {@link #setMaxNumTokensParsed setMaxNumTokensParsed(...)}
 * <li> {@link #setStopWords setStopWord(...)} 
 * </ul> 
 *
 * <hr>
 * <pre>
 * Changes: Mark Harwood 29/02/04
 * Some bugfixing, some refactoring, some optimisation.
 *  - bugfix: retrieveTerms(int docNum) was not working for indexes without a termvector -added missing code
 *  - bugfix: No significant terms being created for fields with a termvector - because 
 *            was only counting one occurrence per term/field pair in calculations(ie not including frequency info from TermVector) 
 *  - refactor: moved common code into isNoiseWord()
 *  - optimise: when no termvector support available - used maxNumTermsParsed to limit amount of tokenization
 * </pre>
 *
 */
public final class MoreLikeThis {

	/**
	 * Default maximum number of tokens to parse in each example doc field that is not stored with TermVector support.
	 * @see #getMaxNumTokensParsed
	 */
    public static final int DEFAULT_MAX_NUM_TOKENS_PARSED=5000;
       

	/**
     * Default analyzer to parse source doc with.
	 * @see #getAnalyzer
     */
    public static final Analyzer DEFAULT_ANALYZER = new StandardAnalyzer(Version.LUCENE_CURRENT);

    /**
     * Ignore terms with less than this frequency in the source doc.
	 * @see #getMinTermFreq
	 * @see #setMinTermFreq	 
     */
    public static final int DEFAULT_MIN_TERM_FREQ = 2;

    /**
     * Ignore words which do not occur in at least this many docs.
	 * @see #getMinDocFreq
	 * @see #setMinDocFreq	 
     */
    public static final int DEFAULT_MIN_DOC_FREQ = 5;

    /**
     * Ignore words which occur in more than this many docs.
	 * @see #getMaxDocFreq
	 * @see #setMaxDocFreq	 
	 * @see #setMaxDocFreqPct	 
     */
    public static final int DEFAULT_MAX_DOC_FREQ = Integer.MAX_VALUE;
    
    /**
     * Boost terms in query based on score.
	 * @see #isBoost
	 * @see #setBoost 
     */
    public static final boolean DEFAULT_BOOST = false;

    /**
     * Default field names. Null is used to specify that the field names should be looked
     * up at runtime from the provided reader.
     */
    public static final String[] DEFAULT_FIELD_NAMES = new String[] { "contents"};

    /**
     * Ignore words less than this length or if 0 then this has no effect.
	 * @see #getMinWordLen
	 * @see #setMinWordLen	 
     */
    public static final int DEFAULT_MIN_WORD_LENGTH = 0;

    /**
     * Ignore words greater than this length or if 0 then this has no effect.
	 * @see #getMaxWordLen
	 * @see #setMaxWordLen	 
     */
    public static final int DEFAULT_MAX_WORD_LENGTH = 0;

	/**
	 * Default set of stopwords.
	 * If null means to allow stop words.
	 *
	 * @see #setStopWords
	 * @see #getStopWords
	 */
	public static final Set<?> DEFAULT_STOP_WORDS = null;

	/**
	 * Current set of stop words.
	 */
	private Set<?> stopWords = DEFAULT_STOP_WORDS;

    /**
     * Return a Query with no more than this many terms.
     *
     * @see BooleanQuery#getMaxClauseCount
	 * @see #getMaxQueryTerms
	 * @see #setMaxQueryTerms	 
     */
    public static final int DEFAULT_MAX_QUERY_TERMS = 25;

    /**
     * Analyzer that will be used to parse the doc.
     */
    private Analyzer analyzer = DEFAULT_ANALYZER;

    /**
     * Ignore words less frequent that this.
     */
    private int minTermFreq = DEFAULT_MIN_TERM_FREQ;

    /**
     * Ignore words which do not occur in at least this many docs.
     */
    private int minDocFreq = DEFAULT_MIN_DOC_FREQ;

	/**
     * Ignore words which occur in more than this many docs.
	 */
	private int maxDocFreq = DEFAULT_MAX_DOC_FREQ;
    
    /**
     * Should we apply a boost to the Query based on the scores?
     */
    private boolean boost = DEFAULT_BOOST;

    /**
     * Field name we'll analyze.
     */
    private String[] fieldNames = DEFAULT_FIELD_NAMES;

	/**
	 * The maximum number of tokens to parse in each example doc field that is not stored with TermVector support
	 */
	private int maxNumTokensParsed=DEFAULT_MAX_NUM_TOKENS_PARSED;   
    


    /**
     * Ignore words if less than this len.
     */
    private int minWordLen = DEFAULT_MIN_WORD_LENGTH;

    /**
     * Ignore words if greater than this len.
     */
    private int maxWordLen = DEFAULT_MAX_WORD_LENGTH;

    /**
     * Don't return a query longer than this.
     */
    private int maxQueryTerms = DEFAULT_MAX_QUERY_TERMS;

    /**
     * For idf() calculations.
     */
    private Similarity similarity;// = new DefaultSimilarity();

    /**
     * IndexReader to use
     */
    private final IndexReader ir;

    /**
     * Boost factor to use when boosting the terms
     */
    private float boostFactor = 1;

    /**
     * Returns the boost factor used when boosting terms
     * @return the boost factor used when boosting terms
     */
    public float getBoostFactor() {
        return boostFactor;
    }

    /**
     * Sets the boost factor to use when boosting terms
     * @param boostFactor
     */
    public void setBoostFactor(float boostFactor) {
        this.boostFactor = boostFactor;
    }

    /**
     * Constructor requiring an IndexReader.
     */
    public MoreLikeThis(IndexReader ir) {
        this(ir, new DefaultSimilarity());
    }

    public MoreLikeThis(IndexReader ir, Similarity sim){
      this.ir = ir;
      this.similarity = sim;
    }


  public Similarity getSimilarity() {
    return similarity;
  }

  public void setSimilarity(Similarity similarity) {
    this.similarity = similarity;
  }

  /**
     * Returns an analyzer that will be used to parse source doc with. The default analyzer
     * is the {@link #DEFAULT_ANALYZER}.
     *
     * @return the analyzer that will be used to parse source doc with.
	 * @see #DEFAULT_ANALYZER
     */
    public Analyzer getAnalyzer() {
        return analyzer;
    }

    /**
     * Sets the analyzer to use. An analyzer is not required for generating a query with the
     * {@link #like(int)} method, all other 'like' methods require an analyzer.
     *
     * @param analyzer the analyzer to use to tokenize text.
     */
    public void setAnalyzer(Analyzer analyzer) {
        this.analyzer = analyzer;
    }

    /**
     * Returns the frequency below which terms will be ignored in the source doc. The default
     * frequency is the {@link #DEFAULT_MIN_TERM_FREQ}.
     *
     * @return the frequency below which terms will be ignored in the source doc.
     */
    public int getMinTermFreq() {
        return minTermFreq;
    }

    /**
     * Sets the frequency below which terms will be ignored in the source doc.
     *
     * @param minTermFreq the frequency below which terms will be ignored in the source doc.
     */
    public void setMinTermFreq(int minTermFreq) {
        this.minTermFreq = minTermFreq;
    }

    /**
     * Returns the frequency at which words will be ignored which do not occur in at least this
     * many docs. The default frequency is {@link #DEFAULT_MIN_DOC_FREQ}.
     *
     * @return the frequency at which words will be ignored which do not occur in at least this
     * many docs.
     */
    public int getMinDocFreq() {
        return minDocFreq;
    }

    /**
     * Sets the frequency at which words will be ignored which do not occur in at least this
     * many docs.
     *
     * @param minDocFreq the frequency at which words will be ignored which do not occur in at
     * least this many docs.
     */
    public void setMinDocFreq(int minDocFreq) {
        this.minDocFreq = minDocFreq;
    }

    /**
     * Returns the maximum frequency in which words may still appear. 
     * Words that appear in more than this many docs will be ignored. The default frequency is 
     * {@link #DEFAULT_MAX_DOC_FREQ}.
     *
     * @return get the maximum frequency at which words are still allowed,  
     * words which occur in more docs than this are ignored.
     */
    public int getMaxDocFreq() {
        return maxDocFreq;
    }

	/**
     * Set the maximum frequency in which words may still appear. Words that appear
     * in more than this many docs will be ignored.
	 * 
	 * @param maxFreq
	 *            the maximum count of documents that a term may appear 
	 *            in to be still considered relevant
	 */
	public void setMaxDocFreq(int maxFreq) {
		this.maxDocFreq = maxFreq;
	}

	/**
     * Set the maximum percentage in which words may still appear. Words that appear
     * in more than this many percent of all docs will be ignored.
	 * 
	 * @param maxPercentage
	 *            the maximum percentage of documents (0-100) that a term may appear 
	 *            in to be still considered relevant
	 */
	public void setMaxDocFreqPct(int maxPercentage) {
		this.maxDocFreq = maxPercentage * ir.numDocs() / 100;
	}

	
    /**
     * Returns whether to boost terms in query based on "score" or not. The default is
     * {@link #DEFAULT_BOOST}.
     *
     * @return whether to boost terms in query based on "score" or not.
	 * @see #setBoost
     */
    public boolean isBoost() {
        return boost;
    }

    /**
     * Sets whether to boost terms in query based on "score" or not.
     *
     * @param boost true to boost terms in query based on "score", false otherwise.
	 * @see #isBoost
     */
    public void setBoost(boolean boost) {
        this.boost = boost;
    }

    /**
     * Returns the field names that will be used when generating the 'More Like This' query.
     * The default field names that will be used is {@link #DEFAULT_FIELD_NAMES}.
     *
     * @return the field names that will be used when generating the 'More Like This' query.
     */
    public String[] getFieldNames() {
        return fieldNames;
    }

    /**
     * Sets the field names that will be used when generating the 'More Like This' query.
     * Set this to null for the field names to be determined at runtime from the IndexReader
     * provided in the constructor.
     *
     * @param fieldNames the field names that will be used when generating the 'More Like This'
     * query.
     */
    public void setFieldNames(String[] fieldNames) {
        this.fieldNames = fieldNames;
    }

    /**
     * Returns the minimum word length below which words will be ignored. Set this to 0 for no
     * minimum word length. The default is {@link #DEFAULT_MIN_WORD_LENGTH}.
     *
     * @return the minimum word length below which words will be ignored.
     */
    public int getMinWordLen() {
        return minWordLen;
    }

    /**
     * Sets the minimum word length below which words will be ignored.
     *
     * @param minWordLen the minimum word length below which words will be ignored.
     */
    public void setMinWordLen(int minWordLen) {
        this.minWordLen = minWordLen;
    }

    /**
     * Returns the maximum word length above which words will be ignored. Set this to 0 for no
     * maximum word length. The default is {@link #DEFAULT_MAX_WORD_LENGTH}.
     *
     * @return the maximum word length above which words will be ignored.
     */
    public int getMaxWordLen() {
        return maxWordLen;
    }

    /**
     * Sets the maximum word length above which words will be ignored.
     *
     * @param maxWordLen the maximum word length above which words will be ignored.
     */
    public void setMaxWordLen(int maxWordLen) {
        this.maxWordLen = maxWordLen;
    }

	/**
	 * Set the set of stopwords.
	 * Any word in this set is considered "uninteresting" and ignored.
	 * Even if your Analyzer allows stopwords, you might want to tell the MoreLikeThis code to ignore them, as
	 * for the purposes of document similarity it seems reasonable to assume that "a stop word is never interesting".
	 * 
	 * @param stopWords set of stopwords, if null it means to allow stop words
	 *
	 * @see org.apache.lucene.analysis.StopFilter#makeStopSet StopFilter.makeStopSet()
	 * @see #getStopWords	 
	 */
	public void setStopWords(Set<?> stopWords) {
		this.stopWords = stopWords;
	}

	/**
	 * Get the current stop words being used.
	 * @see #setStopWords
	 */
	public Set<?> getStopWords() {
		return stopWords;
	}
		

    /**
     * Returns the maximum number of query terms that will be included in any generated query.
     * The default is {@link #DEFAULT_MAX_QUERY_TERMS}.
     *
     * @return the maximum number of query terms that will be included in any generated query.
     */
    public int getMaxQueryTerms() {
        return maxQueryTerms;
    }

    /**
     * Sets the maximum number of query terms that will be included in any generated query.
     *
     * @param maxQueryTerms the maximum number of query terms that will be included in any
     * generated query.
     */
    public void setMaxQueryTerms(int maxQueryTerms) {
        this.maxQueryTerms = maxQueryTerms;
    }

	/**
	 * @return The maximum number of tokens to parse in each example doc field that is not stored with TermVector support
	 * @see #DEFAULT_MAX_NUM_TOKENS_PARSED
	 */
	public int getMaxNumTokensParsed()
	{
		return maxNumTokensParsed;
	}

	/**
	 * @param i The maximum number of tokens to parse in each example doc field that is not stored with TermVector support
	 */
	public void setMaxNumTokensParsed(int i)
	{
		maxNumTokensParsed = i;
	}




    /**
     * Return a query that will return docs like the passed lucene document ID.
     *
     * @param docNum the documentID of the lucene doc to generate the 'More Like This" query for.
     * @return a query that will return docs like the passed lucene document ID.
     */
    public Query like(int docNum) throws IOException {
        if (fieldNames == null) {
            // gather list of valid fields from lucene
            Collection<String> fields = ir.getFieldNames( IndexReader.FieldOption.INDEXED);
            fieldNames = fields.toArray(new String[fields.size()]);
        }

        return createQuery(retrieveTerms(docNum));
    }

    /**
     * Return a query that will return docs like the passed file.
     *
     * @return a query that will return docs like the passed file.
     */
    public Query like(File f) throws IOException {
        if (fieldNames == null) {
            // gather list of valid fields from lucene
            Collection<String> fields = ir.getFieldNames( IndexReader.FieldOption.INDEXED);
            fieldNames = fields.toArray(new String[fields.size()]);
        }

        return like(new FileReader(f));
    }

    /**
     * Return a query that will return docs like the passed URL.
     *
     * @return a query that will return docs like the passed URL.
     */
    public Query like(URL u) throws IOException {
        return like(new InputStreamReader(u.openConnection().getInputStream()));
    }

    /**
     * Return a query that will return docs like the passed stream.
     *
     * @return a query that will return docs like the passed stream.
     */
    public Query like(java.io.InputStream is) throws IOException {
        return like(new InputStreamReader(is));
    }

    /**
     * Return a query that will return docs like the passed Reader.
     *
     * @return a query that will return docs like the passed Reader.
     */
    public Query like(Reader r) throws IOException {
        return createQuery(retrieveTerms(r));
    }

    /**
     * Create the More like query from a PriorityQueue
     */
    private Query createQuery(PriorityQueue<Object[]> q) {
        BooleanQuery query = new BooleanQuery();
        Object cur;
        int qterms = 0;
        float bestScore = 0;

        while (((cur = q.pop()) != null)) {
            Object[] ar = (Object[]) cur;
            TermQuery tq = new TermQuery(new Term((String) ar[1], (String) ar[0]));

            if (boost) {
                if (qterms == 0) {
                    bestScore = ((Float) ar[2]).floatValue();
                }
                float myScore = ((Float) ar[2]).floatValue();

                tq.setBoost(boostFactor * myScore / bestScore);
            }

            try {
                query.add(tq, BooleanClause.Occur.SHOULD);
            }
            catch (BooleanQuery.TooManyClauses ignore) {
                break;
            }

            qterms++;
            if (maxQueryTerms > 0 && qterms >= maxQueryTerms) {
                break;
            }
        }

        return query;
    }

    /**
     * Create a PriorityQueue from a word->tf map.
     *
     * @param words a map of words keyed on the word(String) with Int objects as the values.
     */
    private PriorityQueue<Object[]> createQueue(Map<String,Int> words) throws IOException {
        // have collected all words in doc and their freqs
        int numDocs = ir.numDocs();
        FreqQ res = new FreqQ(words.size()); // will order words by score

        Iterator<String> it = words.keySet().iterator();
        while (it.hasNext()) { // for every word
            String word = it.next();

            int tf = words.get(word).x; // term freq in the source doc
            if (minTermFreq > 0 && tf < minTermFreq) {
                continue; // filter out words that don't occur enough times in the source
            }

            // go through all the fields and find the largest document frequency
            String topField = fieldNames[0];
            int docFreq = 0;
            for (int i = 0; i < fieldNames.length; i++) {
                int freq = ir.docFreq(new Term(fieldNames[i], word));
                topField = (freq > docFreq) ? fieldNames[i] : topField;
                docFreq = (freq > docFreq) ? freq : docFreq;
            }

            if (minDocFreq > 0 && docFreq < minDocFreq) {
                continue; // filter out words that don't occur in enough docs
            }

            if (docFreq > maxDocFreq) {
                continue; // filter out words that occur in too many docs            	
            }

            if (docFreq == 0) {
                continue; // index update problem?
            }

            float idf = similarity.idf(docFreq, numDocs);
            float score = tf * idf;

            // only really need 1st 3 entries, other ones are for troubleshooting
            res.insertWithOverflow(new Object[]{word,                   // the word
                                    topField,               // the top field
                                    Float.valueOf(score),       // overall score
                                    Float.valueOf(idf),         // idf
                                    Integer.valueOf(docFreq),   // freq in all docs
                                    Integer.valueOf(tf)
            });
        }
        return res;
    }

    /**
     * Describe the parameters that control how the "more like this" query is formed.
     */
    public String describeParams() {
        StringBuilder sb = new StringBuilder();
        sb.append("\t" + "maxQueryTerms  : " + maxQueryTerms + "\n");
        sb.append("\t" + "minWordLen     : " + minWordLen + "\n");
        sb.append("\t" + "maxWordLen     : " + maxWordLen + "\n");
        sb.append("\t" + "fieldNames     : ");
        String delim = "";
        for (int i = 0; i < fieldNames.length; i++) {
            String fieldName = fieldNames[i];
            sb.append(delim).append(fieldName);
            delim = ", ";
        }
        sb.append("\n");
        sb.append("\t" + "boost          : " + boost + "\n");
        sb.append("\t" + "minTermFreq    : " + minTermFreq + "\n");
        sb.append("\t" + "minDocFreq     : " + minDocFreq + "\n");
        return sb.toString();
    }

    /**
     * Test driver.
     * Pass in "-i INDEX" and then either "-fn FILE" or "-url URL".
     */
    public static void main(String[] a) throws Throwable {
        String indexName = "localhost_index";
        String fn = "c:/Program Files/Apache Group/Apache/htdocs/manual/vhosts/index.html.en";
        URL url = null;
        for (int i = 0; i < a.length; i++) {
            if (a[i].equals("-i")) {
                indexName = a[++i];
            }
            else if (a[i].equals("-f")) {
                fn = a[++i];
            }
            else if (a[i].equals("-url")) {
                url = new URL(a[++i]);
            }
        }

        PrintStream o = System.out;
        FSDirectory dir = FSDirectory.open(new File(indexName));
        IndexReader r = IndexReader.open(dir, true);
        o.println("Open index " + indexName + " which has " + r.numDocs() + " docs");

        MoreLikeThis mlt = new MoreLikeThis(r);

        o.println("Query generation parameters:");
        o.println(mlt.describeParams());
        o.println();

        Query query = null;
        if (url != null) {
            o.println("Parsing URL: " + url);
            query = mlt.like(url);
        }
        else if (fn != null) {
            o.println("Parsing file: " + fn);
            query = mlt.like(new File(fn));
        }

        o.println("q: " + query);
        o.println();
        IndexSearcher searcher = new IndexSearcher(dir, true);

        TopDocs hits = searcher.search(query, null, 25);
        int len = hits.totalHits;
        o.println("found: " + len + " documents matching");
        o.println();
        ScoreDoc[] scoreDocs = hits.scoreDocs;
        for (int i = 0; i < Math.min(25, len); i++) {
            Document d = searcher.doc(scoreDocs[i].doc);
			String summary = d.get( "summary");
            o.println("score  : " + scoreDocs[i].score);
            o.println("url    : " + d.get("url"));
            o.println("\ttitle  : " + d.get("title"));
			if ( summary != null)
				o.println("\tsummary: " + d.get("summary"));
            o.println();
        }
    }

    /**
     * Find words for a more-like-this query former.
     *
     * @param docNum the id of the lucene document from which to find terms
     */
    public PriorityQueue<Object[]> retrieveTerms(int docNum) throws IOException {
        Map<String,Int> termFreqMap = new HashMap<String,Int>();
        for (int i = 0; i < fieldNames.length; i++) {
            String fieldName = fieldNames[i];
            TermFreqVector vector = ir.getTermFreqVector(docNum, fieldName);

            // field does not store term vector info
            if (vector == null) {
            	Document d=ir.document(docNum);
            	String text[]=d.getValues(fieldName);
            	if(text!=null)
            	{
                for (int j = 0; j < text.length; j++) {
                  addTermFrequencies(new StringReader(text[j]), termFreqMap, fieldName);
                }
            	}
            }
            else {
				addTermFrequencies(termFreqMap, vector);
            }

        }

        return createQueue(termFreqMap);
    }

	/**
	 * Adds terms and frequencies found in vector into the Map termFreqMap
	 * @param termFreqMap a Map of terms and their frequencies
	 * @param vector List of terms and their frequencies for a doc/field
	 */
	private void addTermFrequencies(Map<String,Int> termFreqMap, TermFreqVector vector)
	{
		String[] terms = vector.getTerms();
		int freqs[]=vector.getTermFrequencies();
		for (int j = 0; j < terms.length; j++) {
		    String term = terms[j];
		
			if(isNoiseWord(term)){
				continue;
			}
		    // increment frequency
		    Int cnt = termFreqMap.get(term);
		    if (cnt == null) {
		    	cnt=new Int();
				termFreqMap.put(term, cnt);
				cnt.x=freqs[j];				
		    }
		    else {
		        cnt.x+=freqs[j];
		    }
		}
	}
	/**
	 * Adds term frequencies found by tokenizing text from reader into the Map words
	 * @param r a source of text to be tokenized
	 * @param termFreqMap a Map of terms and their frequencies
	 * @param fieldName Used by analyzer for any special per-field analysis
	 */
	private void addTermFrequencies(Reader r, Map<String,Int> termFreqMap, String fieldName)
		throws IOException
	{
		   TokenStream ts = analyzer.tokenStream(fieldName, r);
			int tokenCount=0;
			// for every token
			TermAttribute termAtt = ts.addAttribute(TermAttribute.class);
			
			while (ts.incrementToken()) {
				String word = termAtt.term();
				tokenCount++;
				if(tokenCount>maxNumTokensParsed)
				{
					break;
				}
				if(isNoiseWord(word)){
					continue;
				}
				
				// increment frequency
				Int cnt = termFreqMap.get(word);
				if (cnt == null) {
					termFreqMap.put(word, new Int());
				}
				else {
					cnt.x++;
				}
			}
	}
	
	
	/** determines if the passed term is likely to be of interest in "more like" comparisons 
	 * 
	 * @param term The word being considered
	 * @return true if should be ignored, false if should be used in further analysis
	 */
	private boolean isNoiseWord(String term)
	{
		int len = term.length();
		if (minWordLen > 0 && len < minWordLen) {
			return true;
		}
		if (maxWordLen > 0 && len > maxWordLen) {
			return true;
		}
		if (stopWords != null && stopWords.contains( term)) {
			return true;
		}
		return false;
	}
	

    /**
     * Find words for a more-like-this query former.
	 * The result is a priority queue of arrays with one entry for <b>every word</b> in the document.
	 * Each array has 6 elements.
	 * The elements are:
	 * <ol>
	 * <li> The word (String)
	 * <li> The top field that this word comes from (String)
	 * <li> The score for this word (Float)
	 * <li> The IDF value (Float)
	 * <li> The frequency of this word in the index (Integer)
	 * <li> The frequency of this word in the source document (Integer)	 	 
	 * </ol>
	 * This is a somewhat "advanced" routine, and in general only the 1st entry in the array is of interest.
	 * This method is exposed so that you can identify the "interesting words" in a document.
	 * For an easier method to call see {@link #retrieveInterestingTerms retrieveInterestingTerms()}.
     *
     * @param r the reader that has the content of the document
	 * @return the most interesting words in the document ordered by score, with the highest scoring, or best entry, first
	 *
	 * @see #retrieveInterestingTerms
     */
    public PriorityQueue<Object[]> retrieveTerms(Reader r) throws IOException {
        Map<String,Int> words = new HashMap<String,Int>();
        for (int i = 0; i < fieldNames.length; i++) {
            String fieldName = fieldNames[i];
			addTermFrequencies(r, words, fieldName);
        }
        return createQueue(words);
    }

  /**
   * @see #retrieveInterestingTerms(java.io.Reader) 
   */
  public String [] retrieveInterestingTerms(int docNum) throws IOException{
    ArrayList<Object> al = new ArrayList<Object>( maxQueryTerms);
		PriorityQueue<Object[]> pq = retrieveTerms(docNum);
		Object cur;
		int lim = maxQueryTerms; // have to be careful, retrieveTerms returns all words but that's probably not useful to our caller...
		// we just want to return the top words
		while (((cur = pq.pop()) != null) && lim-- > 0) {
            Object[] ar = (Object[]) cur;
			al.add( ar[ 0]); // the 1st entry is the interesting word
		}
		String[] res = new String[ al.size()];
		return al.toArray( res);
  }

  /**
	 * Convenience routine to make it easy to return the most interesting words in a document.
	 * More advanced users will call {@link #retrieveTerms(java.io.Reader) retrieveTerms()} directly.
	 * @param r the source document
	 * @return the most interesting words in the document
	 *
	 * @see #retrieveTerms(java.io.Reader)
	 * @see #setMaxQueryTerms
	 */
	public String[] retrieveInterestingTerms( Reader r) throws IOException {
		ArrayList<Object> al = new ArrayList<Object>( maxQueryTerms);
		PriorityQueue<Object[]> pq = retrieveTerms( r);
		Object cur;
		int lim = maxQueryTerms; // have to be careful, retrieveTerms returns all words but that's probably not useful to our caller...
		// we just want to return the top words
		while (((cur = pq.pop()) != null) && lim-- > 0) {
            Object[] ar = (Object[]) cur;
			al.add( ar[ 0]); // the 1st entry is the interesting word
		}
		String[] res = new String[ al.size()];
		return al.toArray( res);
	}

    /**
     * PriorityQueue that orders words by score.
     */
    private static class FreqQ extends PriorityQueue<Object[]> {
        FreqQ (int s) {
            initialize(s);
        }

        @Override
        protected boolean lessThan(Object[] aa, Object[] bb) {
            Float fa = (Float) aa[2];
            Float fb = (Float) bb[2];
            return fa.floatValue() > fb.floatValue();
        }
    }

    /**
     * Use for frequencies and to avoid renewing Integers.
     */
    private static class Int {
        int x;

        Int() {
            x = 1;
        }
    }
    
    
}