PinyinAnalyzer.java example

Explorer

quickdialer-master
- src
  - org
    - apache
      - lucene
        LucenePackage.java
        analysis
        Analyzer.java
        AnalyzerWrapper.java
        CachingTokenFilter.java
        CharFilter.java
        NumericTokenStream.java
        Token.java
        TokenFilter.java
        TokenStream.java
        Tokenizer.java
        core
        KeywordAnalyzer.java
        KeywordTokenizer.java
        LetterTokenizer.java
        LowerCaseFilter.java
        LowerCaseTokenizer.java
        SimpleAnalyzer.java
        WhitespaceAnalyzer.java
        WhitespaceTokenizer.java
        miscellaneous
        PerFieldAnalyzerWrapper.java
        ngram
        EdgeNGramTokenFilter.java
        EdgeNGramTokenizer.java
        NGramTokenFilter.java
        NGramTokenizer.java
        tokenattributes
        CharTermAttribute.java
        CharTermAttributeImpl.java
        FlagsAttribute.java
        FlagsAttributeImpl.java
        KeywordAttribute.java
        KeywordAttributeImpl.java
        OffsetAttribute.java
        OffsetAttributeImpl.java
        PayloadAttribute.java
        PayloadAttributeImpl.java
        PositionIncrementAttribute.java
        PositionIncrementAttributeImpl.java
        PositionLengthAttribute.java
        PositionLengthAttributeImpl.java
        TermToBytesRefAttribute.java
        TypeAttribute.java
        TypeAttributeImpl.java
        util
        CharTokenizer.java
        CharacterUtils.java
        codecs
        BlockTermState.java
        BlockTreeTermsReader.java
        BlockTreeTermsWriter.java
        Codec.java
        CodecUtil.java
        DocValuesArraySource.java
        DocValuesConsumer.java
        DocValuesFormat.java
        FieldInfosFormat.java
        FieldInfosReader.java
        FieldInfosWriter.java
        FieldsConsumer.java
        FieldsProducer.java
        FilterCodec.java
        LiveDocsFormat.java
        MappingMultiDocsAndPositionsEnum.java
        MappingMultiDocsEnum.java
        MultiLevelSkipListReader.java
        MultiLevelSkipListWriter.java
        NormsFormat.java
        PerDocConsumer.java
        PerDocProducer.java
        PerDocProducerBase.java
        PostingsBaseFormat.java
        PostingsConsumer.java
        PostingsFormat.java
        PostingsReaderBase.java
        PostingsWriterBase.java
        SegmentInfoFormat.java
        SegmentInfoReader.java
        SegmentInfoWriter.java
        StoredFieldsFormat.java
        StoredFieldsReader.java
        StoredFieldsWriter.java
        TermStats.java
        TermVectorsFormat.java
        TermVectorsReader.java
        TermVectorsWriter.java
        TermsConsumer.java
        lucene3x
        Lucene3xCodec.java
        Lucene3xFieldInfosFormat.java
        Lucene3xFieldInfosReader.java
        Lucene3xFields.java
        Lucene3xNormsFormat.java
        Lucene3xNormsProducer.java
        Lucene3xPostingsFormat.java
        Lucene3xSegmentInfoFormat.java
        Lucene3xSegmentInfoReader.java
        Lucene3xSkipListReader.java
        Lucene3xStoredFieldsFormat.java
        Lucene3xStoredFieldsReader.java
        Lucene3xTermVectorsFormat.java
        Lucene3xTermVectorsReader.java
        SegmentTermDocs.java
        SegmentTermEnum.java
        SegmentTermPositions.java
        TermBuffer.java
        TermInfo.java
        TermInfosReader.java
        TermInfosReaderIndex.java
        lucene40
        BitVector.java
        Lucene40Codec.java
        Lucene40DocValuesConsumer.java
        Lucene40DocValuesFormat.java
        Lucene40DocValuesProducer.java
        Lucene40FieldInfosFormat.java
        Lucene40FieldInfosReader.java
        Lucene40FieldInfosWriter.java
        Lucene40LiveDocsFormat.java
        Lucene40NormsFormat.java
        Lucene40PostingsBaseFormat.java
        Lucene40PostingsFormat.java
        Lucene40PostingsReader.java
        Lucene40PostingsWriter.java
        Lucene40SegmentInfoFormat.java
        Lucene40SegmentInfoReader.java
        Lucene40SegmentInfoWriter.java
        Lucene40SkipListReader.java
        Lucene40SkipListWriter.java
        Lucene40StoredFieldsFormat.java
        Lucene40StoredFieldsReader.java
        Lucene40StoredFieldsWriter.java
        Lucene40TermVectorsFormat.java
        Lucene40TermVectorsReader.java
        Lucene40TermVectorsWriter.java
        values
        Bytes.java
        DirectSource.java
        DocValuesWriterBase.java
        FixedDerefBytesImpl.java
        FixedSortedBytesImpl.java
        FixedStraightBytesImpl.java
        Floats.java
        Ints.java
        PackedIntValues.java
        VarDerefBytesImpl.java
        VarSortedBytesImpl.java
        VarStraightBytesImpl.java
        Writer.java
        perfield
        PerFieldPostingsFormat.java
        document
        ByteDocValuesField.java
        CompressionTools.java
        DateTools.java
        DerefBytesDocValuesField.java
        Document.java
        DocumentStoredFieldVisitor.java
        DoubleDocValuesField.java
        DoubleField.java
        Field.java
        FieldType.java
        FloatDocValuesField.java
        FloatField.java
        IntDocValuesField.java
        IntField.java
        LongDocValuesField.java
        LongField.java
        PackedLongDocValuesField.java
        ShortDocValuesField.java
        SortedBytesDocValuesField.java
        StoredField.java
        StraightBytesDocValuesField.java
        StringField.java
        TextField.java
        index
        AtomicReader.java
        AtomicReaderContext.java
        AutomatonTermsEnum.java
        BaseCompositeReader.java
        BitsSlice.java
        BufferedDeletes.java
        BufferedDeletesStream.java
        ByteSliceReader.java
        ByteSliceWriter.java
        CheckIndex.java
        CoalescedDeletes.java
        CompositeReader.java
        CompositeReaderContext.java
        ConcurrentMergeScheduler.java
        CorruptIndexException.java
        DirectoryReader.java
        DocConsumer.java
        DocFieldConsumer.java
        DocFieldConsumerPerField.java
        DocFieldProcessor.java
        DocFieldProcessorPerField.java
        DocInverter.java
        DocInverterPerField.java
        DocTermOrds.java
        DocValues.java
        DocsAndPositionsEnum.java
        DocsEnum.java
        DocumentsWriter.java
        DocumentsWriterDeleteQueue.java
        DocumentsWriterFlushControl.java
        DocumentsWriterFlushQueue.java
        DocumentsWriterPerThread.java
        DocumentsWriterPerThreadPool.java
        DocumentsWriterStallControl.java
        FieldInfo.java
        FieldInfos.java
        FieldInvertState.java
        Fields.java
        FilterAtomicReader.java
        FilteredTermsEnum.java
        FlushByRamOrCountsPolicy.java
        FlushPolicy.java
        FreqProxTermsWriter.java
        FreqProxTermsWriterPerField.java
        FrozenBufferedDeletes.java
        IndexCommit.java
        IndexDeletionPolicy.java
        IndexFileDeleter.java
        IndexFileNames.java
        IndexFormatTooNewException.java
        IndexFormatTooOldException.java
        IndexNotFoundException.java
        IndexReader.java
        IndexReaderContext.java
        IndexUpgrader.java
        IndexWriter.java
        IndexWriterConfig.java
        IndexableField.java
        IndexableFieldType.java
        IntBlockPool.java
        InvertedDocConsumer.java
        InvertedDocConsumerPerField.java
        InvertedDocEndConsumer.java
        InvertedDocEndConsumerPerField.java
        KeepOnlyLastCommitDeletionPolicy.java
        LiveIndexWriterConfig.java
        LogByteSizeMergePolicy.java
        LogDocMergePolicy.java
        LogMergePolicy.java
        MergePolicy.java
        MergeScheduler.java
        MergeState.java
        MergedIterator.java
        MultiBits.java
        MultiDocValues.java
        MultiDocsAndPositionsEnum.java
        MultiDocsEnum.java
        MultiFields.java
        MultiReader.java
        MultiTerms.java
        MultiTermsEnum.java
        NoDeletionPolicy.java
        NoMergePolicy.java
        NoMergeScheduler.java
        Norm.java
        NormsConsumer.java
        NormsConsumerPerField.java
        OrdTermState.java
        ParallelAtomicReader.java
        ParallelCompositeReader.java
        ParallelPostingsArray.java
        PerDocWriteState.java
        PersistentSnapshotDeletionPolicy.java
        PrefixCodedTerms.java
        ReaderManager.java
        ReaderSlice.java
        ReaderUtil.java
        ReadersAndLiveDocs.java
        SegmentCoreReaders.java
        SegmentInfo.java
        SegmentInfoPerCommit.java
        SegmentInfos.java
        SegmentMerger.java
        SegmentReadState.java
        SegmentReader.java
        SegmentWriteState.java
        SerialMergeScheduler.java
        SingleTermsEnum.java
        SlowCompositeReaderWrapper.java
        SnapshotDeletionPolicy.java
        SortedBytesMergeUtils.java
        StandardDirectoryReader.java
        StoredFieldVisitor.java
        StoredFieldsConsumer.java
        Term.java
        TermContext.java
        TermState.java
        TermVectorsConsumer.java
        TermVectorsConsumerPerField.java
        Terms.java
        TermsEnum.java
        TermsHash.java
        TermsHashConsumer.java
        TermsHashConsumerPerField.java
        TermsHashPerField.java
        ThreadAffinityDocumentsWriterThreadPool.java
        TieredMergePolicy.java
        TwoPhaseCommit.java
        TwoPhaseCommitTool.java
        TypePromoter.java
        UpgradeIndexMergePolicy.java
        queryparser
        classic
        CharStream.java
        FastCharStream.java
        MultiFieldQueryParser.java
        ParseException.java
        QueryParser.java
        QueryParserBase.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        flexible
        standard
        CommonQueryParserConfiguration.java
        search
        AutomatonQuery.java
        BitsFilteredDocIdSet.java
        BooleanClause.java
        BooleanQuery.java
        BooleanScorer.java
        BooleanScorer2.java
        BoostAttribute.java
        BoostAttributeImpl.java
        CachingCollector.java
        CachingWrapperFilter.java
        CollectionStatistics.java
        Collector.java
        ComplexExplanation.java
        ConjunctionScorer.java
        ConjunctionTermScorer.java
        ConstantScoreAutoRewrite.java
        ConstantScoreQuery.java
        DisjunctionMaxQuery.java
        DisjunctionMaxScorer.java
        DisjunctionScorer.java
        DisjunctionSumScorer.java
        DocIdSet.java
        DocIdSetIterator.java
        ExactPhraseScorer.java
        Explanation.java
        FieldCache.java
        FieldCacheDocIdSet.java
        FieldCacheImpl.java
        FieldCacheRangeFilter.java
        FieldCacheTermsFilter.java
        FieldComparator.java
        FieldComparatorSource.java
        FieldDoc.java
        FieldValueFilter.java
        FieldValueHitQueue.java
        Filter.java
        FilteredDocIdSet.java
        FilteredDocIdSetIterator.java
        FilteredQuery.java
        FuzzyQuery.java
        FuzzyTermsEnum.java
        HitQueue.java
        IndexSearcher.java
        MatchAllDocsQuery.java
        MaxNonCompetitiveBoostAttribute.java
        MaxNonCompetitiveBoostAttributeImpl.java
        MultiCollector.java
        MultiPhraseQuery.java
        MultiTermQuery.java
        MultiTermQueryWrapperFilter.java
        NGramPhraseQuery.java
        NRTManager.java
        NRTManagerReopenThread.java
        NumericRangeFilter.java
        NumericRangeQuery.java
        PhrasePositions.java
        PhraseQuery.java
        PhraseQueue.java
        PhraseScorer.java
        PositiveScoresOnlyCollector.java
        PrefixFilter.java
        PrefixQuery.java
        PrefixTermsEnum.java
        Query.java
        QueryWrapperFilter.java
        ReferenceManager.java
        RegexpQuery.java
        ReqExclScorer.java
        ReqOptSumScorer.java
        ScoreCachingWrappingScorer.java
        ScoreDoc.java
        Scorer.java
        ScoringRewrite.java
        SearcherFactory.java
        SearcherLifetimeManager.java
        SearcherManager.java
        SloppyPhraseScorer.java
        Sort.java
        SortField.java
        TermCollectingRewrite.java
        TermQuery.java
        TermRangeFilter.java
        TermRangeQuery.java
        TermRangeTermsEnum.java
        TermScorer.java
        TermStatistics.java
        TimeLimitingCollector.java
        TopDocs.java
        TopDocsCollector.java
        TopFieldCollector.java
        TopFieldDocs.java
        TopScoreDocCollector.java
        TopTermsRewrite.java
        TotalHitCountCollector.java
        Weight.java
        WildcardQuery.java
        payloads
        AveragePayloadFunction.java
        MaxPayloadFunction.java
        MinPayloadFunction.java
        PayloadFunction.java
        PayloadNearQuery.java
        PayloadSpanUtil.java
        PayloadTermQuery.java
        similarities
        AfterEffect.java
        AfterEffectB.java
        AfterEffectL.java
        BM25Similarity.java
        BasicModel.java
        BasicModelBE.java
        BasicModelD.java
        BasicModelG.java
        BasicModelIF.java
        BasicModelIn.java
        BasicModelIne.java
        BasicModelP.java
        BasicStats.java
        DFRSimilarity.java
        DefaultSimilarity.java
        Distribution.java
        DistributionLL.java
        DistributionSPL.java
        IBSimilarity.java
        LMDirichletSimilarity.java
        LMJelinekMercerSimilarity.java
        LMSimilarity.java
        Lambda.java
        LambdaDF.java
        LambdaTTF.java
        MultiSimilarity.java
        Normalization.java
        NormalizationH1.java
        NormalizationH2.java
        NormalizationH3.java
        NormalizationZ.java
        PerFieldSimilarityWrapper.java
        Similarity.java
        SimilarityBase.java
        TFIDFSimilarity.java
        spans
        FieldMaskingSpanQuery.java
        NearSpansOrdered.java
        NearSpansUnordered.java
        SpanFirstQuery.java
        SpanMultiTermQueryWrapper.java
        SpanNearPayloadCheckQuery.java
        SpanNearQuery.java
        SpanNotQuery.java
        SpanOrQuery.java
        SpanPayloadCheckQuery.java
        SpanPositionCheckQuery.java
        SpanPositionRangeQuery.java
        SpanQuery.java
        SpanScorer.java
        SpanTermQuery.java
        SpanWeight.java
        Spans.java
        TermSpans.java
        store
        AlreadyClosedException.java
        BufferedIndexInput.java
        BufferedIndexOutput.java
        ByteArrayDataInput.java
        ByteArrayDataOutput.java
        ByteBufferIndexInput.java
        ChecksumIndexInput.java
        ChecksumIndexOutput.java
        CompoundFileDirectory.java
        CompoundFileWriter.java
        DataInput.java
        DataOutput.java
        Directory.java
        FSDirectory.java
        FSLockFactory.java
        FileSwitchDirectory.java
        FlushInfo.java
        IOContext.java
        IndexInput.java
        IndexOutput.java
        InputStreamDataInput.java
        Lock.java
        LockFactory.java
        LockObtainFailedException.java
        LockReleaseFailedException.java
        LockStressTest.java
        LockVerifyServer.java
        MMapDirectory.java
        MergeInfo.java
        NIOFSDirectory.java
        NRTCachingDirectory.java
        NativeFSLockFactory.java
        NoLockFactory.java
        NoSuchDirectoryException.java
        OutputStreamDataOutput.java
        RAMDirectory.java
        RAMFile.java
        RAMInputStream.java
        RAMOutputStream.java
        RateLimiter.java
        SimpleFSDirectory.java
        SimpleFSLockFactory.java
        SingleInstanceLockFactory.java
        TrackingDirectoryWrapper.java
        VerifyingLockFactory.java
        util
        ArrayUtil.java
        Attribute.java
        AttributeImpl.java
        AttributeReflector.java
        AttributeSource.java
        BitUtil.java
        Bits.java
        ByteBlockPool.java
        BytesRef.java
        BytesRefHash.java
        BytesRefIterator.java
        CharsRef.java
        CloseableThreadLocal.java
        CollectionUtil.java
        CommandLineUtil.java
        Constants.java
        Counter.java
        DocIdBitSet.java
        DoubleBarrelLRUCache.java
        FieldCacheSanityChecker.java
        FilterIterator.java
        FixedBitSet.java
        IOUtils.java
        IndexableBinaryStringTools.java
        InfoStream.java
        IntsRef.java
        LongsRef.java
        MapOfSets.java
        MathUtil.java
        MutableBits.java
        NamedSPILoader.java
        NamedThreadFactory.java
        NumericUtils.java
        OpenBitSet.java
        OpenBitSetDISI.java
        OpenBitSetIterator.java
        PagedBytes.java
        PrintStreamInfoStream.java
        PriorityQueue.java
        RamUsageEstimator.java
        RecyclingByteBlockAllocator.java
        SPIClassIterator.java
        SentinelIntSet.java
        SetOnce.java
        SmallFloat.java
        SorterTemplate.java
        StringHelper.java
        ThreadInterruptedException.java
        ToStringUtils.java
        UnicodeUtil.java
        Version.java
        VirtualMethod.java
        WeakIdentityMap.java
        automaton
        Automaton.java
        AutomatonProvider.java
        BasicAutomata.java
        BasicOperations.java
        ByteRunAutomaton.java
        CharacterRunAutomaton.java
        CompiledAutomaton.java
        DaciukMihovAutomatonBuilder.java
        Lev1ParametricDescription.java
        Lev1TParametricDescription.java
        Lev2ParametricDescription.java
        Lev2TParametricDescription.java
        LevenshteinAutomata.java
        MinimizationOperations.java
        RegExp.java
        RunAutomaton.java
        SortedIntSet.java
        SpecialOperations.java
        State.java
        StatePair.java
        Transition.java
        UTF32ToUTF8.java
        fst
        Builder.java
        ByteSequenceOutputs.java
        BytesRefFSTEnum.java
        CharSequenceOutputs.java
        FST.java
        FSTEnum.java
        IntSequenceOutputs.java
        IntsRefFSTEnum.java
        NoOutputs.java
        NodeHash.java
        Outputs.java
        PairOutputs.java
        PositiveIntOutputs.java
        UpToTwoPositiveIntOutputs.java
        Util.java
        mutable
        MutableValue.java
        MutableValueBool.java
        MutableValueDate.java
        MutableValueDouble.java
        MutableValueFloat.java
        MutableValueInt.java
        MutableValueLong.java
        MutableValueStr.java
        packed
        BulkOperation.java
        BulkOperationPacked.java
        BulkOperationPacked1.java
        BulkOperationPacked10.java
        BulkOperationPacked11.java
        BulkOperationPacked12.java
        BulkOperationPacked13.java
        BulkOperationPacked14.java
        BulkOperationPacked15.java
        BulkOperationPacked16.java
        BulkOperationPacked17.java
        BulkOperationPacked18.java
        BulkOperationPacked19.java
        BulkOperationPacked2.java
        BulkOperationPacked20.java
        BulkOperationPacked21.java
        BulkOperationPacked22.java
        BulkOperationPacked23.java
        BulkOperationPacked24.java
        BulkOperationPacked3.java
        BulkOperationPacked4.java
        BulkOperationPacked5.java
        BulkOperationPacked6.java
        BulkOperationPacked7.java
        BulkOperationPacked8.java
        BulkOperationPacked9.java
        BulkOperationPackedSingleBlock.java
        Direct16.java
        Direct32.java
        Direct64.java
        Direct8.java
        DirectPacked64SingleBlockReader.java
        DirectPackedReader.java
        GrowableWriter.java
        Packed16ThreeBlocks.java
        Packed64.java
        Packed64SingleBlock.java
        Packed8ThreeBlocks.java
        PackedInts.java
        PackedReaderIterator.java
        PackedWriter.java
  - weiweiwang
    - github
      - quickdialer
        DialerActivity.java
      - search
        AbstractSearchService.java
        SearchCallback.java
        SearchService.java
        analysis
        NGramAnalyzer.java
        PinyinAnalyzer.java
        T9Analyzer.java
        T9Filter.java
        utils
        PinyinConverter.java
        StringUtils.java
        T9Converter.java

package weiweiwang.github.search.analysis;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.core.LetterTokenizer;
import org.apache.lucene.analysis.core.LowerCaseFilter;
import org.apache.lucene.analysis.ngram.EdgeNGramTokenFilter;
import org.apache.lucene.util.Version;

import java.io.Reader;

/**
 * @author wangweiwei
 *         Date: 8/5/12
 *         Time: 4:46 PM
 */
final public class PinyinAnalyzer extends Analyzer {
//    private static NormalizeCharMap NORMALIZE_CHAR_MAP = null;
//
//    static {
//        NormalizeCharMap.Builder builder = new NormalizeCharMap.Builder();
//        for (char c = 'a'; c <= 'z'; c++) {
//            builder.add(String.valueOf(c), "");
//        }
//        NORMALIZE_CHAR_MAP = builder.build();
//    }

    protected final Version matchVersion;
    protected final boolean convertToT9;
//    protected final boolean lowercaseFilter;

    public PinyinAnalyzer(Version version, /*boolean lowercaseFilter,*/ boolean convertToT9) {
        matchVersion = version;
//        this.lowercaseFilter = lowercaseFilter;
        this.convertToT9 = convertToT9;
    }

    @Override
    protected TokenStreamComponents createComponents(String s, Reader reader) {
        Tokenizer source = new LetterTokenizer(matchVersion, reader);
        TokenStream filter =  new LowerCaseFilter(matchVersion, source);
        if (convertToT9) {
            filter = new T9Filter(matchVersion, filter);
        }
        filter = new EdgeNGramTokenFilter(filter, EdgeNGramTokenFilter.Side.FRONT, 1, 10);
        return new TokenStreamComponents(source, filter);
    }

    /**
     * Override this if you want to add a CharFilter chain.
     * <p/>
     * The default implementation returns <code>reader</code>
     * unchanged.
     *
     * @param fieldName IndexableField name being indexed
     * @param reader    original Reader
     * @return reader, optionally decorated with CharFilter(s)
     */
    protected Reader initReader(String fieldName, Reader reader) {
//        if (lowercaseFilter) {
//            return new MappingCharFilter(NORMALIZE_CHAR_MAP, reader);
//        }
        return reader;
    }
}