BlockTermsReader.java example

Explorer

ClusterBasedRelevanceFeedback-master
- src
  - org
    - apache
      - lucene
        ClusterBasedPsuedoRelevanceFeedback
        ClusterPsuedoRelevanceFeedbackDriver.java
        DocumentCluster.java
        LucenePackage.java
        analysis
        Analyzer.java
        CachingTokenFilter.java
        CharArraySet.java
        CharReader.java
        CharStream.java
        CharTokenizer.java
        LetterTokenizer.java
        LowerCaseFilter.java
        LowerCaseTokenizer.java
        NumericTokenStream.java
        SimpleAnalyzer.java
        StopAnalyzer.java
        StopFilter.java
        TeeSinkTokenFilter.java
        Token.java
        TokenFilter.java
        TokenStream.java
        Tokenizer.java
        WordlistLoader.java
        standard
        StandardAnalyzer.java
        StandardFilter.java
        StandardTokenizer.java
        StandardTokenizerImpl.java
        tokenattributes
        CharTermAttribute.java
        CharTermAttributeImpl.java
        FlagsAttribute.java
        FlagsAttributeImpl.java
        KeywordAttribute.java
        KeywordAttributeImpl.java
        OffsetAttribute.java
        OffsetAttributeImpl.java
        PayloadAttribute.java
        PayloadAttributeImpl.java
        PositionIncrementAttribute.java
        PositionIncrementAttributeImpl.java
        TermToBytesRefAttribute.java
        TypeAttribute.java
        TypeAttributeImpl.java
        benchmark
        Constants.java
        quality
        Judge.java
        LanguageQualityBenchmark.java
        QualityBenchmark.java
        QualityQuery.java
        QualityQueryParser.java
        QualityStats.java
        trec
        QueryDriver.java
        Trec1MQReader.java
        TrecJudge.java
        TrecTopicsReader.java
        utils
        DocNameExtractor.java
        QualityQueriesFinder.java
        SimpleQQParser.java
        SubmissionReport.java
        stats
        MemUsage.java
        QueryData.java
        TestData.java
        TestRunData.java
        TimeData.java
        demo
        DeleteFiles.java
        FileDocument.java
        HTMLDocument.java
        IndexFiles.java
        LanguageModelBenchmark.java
        SearchFiles.java
        html
        Entities.java
        HTMLParser.java
        HTMLParserConstants.java
        HTMLParserTokenManager.java
        ParseException.java
        ParserThread.java
        SimpleCharStream.java
        Tags.java
        Test.java
        Token.java
        TokenMgrError.java
        document
        AbstractField.java
        CompressionTools.java
        DateTools.java
        Document.java
        Field.java
        FieldSelector.java
        FieldSelectorResult.java
        Fieldable.java
        LoadFirstFieldSelector.java
        MapFieldSelector.java
        NumericField.java
        SetBasedFieldSelector.java
        index
        BufferedDeletes.java
        BufferedDeletesStream.java
        ByteSliceReader.java
        ByteSliceWriter.java
        CheckIndex.java
        CompoundFileReader.java
        CompoundFileWriter.java
        ConcurrentMergeScheduler.java
        CorruptIndexException.java
        DirectoryReader.java
        DocConsumer.java
        DocConsumerPerThread.java
        DocFieldConsumer.java
        DocFieldConsumerPerField.java
        DocFieldConsumerPerThread.java
        DocFieldProcessor.java
        DocFieldProcessorPerField.java
        DocFieldProcessorPerThread.java
        DocInverter.java
        DocInverterPerField.java
        DocInverterPerThread.java
        DocsAndPositionsEnum.java
        DocsEnum.java
        DocumentsWriter.java
        DocumentsWriterThreadState.java
        FieldInfo.java
        FieldInfos.java
        FieldInvertState.java
        FieldReaderException.java
        FieldSortedTermVectorMapper.java
        Fields.java
        FieldsEnum.java
        FieldsReader.java
        FieldsWriter.java
        FilterIndexReader.java
        FreqProxFieldMergeState.java
        FreqProxTermsWriter.java
        FreqProxTermsWriterPerField.java
        FreqProxTermsWriterPerThread.java
        FrozenBufferedDeletes.java
        IndexCommit.java
        IndexDeletionPolicy.java
        IndexFileDeleter.java
        IndexFileNameFilter.java
        IndexFileNames.java
        IndexFormatTooNewException.java
        IndexFormatTooOldException.java
        IndexNotFoundException.java
        IndexReader.java
        IndexWriter.java
        IndexWriterConfig.java
        IntBlockPool.java
        InvertedDocConsumer.java
        InvertedDocConsumerPerField.java
        InvertedDocConsumerPerThread.java
        InvertedDocEndConsumer.java
        InvertedDocEndConsumerPerField.java
        InvertedDocEndConsumerPerThread.java
        KeepOnlyLastCommitDeletionPolicy.java
        LogByteSizeMergePolicy.java
        LogDocMergePolicy.java
        LogMergePolicy.java
        MergeDocIDRemapper.java
        MergePolicy.java
        MergeScheduler.java
        MultiDocsAndPositionsEnum.java
        MultiDocsEnum.java
        MultiFields.java
        MultiFieldsEnum.java
        MultiNorms.java
        MultiReader.java
        MultiTerms.java
        MultiTermsEnum.java
        NoDeletionPolicy.java
        NoMergePolicy.java
        NoMergeScheduler.java
        NormsWriter.java
        NormsWriterPerField.java
        NormsWriterPerThread.java
        OrdTermState.java
        ParallelPostingsArray.java
        ParallelReader.java
        Payload.java
        PayloadProcessorProvider.java
        PerFieldCodecWrapper.java
        PersistentSnapshotDeletionPolicy.java
        PositionBasedTermVectorMapper.java
        ReusableStringReader.java
        SegmentCodecs.java
        SegmentInfo.java
        SegmentInfos.java
        SegmentMerger.java
        SegmentReadState.java
        SegmentReader.java
        SegmentTermPositionVector.java
        SegmentTermVector.java
        SegmentWriteState.java
        SerialMergeScheduler.java
        SlowMultiReaderWrapper.java
        SnapshotDeletionPolicy.java
        SortedTermVectorMapper.java
        StaleReaderException.java
        StoredFieldsWriter.java
        StoredFieldsWriterPerThread.java
        Term.java
        TermFreqVector.java
        TermPositionVector.java
        TermState.java
        TermVectorEntry.java
        TermVectorEntryFreqSortedComparator.java
        TermVectorMapper.java
        TermVectorOffsetInfo.java
        TermVectorsReader.java
        TermVectorsTermsWriter.java
        TermVectorsTermsWriterPerField.java
        TermVectorsTermsWriterPerThread.java
        TermVectorsWriter.java
        Terms.java
        TermsEnum.java
        TermsHash.java
        TermsHashConsumer.java
        TermsHashConsumerPerField.java
        TermsHashConsumerPerThread.java
        TermsHashPerField.java
        TermsHashPerThread.java
        codecs
        BlockTermState.java
        BlockTermsReader.java
        BlockTermsWriter.java
        Codec.java
        CodecProvider.java
        CoreCodecProvider.java
        DefaultSegmentInfosReader.java
        DefaultSegmentInfosWriter.java
        FieldsConsumer.java
        FieldsProducer.java
        FixedGapTermsIndexReader.java
        FixedGapTermsIndexWriter.java
        MappingMultiDocsAndPositionsEnum.java
        MappingMultiDocsEnum.java
        MergeState.java
        MultiLevelSkipListReader.java
        MultiLevelSkipListWriter.java
        PostingsConsumer.java
        PostingsReaderBase.java
        PostingsWriterBase.java
        SegmentInfosReader.java
        SegmentInfosWriter.java
        TermStats.java
        TermsConsumer.java
        TermsIndexReaderBase.java
        TermsIndexWriterBase.java
        VariableGapTermsIndexReader.java
        VariableGapTermsIndexWriter.java
        intblock
        FixedIntBlockIndexInput.java
        FixedIntBlockIndexOutput.java
        VariableIntBlockIndexInput.java
        VariableIntBlockIndexOutput.java
        preflex
        PreFlexCodec.java
        PreFlexFields.java
        SegmentTermDocs.java
        SegmentTermEnum.java
        SegmentTermPositions.java
        TermBuffer.java
        TermInfo.java
        TermInfosReader.java
        pulsing
        PulsingCodec.java
        PulsingPostingsReaderImpl.java
        PulsingPostingsWriterImpl.java
        sep
        IntIndexInput.java
        IntIndexOutput.java
        IntStreamFactory.java
        SepPostingsReaderImpl.java
        SepPostingsWriterImpl.java
        SepSkipListReader.java
        SepSkipListWriter.java
        simpletext
        SimpleTextCodec.java
        SimpleTextFieldsReader.java
        SimpleTextFieldsWriter.java
        standard
        DefaultSkipListReader.java
        DefaultSkipListWriter.java
        StandardCodec.java
        StandardPostingsReader.java
        StandardPostingsWriter.java
        messages
        Message.java
        MessageImpl.java
        NLS.java
        NLSException.java
        queryParser
        CharStream.java
        FastCharStream.java
        MultiFieldQueryParser.java
        ParseException.java
        QueryParser.java
        QueryParserBase.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        Token.java
        TokenMgrError.java
        search
        AutomatonQuery.java
        AutomatonTermsEnum.java
        BooleanClause.java
        BooleanQuery.java
        BooleanScorer.java
        BooleanScorer2.java
        BoostAttribute.java
        BoostAttributeImpl.java
        CachingSpanFilter.java
        CachingWrapperFilter.java
        Collector.java
        ComplexExplanation.java
        ConjunctionScorer.java
        ConstantScoreAutoRewrite.java
        ConstantScoreQuery.java
        DefaultSimilarity.java
        DefaultSimilarityProvider.java
        DisjunctionMaxQuery.java
        DisjunctionMaxScorer.java
        DisjunctionSumScorer.java
        DocIdSet.java
        DocIdSetIterator.java
        ExactPhraseScorer.java
        Explanation.java
        FieldCache.java
        FieldCacheImpl.java
        FieldCacheRangeFilter.java
        FieldCacheTermsFilter.java
        FieldComparator.java
        FieldComparatorSource.java
        FieldDoc.java
        FieldValueHitQueue.java
        Filter.java
        FilteredDocIdSet.java
        FilteredDocIdSetIterator.java
        FilteredQuery.java
        FilteredTermsEnum.java
        FuzzyQuery.java
        FuzzyTermsEnum.java
        HitQueue.java
        IndexSearcher.java
        LanguageModelQuery.java
        LanguageModelScorer.java
        LanguageModelSimilarity.java
        LanguageModelSimilarityProvider.java
        MatchAllDocsQuery.java
        MaxNonCompetitiveBoostAttribute.java
        MaxNonCompetitiveBoostAttributeImpl.java
        MultiCollector.java
        MultiPhraseQuery.java
        MultiTermQuery.java
        MultiTermQueryWrapperFilter.java
        NumericRangeFilter.java
        NumericRangeQuery.java
        PhrasePositions.java
        PhraseQuery.java
        PhraseQueue.java
        PhraseScorer.java
        PositiveScoresOnlyCollector.java
        PrefixFilter.java
        PrefixQuery.java
        PrefixTermsEnum.java
        Query.java
        QueryTermVector.java
        QueryWrapperFilter.java
        RegexpQuery.java
        ReqExclScorer.java
        ReqOptSumScorer.java
        ScoreCachingWrappingScorer.java
        ScoreDoc.java
        Scorer.java
        ScoringRewrite.java
        Similarity.java
        SimilarityProvider.java
        SingleTermsEnum.java
        SloppyPhraseScorer.java
        Sort.java
        SortField.java
        SpanFilter.java
        SpanFilterResult.java
        SpanQueryFilter.java
        TermCollectingRewrite.java
        TermQuery.java
        TermRangeFilter.java
        TermRangeQuery.java
        TermRangeTermsEnum.java
        TermScorer.java
        TimeLimitingCollector.java
        TopDocs.java
        TopDocsCollector.java
        TopFieldCollector.java
        TopFieldDocs.java
        TopScoreDocCollector.java
        TopTermsRewrite.java
        TotalHitCountCollector.java
        Weight.java
        WildcardQuery.java
        cache
        ByteValuesCreator.java
        CachedArray.java
        CachedArrayCreator.java
        DocTermsCreator.java
        DocTermsIndexCreator.java
        DoubleValuesCreator.java
        EntryCreator.java
        EntryCreatorWithOptions.java
        EntryKey.java
        FloatValuesCreator.java
        IntValuesCreator.java
        LongValuesCreator.java
        ShortValuesCreator.java
        SimpleEntryKey.java
        function
        ByteFieldSource.java
        CustomScoreProvider.java
        CustomScoreQuery.java
        DocValues.java
        FieldCacheSource.java
        FieldScoreQuery.java
        FloatFieldSource.java
        IntFieldSource.java
        MultiValueSource.java
        OrdFieldSource.java
        ReverseOrdFieldSource.java
        ShortFieldSource.java
        ValueSource.java
        ValueSourceQuery.java
        payloads
        AveragePayloadFunction.java
        MaxPayloadFunction.java
        MinPayloadFunction.java
        PayloadFunction.java
        PayloadNearQuery.java
        PayloadSpanUtil.java
        PayloadTermQuery.java
        spans
        FieldMaskingSpanQuery.java
        NearSpansOrdered.java
        NearSpansUnordered.java
        SpanFirstQuery.java
        SpanMultiTermQueryWrapper.java
        SpanNearPayloadCheckQuery.java
        SpanNearQuery.java
        SpanNotQuery.java
        SpanOrQuery.java
        SpanPayloadCheckQuery.java
        SpanPositionCheckQuery.java
        SpanPositionRangeQuery.java
        SpanQuery.java
        SpanScorer.java
        SpanTermQuery.java
        SpanWeight.java
        Spans.java
        TermSpans.java
        store
        AlreadyClosedException.java
        BufferedIndexInput.java
        BufferedIndexOutput.java
        ByteArrayDataInput.java
        ChecksumIndexInput.java
        ChecksumIndexOutput.java
        DataInput.java
        DataOutput.java
        Directory.java
        FSDirectory.java
        FSLockFactory.java
        FileSwitchDirectory.java
        IndexInput.java
        IndexOutput.java
        Lock.java
        LockFactory.java
        LockObtainFailedException.java
        LockReleaseFailedException.java
        LockStressTest.java
        LockVerifyServer.java
        MMapDirectory.java
        NIOFSDirectory.java
        NativeFSLockFactory.java
        NoLockFactory.java
        NoSuchDirectoryException.java
        RAMDirectory.java
        RAMFile.java
        RAMInputStream.java
        RAMOutputStream.java
        SimpleFSDirectory.java
        SimpleFSLockFactory.java
        SingleInstanceLockFactory.java
        VerifyingLockFactory.java
        util
        ArrayUtil.java
        Attribute.java
        AttributeImpl.java
        AttributeReflector.java
        AttributeSource.java
        AverageGuessMemoryModel.java
        BitUtil.java
        BitVector.java
        Bits.java
        BitsSlice.java
        ByteBlockPool.java
        BytesRef.java
        BytesRefHash.java
        CharacterUtils.java
        CloseableThreadLocal.java
        CodecUtil.java
        CollectionUtil.java
        Constants.java
        DocIdBitSet.java
        DoubleBarrelLRUCache.java
        DummyConcurrentLock.java
        English.java
        FieldCacheSanityChecker.java
        IOUtils.java
        IndexableBinaryStringTools.java
        IntsRef.java
        MapBackedSet.java
        MapOfSets.java
        MemoryModel.java
        MultiBits.java
        NamedThreadFactory.java
        NumericUtils.java
        OpenBitSet.java
        OpenBitSetDISI.java
        OpenBitSetIterator.java
        PagedBytes.java
        PerReaderTermState.java
        PriorityQueue.java
        RamUsageEstimator.java
        ReaderUtil.java
        RecyclingByteBlockAllocator.java
        ScorerDocQueue.java
        SetOnce.java
        SimpleStringInterner.java
        SmallFloat.java
        SortedVIntList.java
        SorterTemplate.java
        StringHelper.java
        StringInterner.java
        ThreadInterruptedException.java
        ToStringUtils.java
        UnicodeUtil.java
        Version.java
        VirtualMethod.java
        automaton
        Automaton.java
        AutomatonProvider.java
        BasicAutomata.java
        BasicOperations.java
        ByteRunAutomaton.java
        CharacterRunAutomaton.java
        Lev1ParametricDescription.java
        Lev2ParametricDescription.java
        LevenshteinAutomata.java
        MinimizationOperations.java
        RegExp.java
        RunAutomaton.java
        SortedIntSet.java
        SpecialOperations.java
        State.java
        StatePair.java
        Transition.java
        UTF32ToUTF8.java
        fst
        Builder.java
        ByteSequenceOutputs.java
        BytesRefFSTEnum.java
        FST.java
        FSTEnum.java
        IntSequenceOutputs.java
        IntsRefFSTEnum.java
        NoOutputs.java
        NodeHash.java
        Outputs.java
        PairOutputs.java
        PositiveIntOutputs.java
        Util.java
        packed
        Direct16.java
        Direct32.java
        Direct64.java
        Direct8.java
        GrowableWriter.java
        Packed32.java
        Packed64.java
        PackedInts.java
        PackedReaderIterator.java
        PackedWriter.java
      - lucenesandbox
        xmlindexingdemo
        XMLDocumentHandlerTxt.java

package org.apache.lucene.index.codecs;

/**
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

import java.io.Closeable;
import java.io.IOException;
import java.util.Collection;
import java.util.Comparator;
import java.util.Iterator;
import java.util.TreeMap;

import org.apache.lucene.index.DocsAndPositionsEnum;
import org.apache.lucene.index.DocsEnum;
import org.apache.lucene.index.FieldInfo;
import org.apache.lucene.index.FieldInfos;
import org.apache.lucene.index.FieldsEnum;
import org.apache.lucene.index.IndexFileNames;
import org.apache.lucene.index.SegmentInfo;
import org.apache.lucene.index.TermState;
import org.apache.lucene.index.Terms;
import org.apache.lucene.index.TermsEnum;
import org.apache.lucene.index.codecs.standard.StandardPostingsReader; // javadocs
import org.apache.lucene.store.ByteArrayDataInput;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.IndexInput;
import org.apache.lucene.util.ArrayUtil;
import org.apache.lucene.util.Bits;
import org.apache.lucene.util.BytesRef;
import org.apache.lucene.util.CodecUtil;
import org.apache.lucene.util.DoubleBarrelLRUCache;

/** Handles a terms dict, but decouples all details of
 *  doc/freqs/positions reading to an instance of {@link
 *  PostingsReaderBase}.  This class is reusable for
 *  codecs that use a different format for
 *  docs/freqs/positions (though codecs are also free to
 *  make their own terms dict impl).
 *
 * <p>This class also interacts with an instance of {@link
 * TermsIndexReaderBase}, to abstract away the specific
 * implementation of the terms dict index. 
 * @lucene.experimental */

public class BlockTermsReader extends FieldsProducer {
  // Open input to the main terms dict file (_X.tis)
  private final IndexInput in;

  // Reads the terms dict entries, to gather state to
  // produce DocsEnum on demand
  private final PostingsReaderBase postingsReader;

  private final TreeMap<String,FieldReader> fields = new TreeMap<String,FieldReader>();

  // Caches the most recently looked-up field + terms:
  private final DoubleBarrelLRUCache<FieldAndTerm,BlockTermState> termsCache;

  // Reads the terms index
  private TermsIndexReaderBase indexReader;

  // keeps the dirStart offset
  protected long dirOffset;

  // Used as key for the terms cache
  private static class FieldAndTerm extends DoubleBarrelLRUCache.CloneableKey {
    String field;
    BytesRef term;

    public FieldAndTerm() {
    }

    public FieldAndTerm(FieldAndTerm other) {
      field = other.field;
      term = new BytesRef(other.term);
    }

    @Override
    public boolean equals(Object _other) {
      FieldAndTerm other = (FieldAndTerm) _other;
      return other.field == field && term.bytesEquals(other.term);
    }

    @Override
    public Object clone() {
      return new FieldAndTerm(this);
    }

    @Override
    public int hashCode() {
      return field.hashCode() * 31 + term.hashCode();
    }
  }
  
  //private String segment;
  
  public BlockTermsReader(TermsIndexReaderBase indexReader, Directory dir, FieldInfos fieldInfos, String segment, PostingsReaderBase postingsReader, int readBufferSize,
                          int termsCacheSize, String codecId)
    throws IOException {
    
    this.postingsReader = postingsReader;
    termsCache = new DoubleBarrelLRUCache<FieldAndTerm,BlockTermState>(termsCacheSize);

    //this.segment = segment;
    in = dir.openInput(IndexFileNames.segmentFileName(segment, codecId, BlockTermsWriter.TERMS_EXTENSION),
                       readBufferSize);

    boolean success = false;
    try {
      readHeader(in);

      // Have PostingsReader init itself
      postingsReader.init(in);

      // Read per-field details
      seekDir(in, dirOffset);

      final int numFields = in.readVInt();

      for(int i=0;i<numFields;i++) {
        final int field = in.readVInt();
        final long numTerms = in.readVLong();
        assert numTerms >= 0;
        final long termsStartPointer = in.readVLong();
        final FieldInfo fieldInfo = fieldInfos.fieldInfo(field);
        final long sumTotalTermFreq = fieldInfo.omitTermFreqAndPositions ? -1 : in.readVLong();
        assert !fields.containsKey(fieldInfo.name);
        fields.put(fieldInfo.name, new FieldReader(fieldInfo, numTerms, termsStartPointer, sumTotalTermFreq));
      }
      success = true;
    } finally {
      if (!success) {
        in.close();
      }
    }

    this.indexReader = indexReader;
  }

  protected void readHeader(IndexInput input) throws IOException {
    CodecUtil.checkHeader(in, BlockTermsWriter.CODEC_NAME,
                          BlockTermsWriter.VERSION_START,
                          BlockTermsWriter.VERSION_CURRENT);
    dirOffset = in.readLong();    
  }
  
  protected void seekDir(IndexInput input, long dirOffset)
      throws IOException {
    input.seek(dirOffset);
  }
  
  @Override
  public void loadTermsIndex(int indexDivisor) throws IOException {
    indexReader.loadTermsIndex(indexDivisor);
  }

  @Override
  public void close() throws IOException {
    try {
      try {
        if (indexReader != null) {
          indexReader.close();
        }
      } finally {
        // null so if an app hangs on to us (ie, we are not
        // GCable, despite being closed) we still free most
        // ram
        indexReader = null;
        if (in != null) {
          in.close();
        }
      }
    } finally {
      try {
        if (postingsReader != null) {
          postingsReader.close();
        }
      } finally {
        for(FieldReader field : fields.values()) {
          field.close();
        }
      }
    }
  }

  public static void files(Directory dir, SegmentInfo segmentInfo, String id, Collection<String> files) {
    files.add(IndexFileNames.segmentFileName(segmentInfo.name, id, BlockTermsWriter.TERMS_EXTENSION));
  }

  public static void getExtensions(Collection<String> extensions) {
    extensions.add(BlockTermsWriter.TERMS_EXTENSION);
  }

  @Override
  public FieldsEnum iterator() {
    return new TermFieldsEnum();
  }

  @Override
  public Terms terms(String field) throws IOException {
    return fields.get(field);
  }

  // Iterates through all fields
  private class TermFieldsEnum extends FieldsEnum {
    final Iterator<FieldReader> it;
    FieldReader current;

    TermFieldsEnum() {
      it = fields.values().iterator();
    }

    @Override
    public String next() {
      if (it.hasNext()) {
        current = it.next();
        return current.fieldInfo.name;
      } else {
        current = null;
        return null;
      }
    }
    
    @Override
    public TermsEnum terms() throws IOException {
      return current.iterator();
    }
  }

  private class FieldReader extends Terms implements Closeable {
    final long numTerms;
    final FieldInfo fieldInfo;
    final long termsStartPointer;
    final long sumTotalTermFreq;

    FieldReader(FieldInfo fieldInfo, long numTerms, long termsStartPointer, long sumTotalTermFreq) {
      assert numTerms > 0;
      this.fieldInfo = fieldInfo;
      this.numTerms = numTerms;
      this.termsStartPointer = termsStartPointer;
      this.sumTotalTermFreq = sumTotalTermFreq;
    }

    @Override
    public Comparator<BytesRef> getComparator() {
      return BytesRef.getUTF8SortedAsUnicodeComparator();
    }

    @Override
    public void close() {
      super.close();
    }
    
    @Override
    public TermsEnum iterator() throws IOException {
      return new SegmentTermsEnum();
    }

    @Override
    public long getUniqueTermCount() {
      return numTerms;
    }

    @Override
    public long getSumTotalTermFreq() {
      return sumTotalTermFreq;
    }

    // Iterates through terms in this field
    private final class SegmentTermsEnum extends TermsEnum {
      private final IndexInput in;
      private final BlockTermState state;
      private final boolean doOrd;
      private final FieldAndTerm fieldTerm = new FieldAndTerm();
      private final TermsIndexReaderBase.FieldIndexEnum indexEnum;
      private final BytesRef term = new BytesRef();

      /* This is true if indexEnum is "still" seek'd to the index term
         for the current term. We set it to true on seeking, and then it
         remains valid until next() is called enough times to load another
         terms block: */
      private boolean indexIsCurrent;

      /* True if we've already called .next() on the indexEnum, to "bracket"
         the current block of terms: */
      private boolean didIndexNext;

      /* Next index term, bracketing the current block of terms; this is
         only valid if didIndexNext is true: */
      private BytesRef nextIndexTerm;

      /* True after seek(TermState), do defer seeking.  If the app then
         calls next() (which is not "typical"), then we'll do the real seek */
      private boolean seekPending;

      /* How many blocks we've read since last seek.  Once this
         is >= indexEnum.getDivisor() we set indexIsCurrent to false (since
         the index can no long bracket seek-within-block). */
      private int blocksSinceSeek;

      private byte[] termSuffixes;
      private ByteArrayDataInput termSuffixesReader = new ByteArrayDataInput(null);

      /* Common prefix used for all terms in this block. */
      private int termBlockPrefix;

      private byte[] docFreqBytes;
      private final ByteArrayDataInput freqReader = new ByteArrayDataInput(null);
      private int metaDataUpto;

      public SegmentTermsEnum() throws IOException {
        in = (IndexInput) BlockTermsReader.this.in.clone();
        in.seek(termsStartPointer);
        indexEnum = indexReader.getFieldEnum(fieldInfo);
        doOrd = indexReader.supportsOrd();
        fieldTerm.field = fieldInfo.name;
        state = postingsReader.newTermState();
        state.totalTermFreq = -1;
        state.ord = -1;

        termSuffixes = new byte[128];
        docFreqBytes = new byte[64];
        //System.out.println("BTR.enum init this=" + this + " postingsReader=" + postingsReader);
      }

      @Override
      public Comparator<BytesRef> getComparator() {
        return BytesRef.getUTF8SortedAsUnicodeComparator();
      }

      // TODO: we may want an alternate mode here which is
      // "if you are about to return NOT_FOUND I won't use
      // the terms data from that"; eg FuzzyTermsEnum will
      // (usually) just immediately call seek again if we
      // return NOT_FOUND so it's a waste for us to fill in
      // the term that was actually NOT_FOUND
      @Override
      public SeekStatus seek(final BytesRef target, final boolean useCache) throws IOException {

        if (indexEnum == null) {
          throw new IllegalStateException("terms index was not loaded");
        }
   
        /*
        System.out.println("BTR.seek seg=" + segment + " target=" + fieldInfo.name + ":" + target.utf8ToString() + " " + target + " current=" + term().utf8ToString() + " " + term() + " useCache=" + useCache + " indexIsCurrent=" + indexIsCurrent + " didIndexNext=" + didIndexNext + " seekPending=" + seekPending + " divisor=" + indexReader.getDivisor() + " this="  + this);
        if (didIndexNext) {
          if (nextIndexTerm == null) {
            System.out.println("  nextIndexTerm=null");
          } else {
            System.out.println("  nextIndexTerm=" + nextIndexTerm.utf8ToString());
          }
        }
        */

        // Check cache
        if (useCache) {
          fieldTerm.term = target;
          // TODO: should we differentiate "frozen"
          // TermState (ie one that was cloned and
          // cached/returned by termState()) from the
          // malleable (primary) one?
          final TermState cachedState = termsCache.get(fieldTerm);
          if (cachedState != null) {
            seekPending = true;
            //System.out.println("  cached!");
            seek(target, cachedState);
            //System.out.println("  term=" + term.utf8ToString());
            return SeekStatus.FOUND;
          }
        }

        boolean doSeek = true;

        // See if we can avoid seeking, because target term
        // is after current term but before next index term:
        if (indexIsCurrent) {

          final int cmp = BytesRef.getUTF8SortedAsUnicodeComparator().compare(term, target);

          if (cmp == 0) {
            // Already at the requested term
            return SeekStatus.FOUND;
          } else if (cmp < 0) {

            // Target term is after current term
            if (!didIndexNext) {
              if (indexEnum.next() == -1) {
                nextIndexTerm = null;
              } else {
                nextIndexTerm = indexEnum.term();
              }
              //System.out.println("  now do index next() nextIndexTerm=" + (nextIndexTerm == null ? "null" : nextIndexTerm.utf8ToString()));
              didIndexNext = true;
            }

            if (nextIndexTerm == null || BytesRef.getUTF8SortedAsUnicodeComparator().compare(target, nextIndexTerm) < 0) {
              // Optimization: requested term is within the
              // same term block we are now in; skip seeking
              // (but do scanning):
              doSeek = false;
              //System.out.println("  skip seek: nextIndexTerm=" + (nextIndexTerm == null ? "null" : nextIndexTerm.utf8ToString()));
            }
          }
        }

        if (doSeek) {
          //System.out.println("  seek");

          // Ask terms index to find biggest indexed term (=
          // first term in a block) that's <= our text:
          in.seek(indexEnum.seek(target));
          boolean result = nextBlock();

          // Block must exist since, at least, the indexed term
          // is in the block:
          assert result;

          indexIsCurrent = true;
          didIndexNext = false;
          blocksSinceSeek = 0;          

          if (doOrd) {
            state.ord = indexEnum.ord()-1;
          }

          term.copy(indexEnum.term());
          //System.out.println("  seek: term=" + term.utf8ToString());
        } else {
          //System.out.println("  skip seek");
          if (state.termCount == state.blockTermCount && !nextBlock()) {
            indexIsCurrent = false;
            return SeekStatus.END;
          }
        }

        seekPending = false;

        int common = 0;

        // Scan within block.  We could do this by calling
        // _next() and testing the resulting term, but this
        // is wasteful.  Instead, we first confirm the
        // target matches the common prefix of this block,
        // and then we scan the term bytes directly from the
        // termSuffixesreader's byte[], saving a copy into
        // the BytesRef term per term.  Only when we return
        // do we then copy the bytes into the term.

        while(true) {

          // First, see if target term matches common prefix
          // in this block:
          if (common < termBlockPrefix) {
            final int cmp = (term.bytes[common]&0xFF) - (target.bytes[target.offset + common]&0xFF);
            if (cmp < 0) {

              // TODO: maybe we should store common prefix
              // in block header?  (instead of relying on
              // last term of previous block)

              // Target's prefix is after the common block
              // prefix, so term cannot be in this block
              // but it could be in next block.  We
              // must scan to end-of-block to set common
              // prefix for next block:
              if (state.termCount < state.blockTermCount) {
                while(state.termCount < state.blockTermCount-1) {
                  state.termCount++;
                  state.ord++;
                  termSuffixesReader.skipBytes(termSuffixesReader.readVInt());
                }
                final int suffix = termSuffixesReader.readVInt();
                term.length = termBlockPrefix + suffix;
                if (term.bytes.length < term.length) {
                  term.grow(term.length);
                }
                termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);
              }
              state.ord++;
              
              if (!nextBlock()) {
                indexIsCurrent = false;
                return SeekStatus.END;
              }
              common = 0;

            } else if (cmp > 0) {
              // Target's prefix is before the common prefix
              // of this block, so we position to start of
              // block and return NOT_FOUND:
              assert state.termCount == 0;

              final int suffix = termSuffixesReader.readVInt();
              term.length = termBlockPrefix + suffix;
              if (term.bytes.length < term.length) {
                term.grow(term.length);
              }
              termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);
              return SeekStatus.NOT_FOUND;
            } else {
              common++;
            }

            continue;
          }

          // Test every term in this block
          while (true) {
            state.termCount++;
            state.ord++;

            final int suffix = termSuffixesReader.readVInt();
            
            // We know the prefix matches, so just compare the new suffix:
            final int termLen = termBlockPrefix + suffix;
            int bytePos = termSuffixesReader.getPosition();

            boolean next = false;
            final int limit = target.offset + (termLen < target.length ? termLen : target.length);
            int targetPos = target.offset + termBlockPrefix;
            while(targetPos < limit) {
              final int cmp = (termSuffixes[bytePos++]&0xFF) - (target.bytes[targetPos++]&0xFF);
              if (cmp < 0) {
                // Current term is still before the target;
                // keep scanning
                next = true;
                break;
              } else if (cmp > 0) {
                // Done!  Current term is after target. Stop
                // here, fill in real term, return NOT_FOUND.
                term.length = termBlockPrefix + suffix;
                if (term.bytes.length < term.length) {
                  term.grow(term.length);
                }
                termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);
                //System.out.println("  NOT_FOUND");
                return SeekStatus.NOT_FOUND;
              }
            }

            if (!next && target.length <= termLen) {
              term.length = termBlockPrefix + suffix;
              if (term.bytes.length < term.length) {
                term.grow(term.length);
              }
              termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);

              if (target.length == termLen) {
                // Done!  Exact match.  Stop here, fill in
                // real term, return FOUND.
                //System.out.println("  FOUND");

                if (useCache) {
                  // Store in cache
                  decodeMetaData();
                  //System.out.println("  cache! state=" + state);
                  termsCache.put(new FieldAndTerm(fieldTerm), (BlockTermState) state.clone());
                }

                return SeekStatus.FOUND;
              } else {
                //System.out.println("  NOT_FOUND");
                return SeekStatus.NOT_FOUND;
              }
            }

            if (state.termCount == state.blockTermCount) {
              // Must pre-fill term for next block's common prefix
              term.length = termBlockPrefix + suffix;
              if (term.bytes.length < term.length) {
                term.grow(term.length);
              }
              termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);
              break;
            } else {
              termSuffixesReader.skipBytes(suffix);
            }
          }

          // The purpose of the terms dict index is to seek
          // the enum to the closest index term before the
          // term we are looking for.  So, we should never
          // cross another index term (besides the first
          // one) while we are scanning:

          assert indexIsCurrent;

          if (!nextBlock()) {
            //System.out.println("  END");
            indexIsCurrent = false;
            return SeekStatus.END;
          }
          common = 0;
        }
      }

      @Override
      public BytesRef next() throws IOException {
        //System.out.println("BTR.next() seekPending=" + seekPending + " pendingSeekCount=" + state.termCount);

        // If seek was previously called and the term was cached,
        // usually caller is just going to pull a D/&PEnum or get
        // docFreq, etc.  But, if they then call next(),
        // this method catches up all internal state so next()
        // works properly:
        if (seekPending) {
          assert !indexIsCurrent;
          in.seek(state.blockFilePointer);
          final int pendingSeekCount = state.termCount;
          boolean result = nextBlock();

          final long savOrd = state.ord;

          // Block must exist since seek(TermState) was called w/ a
          // TermState previously returned by this enum when positioned
          // on a real term:
          assert result;

          while(state.termCount < pendingSeekCount) {
            BytesRef nextResult = _next();
            assert nextResult != null;
          }
          seekPending = false;
          state.ord = savOrd;
        }
        return _next();
      }

      /* Decodes only the term bytes of the next term.  If caller then asks for
         metadata, ie docFreq, totalTermFreq or pulls a D/&PEnum, we then (lazily)
         decode all metadata up to the current term. */
      private BytesRef _next() throws IOException {
        //System.out.println("BTR._next seg=" + segment + " this=" + this + " termCount=" + state.termCount + " (vs " + state.blockTermCount + ")");
        if (state.termCount == state.blockTermCount && !nextBlock()) {
          //System.out.println("  eof");
          indexIsCurrent = false;
          return null;
        }

        // TODO: cutover to something better for these ints!  simple64?
        final int suffix = termSuffixesReader.readVInt();
        //System.out.println("  suffix=" + suffix);

        term.length = termBlockPrefix + suffix;
        if (term.bytes.length < term.length) {
          term.grow(term.length);
        }
        termSuffixesReader.readBytes(term.bytes, termBlockPrefix, suffix);
        state.termCount++;

        // NOTE: meaningless in the non-ord case
        state.ord++;

        //System.out.println("  return term=" + fieldInfo.name + ":" + term.utf8ToString() + " " + term);
        return term;
      }

      @Override
      public BytesRef term() {
        return term;
      }

      @Override
      public int docFreq() throws IOException {
        //System.out.println("BTR.docFreq");
        decodeMetaData();
        //System.out.println("  return " + state.docFreq);
        return state.docFreq;
      }

      @Override
      public long totalTermFreq() throws IOException {
        decodeMetaData();
        return state.totalTermFreq;
      }

      @Override
      public DocsEnum docs(Bits skipDocs, DocsEnum reuse) throws IOException {
        //System.out.println("BTR.docs this=" + this);
        decodeMetaData();
        //System.out.println("  state.docFreq=" + state.docFreq);
        final DocsEnum docsEnum = postingsReader.docs(fieldInfo, state, skipDocs, reuse);
        assert docsEnum != null;
        return docsEnum;
      }

      @Override
      public DocsAndPositionsEnum docsAndPositions(Bits skipDocs, DocsAndPositionsEnum reuse) throws IOException {
        //System.out.println("BTR.d&p this=" + this);
        decodeMetaData();
        if (fieldInfo.omitTermFreqAndPositions) {
          return null;
        } else {
          DocsAndPositionsEnum dpe = postingsReader.docsAndPositions(fieldInfo, state, skipDocs, reuse);
          //System.out.println("  return d&pe=" + dpe);
          return dpe;
        }
      }

      @Override
      public void seek(BytesRef target, TermState otherState) throws IOException {
        //System.out.println("BTR.seek termState target=" + target.utf8ToString() + " " + target + " this=" + this);
        assert otherState != null && otherState instanceof BlockTermState;
        assert !doOrd || ((BlockTermState) otherState).ord < numTerms;
        state.copyFrom(otherState);
        seekPending = true;
        indexIsCurrent = false;
        term.copy(target);
      }
      
      @Override
      public TermState termState() throws IOException {
        //System.out.println("BTR.termState this=" + this);
        decodeMetaData();
        TermState ts = (TermState) state.clone();
        //System.out.println("  return ts=" + ts);
        return ts;
      }

      @Override
      public SeekStatus seek(long ord) throws IOException {
        //System.out.println("BTR.seek by ord ord=" + ord);
        if (indexEnum == null) {
          throw new IllegalStateException("terms index was not loaded");
        }

        if (ord >= numTerms) {
          state.ord = numTerms-1;
          return SeekStatus.END;
        }

        // TODO: if ord is in same terms block and
        // after current ord, we should avoid this seek just
        // like we do in the seek(BytesRef) case
        in.seek(indexEnum.seek(ord));
        boolean result = nextBlock();

        // Block must exist since ord < numTerms:
        assert result;

        indexIsCurrent = true;
        didIndexNext = false;
        blocksSinceSeek = 0;
        seekPending = false;

        state.ord = indexEnum.ord()-1;
        assert state.ord >= -1: "ord=" + state.ord;
        term.copy(indexEnum.term());

        // Now, scan:
        int left = (int) (ord - state.ord);
        while(left > 0) {
          final BytesRef term = _next();
          assert term != null;
          left--;
          assert indexIsCurrent;
        }

        // always found
        return SeekStatus.FOUND;
      }

      @Override
      public long ord() {
        if (!doOrd) {
          throw new UnsupportedOperationException();
        }
        return state.ord;
      }

      private void doPendingSeek() {
      }

      /* Does initial decode of next block of terms; this
         doesn't actually decode the docFreq, totalTermFreq,
         postings details (frq/prx offset, etc.) metadata;
         it just loads them as byte[] blobs which are then      
         decoded on-demand if the metadata is ever requested
         for any term in this block.  This enables terms-only
         intensive consumes (eg certain MTQs, respelling) to
         not pay the price of decoding metadata they won't
         use. */
      private boolean nextBlock() throws IOException {

        // TODO: we still lazy-decode the byte[] for each
        // term (the suffix), but, if we decoded
        // all N terms up front then seeking could do a fast
        // bsearch w/in the block...

        //System.out.println("BTR.nextBlock() fp=" + in.getFilePointer() + " this=" + this);
        state.blockFilePointer = in.getFilePointer();
        state.blockTermCount = in.readVInt();
        //System.out.println("  blockTermCount=" + state.blockTermCount);
        if (state.blockTermCount == 0) {
          return false;
        }
        termBlockPrefix = in.readVInt();

        // term suffixes:
        int len = in.readVInt();
        if (termSuffixes.length < len) {
          termSuffixes = new byte[ArrayUtil.oversize(len, 1)];
        }
        //System.out.println("  termSuffixes len=" + len);
        in.readBytes(termSuffixes, 0, len);
        termSuffixesReader.reset(termSuffixes, 0, len);

        // docFreq, totalTermFreq
        len = in.readVInt();
        if (docFreqBytes.length < len) {
          docFreqBytes = new byte[ArrayUtil.oversize(len, 1)];
        }
        //System.out.println("  freq bytes len=" + len);
        in.readBytes(docFreqBytes, 0, len);
        freqReader.reset(docFreqBytes, 0, len);
        metaDataUpto = 0;

        state.termCount = 0;

        postingsReader.readTermsBlock(in, fieldInfo, state);

        blocksSinceSeek++;
        indexIsCurrent &= (blocksSinceSeek < indexReader.getDivisor());
        //System.out.println("  indexIsCurrent=" + indexIsCurrent);

        return true;
      }

      private void decodeMetaData() throws IOException {
        //System.out.println("BTR.decodeMetadata mdUpto=" + metaDataUpto + " vs termCount=" + state.termCount + " state=" + state);
        if (!seekPending) {
          // lazily catch up on metadata decode:
          final int limit = state.termCount;
          // We must set/incr state.termCount because
          // postings impl can look at this
          state.termCount = metaDataUpto;
          // TODO: better API would be "jump straight to term=N"???
          while (metaDataUpto < limit) {
            //System.out.println("  decode mdUpto=" + metaDataUpto);
            // TODO: we could make "tiers" of metadata, ie,
            // decode docFreq/totalTF but don't decode postings
            // metadata; this way caller could get
            // docFreq/totalTF w/o paying decode cost for
            // postings

            // TODO: if docFreq were bulk decoded we could
            // just skipN here:
            state.docFreq = freqReader.readVInt();
            //System.out.println("    dF=" + state.docFreq);
            if (!fieldInfo.omitTermFreqAndPositions) {
              state.totalTermFreq = state.docFreq + freqReader.readVLong();
              //System.out.println("    totTF=" + state.totalTermFreq);
            }

            postingsReader.nextTerm(fieldInfo, state);
            metaDataUpto++;
            state.termCount++;
          }
        //} else {
          //System.out.println("  skip! seekPending");
        }
      }
    }
  }
}