ExplicitColumnTracker.java example

Explorer

CCIndex_HBase_0.90.0-master
- src
  - main
    - java
      - org
        apache
        hadoop
        hbase
        Abortable.java
        CCIndexTestCase.java
        Chore.java
        ClockOutOfSyncException.java
        ClusterStatus.java
        DoNotRetryIOException.java
        DroppedSnapshotException.java
        HBaseConfiguration.java
        HColumnDescriptor.java
        HConstants.java
        HMsg.java
        HRegionInfo.java
        HRegionLocation.java
        HServerAddress.java
        HServerInfo.java
        HServerLoad.java
        HTableDescriptor.java
        InvalidFamilyOperationException.java
        KeyValue.java
        LocalHBaseCluster.java
        MasterAddressTracker.java
        MasterNotRunningException.java
        NotAllMetaRegionsOnlineException.java
        NotServingRegionException.java
        PleaseHoldException.java
        RegionException.java
        RemoteExceptionHandler.java
        Server.java
        Stoppable.java
        TableExistsException.java
        TableNotDisabledException.java
        TableNotFoundException.java
        UnknownRegionException.java
        UnknownRowLockException.java
        UnknownScannerException.java
        VersionAnnotation.java
        YouAreDeadException.java
        ZooKeeperConnectionException.java
        avro
        AvroServer.java
        AvroUtil.java
        generated
        AAlreadyExists.java
        AClusterStatus.java
        AColumn.java
        AColumnFamilyDescriptor.java
        AColumnValue.java
        ACompressionAlgorithm.java
        ADelete.java
        AFamilyDescriptor.java
        AGet.java
        AIOError.java
        AIllegalArgument.java
        AMasterNotRunning.java
        APut.java
        ARegionLoad.java
        AResult.java
        AResultEntry.java
        AScan.java
        AServerAddress.java
        AServerInfo.java
        AServerLoad.java
        ATableDescriptor.java
        ATableExists.java
        ATimeRange.java
        HBase.java
        IOError.java
        TCell.java
        catalog
        CatalogTracker.java
        MetaEditor.java
        MetaReader.java
        RootLocationEditor.java
        client
        Action.java
        Delete.java
        Get.java
        HBaseAdmin.java
        HConnection.java
        HConnectionManager.java
        HTable.java
        HTableFactory.java
        HTableInterface.java
        HTableInterfaceFactory.java
        HTablePool.java
        Increment.java
        MetaScanner.java
        MultiAction.java
        MultiPut.java
        MultiPutResponse.java
        MultiResponse.java
        NoServerForRegionException.java
        Put.java
        RegionOfflineException.java
        Result.java
        ResultScanner.java
        RetriesExhaustedException.java
        RetriesExhaustedWithDetailsException.java
        Row.java
        RowLock.java
        Scan.java
        ScannerCallable.java
        ScannerTimeoutException.java
        ServerCallable.java
        UnmodifyableHColumnDescriptor.java
        UnmodifyableHRegionInfo.java
        UnmodifyableHTableDescriptor.java
        ccindex
        CCIndexAdmin.java
        CCIndexConstants.java
        CCIndexDescriptor.java
        HTable.java
        IndexKeyGenerator.java
        IndexNotFoundException.java
        IndexSpecification.java
        IndexSpecificationArray.java
        IndexedTable.java
        Optimizer.java
        Range.java
        ResultReader.java
        SimpleIndexKeyGenerator.java
        SimpleOptimizer.java
        SingleReader.java
        Utilities.java
        test.java
        package-info.java
        replication
        ReplicationAdmin.java
        executor
        EventHandler.java
        ExecutorService.java
        RegionTransitionData.java
        filter
        BinaryComparator.java
        BinaryPrefixComparator.java
        ColumnCountGetFilter.java
        ColumnPaginationFilter.java
        ColumnPrefixFilter.java
        CompareFilter.java
        DependentColumnFilter.java
        FamilyFilter.java
        Filter.java
        FilterBase.java
        FilterList.java
        FirstKeyOnlyFilter.java
        InclusiveStopFilter.java
        IncompatibleFilterException.java
        InvalidRowFilterException.java
        KeyOnlyFilter.java
        PageFilter.java
        PrefixFilter.java
        QualifierFilter.java
        RegexStringComparator.java
        RowFilter.java
        SingleColumnValueExcludeFilter.java
        SingleColumnValueFilter.java
        SkipFilter.java
        SubstringComparator.java
        TimestampsFilter.java
        ValueFilter.java
        WhileMatchFilter.java
        WritableByteArrayComparable.java
        package-info.java
        io
        CodeToClassAndBack.java
        HalfStoreFileReader.java
        HbaseMapWritable.java
        HbaseObjectWritable.java
        HeapSize.java
        ImmutableBytesWritable.java
        Reference.java
        TimeRange.java
        WritableWithSize.java
        hfile
        BlockCache.java
        BoundedRangeFileInputStream.java
        CachedBlock.java
        CachedBlockQueue.java
        Compression.java
        HFile.java
        HFileScanner.java
        LruBlockCache.java
        SimpleBlockCache.java
        ipc
        ByteBufferOutputStream.java
        HBaseClient.java
        HBaseRPC.java
        HBaseRPCErrorHandler.java
        HBaseRPCProtocolVersion.java
        HBaseRPCStatistics.java
        HBaseRpcMetrics.java
        HBaseServer.java
        HMasterInterface.java
        HMasterRegionInterface.java
        HRegionInterface.java
        ServerNotRunningException.java
        mapred
        Driver.java
        GroupingTableMap.java
        HRegionPartitioner.java
        IdentityTableMap.java
        IdentityTableReduce.java
        RowCounter.java
        TableInputFormat.java
        TableInputFormatBase.java
        TableMap.java
        TableMapReduceUtil.java
        TableOutputFormat.java
        TableRecordReader.java
        TableRecordReaderImpl.java
        TableReduce.java
        TableSplit.java
        package-info.java
        mapreduce
        CopyTable.java
        Driver.java
        Export.java
        GroupingTableMapper.java
        HFileOutputFormat.java
        HRegionPartitioner.java
        IdentityTableMapper.java
        IdentityTableReducer.java
        Import.java
        ImportTsv.java
        KeyValueSortReducer.java
        LoadIncrementalHFiles.java
        MultiTableOutputFormat.java
        PutSortReducer.java
        RowCounter.java
        SimpleTotalOrderPartitioner.java
        TableInputFormat.java
        TableInputFormatBase.java
        TableMapReduceUtil.java
        TableMapper.java
        TableOutputCommitter.java
        TableOutputFormat.java
        TableRecordReader.java
        TableRecordReaderImpl.java
        TableReducer.java
        TableSplit.java
        hadoopbackport
        InputSampler.java
        TotalOrderPartitioner.java
        package-info.java
        replication
        VerifyReplication.java
        master
        ActiveMasterManager.java
        AssignmentManager.java
        BulkAssigner.java
        CatalogJanitor.java
        DeadServer.java
        HMaster.java
        HMasterCommandLine.java
        LoadBalancer.java
        LogCleaner.java
        LogCleanerDelegate.java
        MasterFileSystem.java
        MasterServices.java
        ServerManager.java
        TimeToLiveLogCleaner.java
        handler
        ClosedRegionHandler.java
        DeleteTableHandler.java
        DisableTableHandler.java
        EnableTableHandler.java
        MetaServerShutdownHandler.java
        ModifyTableHandler.java
        OpenedRegionHandler.java
        ServerShutdownHandler.java
        TableAddFamilyHandler.java
        TableDeleteFamilyHandler.java
        TableEventHandler.java
        TableModifyFamilyHandler.java
        TotesHRegionInfo.java
        metrics
        MasterMetrics.java
        MasterStatistics.java
        metrics
        HBaseInfo.java
        MetricsMBeanBase.java
        MetricsRate.java
        MetricsString.java
        PersistentMetricsTimeVaryingRate.java
        file
        TimeStampingFileContext.java
        regionserver
        ChangedReadersObserver.java
        ColumnCount.java
        ColumnTracker.java
        CompactSplitThread.java
        CompactionRequestor.java
        DebugPrint.java
        DeleteTracker.java
        ExplicitColumnTracker.java
        FlushRequester.java
        GetClosestRowBeforeTracker.java
        HRegion.java
        HRegionServer.java
        HRegionServerCommandLine.java
        InternalScan.java
        InternalScanner.java
        KeyValueHeap.java
        KeyValueScanner.java
        KeyValueSkipListSet.java
        LeaseException.java
        LeaseListener.java
        Leases.java
        LogRoller.java
        LruHashMap.java
        MemStore.java
        MemStoreFlusher.java
        NoSuchColumnFamilyException.java
        OnlineRegions.java
        PriorityCompactionQueue.java
        ReadWriteConsistencyControl.java
        RegionServerRunningException.java
        RegionServerServices.java
        RegionServerStoppedException.java
        ScanDeleteTracker.java
        ScanQueryMatcher.java
        ScanWildcardColumnTracker.java
        ShutdownHook.java
        SplitTransaction.java
        Store.java
        StoreFile.java
        StoreFileScanner.java
        StoreFlusher.java
        StoreScanner.java
        TimeRangeTracker.java
        WrongRegionException.java
        ccindex
        ByteUtil.java
        Checker.java
        CheckerMaster.java
        Flusher.java
        IndexMaintenanceException.java
        IndexMaintenanceUtils.java
        IndexedRegion.java
        IndexedRegionServer.java
        handler
        CloseMetaHandler.java
        CloseRegionHandler.java
        CloseRootHandler.java
        OpenMetaHandler.java
        OpenRegionHandler.java
        OpenRootHandler.java
        metrics
        RegionServerMetrics.java
        RegionServerStatistics.java
        wal
        FailedLogCloseException.java
        HLog.java
        HLogKey.java
        HLogSplitter.java
        OrphanHLogAfterSplitException.java
        SequenceFileLogReader.java
        SequenceFileLogWriter.java
        WALEdit.java
        WALObserver.java
        replication
        ReplicationPeer.java
        ReplicationZookeeper.java
        master
        ReplicationLogCleaner.java
        regionserver
        Replication.java
        ReplicationSink.java
        ReplicationSinkMetrics.java
        ReplicationSource.java
        ReplicationSourceInterface.java
        ReplicationSourceManager.java
        ReplicationSourceMetrics.java
        ReplicationStatistics.java
        rest
        Constants.java
        ExistsResource.java
        Main.java
        ProtobufMessageHandler.java
        RESTServlet.java
        RegionsResource.java
        ResourceBase.java
        ResourceConfig.java
        ResultGenerator.java
        RootResource.java
        RowResource.java
        RowResultGenerator.java
        RowSpec.java
        ScannerInstanceResource.java
        ScannerResource.java
        ScannerResultGenerator.java
        SchemaResource.java
        StorageClusterStatusResource.java
        StorageClusterVersionResource.java
        TableResource.java
        VersionResource.java
        client
        Client.java
        Cluster.java
        RemoteAdmin.java
        RemoteHTable.java
        Response.java
        filter
        GZIPRequestStream.java
        GZIPRequestWrapper.java
        GZIPResponseStream.java
        GZIPResponseWrapper.java
        GzipFilter.java
        metrics
        RESTMetrics.java
        RESTStatistics.java
        model
        CellModel.java
        CellSetModel.java
        ColumnSchemaModel.java
        RowModel.java
        ScannerModel.java
        StorageClusterStatusModel.java
        StorageClusterVersionModel.java
        TableInfoModel.java
        TableListModel.java
        TableModel.java
        TableRegionModel.java
        TableSchemaModel.java
        VersionModel.java
        protobuf
        generated
        CellMessage.java
        CellSetMessage.java
        ColumnSchemaMessage.java
        ScannerMessage.java
        StorageClusterStatusMessage.java
        TableInfoMessage.java
        TableListMessage.java
        TableSchemaMessage.java
        VersionMessage.java
        provider
        JAXBContextResolver.java
        consumer
        ProtobufMessageBodyConsumer.java
        producer
        PlainTextMessageBodyProducer.java
        ProtobufMessageBodyProducer.java
        transform
        Base64.java
        NullTransform.java
        Transform.java
        security
        User.java
        thrift
        ThriftServer.java
        ThriftUtilities.java
        generated
        AlreadyExists.java
        BatchMutation.java
        ColumnDescriptor.java
        Hbase.java
        IOError.java
        IllegalArgument.java
        Mutation.java
        TCell.java
        TRegionInfo.java
        TRowResult.java
        util
        Base64.java
        BloomFilter.java
        ByteBloomFilter.java
        Bytes.java
        ClassSize.java
        CompressionTest.java
        DefaultEnvironmentEdge.java
        DynamicByteBloomFilter.java
        EnvironmentEdge.java
        EnvironmentEdgeManager.java
        FSUtils.java
        FileSystemVersionException.java
        HBaseConfTool.java
        HBaseFsck.java
        HBaseFsckRepair.java
        HMerge.java
        Hash.java
        IncrementingEnvironmentEdge.java
        InfoServer.java
        JVMClusterUtil.java
        JenkinsHash.java
        JvmVersion.java
        Keying.java
        MD5Hash.java
        ManualEnvironmentEdge.java
        Merge.java
        MetaUtils.java
        MurmurHash.java
        Pair.java
        PairOfSameType.java
        ServerCommandLine.java
        Sleeper.java
        SoftValueSortedMap.java
        Strings.java
        Threads.java
        VersionInfo.java
        Writables.java
        zookeeper
        ClusterStatusTracker.java
        HQuorumPeer.java
        MetaNodeTracker.java
        MiniZooKeeperCluster.java
        RegionServerTracker.java
        RootRegionTracker.java
        ZKAssign.java
        ZKConfig.java
        ZKServerTool.java
        ZKTable.java
        ZKTableDisable.java
        ZKUtil.java
        ZooKeeperListener.java
        ZooKeeperMainServerArg.java
        ZooKeeperNodeTracker.java
        ZooKeeperWatcher.java

/*
 * Copyright 2009 The Apache Software Foundation
 *
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.apache.hadoop.hbase.regionserver;

import java.util.ArrayList;
import java.util.List;
import java.util.NavigableSet;

import org.apache.hadoop.hbase.HConstants;
import org.apache.hadoop.hbase.util.Bytes;

/**
 * This class is used for the tracking and enforcement of columns and numbers
 * of versions during the course of a Get or Scan operation, when explicit
 * column qualifiers have been asked for in the query.
 *
 * With a little magic (see {@link ScanQueryMatcher}), we can use this matcher
 * for both scans and gets.  The main difference is 'next' and 'done' collapse
 * for the scan case (since we see all columns in order), and we only reset
 * between rows.
 *
 * <p>
 * This class is utilized by {@link ScanQueryMatcher} through two methods:
 * <ul><li>{@link #checkColumn} is called when a Put satisfies all other
 * conditions of the query.  This method returns a {@link org.apache.hadoop.hbase.regionserver.ScanQueryMatcher.MatchCode} to define
 * what action should be taken.
 * <li>{@link #update} is called at the end of every StoreFile or memstore.
 * <p>
 * This class is NOT thread-safe as queries are never multi-threaded
 */
public class ExplicitColumnTracker implements ColumnTracker {

  private final int maxVersions;
  private final List<ColumnCount> columns;
  private final List<ColumnCount> columnsToReuse;
  private int index;
  private ColumnCount column;
  /** Keeps track of the latest timestamp included for current column.
   * Used to eliminate duplicates. */
  private long latestTSOfCurrentColumn;

  /**
   * Default constructor.
   * @param columns columns specified user in query
   * @param maxVersions maximum versions to return per column
   */
  public ExplicitColumnTracker(NavigableSet<byte[]> columns, int maxVersions) {
    this.maxVersions = maxVersions;
    this.columns = new ArrayList<ColumnCount>(columns.size());
    this.columnsToReuse = new ArrayList<ColumnCount>(columns.size());
    for(byte [] column : columns) {
      this.columnsToReuse.add(new ColumnCount(column,maxVersions));
    }
    reset();
  }

  /**
   * Done when there are no more columns to match against.
   */
  public boolean done() {
    return this.columns.size() == 0;
  }

  public ColumnCount getColumnHint() {
    return this.column;
  }

  /**
   * Checks against the parameters of the query and the columns which have
   * already been processed by this query.
   * @param bytes KeyValue buffer
   * @param offset offset to the start of the qualifier
   * @param length length of the qualifier
   * @param timestamp timestamp of the key being checked
   * @return MatchCode telling ScanQueryMatcher what action to take
   */
  public ScanQueryMatcher.MatchCode checkColumn(byte [] bytes, int offset,
      int length, long timestamp) {
    do {
      // No more columns left, we are done with this query
      if(this.columns.size() == 0) {
        return ScanQueryMatcher.MatchCode.SEEK_NEXT_ROW; // done_row
      }

      // No more columns to match against, done with storefile
      if(this.column == null) {
        return ScanQueryMatcher.MatchCode.SEEK_NEXT_ROW; // done_row
      }

      // Compare specific column to current column
      int ret = Bytes.compareTo(column.getBuffer(), column.getOffset(),
          column.getLength(), bytes, offset, length);

      // Column Matches. If it is not a duplicate key, decrement versions left
      // and include.
      if(ret == 0) {
        //If column matches, check if it is a duplicate timestamp
        if (sameAsPreviousTS(timestamp)) {
          //If duplicate, skip this Key
          return ScanQueryMatcher.MatchCode.SKIP;
        }
        if(this.column.decrement() == 0) {
          // Done with versions for this column
          this.columns.remove(this.index);
          resetTS();
          if(this.columns.size() == this.index) {
            // Will not hit any more columns in this storefile
            this.column = null;
          } else {
            this.column = this.columns.get(this.index);
          }
        } else {
          setTS(timestamp);
        }
        return ScanQueryMatcher.MatchCode.INCLUDE;
      }

      resetTS();

      if (ret > 0) {
        // Specified column is smaller than the current, skip to next column.
        return ScanQueryMatcher.MatchCode.SEEK_NEXT_COL;
      }

      // Specified column is bigger than current column
      // Move down current column and check again
      if(ret <= -1) {
        if(++this.index >= this.columns.size()) {
          // No more to match, do not include, done with storefile
          return ScanQueryMatcher.MatchCode.SEEK_NEXT_ROW; // done_row
        }
        // This is the recursive case.
        this.column = this.columns.get(this.index);
      }
    } while(true);
  }

  /**
   * Called at the end of every StoreFile or memstore.
   */
  public void update() {
    if(this.columns.size() != 0) {
      this.index = 0;
      this.column = this.columns.get(this.index);
    } else {
      this.index = -1;
      this.column = null;
    }
  }

  // Called between every row.
  public void reset() {
    buildColumnList();
    this.index = 0;
    this.column = this.columns.get(this.index);
    resetTS();
  }

  private void resetTS() {
    latestTSOfCurrentColumn = HConstants.LATEST_TIMESTAMP;
  }

  private void setTS(long timestamp) {
    latestTSOfCurrentColumn = timestamp;
  }

  private boolean sameAsPreviousTS(long timestamp) {
    return timestamp == latestTSOfCurrentColumn;
  }

  private void buildColumnList() {
    this.columns.clear();
    this.columns.addAll(this.columnsToReuse);
    for(ColumnCount col : this.columns) {
      col.setCount(this.maxVersions);
    }
  }

  /**
   * This method is used to inform the column tracker that we are done with
   * this column. We may get this information from external filters or
   * timestamp range and we then need to indicate this information to
   * tracker. It is required only in case of ExplicitColumnTracker.
   * @param bytes
   * @param offset
   * @param length
   */
  public void doneWithColumn(byte [] bytes, int offset, int length) {
    while (this.column != null) {
      int compare = Bytes.compareTo(column.getBuffer(), column.getOffset(),
          column.getLength(), bytes, offset, length);
      if (compare == 0) {
        this.columns.remove(this.index);
        if (this.columns.size() == this.index) {
          // Will not hit any more columns in this storefile
          this.column = null;
        } else {
          this.column = this.columns.get(this.index);
        }
        return;
      } else if ( compare <= -1) {
        if(++this.index != this.columns.size()) {
          this.column = this.columns.get(this.index);
        } else {
          this.column = null;
        }
      } else {
        return;
      }
    }
  }

}