PentahoTableRecordReader.java example

Explorer

pentaho-hadoop-shims-master
- api
  - src
    - main
      - java
        org
        pentaho
        hadoop
        mapreduce
        BaseKeyValueOrdinals.java
        InKeyValueOrdinals.java
        OutKeyValueOrdinals.java
        shim
        ActiveHadoopShimFileProvider.java
        ConfigurationException.java
        HadoopConfiguration.java
        HadoopConfigurationClassLoader.java
        HadoopConfigurationFileSystemManager.java
        HadoopConfigurationLocator.java
        ShimVersion.java
        api
        ActiveHadoopConfigurationLocator.java
        Configuration.java
        DistributedCacheUtil.java
        Required.java
        ShimProperties.java
        fs
        FileSystem.java
        Path.java
        mapred
        RunningJob.java
        TaskCompletionEvent.java
        process
        Processable.java
        RequiredCredentialsToken.java
        spi
        HadoopConfigurationProvider.java
        HadoopShim.java
        PentahoHadoopShim.java
        PigShim.java
        SnappyShim.java
        SqoopShim.java
        hbase
        shim
        api
        ColumnFilter.java
        HBaseValueMeta.java
        Mapping.java
        spi
        HBaseBytesUtilShim.java
        HBaseConnection.java
        HBaseShim.java
        oozie
        shim
        api
        OozieClient.java
        OozieClientException.java
        OozieClientFactory.java
        OozieJob.java
    - test
      - java
        org
        pentaho
        hadoop
        mapreduce
        OrdinalExtractionTest.java
        shim
        ActiveHadoopShimFileProviderTest.java
        HadoopConfigurationClassLoaderTest.java
        HadoopConfigurationLocatorTest.java
        HadoopConfigurationTest.java
        HadoopExcludeJarsTest.java
        HadoopRunningOnClusterTest.java
        MockActiveHadoopConfigurationLocator.java
        MockHadoopConfigurationProvider.java
        ShimVersionTest.java
        api
        HadoopConfigurationFileSystemManagerTest.java
        MockFileProvider.java
        ShimPropertiesTest.java
        spi
        MockHBaseShim.java
        MockHadoopShim.java
        MockPigShim.java
        MockSnappyShim.java
        MockSqoopShim.java
        hbase
        shim
        api
        ColumnFilterTest.java
        HBaseValueMetaTest.java
        MappingTest.java
        spi
        HBaseConnectionTest.java
        MockHBaseByteConverterUsingJavaByteBuffer.java
        MockHBaseBytesUtilShim.java
- common
  - common-hbase-comparators-api
    - src
      - main
        java
        org
        pentaho
        hbase
        shim
        common
        wrapper
        HBaseConnectionInterface.java
        HBaseShimInterface.java
        spi
        IDeserializedBooleanComparator.java
        IDeserializedNumericComparator.java
  - common-shim
    - src
      - main
        java
        org
        pentaho
        hadoop
        shim
        common
        CommonHadoopShim.java
        CommonPigShim.java
        CommonSnappyShim.java
        CommonSqoopShim.java
        ConfigurationProxy.java
        DistributedCacheUtilImpl.java
        DriverProxyInvocationChain.java
        HiveSQLUtils.java
        ShimUtils.java
        fs
        FileSystemProxy.java
        PathProxy.java
        invocationhandler
        CaptureResultSetInvocationHandler.java
        ConnectionInvocationHandler.java
        DatabaseMetaDataInvocationHandler.java
        DriverInvocationHandler.java
        ResultSetInvocationHandler.java
        ResultSetMetaDataInvocationHandler.java
        mapred
        RunningJobProxy.java
        TaskCompletionEventProxy.java
        utils
        OverloadedIterator.java
        OverloadedServiceLoader.java
        hbase
        shim
        common
        CommonHBaseBytesUtil.java
        CommonHBaseConnection.java
        CommonHBaseShim.java
        fake
        FakeHBaseConnection.java
        FakeHBaseShim.java
      - test
        java
        org
        apache
        hadoop
        mapred
        TaskCompletionEventList.java
        pentaho
        hadoop
        mapreduce
        GenericTransCombinerTest.java
        GenericTransReduceTest.java
        MRTestUtil.java
        MockOutputCollector.java
        MockRecordReader.java
        PentahoMapReduceIT.java
        PentahoMapRunnableTest.java
        converter
        TypeConverterFactoryTest.java
        converters
        BytesWritableToByteArrayConverterTest.java
        DoubleWritableToDoubleConverterTest.java
        DoubleWritableToLongConverterTest.java
        ImmutableBytesWritablePassThroughConverterTest.java
        IntWritableToLongConverterTest.java
        KettleTypeToBooleanWritableConverterTest.java
        KettleTypeToBytesWritableConverterTest.java
        KettleTypeToDoubleWritableConverterTest.java
        KettleTypeToIntWritableConverterTest.java
        KettleTypeToLongWritableConverterTest.java
        KettleTypeToTextConverterTest.java
        LongWritableToLongConverterTest.java
        LongWritableToTextConverterTest.java
        NullConverterTest.java
        NullWritableConverterTest.java
        ObjectToStringConverterTest.java
        ResultPassThroughConverterTest.java
        TextToIntegerConverterTest.java
        TextToLongConverterTest.java
        TextToStringConverterTest.java
        test
        MRUtilTest.java
        shim
        common
        CommonHadoopShimTest.java
        CommonPigShimTest.java
        ConfigurationProxyTest.java
        DistributedCacheTestUtil.java
        DistributedCacheUtilImplOSDependentTest.java
        DistributedCacheUtilImplTest.java
        DriverProxyInvocationChainTest.java
        HiveSQLUtilsTest.java
        fs
        FileSystemProxyTest.java
        mapred
        MockRunningJob.java
        RunningJobProxyTest.java
        TaskCompletionEventProxyTest.java
        hbase
        shim
        common
        CommonHBaseBytesUtilTest.java
  - hadoop-shim
    - src
      - main
        java
        org
        pentaho
        hadoop
        shim
        common
        ConfigurationProxyV2.java
        FileSystemProxyV2.java
        HadoopShimImpl.java
        RunningJobProxyV2.java
        SnappyShimImpl.java
      - test
        java
        org
        pentaho
        hadoop
        shim
        common
        ConfigurationProxyV2Test.java
  - hbase
    - src
      - main
        java
        org
        apache
        hadoop
        hbase
        mapred
        Table10InputFormatDiscloser.java
        pentaho
        hadoop
        hbase
        factory
        HBase10Admin.java
        HBase10ClientFactory.java
        HBase10ClientFactoryLocatorImpl.java
        HBase10Put.java
        HBase10Table.java
  - hbase-comparators
    - src
      - main
        java
        org
        pentaho
        hbase
        shim
        common
        DeserializedBooleanComparator.java
        DeserializedNumericComparator.java
        HBaseConnectionImpl.java
        HBaseShimImpl.java
      - test
        java
        org
        pentaho
        hbase
        shim
        common
        CommonHBaseConnectionTest.java
        HBase11HBaseConnectionTest.java
  - mapred
    - src
      - main
        java
        org
        pentaho
        hadoop
        mapreduce
        GenericTransCombiner.java
        GenericTransReduce.java
        MRUtil.java
        OutputCollectorRowListener.java
        PentahoMapReduceBase.java
        PentahoMapRunnable.java
        converter
        TypeConversionException.java
        TypeConverterFactory.java
        converters
        BytesWritableToByteArrayConverter.java
        DoubleWritableToDoubleConverter.java
        DoubleWritableToLongConverter.java
        ImmutableBytesWritablePassThroughConverter.java
        IntWritableToLongConverter.java
        KettleTypeToBooleanWritableConverter.java
        KettleTypeToBytesWritableConverter.java
        KettleTypeToDoubleWritableConverter.java
        KettleTypeToIntWritableConverter.java
        KettleTypeToLongWritableConverter.java
        KettleTypeToTextConverter.java
        LongWritableToLongConverter.java
        LongWritableToTextConverter.java
        NullConverter.java
        NullWritableConverter.java
        ObjectToStringConverter.java
        ResultPassThroughConverter.java
        TextToIntegerConverter.java
        TextToLongConverter.java
        TextToStringConverter.java
        spi
        ITypeConverter.java
        hbase
        factory
        HBaseAdmin.java
        HBaseClientFactory.java
        HBaseClientFactoryLocator.java
        HBasePut.java
        HBaseTable.java
        mapred
        PentahoTableInputFormat.java
        PentahoTableRecordReader.java
        PentahoTableRecordReaderImpl.java
  - modern
    - src
      - main
        java
        org
        pentaho
        hadoop
        shim
        common
        ClassPathModifyingSqoopShim.java
        authentication
        HadoopNoAuthConsumer.java
        PropertyAuthenticationProviderParser.java
        authorization
        AuthenticatingHadoopShim.java
        HadoopAuthorizationService.java
        HasHadoopAuthorizationService.java
        NoOpHadoopAuthorizationService.java
        delegating
        DelegatingHBaseConnection.java
        DelegatingHBaseShim.java
        DelegatingHadoopShim.java
        DelegatingOozieClientFactory.java
        DelegatingPigShim.java
        DelegatingSnappyShim.java
        DelegatingSqoopShim.java
      - test
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        di
        job
        entries
        oozie
        OozieClientFactoryImpl.java
        hadoop
        shim
        common
        ClassPathModifyingSqoopShimTest.java
        HadoopShimTest.java
        ShimRegistrationTest.java
        authentication
        PropertyAuthenticationProviderParserTest.java
        authorization
        AuthenticatingHadoopShimTest.java
        delegating
        DelegatingHBaseConnectionTest.java
        DelegatingHBaseShimTest.java
        DelegatingHadoopShimTest.java
        DelegatingOozieClientFactoryTest.java
        DelegatingPigShimTest.java
        DelegatingSnappyShimTest.java
        DelegatingUtils.java
  - pig-shim-1.0
    - src
      - main
        java
        org
        pentaho
        hadoop
        shim
        common
        PigShimImpl.java
  - pig-shim-1.1
    - src
      - main
        java
        org
        pentaho
        hadoop
        shim
        common
        PigShimImpl.java
- shims
  - cdh510
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        cdh510
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - cdh511
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        cdh511
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - emr52
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        emr52
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - emr531
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        emr531
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - hdi35
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        hdi35
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
        invocationhandler
        HDIDriverInvocationHandler.java
  - hdp25
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        hdp25
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - hdp26
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        hdp26
        HadoopShim.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
  - mapr510
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        mapr510
        ConfigurationProxyV2.java
        HadoopShim.java
        MapR5DistributedCacheUtilImpl.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
        test
        java
        org
        pentaho
        hadoop
        shim
        mapr510
        MapR5DistributedCacheUtilImplOSDependentTest.java
  - mapr520
    - impl
      - src
        main
        java
        org
        apache
        hadoop
        hive
        jdbc
        HiveDriver.java
        pentaho
        hadoop
        shim
        mapr520
        ConfigurationProxyV2.java
        HadoopShim.java
        MapR5DistributedCacheUtilImpl.java
        authorization
        ShimNoOpHadoopAuthorizationService.java
        test
        java
        org
        pentaho
        hadoop
        shim
        mapr520
        MapR5DistributedCacheUtilImplOSDependentTest.java

/*******************************************************************************
 *
 * Pentaho Big Data
 *
 * Copyright (C) 2002-2015 by Pentaho : http://www.pentaho.com
 *
 *******************************************************************************
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with
 * the License. You may obtain a copy of the License at
 *
 *    http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 *
 ******************************************************************************/

package org.pentaho.hbase.mapred;

import java.io.IOException;

import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapred.TableRecordReader;

/**
 * Subclasses TableRecordReader from the mapred package in order to add more configuration options (ala the
 * implemetation in mapreduce).
 *
 * @author Mark Hall (mhall{[at]}pentaho{[dot]}com)
 */
public class PentahoTableRecordReader extends TableRecordReader {

  /**
   * Our actual record reader implementation
   */
  private PentahoTableRecordReaderImpl m_recordReaderImpl = new PentahoTableRecordReaderImpl();

  public void setScanCacheRowSize( int size ) {
    m_recordReaderImpl.setScanCacheRowSize( size );
  }

  public void setTimestamp( long ts ) {
    m_recordReaderImpl.setTimestamp( ts );
  }

  public void setTimeStampRange( long start, long end ) {
    m_recordReaderImpl.setTimeStampRange( start, end );
  }

  /**
   * Restart from survivable exceptions by creating a new scanner.
   *
   * @param firstRow
   * @throws IOException
   */
  public void restart( byte[] firstRow ) throws IOException {
    m_recordReaderImpl.restart( firstRow );
  }

  /**
   * Build the scanner. Not done in constructor to allow for extension.
   *
   * @throws IOException
   */
  public void init() throws IOException {
    m_recordReaderImpl.restart( m_recordReaderImpl.getStartRow() );
  }

  /**                                                                                                                                                  
   * @param inputColumns the columns to be placed in {@link Result}.                                                                                   
   */
  public void setInputColumns( final byte[][] inputColumns ) {
    m_recordReaderImpl.setInputColumns( inputColumns );
  }

  /**
   * @param startRow the first row in the split
   */
  public void setStartRow( final byte[] startRow ) {
    m_recordReaderImpl.setStartRow( startRow );
  }

  /**
   * @param endRow the last row in the split
   */
  public void setEndRow( final byte[] endRow ) {
    m_recordReaderImpl.setEndRow( endRow );
  }

  /**
   * @param rowFilter the {@link Filter} to be used.
   */
  public void setRowFilter( Filter rowFilter ) {
    m_recordReaderImpl.setRowFilter( rowFilter );
  }

  public void close() {
    m_recordReaderImpl.close();
  }

  /**
   * @return ImmutableBytesWritable
   * @see org.apache.hadoop.mapred.RecordReader#createKey()
   */
  public ImmutableBytesWritable createKey() {
    return m_recordReaderImpl.createKey();
  }

  /**
   * @return RowResult
   * @see org.apache.hadoop.mapred.RecordReader#createValue()
   */
  public Result createValue() {
    return m_recordReaderImpl.createValue();
  }

  public long getPos() {

    // This should be the ordinal tuple in the range;

    // not clear how to calculate...

    return m_recordReaderImpl.getPos();
  }

  public float getProgress() {
    // Depends on the total number of tuples and getPos

    return m_recordReaderImpl.getPos();
  }

  /**
   * @param key   HStoreKey as input key.
   * @param value MapWritable as input value
   * @return true if there was more data
   * @throws IOException
   */
  public boolean next( ImmutableBytesWritable key, Result value )
    throws IOException {
    return m_recordReaderImpl.next( key, value );
  }

  protected PentahoTableRecordReaderImpl getImpl() {
    return m_recordReaderImpl;
  }
}