TitanHBaseInputFormat.java example

Explorer

faunus-master
- src
  - main
    - java
      - com
        thinkaurelius
        faunus
        FaunusEdge.java
        FaunusElement.java
        FaunusFactory.java
        FaunusGraph.java
        FaunusPipeline.java
        FaunusVertex.java
        Holder.java
        Tokens.java
        WeightedWritable.java
        formats
        BlueprintsGraphOutputMapReduce.java
        EdgeCopyMapReduce.java
        FaunusFileOutputFormat.java
        FormatTools.java
        Inverter.java
        JobConfigurationFormat.java
        MapReduceFormat.java
        VertexQueryFilter.java
        edgelist
        EdgeListInputMapReduce.java
        EdgeListOutputFormat.java
        EdgeListRecordWriter.java
        rdf
        Crc64.java
        RDFBlueprintsHandler.java
        RDFInputFormat.java
        RDFRecordReader.java
        graphson
        FaunusGraphSONUtility.java
        GraphSONInputFormat.java
        GraphSONOutputFormat.java
        GraphSONRecordReader.java
        GraphSONRecordWriter.java
        noop
        NoOpOutputFormat.java
        NoOpRecordWriter.java
        rexster
        FaunusRexsterInputFormatExtension.java
        RexsterConfiguration.java
        RexsterInputFormat.java
        RexsterInputSplit.java
        RexsterRecordReader.java
        util
        DefaultElementIdHandler.java
        ElementIdHandler.java
        HttpHelper.java
        OrientElementIdHandler.java
        TitanBerkeleyJEElementIdHandler.java
        VertexToFaunusBinary.java
        script
        ScriptInputFormat.java
        ScriptOutputFormat.java
        ScriptRecordReader.java
        ScriptRecordWriter.java
        titan
        FaunusTitanGraph.java
        FaunusVertexLoader.java
        GraphFactory.java
        SchemaInferencerMapReduce.java
        TitanInputFormat.java
        TitanOutputFormat.java
        cassandra
        FaunusTitanCassandraGraph.java
        TitanCassandraInputFormat.java
        TitanCassandraOutputFormat.java
        TitanCassandraRecordReader.java
        hbase
        FaunusTitanHBaseGraph.java
        TitanHBaseInputFormat.java
        TitanHBaseOutputFormat.java
        TitanHBaseRecordReader.java
        hdfs
        HDFSTools.java
        NoFilter.java
        NoSideEffectFilter.java
        NoUnderscoreFilter.java
        TextFileLineIterator.java
        mapreduce
        FaunusCompiler.java
        IdentityMap.java
        MapSequence.java
        MemoryMapper.java
        filter
        BackFilterMapReduce.java
        CyclicPathFilterMap.java
        DuplicateFilterMap.java
        FilterMap.java
        IntervalFilterMap.java
        PropertyFilterMap.java
        sideeffect
        CommitEdgesMap.java
        CommitVerticesMapReduce.java
        GroupCountMapReduce.java
        LinkMapReduce.java
        ScriptMap.java
        SideEffectMap.java
        ValueGroupCountMapReduce.java
        transform
        EdgesMap.java
        EdgesVerticesMap.java
        OrderMapReduce.java
        PathMap.java
        PropertyMap.java
        PropertyMapMap.java
        TransformMap.java
        VertexMap.java
        VerticesEdgesMapReduce.java
        VerticesMap.java
        VerticesVerticesMapReduce.java
        util
        CountMapReduce.java
        CounterMap.java
        ElementChecker.java
        ElementPicker.java
        EmptyConfiguration.java
        SafeMapperOutputs.java
        SafeReducerOutputs.java
        WritableComparators.java
        WritableHandler.java
        tinkerpop
        gremlin
        Console.java
        FaunusGremlinScriptEngine.java
        FaunusGremlinScriptEngineFactory.java
        Imports.java
        InlineScriptExecutor.java
        ResultHookClosure.java
        ScriptExecutor.java
        Version.java
        rexster
        FaunusEvaluationJob.java
        FaunusRexsterExecutorExtension.java
  - test
    - java
      - com
        thinkaurelius
        faunus
        BaseTest.java
        FaunusEdgeTest.java
        FaunusElementTest.java
        FaunusPipelineTest.java
        FaunusVertexTest.java
        HolderTest.java
        WeightedWritableTest.java
        WritableHandlerTest.java
        formats
        BlueprintsGraphOutputMapReduceTest.java
        EdgeCopyMapReduceTest.java
        InverterTest.java
        VertexQueryFilterTest.java
        edgelist
        EdgeListInputMapReduceTest.java
        EdgeListOutputFormatTest.java
        rdf
        RDFBlueprintsHandlerTest.java
        RDFInputFormatTest.java
        RDFRecordReaderTest.java
        graphson
        FaunusGraphSONUtilityTest.java
        GraphSONInputFormatTest.java
        GraphSONOutputFormatTest.java
        GraphSONRecordReaderTest.java
        noop
        NoOpOutputFormatTest.java
        rexster
        FaunusRexsterInputFormatExtensionTest.java
        RexsterInputFormatTest.java
        util
        DefaultElementIdHandlerTest.java
        VertexToFaunusBinaryTest.java
        script
        ScriptInputFormatTest.java
        ScriptOutputFormatTest.java
        ScriptRecordReaderTest.java
        ScriptRecordWriterTest.java
        titan
        GraphFactoryTest.java
        cassandra
        TitanCassandraInputFormatTest.java
        TitanCassandraOutputFormatTest.java
        hbase
        TitanHBaseInputFormatTest.java
        TitanHBaseOutputFormatTest.java
        hdfs
        HDFSToolsTest.java
        mapreduce
        FaunusCompilerTest.java
        IdentityMapTest.java
        MapSequenceTest.java
        MemoryMapperTest.java
        filter
        BackFilterMapReduceTest.java
        CyclicPathFilterMapTest.java
        DuplicateFilterMapTest.java
        FilterMapTest.java
        IntervalFilterMapTest.java
        PropertyFilterMapTest.java
        sideeffect
        CommitEdgesMapTest.java
        CommitVerticesMapReduceTest.java
        GroupCountMapReduceTest.java
        LinkMapReduceTest.java
        SideEffectMapTest.java
        ValueGroupCountMapReduceTest.java
        transform
        EdgesMapTest.java
        EdgesVerticesMapTest.java
        PathMapTest.java
        PropertyMapTest.java
        TransformMapTest.java
        VertexMapTest.java
        VerticesEdgesMapReduceTest.java
        VerticesMapTest.java
        VerticesVerticesMapReduceTest.java
        util
        CountMapReduceTest.java
        CounterMapTest.java
        ElementCheckerTest.java
        ElementPickerTest.java
        EmptyConfigurationTest.java
        tinkerpop
        gremlin
        FaunusGremlinScriptEngineTest.java
        ScriptExecutorTest.java

package com.thinkaurelius.faunus.formats.titan.hbase;

import com.thinkaurelius.faunus.FaunusVertex;
import com.thinkaurelius.faunus.formats.VertexQueryFilter;
import com.thinkaurelius.faunus.formats.titan.GraphFactory;
import com.thinkaurelius.faunus.formats.titan.TitanInputFormat;
import com.thinkaurelius.faunus.mapreduce.FaunusCompiler;
import com.thinkaurelius.titan.diskstorage.Backend;
import com.thinkaurelius.titan.diskstorage.hbase.HBaseKeyColumnValueStore;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HConstants;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.mapreduce.TableInputFormat;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableRecordReader;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.mapreduce.InputSplit;
import org.apache.hadoop.mapreduce.JobContext;
import org.apache.hadoop.mapreduce.RecordReader;
import org.apache.hadoop.mapreduce.TaskAttemptContext;

import java.io.IOException;
import java.lang.reflect.Method;
import java.util.List;

/**
 * @author Marko A. Rodriguez (http://markorodriguez.com)
 */
public class TitanHBaseInputFormat extends TitanInputFormat {

    public static final String FAUNUS_GRAPH_INPUT_TITAN_STORAGE_TABLENAME = "faunus.graph.input.titan.storage.tablename";
    static final byte[] EDGE_STORE_FAMILY = Bytes.toBytes(Backend.EDGESTORE_NAME);

    private final TableInputFormat tableInputFormat = new TableInputFormat();
    private FaunusTitanHBaseGraph graph;
    private VertexQueryFilter vertexQuery;
    private boolean pathEnabled;

    @Override
    public List<InputSplit> getSplits(final JobContext jobContext) throws IOException, InterruptedException {
        return this.tableInputFormat.getSplits(jobContext);
    }

    @Override
    public RecordReader<NullWritable, FaunusVertex> createRecordReader(final InputSplit inputSplit, final TaskAttemptContext taskAttemptContext) throws IOException, InterruptedException {
        return new TitanHBaseRecordReader(this.graph, this.vertexQuery, this.pathEnabled, (TableRecordReader) this.tableInputFormat.createRecordReader(inputSplit, taskAttemptContext));
    }

    @Override
    public void setConf(final Configuration config) {
        this.graph = new FaunusTitanHBaseGraph(GraphFactory.generateTitanConfiguration(config, FAUNUS_GRAPH_INPUT_TITAN));
        this.vertexQuery = VertexQueryFilter.create(config);
        this.pathEnabled = config.getBoolean(FaunusCompiler.PATH_ENABLED, false);

        //config.set(TableInputFormat.SCAN_COLUMN_FAMILY, Backend.EDGESTORE_NAME);
        config.set(TableInputFormat.INPUT_TABLE, config.get(FAUNUS_GRAPH_INPUT_TITAN_STORAGE_TABLENAME));
        config.set(HConstants.ZOOKEEPER_QUORUM, config.get(FAUNUS_GRAPH_INPUT_TITAN_STORAGE_HOSTNAME));
        if (config.get(FAUNUS_GRAPH_INPUT_TITAN_STORAGE_PORT, null) != null)
            config.set(HConstants.ZOOKEEPER_CLIENT_PORT, config.get(FAUNUS_GRAPH_INPUT_TITAN_STORAGE_PORT));
        config.set("storage.read-only", "true");
        config.set("autotype", "none");
        Scan scanner = new Scan();
        scanner.addFamily(Backend.EDGESTORE_NAME.getBytes());
        scanner.setFilter(getColumnFilter(this.vertexQuery));
        //TODO (minor): should we set other options in http://hbase.apache.org/apidocs/org/apache/hadoop/hbase/client/Scan.html for optimization?
        Method converter;
        try {
            converter = TableMapReduceUtil.class.getDeclaredMethod("convertScanToString", Scan.class);
            converter.setAccessible(true);
            config.set(TableInputFormat.SCAN, (String) converter.invoke(null, scanner));
        } catch (Exception e) {
            throw new RuntimeException(e);
        }

        this.tableInputFormat.setConf(config);
    }

    private Filter getColumnFilter(VertexQueryFilter inputFilter) {
        return HBaseKeyColumnValueStore.getFilter(TitanInputFormat.inputSlice(inputFilter, graph));
    }

    @Override
    public Configuration getConf() {
        return tableInputFormat.getConf();
    }
}