TestEnclosedEsriJsonRecordReader.java example

Explorer

spatial-framework-for-hadoop-master
- hive
  - src
    - main
      - java
        com
        esri
        hadoop
        hive
        BinUtils.java
        GeometryUtils.java
        HiveGeometry.java
        HiveGeometryOIHelper.java
        LogUtils.java
        ST_Aggr_ConvexHull.java
        ST_Aggr_Intersection.java
        ST_Aggr_Union.java
        ST_Area.java
        ST_AsBinary.java
        ST_AsGeoJson.java
        ST_AsJson.java
        ST_AsShape.java
        ST_AsText.java
        ST_Bin.java
        ST_BinEnvelope.java
        ST_Boundary.java
        ST_Buffer.java
        ST_Centroid.java
        ST_Contains.java
        ST_ConvexHull.java
        ST_CoordDim.java
        ST_Crosses.java
        ST_Difference.java
        ST_Dimension.java
        ST_Disjoint.java
        ST_Distance.java
        ST_EndPoint.java
        ST_EnvIntersects.java
        ST_Envelope.java
        ST_Equals.java
        ST_ExteriorRing.java
        ST_GeodesicLengthWGS84.java
        ST_GeomCollection.java
        ST_GeomFromGeoJson.java
        ST_GeomFromJson.java
        ST_GeomFromShape.java
        ST_GeomFromText.java
        ST_GeomFromWKB.java
        ST_Geometry.java
        ST_GeometryAccessor.java
        ST_GeometryN.java
        ST_GeometryProcessing.java
        ST_GeometryRelational.java
        ST_GeometryType.java
        ST_InteriorRingN.java
        ST_Intersection.java
        ST_Intersects.java
        ST_Is3D.java
        ST_IsClosed.java
        ST_IsEmpty.java
        ST_IsMeasured.java
        ST_IsRing.java
        ST_IsSimple.java
        ST_Length.java
        ST_LineFromWKB.java
        ST_LineString.java
        ST_M.java
        ST_MLineFromWKB.java
        ST_MPointFromWKB.java
        ST_MPolyFromWKB.java
        ST_MaxM.java
        ST_MaxX.java
        ST_MaxY.java
        ST_MaxZ.java
        ST_MinM.java
        ST_MinX.java
        ST_MinY.java
        ST_MinZ.java
        ST_MultiLineString.java
        ST_MultiPoint.java
        ST_MultiPolygon.java
        ST_NumGeometries.java
        ST_NumInteriorRing.java
        ST_NumPoints.java
        ST_Overlaps.java
        ST_Point.java
        ST_PointFromWKB.java
        ST_PointN.java
        ST_PointZ.java
        ST_PolyFromWKB.java
        ST_Polygon.java
        ST_Relate.java
        ST_SRID.java
        ST_SetSRID.java
        ST_StartPoint.java
        ST_SymmetricDiff.java
        ST_Touches.java
        ST_Union.java
        ST_Within.java
        ST_X.java
        ST_Y.java
        ST_Z.java
        serde
        BaseJsonSerDe.java
        EsriJsonSerDe.java
        GeoJsonSerDe.java
        JsonSerde.java
        shims
        HiveShims.java
    - test
      - java
        com
        esri
        hadoop
        hive
        TestStAsShape.java
        TestStGeomFromShape.java
        TestStGeometryType.java
        TestStLineString.java
        TestStMinX.java
        TestStMinY.java
        TestStMultiPoint.java
        TestStMultiPolygon.java
        TestStPoint.java
        TestStX.java
        TestStY.java
        serde
        JsonSerDeTestingBase.java
        TestEsriJsonSerDe.java
        TestGeoJsonSerDe.java
- json
  - src
    - main
      - java
        com
        esri
        json
        EsriFeature.java
        EsriFeatureClass.java
        EsriField.java
        EsriFieldType.java
        EsriJsonFactory.java
        deserializer
        GeometryJsonDeserializer.java
        GeometryTypeJsonDeserializer.java
        SpatialReferenceJsonDeserializer.java
        hadoop
        EnclosedBaseJsonRecordReader.java
        EnclosedEsriJsonInputFormat.java
        EnclosedEsriJsonRecordReader.java
        EnclosedGeoJsonInputFormat.java
        EnclosedGeoJsonRecordReader.java
        EnclosedJsonInputFormat.java
        EnclosedJsonRecordReader.java
        UnenclosedBaseJsonRecordReader.java
        UnenclosedEsriJsonInputFormat.java
        UnenclosedEsriJsonRecordReader.java
        UnenclosedGeoJsonInputFormat.java
        UnenclosedGeoJsonRecordReader.java
        UnenclosedJsonInputFormat.java
        UnenclosedJsonRecordReader.java
        serializer
        GeometryJsonSerializer.java
        GeometryTypeJsonSerializer.java
        SpatialReferenceJsonSerializer.java
    - test
      - java
        com
        esri
        json
        hadoop
        TestEnclosedEsriJsonRecordReader.java
        TestEnclosedGeoJsonRecordReader.java
        TestUnenclosedEsriJsonRecordMrv1.java
        TestUnenclosedEsriJsonRecordReader.java
        TestUnenclosedGeoJsonRecordReader.java

package com.esri.json.hadoop;

import static org.junit.Assert.*;
import org.junit.Test;

import java.util.LinkedList;
import java.util.List;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.TaskAttemptContext;
import org.apache.hadoop.mapreduce.TaskAttemptID;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;

public class TestEnclosedEsriJsonRecordReader {

	private TaskAttemptContext createTaskAttemptContext(Configuration conf, TaskAttemptID taid)
		throws Exception  {       //shim
		try {                     // Hadoop-1
			return (TaskAttemptContext)TaskAttemptContext.class.
				getConstructor(Configuration.class, TaskAttemptID.class).
				newInstance(conf, taid);
		} catch (Exception e) {   // Hadoop-2
			Class<?> clazz =
				Class.forName("org.apache.hadoop.mapreduce.task.TaskAttemptContextImpl");
			return (TaskAttemptContext)clazz.getConstructor(Configuration.class, TaskAttemptID.class).
				newInstance(conf, taid);
		}
	}

	long [] getRecordIndexesInFile(String resource, int start, int end) throws Exception {
		EnclosedEsriJsonRecordReader reader = new EnclosedEsriJsonRecordReader();
		Path path = new Path(this.getClass().getResource(resource).getFile());
		FileSplit split = new FileSplit(path, start, end - start, new String[0]);
        try {
			TaskAttemptContext tac =
                createTaskAttemptContext(new Configuration(), new TaskAttemptID());
			reader.initialize(split, tac);
		} catch (InterruptedException ie) {
			Thread.currentThread().interrupt();
		}
		List<Long> linesList = new LinkedList<Long>();
		
		LongWritable key = null;
		//Text value = null;
		
		try {
			while (reader.nextKeyValue()) {
				key = reader.getCurrentKey();
				//value = reader.getCurrentValue();
				linesList.add(key.get());
				//System.out.println(key.get() + " - " + value);
			}
		} catch (InterruptedException ie) {
			Thread.currentThread().interrupt();
		}
		
		long [] offsets = new long[linesList.size()];  // list-as-array
		for (int i=0;i<linesList.size();i++) {
			offsets[i] = linesList.get(i);
		}
        reader.close();
		return offsets;
	}

	@Test
	public void TestArbitrarySplitLocations() throws Exception {
		//long [] recordBreaks = new long[] { 1872, 11284, 0, 0, 0,  };
		//assertArrayEquals(new long[] { 94L }, getRecordIndexesInFile("sample-study-area.json", 0, 208));
		long[] rslt = getRecordIndexesInFile("sample-study-area.json", 0, 208);
		assertEquals(1, rslt.length);
	}

	@Test
	public void TestMrv1() throws Exception {
		//long [] recordBreaks = new long[] { 1872, 11284, 0, 0, 0,  };
		//assertArrayEquals(new long[] { 94L }, getRecordIndexesInFile("sample-study-area.json", 0, 208));
		Path path = new Path(this.getClass().getResource("sample-study-area.json").getFile());
		org.apache.hadoop.mapred.JobConf conf = new org.apache.hadoop.mapred.JobConf();
		org.apache.hadoop.mapred.FileSplit split =
			new org.apache.hadoop.mapred.FileSplit(path, 0, 208, new String[0]);
		EnclosedEsriJsonRecordReader reader = new EnclosedEsriJsonRecordReader(split, conf);
		LongWritable key = reader.createKey();
		Text value = reader.createValue();
		assertTrue (reader.next(key, value));
		//System.out.println(key.get() + " - " + value.toString());
		assertFalse (reader.next(key, value));
		reader.close();
	}

	@Test
	public void TestLegacy() throws Exception {
		Path path = new Path(this.getClass().getResource("sample-study-area.json").getFile());
		org.apache.hadoop.mapred.JobConf conf = new org.apache.hadoop.mapred.JobConf();
		org.apache.hadoop.mapred.FileSplit split =
			new org.apache.hadoop.mapred.FileSplit(path, 0, 208, new String[0]);
		EnclosedEsriJsonRecordReader reader = new EnclosedJsonRecordReader(split, conf);
		LongWritable key = reader.createKey();
		Text value = reader.createValue();
		assertTrue (reader.next(key, value));
		//System.out.println(key.get() + " - " + value.toString());
		assertFalse (reader.next(key, value));
		reader.close();
	}

}