HiveAvroORCQueryGenerator.java example

Explorer

gobblin-master
- gobblin-admin
  - src
    - main
      - java
        gobblin
        admin
        AdminWebServer.java
        cli
        AdminClient.java
        Cli.java
        CliTablePrinter.java
        Command.java
        JobCommand.java
        JobInfoPrintUtils.java
    - test
      - java
        gobblin
        admin
        AdminWebServerTest.java
- gobblin-api
  - src
    - main
      - java
        gobblin
        Constructs.java
        annotation
        Alias.java
        Alpha.java
        Beta.java
        Stable.java
        broker
        BrokerConstants.java
        ResourceCoordinate.java
        ResourceInstance.java
        SimpleScope.java
        SimpleScopeType.java
        gobblin_scopes
        GobblinScopeInstance.java
        GobblinScopeTypes.java
        JobScopeInstance.java
        TaskScopeInstance.java
        iface
        ConfigView.java
        NoSuchScopeException.java
        NotConfiguredException.java
        ScopeInstance.java
        ScopeType.java
        ScopedConfigView.java
        SharedResourceFactory.java
        SharedResourceFactoryResponse.java
        SharedResourceKey.java
        SharedResourcesBroker.java
        SubscopedBrokerBuilder.java
        codec
        StreamCodec.java
        commit
        CommitSequence.java
        CommitSequenceStore.java
        CommitStep.java
        CommitStepBase.java
        DeliverySemantics.java
        compat
        hadoop
        TextSerializer.java
        WritableShim.java
        configuration
        ConfigurationKeys.java
        ImmutableWorkUnitState.java
        SourceState.java
        State.java
        StateUtils.java
        WorkUnitState.java
        converter
        Converter.java
        DataConversionException.java
        SchemaConversionException.java
        crypto
        CredentialStore.java
        EncryptionProvider.java
        dataset
        Dataset.java
        DatasetsFinder.java
        FileSystemDataset.java
        IterableDatasetFinder.java
        IterableDatasetFinderImpl.java
        fork
        CopyHelper.java
        CopyNotSupportedException.java
        Copyable.java
        ForkOperator.java
        metadata
        MetadataMerger.java
        password
        PasswordManager.java
        publisher
        DataPublisher.java
        SingleTaskDataPublisher.java
        UnpublishedHandling.java
        qualitychecker
        row
        RowLevelPolicy.java
        task
        TaskLevelPolicy.java
        recordaccess
        FieldDoesNotExistException.java
        IncorrectTypeException.java
        RecordAccessor.java
        RecordAccessorException.java
        RecordAccessorProvider.java
        runtime
        api
        Spec.java
        SpecExecutorInstance.java
        SpecExecutorInstanceConsumer.java
        SpecExecutorInstanceProducer.java
        source
        Source.java
        WorkUnitStreamSource.java
        extractor
        CheckpointableWatermark.java
        ComparableWatermark.java
        DataRecordException.java
        Extractor.java
        RecordEnvelope.java
        StreamingExtractor.java
        Watermark.java
        WatermarkInterval.java
        WatermarkSerializerHelper.java
        workunit
        BasicWorkUnitStream.java
        Extract.java
        ExtractFactory.java
        ImmutableExtract.java
        ImmutableWorkUnit.java
        MissingExtractAttributeException.java
        MultiWorkUnit.java
        WorkUnit.java
        WorkUnitBinPacker.java
        WorkUnitStream.java
        WorkUnitWeighter.java
        testing
        AssertWithBackoff.java
        util
        ClassAliasResolver.java
        CompletedFuture.java
        Decorator.java
        DecoratorUtils.java
        FinalState.java
        RecordCountProvider.java
        writer
        DataWriter.java
        DataWriterBuilder.java
        Destination.java
        FluentDataWriterBuilder.java
        WatermarkStorage.java
        WriterOutputFormat.java
    - test
      - java
        gobblin
        broker
        gobblin_scopes
        GobblinScopesTest.java
        compat
        TextSerializerTest.java
        configuration
        StateTest.java
        fork
        CopyHelperTest.java
        password
        PasswordManagerTest.java
        source
        extractor
        TestWatermark.java
        WatermarkTest.java
        workunit
        ExtractFactoryTest.java
        testing
        AssertWithBackoffTest.java
        util
        ClassAliasResolverTest.java
- gobblin-audit
  - src
    - main
      - java
        gobblin
        audit
        values
        auditor
        ValueAuditGenerator.java
        ValueAuditRuntimeMetadata.java
        policy
        column
        AbstractColumnProjectionPolicy.java
        ColumnProjectionPolicy.java
        DefaultColumnProjectionPolicyFactory.java
        ProjectAllColumnProjectionPolicy.java
        row
        AbstractRowSelectionPolicy.java
        DefaultRowSelectionPolicyFactory.java
        RowSelectionPolicy.java
        SelectAllRowSelectionPolicy.java
        sink
        AuditSink.java
        DefaultAuditSinkFactory.java
        FsAuditSink.java
    - test
      - java
        gobblin
        audit
        values
        FsAuditSinkTest.java
        MockSink.java
        ValueAuditGeneratorTest.java
        ValueAuditRuntimeMetadataTest.java
- gobblin-aws
  - src
    - main
      - java
        gobblin
        aws
        AWSClusterSecurityManager.java
        AWSJobConfigurationManager.java
        AWSSdkClient.java
        AWSShutdownHandler.java
        CloudInitScriptBuilder.java
        GobblinAWSClusterLauncher.java
        GobblinAWSClusterManager.java
        GobblinAWSConfigurationKeys.java
        GobblinAWSTaskRunner.java
        GobblinAWSUtils.java
        Log4jConfigHelper.java
    - test
      - java
        gobblin
        aws
        AWSJobConfigurationManagerTest.java
        CloudInitScriptBuilderTest.java
        GobblinAWSClusterLauncherTest.java
- gobblin-cluster
  - src
    - main
      - java
        gobblin
        cluster
        ContainerMetrics.java
        GobblinClusterConfigurationKeys.java
        GobblinClusterManager.java
        GobblinClusterMetricTagNames.java
        GobblinClusterUtils.java
        GobblinHelixConstants.java
        GobblinHelixJob.java
        GobblinHelixJobLauncher.java
        GobblinHelixJobScheduler.java
        GobblinHelixMessagingService.java
        GobblinHelixTask.java
        GobblinHelixTaskDriver.java
        GobblinHelixTaskFactory.java
        GobblinHelixTaskStateTracker.java
        GobblinTaskRunner.java
        GobblinTaskStateModel.java
        GobblinTaskStateModelFactory.java
        HelixMessageSubTypes.java
        HelixUtils.java
        JobConfigurationManager.java
        NoopReplyHandler.java
        ScheduledJobConfigurationManager.java
        StreamingJobConfigurationManager.java
        event
        ClusterManagerShutdownRequest.java
        DeleteJobConfigArrivalEvent.java
        NewJobConfigArrivalEvent.java
        UpdateJobConfigArrivalEvent.java
        org
        apache
        helix
        task
        GobblinJobRebalancer.java
    - test
      - java
        gobblin
        cluster
        GobblinClusterKillTest.java
        GobblinClusterManagerTest.java
        GobblinHelixJobLauncherTest.java
        GobblinHelixTaskTest.java
        GobblinTaskRunnerTest.java
        HelixMessageTestBase.java
        HelixUtilsTest.java
        JobConfigurationManagerTest.java
        TestHelper.java
        TestShutdownMessageHandlerFactory.java
- gobblin-compaction
  - src
    - main
      - java
        gobblin
        compaction
        CliOptions.java
        Compactor.java
        CompactorCreationException.java
        CompactorFactory.java
        ReflectionCompactorFactory.java
        action
        CompactionCompleteAction.java
        CompactionCompleteFileOperationAction.java
        CompactionHiveRegistrationAction.java
        audit
        AuditCountClient.java
        AuditCountClientFactory.java
        KafkaAuditCountHttpClient.java
        KafkaAuditCountHttpClientFactory.java
        PinotAuditCountHttpClient.java
        PinotAuditCountHttpClientFactory.java
        conditions
        RecompactionCombineCondition.java
        RecompactionCondition.java
        RecompactionConditionBasedOnDuration.java
        RecompactionConditionBasedOnFileCount.java
        RecompactionConditionBasedOnRatio.java
        RecompactionConditionFactory.java
        dataset
        Dataset.java
        DatasetHelper.java
        DatasetsFinder.java
        SimpleDatasetsFinder.java
        TimeBasedSubDirDatasetsFinder.java
        event
        CompactionSlaEventHelper.java
        DedupeStatus.java
        hive
        AvroExternalTable.java
        CompactionRunner.java
        HdfsIO.java
        HdfsReader.java
        HdfsWriter.java
        HiveAttribute.java
        HiveManagedTable.java
        HiveTable.java
        SerialCompactor.java
        registration
        HiveRegistrationCompactorListener.java
        hivebasedconstructs
        CompactionLauncherWriter.java
        CompactionLauncherWriterBuilder.java
        HiveMetadataForCompactionExtractor.java
        HiveMetadataForCompactionExtractorFactory.java
        MRCompactionEntity.java
        listeners
        CompactorCompletionListener.java
        CompactorCompletionListenerFactory.java
        CompactorListener.java
        CompactorListenerCreationException.java
        CompactorListenerFactory.java
        ReflectionCompactorListenerFactory.java
        SerialCompactorListener.java
        SimpleCompactorCompletionListener.java
        mapreduce
        CompactionAvroJobConfigurator.java
        MRCompactionRunner.java
        MRCompactionTask.java
        MRCompactionTaskFactory.java
        MRCompactor.java
        MRCompactorJobPropCreator.java
        MRCompactorJobRunner.java
        avro
        AvroDeltaFieldNameProvider.java
        AvroKeyCombineFileRecordReader.java
        AvroKeyCompactorOutputCommitter.java
        AvroKeyCompactorOutputFormat.java
        AvroKeyDedupReducer.java
        AvroKeyMapper.java
        AvroKeyRecursiveCombineFileInputFormat.java
        ConfBasedDeltaFieldProvider.java
        FieldAttributeBasedDeltaFieldsProvider.java
        MRCompactorAvroKeyDedupJobRunner.java
        parser
        CompactionPathParser.java
        source
        CompactionSource.java
        suite
        CompactionAvroSuite.java
        CompactionAvroSuiteFactory.java
        CompactionSuite.java
        CompactionSuiteFactory.java
        CompactionSuiteUtils.java
        verify
        CompactionAuditCountVerifier.java
        CompactionThresholdVerifier.java
        CompactionTimeRangeVerifier.java
        CompactionVerifier.java
        DataCompletenessVerifier.java
        InputRecordCountHelper.java
    - test
      - java
        gobblin
        compaction
        mapreduce
        MRCompactionTaskTest.java
        MRCompactorJobRunnerFilenameRecordCountProviderTest.java
        RenameSourceDirectoryTest.java
        avro
        AvroKeyDedupReducerTest.java
        ConfBasedDeltaFieldProviderTest.java
        FieldAttributeBasedDeltaFieldsProviderTest.java
        MRCompactorAvroKeyDedupJobRunnerTest.java
        conditions
        RecompactionConditionTest.java
        verify
        PinotAuditCountVerifierTest.java
- gobblin-config-management
  - gobblin-config-client
    - src
      - main
        java
        gobblin
        config
        client
        ConfigClient.java
        ConfigClientCache.java
        ConfigClientUtils.java
        ConfigStoreFactoryRegister.java
        package-info.java
      - test
        java
        gobblin
        config
        client
        TestConfigClient.java
        TestConfigClientUtils.java
  - gobblin-config-core
    - src
      - main
        java
        gobblin
        config
        client
        api
        ConfigStoreFactoryDoesNotExistsException.java
        VersionStabilityPolicy.java
        common
        impl
        CircularDependencyException.java
        ConfigStoreBackedTopology.java
        ConfigStoreBackedValueInspector.java
        ConfigStoreTopologyInspector.java
        ConfigStoreValueInspector.java
        InMemoryTopology.java
        InMemoryValueInspector.java
        SingleLinkedListConfigKeyPath.java
        store
        api
        ConfigKeyPath.java
        ConfigStore.java
        ConfigStoreCreationException.java
        ConfigStoreFactory.java
        ConfigStoreWithBatchFetches.java
        ConfigStoreWithImportedBy.java
        ConfigStoreWithImportedByRecursively.java
        ConfigStoreWithResolution.java
        ConfigStoreWithStableVersioning.java
        VersionDoesNotExistException.java
        package-info.java
        deploy
        ClasspathConfigSource.java
        ConfigStream.java
        Deployable.java
        DeployableConfigSource.java
        DeploymentConfig.java
        FsDeploymentConfig.java
        StoreDeployer.java
        hdfs
        SimpleHDFSConfigStore.java
        SimpleHDFSConfigStoreFactory.java
        SimpleHDFSStoreMetadata.java
        SimpleLocalHDFSConfigStoreFactory.java
        UserDirectoryHDFSConfigStoreFactory.java
      - test
        java
        gobblin
        config
        TestEnvironment.java
        common
        impl
        TestCircularDependency.java
        TestConfigStoreValueInspector.java
        TestInMemoryTopology.java
        TestSingleLinkedListConfigKeyPath.java
        store
        hdfs
        SimpleHDFSStoreMetadataTest.java
        SimpleHdfsConfigStoreTest.java
        SimpleHdfsConfigureStoreFactoryTest.java
- gobblin-core
  - src
    - main
      - java
        gobblin
        async
        AsyncDataDispatcher.java
        DispatchException.java
        commit
        FsRenameCommitStep.java
        SpeculativeAttemptAwareConstruct.java
        config
        ConfigBuilder.java
        converter
        EmptyIterable.java
        GobblinMetricsPinotFlattenerConverter.java
        StringSchemaInjector.java
        avro
        AvroFieldRetrieverConverter.java
        AvroRecordToAvroWritableConverter.java
        AvroToAvroCopyableConverter.java
        FlattenNestedKeyConverter.java
        JsonElementConversionFactory.java
        JsonIntermediateToAvroConverter.java
        UnsupportedDateTypeException.java
        csv
        CsvToJsonConverter.java
        CsvToJsonConverterV2.java
        filter
        AvroFieldsPickConverter.java
        AvroFilterConverter.java
        http
        AvroToRestJsonEntryConverter.java
        RestEntry.java
        initializer
        AvroToJdbcEntryConverterInitializer.java
        ConverterInitializer.java
        ConverterInitializerFactory.java
        MultiConverterInitializer.java
        NoopConverterInitializer.java
        jdbc
        AvroToJdbcEntryConverter.java
        JdbcEntryData.java
        JdbcEntryDatum.java
        JdbcEntryMetaDatum.java
        JdbcEntrySchema.java
        JdbcType.java
        json
        JsonStringToJsonIntermediateConverter.java
        JsonToStringConverter.java
        objectstore
        ObjectStoreConverter.java
        ObjectStoreDeleteConverter.java
        serde
        HiveSerDeConverter.java
        string
        ObjectToStringConverter.java
        StringFilterConverter.java
        StringSplitterConverter.java
        StringSplitterToListConverter.java
        StringToBytesConverter.java
        TextToStringConverter.java
        fork
        CopyableGenericRecord.java
        CopyableSchema.java
        IdentityForkOperator.java
        http
        DefaultHttpClientConfigurator.java
        HttpClient.java
        HttpClientConfigurator.java
        HttpClientConfiguratorLoader.java
        ResponseHandler.java
        ResponseStatus.java
        StatusType.java
        initializer
        Initializer.java
        MultiInitializer.java
        NoopInitializer.java
        policies
        avro
        AvroHeaderGuidPolicy.java
        AvroHeaderTimestampPolicy.java
        AvroRecordTimestampLowerBoundPolicy.java
        count
        RowCountPolicy.java
        RowCountRangePolicy.java
        schema
        SchemaCompatibilityPolicy.java
        SchemaRowCheckPolicy.java
        time
        RecordTimestampLowerBoundPolicy.java
        publisher
        BaseDataPublisher.java
        BaseDataPublisherWithHiveRegistration.java
        CommitSequencePublisher.java
        HiveRegistrationPublisher.java
        JdbcPublisher.java
        NoopPublisher.java
        TaskPublisher.java
        TaskPublisherBuilder.java
        TaskPublisherBuilderFactory.java
        TimePartitionedDataPublisher.java
        TimestampDataPublisher.java
        TimestampDataPublisherWithHiveRegistration.java
        qualitychecker
        row
        RowLevelErrFileWriter.java
        RowLevelPolicyCheckResults.java
        RowLevelPolicyChecker.java
        RowLevelPolicyCheckerBuilder.java
        RowLevelPolicyCheckerBuilderFactory.java
        task
        TaskLevelPolicyCheckResults.java
        TaskLevelPolicyChecker.java
        TaskLevelPolicyCheckerBuilder.java
        TaskLevelPolicyCheckerBuilderFactory.java
        recordaccess
        AvroGenericRecordAccessor.java
        CoreRecordAccessProvider.java
        RecordAccessorProviderFactory.java
        retry
        RetryerFactory.java
        source
        DatePartitionedAvroFileSource.java
        DatePartitionedDailyAvroSource.java
        DatePartitionedNestedRetriever.java
        PartitionAwareFileRetriever.java
        PartitionedFileSourceBase.java
        RegexBasedPartitionedRetriever.java
        RegexPartitionedAvroFileSource.java
        extractor
        DatePartitionedAvroFileExtractor.java
        DummyExtractor.java
        exception
        ExtractPrepareException.java
        HighWatermarkException.java
        MetadataException.java
        RecordCountException.java
        RestApiClientException.java
        RestApiConnectionException.java
        RestApiProcessingException.java
        SchemaException.java
        extract
        Command.java
        CommandOutput.java
        CommandType.java
        ExtractType.java
        ProtocolSpecificLayer.java
        QueryBasedExtractor.java
        QueryBasedSource.java
        SourceSpecificLayer.java
        jdbc
        JdbcCommand.java
        JdbcCommandFormatException.java
        JdbcCommandOutput.java
        JdbcExtractor.java
        JdbcProvider.java
        JdbcSpecificLayer.java
        MysqlExtractor.java
        MysqlSource.java
        OracleExtractor.java
        OracleSource.java
        SqlQueryUtils.java
        SqlServerExtractor.java
        SqlServerSource.java
        TeradataExtractor.java
        TeradataSource.java
        restapi
        RestApiCommand.java
        RestApiCommandOutput.java
        RestApiConnector.java
        RestApiExtractor.java
        RestApiSpecificLayer.java
        sftp
        SftpExtractor.java
        SftpFsHelper.java
        SftpLightWeightFileSystem.java
        SftpSource.java
        filebased
        CsvFileDownloader.java
        FileBasedExtractor.java
        FileBasedHelper.java
        FileBasedHelperException.java
        FileBasedSource.java
        FileByteIterator.java
        FileDownloader.java
        GZIPFileDownloader.java
        SingleFileDownloader.java
        SizeAwareFileBasedHelper.java
        SizeAwareFileBasedHelperDecorator.java
        TimestampAwareFileBasedHelper.java
        TokenBasedFileInputStreamExtractor.java
        TokenizedFileDownloader.java
        hadoop
        AvroFileExtractor.java
        AvroFileSource.java
        AvroFsHelper.java
        HadoopFileInputExtractor.java
        HadoopFileInputSource.java
        HadoopFsHelper.java
        HadoopTextInputSource.java
        OldApiHadoopFileInputExtractor.java
        OldApiHadoopFileInputSource.java
        OldApiHadoopTextInputSource.java
        OldApiWritableFileExtractor.java
        OldApiWritableFileSource.java
        partition
        AppendMaxLimitType.java
        Partition.java
        Partitioner.java
        resultset
        RecordSet.java
        RecordSetList.java
        schema
        ArrayDataType.java
        ColumnAttributes.java
        ColumnNameCase.java
        DataType.java
        EnumDataType.java
        MapDataType.java
        Schema.java
        utils
        InputStreamCSVReader.java
        ProxyFsInput.java
        Utils.java
        watermark
        DateWatermark.java
        HourWatermark.java
        Predicate.java
        SimpleWatermark.java
        TimestampWatermark.java
        Watermark.java
        WatermarkPredicate.java
        WatermarkType.java
        workunit
        MultiWorkUnitWeightedQueue.java
        state
        ConstructState.java
        util
        TestUtils.java
        writer
        AvroDataWriterBuilder.java
        AvroHdfsDataWriter.java
        ConsoleWriter.java
        ConsoleWriterBuilder.java
        DataWriterWrapperBuilder.java
        FsDataWriter.java
        FsDataWriterBuilder.java
        HiveWritableHdfsDataWriter.java
        HiveWritableHdfsDataWriterBuilder.java
        JdbcWriter.java
        JdbcWriterBuilder.java
        MetadataAwareWriter.java
        MetadataWriterWrapper.java
        PartitionedDataWriter.java
        Retriable.java
        RetryWriter.java
        SchemaBasedPartitionedDataWriterBuilder.java
        SimpleDataWriter.java
        SimpleDataWriterBuilder.java
        ThrottleWriter.java
        commands
        BaseJdbcBufferedInserter.java
        GenericJdbcBufferedInserter.java
        JdbcBufferedInserter.java
        JdbcWriterCommands.java
        JdbcWriterCommandsFactory.java
        MySqlBufferedInserter.java
        MySqlWriterCommands.java
        TeradataBufferedInserter.java
        TeradataWriterCommands.java
        http
        AbstractAsyncDataWriter.java
        AbstractHttpWriter.java
        AbstractHttpWriterBuilder.java
        AsyncHttpWriter.java
        AsyncHttpWriterBuilder.java
        AsyncWriteRequest.java
        AsyncWriteRequestBuilder.java
        BufferedRecord.java
        DelegatingHttpClientConnectionManager.java
        HttpWriter.java
        HttpWriterBuilder.java
        HttpWriterDecoration.java
        HttpWriterDecorator.java
        RestJsonWriter.java
        RestJsonWriterBuilder.java
        RestWriter.java
        RestWriterBuilder.java
        SalesForceRestWriterBuilder.java
        SalesforceRestWriter.java
        UnexpectedResponseException.java
        initializer
        JdbcWriterInitializer.java
        MultiWriterInitializer.java
        NoopWriterInitializer.java
        WriterInitializer.java
        WriterInitializerFactory.java
        objectstore
        ObjectStoreClient.java
        ObjectStoreDeleteOperation.java
        ObjectStoreOperation.java
        ObjectStoreOperationBuilder.java
        ObjectStoreWriter.java
        response
        DeleteResponse.java
        GetObjectResponse.java
        partitioner
        SchemaBasedWriterPartitioner.java
        TimeBasedAvroWriterPartitioner.java
        TimeBasedWriterPartitioner.java
        WorkUnitStateWriterPartitioner.java
        test
        GobblinTestEventBusWriter.java
        TestingEventBusAsserter.java
        TestingEventBuses.java
    - test
      - java
        gobblin
        async
        AsyncDataDispatcherTest.java
        commit
        FsRenameCommitStepTest.java
        configuration
        StateTest.java
        WorkUnitStateTest.java
        workunit
        MultiWorkUnitTest.java
        converter
        EmptyIterableTest.java
        GobblinMetricsPinotFlattenerConverterTest.java
        avro
        FlattenNestedKeyConverterTest.java
        JsonIntermediateToAvroConverterTest.java
        csv
        CsvToJsonConverterV2Test.java
        filter
        AvroFieldsPickConverterTest.java
        http
        AvroToRestJsonEntryConverterTest.java
        jdbc
        AvroToJdbcEntryConverterTest.java
        objectstore
        ObjectStoreDeleteConverterTest.java
        string
        ObjectToStringConverterTest.java
        StringFilterConverterTest.java
        StringSplitterConverterTest.java
        StringSplitterToListConverterTest.java
        TextToStringConverterTest.java
        fork
        CopyableGenericRecordTest.java
        CopyableSchemaTest.java
        IdentityForkOperatorTest.java
        http
        TestDefaultHttpClientConfiguration.java
        TestHttpClientConfiguratorLoader.java
        instrumented
        InstrumentedTest.java
        policies
        count
        RowCountRangePolicyTest.java
        publisher
        BaseDataPublisherTest.java
        qualitychecker
        RowCountTaskLevelPolicyTest.java
        RowLevelQualityCheckerTest.java
        TaskLevelQualityCheckerTest.java
        TestConstants.java
        TestRowLevelPolicy.java
        TestRowLevelPolicyFail.java
        TestTaskLevelPolicy.java
        recordaccess
        AvroGenericRecordAccessorTest.java
        RecordAccessorProviderFactoryTest.java
        serde
        HiveSerDeTest.java
        source
        RegexBasedPartitionedRetrieverTest.java
        extractor
        DatePartitionedAvroFileExtractorTest.java
        extract
        QueryBasedExtractorTest.java
        QueryBasedSourceTest.java
        jdbc
        JdbcExtractorTest.java
        MockJdbcColumn.java
        OracleExtractorTest.java
        SqlQueryUtilsTest.java
        filebased
        FileBasedExtractorTest.java
        FileBasedSourceTest.java
        TokenizedFileDownloaderTest.java
        hadoop
        HadoopFileInputSourceTest.java
        HadoopFsHelperTest.java
        OldApiHadoopFileInputSourceTest.java
        partition
        PartitionerTest.java
        watermark
        DateWatermarkTest.java
        HourWatermarkTest.java
        SimpleWatermarkTest.java
        TimestampWatermarkTest.java
        workunit
        MultiWorkUnitWeightedQueueTest.java
        state
        ConstructStateTest.java
        writer
        AvroHdfsDataWriterTest.java
        ConsoleWriterTest.java
        DestinationTest.java
        MetadataWriterWrapperTest.java
        PartitionedWriterTest.java
        RetryWriterTest.java
        SimpleDataWriterTest.java
        TestConstants.java
        ThrottleWriterTest.java
        http
        AsyncHttpWriterTest.java
        SalesforceRestWriterTest.java
        jdbc
        JdbcBufferedInserterTestBase.java
        JdbcPublisherTest.java
        JdbcWriterCommandsTest.java
        JdbcWriterInitializerTest.java
        JdbcWriterTest.java
        MySqlBufferedInserterTest.java
        TeradataBufferedInserterTest.java
        objectstore
        ObjectStoreWriterTest.java
        partitioner
        SchemaBasedWriterPartitionerTest.java
        TimeBasedAvroWriterPartitionerTest.java
        test
        GobblinTestEventBusWriterTest.java
        TestPartitionAwareWriterBuilder.java
        TestPartitioner.java
        TestingEventBusAsserterTest.java
- gobblin-core-base
  - src
- gobblin-data-management
  - src
    - main
      - java
        gobblin
        data
        management
        conversion
        hive
        avro
        AvroSchemaManager.java
        SchemaNotFoundException.java
        converter
        AbstractAvroToOrcConverter.java
        HiveAvroToFlattenedOrcConverter.java
        HiveAvroToNestedOrcConverter.java
        dataset
        ConvertibleHiveDataset.java
        ConvertibleHiveDatasetFinder.java
        entities
        QueryBasedHiveConversionEntity.java
        QueryBasedHivePublishEntity.java
        SchemaAwareHivePartition.java
        SchemaAwareHiveTable.java
        events
        EventConstants.java
        EventWorkunitUtils.java
        extractor
        HiveBaseExtractor.java
        HiveBaseExtractorFactory.java
        HiveConvertExtractor.java
        HiveConvertExtractorFactory.java
        provider
        DatePatternUpdateProvider.java
        HdfsBasedUpdateProvider.java
        HiveMetastoreBasedUpdateProvider.java
        HiveUnitUpdateProvider.java
        UpdateNotFoundException.java
        UpdateProviderFactory.java
        publisher
        HiveConvertPublisher.java
        query
        HiveAvroORCQueryGenerator.java
        HiveValidationQueryGenerator.java
        source
        BackfillHiveSource.java
        HiveAvroToOrcSource.java
        HiveSource.java
        HiveWorkUnit.java
        watermarker
        HiveSourceWatermarker.java
        HiveSourceWatermarkerFactory.java
        MultiKeyValueLongWatermark.java
        PartitionLevelWatermarker.java
        TableLevelWatermarker.java
        writer
        HiveQueryExecutionWriter.java
        HiveQueryWriterBuilder.java
        copy
        AllEqualComparator.java
        CloseableFsCopySource.java
        ConcurrentBoundedWorkUnitList.java
        CopyConfiguration.java
        CopyContext.java
        CopyEntity.java
        CopyResourcePool.java
        CopySource.java
        CopyableDataset.java
        CopyableDatasetBase.java
        CopyableDatasetMetadata.java
        CopyableFile.java
        CopyableFileFilter.java
        CopyableGlobDatasetFinder.java
        FileAwareInputStream.java
        IterableCopyableDataset.java
        IterableCopyableDatasetImpl.java
        OwnerAndPermission.java
        PreserveAttributes.java
        ReadyCopyableFileFilter.java
        RecursiveCopyableDataset.java
        RecursivePathFinder.java
        SubsetFilesCopyableDataset.java
        SubsetFilesCopyableDatasetFinder.java
        TimestampBasedCopyableDataset.java
        converter
        DecryptConverter.java
        DistcpConverter.java
        UnGzipConverter.java
        entities
        CommitStepCopyEntity.java
        PostPublishStep.java
        PrePublishStep.java
        extractor
        CloseableFsFileAwareInputStreamExtractor.java
        EmptyExtractor.java
        FileAwareInputStreamExtractor.java
        hive
        HiveCopyEntityHelper.java
        HiveDataset.java
        HiveDatasetFinder.java
        HiveFileSet.java
        HiveLocationDescriptor.java
        HivePartitionExtendedFilter.java
        HivePartitionExtendedFilterFactory.java
        HivePartitionFileSet.java
        HivePartitionsDeregisterFileSet.java
        HiveTableLocationNotMatchException.java
        HiveTargetPathHelper.java
        HiveUtils.java
        PartitionFilterGenerator.java
        PathBasedHivePartitionFilterFactory.java
        PathBasedPartitionFilter.java
        UnpartitionedTableFileSet.java
        avro
        HiveAvroCopyEntityHelper.java
        filter
        LookbackPartitionFilterGenerator.java
        predicates
        AlwaysTrue.java
        NonPartitionTableRegistrationTimeSkipPredicate.java
        RegistrationTimeSkipPredicate.java
        RootDirectoryModtimeSkipPredicate.java
        prioritization
        FileSetComparator.java
        PrioritizedCopyableDataset.java
        publisher
        CopyDataPublisher.java
        CopyEventSubmitterHelper.java
        DeletingCopyDataPublisher.java
        recovery
        RecoveryHelper.java
        replication
        ConfigBasedDataset.java
        ConfigBasedDatasetsFinder.java
        ConfigBasedMultiDatasets.java
        CopyRoute.java
        CopyRouteGenerator.java
        CopyRouteGeneratorBase.java
        CopyRouteGeneratorOptimizedLatency.java
        CopyRouteGeneratorOptimizedNetworkBandwidth.java
        CopyRouteGeneratorOptimizer.java
        DataFlowTopology.java
        DataFlowTopologyPickerByHadoopFsSource.java
        DataFlowTopologyPickerBySource.java
        EndPoint.java
        EndPointFactory.java
        HadoopFsEndPoint.java
        HadoopFsEndPointDataset.java
        HadoopFsEndPointFactory.java
        HadoopFsReplicaConfig.java
        ReplicaHadoopFsEndPoint.java
        ReplicationConfiguration.java
        ReplicationCopyMode.java
        ReplicationDataValidPathPicker.java
        ReplicationMetaData.java
        SourceHadoopFsEndPoint.java
        WatermarkMetadataGenerationCommitStep.java
        WatermarkMetadataUtil.java
        watermark
        CopyableFileWatermarkGenerator.java
        CopyableFileWatermarkHelper.java
        FullPathCopyableFileWatermarkGenerator.java
        StringWatermark.java
        writer
        FileAwareInputStreamDataWriter.java
        FileAwareInputStreamDataWriterBuilder.java
        TarArchiveInputStreamDataWriter.java
        TarArchiveInputStreamDataWriterBuilder.java
        dataset
        Dataset.java
        DatasetUtils.java
        DefaultFileSystemGlobFinder.java
        DummyDataset.java
        hive
        HiveConfigClientUtils.java
        HiveRegistrableDataset.java
        partition
        CopyableDatasetRequestor.java
        File.java
        FileSet.java
        FileSetResourceEstimator.java
        StaticFileSet.java
        policy
        CombineSelectionPolicy.java
        EmbeddedRetentionSelectionPolicy.java
        NewestKSelectionPolicy.java
        SelectAfterTimeBasedPolicy.java
        SelectAllPolicy.java
        SelectBeforeTimeBasedPolicy.java
        SelectBetweenTimeBasedPolicy.java
        SelectNothingPolicy.java
        VersionSelectionPolicy.java
        retention
        DatasetCleaner.java
        RetentionEvents.java
        action
        AccessControlAction.java
        MultiAccessControlAction.java
        RetentionAction.java
        dataset
        CleanableDataset.java
        CleanableDatasetBase.java
        CleanableHiveDataset.java
        ConfigurableCleanableDataset.java
        FsCleanableHelper.java
        ModificationTimeDataset.java
        MultiVersionCleanableDatasetBase.java
        SnapshotDataset.java
        TrackingDataset.java
        finder
        CleanableHiveDatasetFinder.java
        DatasetFinder.java
        policy
        CombineRetentionPolicy.java
        DeleteAllRetentionPolicy.java
        DeleteNothingRetentionPolicy.java
        NewestKRetentionPolicy.java
        PredicateRetentionPolicy.java
        RawDatasetRetentionPolicy.java
        RetentionPolicy.java
        TimeBasedRetentionPolicy.java
        predicates
        WhitelistPredicate.java
        profile
        ConfigurableGlobDatasetFinder.java
        GlobCleanableDatasetFinder.java
        ManagedCleanableDatasetFinder.java
        ModificationTimeDatasetProfile.java
        MultiCleanableDatasetFinder.java
        MultiDatasetFinder.java
        ProxyableDatasetProfile.java
        SnapshotDatasetProfile.java
        TrackingDatasetProfile.java
        version
        DatasetVersion.java
        FileStatusDatasetVersion.java
        HiveDatasetVersionCleaner.java
        StringDatasetVersion.java
        TimestampedDatasetVersion.java
        VersionCleaner.java
        finder
        DatasetVersionFinder.java
        DateTimeDatasetVersionFinder.java
        FileLevelTimestampVersionFinder.java
        GlobModTimeDatasetVersionFinder.java
        ModDateTimeDatasetVersionFinder.java
        SingleVersionFinder.java
        UnixTimestampVersionFinder.java
        VersionFinder.java
        WatermarkDatasetVersionFinder.java
        trash
        AsyncTrash.java
        GobblinProxiedTrash.java
        GobblinTrash.java
        ImmediateDeletionTrash.java
        MockTrash.java
        NoopSnapshotCleanupPolicy.java
        ProxiedTrash.java
        SnapshotCleanupPolicy.java
        TestTrash.java
        TimeBasedSnapshotCleanupPolicy.java
        Trash.java
        TrashFactory.java
        version
        DatasetVersion.java
        FileStatusAware.java
        FileStatusDatasetVersion.java
        FileStatusTimestampedDatasetVersion.java
        FileSystemDatasetVersion.java
        HiveDatasetVersion.java
        StringDatasetVersion.java
        TimestampedDatasetVersion.java
        TimestampedHiveDatasetVersion.java
        finder
        AbstractDatasetVersionFinder.java
        AbstractHiveDatasetVersionFinder.java
        DatasetVersionFinder.java
        DatePartitionHiveVersionFinder.java
        DateTimeDatasetVersionFinder.java
        FileLevelTimestampVersionFinder.java
        GlobModTimeDatasetVersionFinder.java
        ModDateTimeDatasetVersionFinder.java
        SingleVersionFinder.java
        UnixTimestampVersionFinder.java
        VersionFinder.java
        WatermarkDatasetVersionFinder.java
        runtime
        embedded
        EmbeddedGobblinDistcp.java
        util
        commit
        DeleteFileCommitStep.java
        request_allocation
        SimpleHiveDatasetTieringPrioritizer.java
        test
        RetentionTestDataGenerator.java
        RetentionTestHelper.java
    - test
      - java
        gobblin
        data
        management
        ConversionHiveTestUtils.java
        conversion
        hive
        BackfillHiveSourceTest.java
        HiveSourceTest.java
        LocalHiveMetastoreTestUtils.java
        converter
        HiveAvroToOrcConverterTest.java
        HiveSchemaEvolutionTest.java
        dataset
        ConvertibleHiveDatasetTest.java
        provider
        DatePatternUpdateProviderTest.java
        util
        HiveAvroORCQueryGeneratorTest.java
        watermarker
        PartitionLevelWatermarkerTest.java
        TableLevelWatermarkerTest.java
        copy
        ConcurrentBoundedWorkUnitListTest.java
        CopySourcePrioritizationTest.java
        CopySourceTest.java
        CopyableDatasetMetadataTest.java
        CopyableFileTest.java
        CopyableFileUtils.java
        PreserveAttributesTest.java
        ReadyCopyableFileFilterTest.java
        RecursiveCopyableDatasetTest.java
        TestCopyableDataset.java
        TestCopyableDatasetFinder.java
        TestCopyablePartitionableDatasedFinder.java
        TestCopyablePartitionableDataset.java
        TimestampBasedCopyableDatasetTest.java
        converter
        DecryptConverterTest.java
        UnGzipConverterTest.java
        extractor
        InputStreamExtractorTest.java
        hive
        HiveCopyEntityHelperTest.java
        HiveDatasetFinderTest.java
        HiveDatasetTest.java
        HiveTargetPathHelperTest.java
        WhitelistBlacklistTest.java
        filter
        LookbackPartitionFilterGeneratorTest.java
        predicates
        RegistrationTimeSkipPredicateTest.java
        publisher
        CopyDataPublisherTest.java
        DeletingCopyDataPublisherTest.java
        recovery
        RecoveryHelperTest.java
        replication
        ConfigBasedDatasetsFinderTest.java
        ConfigBasedDatasetsTest.java
        CopyRouteGeneratorTest.java
        ReplicationConfigurationTest.java
        writer
        FileAwareInputStreamDataWriterTest.java
        TarArchiveInputStreamDataWriterTest.java
        partition
        FileSetTest.java
        policy
        NewestKSelectionPolicyTest.java
        TimeBasedSelectionPolicyTest.java
        retention
        CleanableDatasetBaseTest.java
        CombineRetentionPolicyTest.java
        ConfigurableCleanableDatasetTest.java
        DatasetVersionFinderTest.java
        FsCleanableHelperTest.java
        NewestKRetentionPolicyTest.java
        TimeBasedRetentionPolicyTest.java
        TimestampedDatasetVersionFinderTest.java
        UnixTimestampVersionFinderTest.java
        WatermarkDatasetVersionFinderTest.java
        action
        RetentionActionTest.java
        integration
        HiveRetentionTest.java
        RetentionIntegrationTest.java
        sql
        SqlBasedRetentionPoc.java
        SqlUdfs.java
        test
        ContainsARetentionPolicy.java
        ContainsBRetentionPolicy.java
        ContainsCRetentionPolicy.java
        ContainsStringRetentionPolicy.java
        version
        HiveDatasetVersionCleanerTest.java
        trash
        AsyncTrashTest.java
        MockTrashTest.java
        TestCleanupPolicy.java
        TestTrashTest.java
        TrashFactoryTest.java
        TrashTest.java
        TrashTestBase.java
        util
        PathUtilsTest.java
        version
        finder
        DatePartitionedHiveVersionFinderTest.java
        runtime
        embedded
        EmbeddedGobblinDistcpTest.java
        util
        request_allocation
        SimpleHiveDatasetTieringPrioritizerTest.java
- gobblin-example
  - src
    - main
      - java
        gobblin
        example
        simplejson
        SimpleJsonConverter.java
        SimpleJsonExtractor.java
        SimpleJsonSource.java
        wikipedia
        EmbeddedWikipediaExample.java
        WikipediaConverter.java
        WikipediaExtractor.java
        WikipediaPartitioner.java
        WikipediaSource.java
- gobblin-hive-registration
  - src
    - main
      - java
        gobblin
        hive
        HiveConstants.java
        HiveLock.java
        HiveMetaStoreClientFactory.java
        HiveMetastoreClientPool.java
        HivePartition.java
        HivePartitionComparator.java
        HiveRegProps.java
        HiveRegister.java
        HiveRegisterStep.java
        HiveRegisterUtils.java
        HiveRegistrationUnit.java
        HiveRegistrationUnitComparator.java
        HiveSerDeManager.java
        HiveSerDeWrapper.java
        HiveTable.java
        HiveTableComparator.java
        PartitionDeregisterStep.java
        TableDeregisterStep.java
        avro
        HiveAvroSerDeManager.java
        metastore
        HiveMetaStoreBasedRegister.java
        HiveMetaStoreEventHelper.java
        HiveMetaStoreUtils.java
        policy
        HiveRegistrationPolicy.java
        HiveRegistrationPolicyBase.java
        HiveSnapshotRegistrationPolicy.java
        spec
        HiveSpec.java
        HiveSpecWithPostActivities.java
        HiveSpecWithPreActivities.java
        HiveSpecWithPredicates.java
        SimpleHiveSpec.java
        activity
        Activity.java
        DropPartitionActivity.java
        DropTableActivity.java
        predicate
        PartitionNotExistPredicate.java
        TableNotExistPredicate.java
    - test
      - java
        gobblin
        hive
        HiveMetaStoreClientFactoryTest.java
        HiveRegistrationUnitComparatorTest.java
        metastore
        HiveMetaStoreUtilsTest.java
        policy
        HiveRegistrationPolicyBaseTest.java
- gobblin-metastore
  - src
    - main
      - java
        gobblin
        metastore
        DatabaseJobHistoryStore.java
        DatasetStateStore.java
        FsStateStore.java
        FsStateStoreFactory.java
        JobHistoryDataSourceProvider.java
        JobHistoryStore.java
        MetaStoreModule.java
        MysqlStateStore.java
        MysqlStateStoreFactory.java
        StateStore.java
        database
        DatabaseJobHistoryStoreV100.java
        DatabaseJobHistoryStoreV101.java
        Filter.java
        SupportedDatabaseVersion.java
        VersionedDatabaseJobHistoryStore.java
        nameParser
        DatasetUrnStateStoreNameParser.java
        GuidDatasetUrnStateStoreNameParser.java
        SimpleDatasetUrnStateStoreNameParser.java
        util
        DatabaseJobHistoryStoreSchemaManager.java
        MySqlJdbcUrl.java
        StateStoreCleaner.java
    - test
      - java
        gobblin
        metastore
        DatabaseJobHistoryStoreTest.java
        DatabaseJobHistoryStoreV100Test.java
        DatabaseJobHistoryStoreV101Test.java
        FsStateStoreTest.java
        nameParser
        GuidDatasetUrnStateStoreNameParserTest.java
        testing
        ITestMetastoreDatabase.java
        TestMetadataDatabase.java
        TestMetastoreDatabaseFactory.java
        TestMetastoreDatabaseServer.java
- gobblin-metrics-libs
  - gobblin-metrics
    - src
      - main
        java
        gobblin
        MetricsHelper.java
        metrics
        GobblinMetrics.java
        GobblinMetricsRegistry.java
      - test
        java
        gobblin
        metrics
        reporter
        PrefixContextFilter.java
        ScheduledReporterTest.java
  - gobblin-metrics-base
    - src
      - main
        gen-java
        gobblin
        metrics
        FlatGobblinMetric.java
        GobblinTrackingEvent.java
        Metric.java
        MetricReport.java
        java
        gobblin
        filesystem
        MetricsFileSystemInstrumentation.java
        metrics
        ConsoleEventReporterFactory.java
        ConsoleReporterFactory.java
        ContextAwareCounter.java
        ContextAwareGauge.java
        ContextAwareHistogram.java
        ContextAwareMeter.java
        ContextAwareMetric.java
        ContextAwareMetricFactory.java
        ContextAwareTimer.java
        Counters.java
        CustomCodahaleReporterFactory.java
        CustomReporterFactory.java
        InnerCounter.java
        InnerGauge.java
        InnerHistogram.java
        InnerMeter.java
        InnerMetricContext.java
        InnerTimer.java
        Measurements.java
        MetricContext.java
        MetricNames.java
        RootMetricContext.java
        Tag.java
        TagBasedMetricFilter.java
        Taggable.java
        Tagged.java
        broker
        MetricContextFactory.java
        MetricContextKey.java
        SubTaggedMetricContextKey.java
        context
        ContextWeakReference.java
        NameConflictException.java
        ReportableContext.java
        filter
        AllContextFilter.java
        ContextFilter.java
        ContextFilterFactory.java
        event
        EventSubmitter.java
        JobEvent.java
        MultiPartEvent.java
        MultiTimingEvent.java
        TaskEvent.java
        TimingEvent.java
        sla
        SlaEventKeys.java
        SlaEventSubmitter.java
        example
        ReporterExampleBase.java
        metric
        InnerMetric.java
        Metrics.java
        ProxyMetric.java
        filter
        MetricFilters.java
        MetricNameRegexFilter.java
        MetricTypeFilter.java
        notification
        EventNotification.java
        MetricContextCleanupNotification.java
        NewMetricContextNotification.java
        Notification.java
        reporter
        ConfiguredScheduledReporter.java
        ContextAwareReporter.java
        ContextAwareScheduledReporter.java
        EventReporter.java
        MetricReportReporter.java
        OutputStreamEventReporter.java
        OutputStreamReporter.java
        RecursiveScheduledMetricReporter.java
        RecursiveScheduledReporter.java
        ScheduledReporter.java
        util
        AvroBinarySerializer.java
        AvroJsonSerializer.java
        AvroSerializer.java
        EventUtils.java
        FixedSchemaVersionWriter.java
        MetricReportUtils.java
        NoopSchemaVersionWriter.java
        SchemaVersionWriter.java
        test
        ContextStoreReporter.java
        MetricsAssert.java
        TestConstants.java
        TimestampedValue.java
      - test
        java
        gobblin
        filesystem
        MetricsFileSystemInstrumentationTest.java
        metrics
        ContextAwareMetricFactoryTest.java
        MetricContextTest.java
        OutputStreamReporterTest.java
        RootMetricContextTest.java
        TagTest.java
        TaggedTest.java
        broker
        MetricContextFactoryTest.java
        callback
        NotificationStore.java
        metric
        filter
        MetricFiltersTest.java
        MetricNameRegexFilterTest.java
        MetricTypeFilterTest.java
        performance
        Incrementer.java
        MetricsPerformanceTest.java
        MetricsUpdater.java
        PerformanceUtils.java
- gobblin-modules
  - gobblin-avro-json
    - src
      - main
        java
        gobblin
        converter
        avro
        AvroToJsonBytesConverter.java
        AvroToJsonBytesWithMetadataConverter.java
        AvroToJsonConverter.java
        AvroToJsonRecordWithMetadataConverter.java
        AvroToJsonStringConverter.java
        AvroToJsonStringConverterBase.java
      - test
        java
        gobblin
        converter
        avro
        AvroToJsonRecordWithMetadataConverterTest.java
        AvroToJsonStringConverterTest.java
  - gobblin-azkaban
    - src
      - main
        java
        gobblin
        azkaban
        AzkabanCompactionJobLauncher.java
        AzkabanGobblinDaemon.java
        AzkabanGobblinYarnAppLauncher.java
        AzkabanIntegrationTestLauncher.java
        AzkabanJobLauncher.java
        AzkabanStateStoreCleanerJob.java
        AzkabanTags.java
        data
        management
        conversion
        hive
        validation
        ValidationJob.java
        retention
        DatasetCleanerJob.java
        trash
        TrashCollectorJob.java
  - gobblin-codecs
    - src
      - main
        java
        gobblin
        codec
        Base64Codec.java
        GzipCodec.java
  - gobblin-compliance
    - src
      - main
        java
        gobblin
        compliance
        ComplianceConfigurationKeys.java
        ComplianceEvents.java
        ComplianceJob.java
        DatasetDescriptor.java
        DatasetDescriptorImpl.java
        HivePartitionDataset.java
        HivePartitionDatasetPolicy.java
        HivePartitionFinder.java
        HivePartitionVersion.java
        HivePartitionVersionFinder.java
        HivePartitionVersionPolicy.java
        HiveProxyQueryExecutor.java
        Policy.java
        QueryExecutor.java
        azkaban
        ComplianceAzkabanJob.java
        purger
        CommitPolicy.java
        HivePurgerCommitPolicy.java
        HivePurgerConverter.java
        HivePurgerExtractor.java
        HivePurgerPolicy.java
        HivePurgerPublisher.java
        HivePurgerQueryTemplate.java
        HivePurgerSource.java
        HivePurgerWriter.java
        HivePurgerWriterBuilder.java
        PurgePolicy.java
        PurgeableDataset.java
        PurgeableHivePartitionDataset.java
        PurgeableHivePartitionDatasetSchema.java
        restore
        AdhocRestorePolicy.java
        ComplianceRestoreJob.java
        HivePartitionRestorePolicy.java
        LKGRestorePolicy.java
        RestorableDataset.java
        RestorableHivePartitionDataset.java
        RestorableHivePartitionDatasetFinder.java
        RestorePolicy.java
        retention
        CleanableHivePartitionDataset.java
        CleanableHivePartitionDatasetFinder.java
        ComplianceRetentionJob.java
        HivePartitionRetentionVersion.java
        HivePartitionVersionRetentionCleaner.java
        HivePartitionVersionRetentionCleanerPolicy.java
        HivePartitionVersionRetentionReaper.java
        HivePartitionVersionRetentionReaperPolicy.java
        HivePartitionVersionRetentionRunner.java
        utils
        DatasetUtils.java
        PartitionUtils.java
        ProxyUtils.java
        validation
        ComplianceValidationJob.java
        ValidatableDataset.java
      - test
        java
        gobblin
        compliance
        purger
        HivePurgerConverterTest.java
        HivePurgerExtractorTest.java
        HivePurgerWriterTest.java
  - gobblin-couchbase
    - src
      - main
        java
        gobblin
        couchbase
        common
        TupleDocument.java
        converter
        AnyToCouchbaseJsonConverter.java
        AvroToCouchbaseTupleConverter.java
        writer
        CouchbaseEnvironmentFactory.java
        CouchbaseWriter.java
        CouchbaseWriterBuilder.java
        CouchbaseWriterConfigurationKeys.java
      - test
        java
        gobblin
        couchbase
        CouchbaseTestServer.java
        converter
        AnyToCouchbaseJsonConverterTest.java
        AvroToCouchbaseTupleConverterTest.java
        writer
        CouchbaseWriterTest.java
  - gobblin-crypto
    - src
      - jmh
        java
        gobblin
        crypto
        EncodingBenchmark.java
      - main
        java
        gobblin
        converter
        SerializedRecordToEncryptedSerializedRecordConverterBase.java
        crypto
        GPGCodec.java
        GPGFileDecryptor.java
        JCEKSKeystoreCredentialStore.java
        JsonCredentialStore.java
        RotatingAESCodec.java
      - test
        java
        gobblin
        crypto
        JCEKSKeystoreCredentialStoreTest.java
        JsonCredentialStoreTest.java
        RotatingAESCodecTest.java
  - gobblin-crypto-provider
    - src
      - main
        java
        gobblin
        converter
        AvroStringFieldEncryptorConverter.java
        SerializedRecordToEncryptedSerializedRecordConverter.java
        StringFieldEncryptorConverter.java
        crypto
        GobblinEncryptionProvider.java
        JCEKSKeystoreCredentialStoreCli.java
      - test
        java
        gobblin
        converter
        AvroStringFieldEncryptorConverterTest.java
        SerializedRecordToEncryptedSerializedRecordConverterTest.java
        crypto
        GobblinEncryptionProviderTest.java
  - gobblin-eventhub
    - src
      - main
        java
        gobblin
        eventhub
        EventhubMetricNames.java
        writer
        BatchedEventhubDataWriter.java
        EventhubBatchAccumulator.java
        EventhubDataWriter.java
        EventhubDataWriterBuilder.java
        EventhubRequest.java
      - test
        java
        gobblin
        eventhub
        writer
        BatchedEventhubDataWriterTest.java
        EventhubAccumulatorTest.java
        EventhubBatchTest.java
        EventhubDataWriterTest.java
  - gobblin-helix
    - src
      - main
        java
        gobblin
        metastore
        ZkStateStore.java
        ZkStateStoreConfigurationKeys.java
        ZkStateStoreFactory.java
        runtime
        ZkDatasetStateStore.java
        ZkDatasetStateStoreFactory.java
      - test
        java
        gobblin
        runtime
        StateStoreWatermarkStorageTest.java
        ZkDatasetStateStoreTest.java
  - gobblin-http
    - src
      - main
        java
        gobblin
        restli
        RestliR2Client.java
  - gobblin-kafka-08
    - src
      - main
        java
        gobblin
        kafka
        client
        Kafka08ConsumerClient.java
        serialize
        LiAvroDeserializer.java
        LiAvroSerializer.java
        tool
        KafkaCheckpoint.java
        SimpleKafkaConsumer.java
        writer
        Kafka08DataWriter.java
        KafkaDataWriterBuilder.java
        metrics
        KafkaReportingFormats.java
        kafka
        KafkaAvroEventReporter.java
        KafkaAvroReporter.java
        KafkaEventReporter.java
        KafkaPusher.java
        KafkaReporter.java
        KafkaReporterFactory.java
        ProducerCloseable.java
        service
        SimpleKafkaSpecExecutorInstance.java
        SimpleKafkaSpecExecutorInstanceConsumer.java
        SimpleKafkaSpecExecutorInstanceProducer.java
        StreamingKafkaSpecExecutorInstanceConsumer.java
        source
        extractor
        extract
        kafka
        KafkaDeserializerExtractor.java
        KafkaDeserializerSource.java
        KafkaGsonDeserializer.java
        KafkaWrapper.java
      - test
        java
        StandaloneTestKafkaServer.java
        gobblin
        kafka
        FlakyKafkaProducer.java
        KafkaTestBase.java
        writer
        Kafka08DataWriterIntegrationTest.java
        Kafka08DataWriterTest.java
        Kafka08DataWriterUnitTest.java
        metrics
        reporter
        KafkaAvroEventReporterTest.java
        KafkaAvroEventReporterWithSchemaRegistryTest.java
        KafkaAvroReporterTest.java
        KafkaEventReporterTest.java
        KafkaPusherTest.java
        KafkaReporterTest.java
        KafkaTestBase.java
        MockKafkaPusher.java
        service
        SimpleKafkaSpecExecutorInstanceTest.java
        StreamingKafkaSpecExecutorInstanceTest.java
        source
        extractor
        extract
        kafka
        ConfluentKafkaSchemaRegistryTest.java
        KafkaDeserializerExtractorTest.java
        KafkaGsonDeserializerTest.java
        KafkaWrapperTest.java
        SimpleKafkaSchemaRegistryTest.java
  - gobblin-kafka-09
    - src
      - main
        java
        gobblin
        kafka
        client
        Kafka09ConsumerClient.java
        serialize
        LiAvroDeserializer.java
        LiAvroSerializer.java
        writer
        Kafka09DataWriter.java
        KafkaDataWriterBuilder.java
        source
        extractor
        extract
        kafka
        KafkaSimpleStreamingExtractor.java
        KafkaSimpleStreamingSource.java
      - test
        java
        gobblin
        kafka
        KafkaTestBase.java
        client
        Kafka09ConsumerClientTest.java
        source
        extractor
        extract
        kafka
        KafkaSimpleStreamingTest.java
        writer
        Kafka09DataWriterTest.java
  - gobblin-kafka-common
    - src
      - main
        java
        gobblin
        converter
        EnvelopeSchemaConverter.java
        LiKafkaByteArrayMsgToAvroConverter.java
        kafka
        client
        AbstractBaseKafkaConsumerClient.java
        BaseKafkaConsumerRecord.java
        ByteArrayBasedKafkaRecord.java
        DecodeableKafkaRecord.java
        GobblinKafkaConsumerClient.java
        KafkaConsumerRecord.java
        schemareg
        CachingKafkaSchemaRegistry.java
        ConfigDrivenMd5SchemaRegistry.java
        HttpClientFactory.java
        KafkaSchemaRegistry.java
        KafkaSchemaRegistryConfigurationKeys.java
        KafkaSchemaRegistryFactory.java
        LiKafkaSchemaRegistry.java
        SchemaRegistryException.java
        serialize
        LiAvroDeserializerBase.java
        LiAvroSerDeHelper.java
        LiAvroSerializerBase.java
        MD5Digest.java
        SerializationException.java
        writer
        BaseKafkaDataWriterBuilder.java
        KafkaWriterConfigurationKeys.java
        KafkaWriterHelper.java
        KafkaWriterMetricNames.java
        metrics
        kafka
        KafkaAvroSchemaRegistry.java
        KafkaAvroSchemaRegistryFactory.java
        KafkaSchemaRegistry.java
        KafkaSchemaRegistryFactory.java
        SchemaRegistryException.java
        reporter
        util
        SchemaRegistryVersionWriter.java
        source
        extractor
        extract
        kafka
        ConfluentKafkaSchemaRegistry.java
        FixedSchemaKafkaAvroExtractor.java
        KafkaAvroExtractor.java
        KafkaExtractor.java
        KafkaOffsetRetrievalFailureException.java
        KafkaPartition.java
        KafkaRecord.java
        KafkaSimpleExtractor.java
        KafkaSimpleJsonExtractor.java
        KafkaSimpleSource.java
        KafkaSource.java
        KafkaTopic.java
        KafkaUtils.java
        MultiLongWatermark.java
        PreviousOffsetNotFoundException.java
        SimpleKafkaSchemaRegistry.java
        StartOffsetOutOfRangeException.java
        UniversalKafkaSource.java
        workunit
        packer
        KafkaAvgRecordSizeBasedWorkUnitSizeEstimator.java
        KafkaAvgRecordTimeBasedWorkUnitSizeEstimator.java
        KafkaBiLevelWorkUnitPacker.java
        KafkaSingleLevelWorkUnitPacker.java
        KafkaWorkUnitPacker.java
        KafkaWorkUnitSizeEstimator.java
      - test
        java
        gobblin
        converter
        EnvelopeSchemaConverterTest.java
        KafkaAvroSchemaRegistryForTest.java
        kafka
        schemareg
        CachingKafkaSchemaRegistryTest.java
        serialize
        MD5DigestTest.java
  - gobblin-metadata
    - src
      - main
        java
        gobblin
        converter
        MetadataConverterWrapper.java
        RecordWithMetadataToEnvelopedRecordWithMetadata.java
        metadata
        GlobalMetadataCollector.java
        types
        GlobalMetadata.java
        GlobalMetadataJsonMerger.java
        Metadata.java
        type
        ContentTypeUtils.java
        RecordWithMetadata.java
        SerializedRecordWithMetadata.java
      - test
        java
        gobblin
        converter
        MetadataConverterWrapperTest.java
        RecordWithMetadataToEnvelopedRecordWithMetadataTest.java
        metadata
        GlobalMetadataCollectorTest.java
        types
        GlobalMetadataTest.java
  - gobblin-metrics-graphite
    - src
      - main
        java
        gobblin
        metrics
        graphite
        GraphiteConnectionType.java
        GraphiteEventReporter.java
        GraphitePusher.java
        GraphiteReporter.java
      - test
        java
        gobblin
        metrics
        graphite
        GraphiteEventReporterTest.java
        GraphiteReporterTest.java
        TestGraphiteSender.java
  - gobblin-metrics-hadoop
    - src
      - main
        java
        gobblin
        metrics
        hadoop
        AbstractHadoopCounterReporter.java
        HadoopCounterReporter.java
        NewAPIHadoopCounterReporter.java
      - test
        java
        gobblin
        metrics
        hadoop
        HadoopCounterReporterTest.java
        NewAPIHadoopCounterReporterTest.java
  - gobblin-metrics-influxdb
    - src
      - main
        java
        gobblin
        metrics
        influxdb
        InfluxDBConnectionType.java
        InfluxDBEventReporter.java
        InfluxDBPusher.java
        InfluxDBReporter.java
      - test
        java
        gobblin
        metrics
        influxdb
        InfluxDBEventReporterTest.java
        InfluxDBReporterTest.java
        TestInfluxDB.java
  - google-ingestion
    - src
      - main
        java
        gobblin
        ingestion
        google
        AsyncIteratorWithDataSink.java
        DayPartitioner.java
        GoggleIngestionConfigurationKeys.java
        util
        SchemaUtil.java
        webmaster
        GoogleWebMasterSource.java
        GoogleWebMasterSourceDaily.java
        GoogleWebmasterClient.java
        GoogleWebmasterClientImpl.java
        GoogleWebmasterDataFetcher.java
        GoogleWebmasterDataFetcherImpl.java
        GoogleWebmasterDayPartitioner.java
        GoogleWebmasterExtractor.java
        GoogleWebmasterExtractorIterator.java
        GoogleWebmasterFilter.java
        ProducerJob.java
        SimpleProducerJob.java
        TrieBasedProducerJob.java
        UrlGrouper.java
        UrlTrie.java
        UrlTrieNode.java
        UrlTriePostOrderIterator.java
        UrlTriePrefixGrouper.java
        source
        extractor
        extract
        google
        GoogleAnalyticsUnsampledExtractor.java
        GoogleAnalyticsUnsampledSource.java
        GoogleCommon.java
        GoogleCommonKeys.java
        GoogleDriveExtractor.java
        GoogleDriveFileSystem.java
        GoogleDriveFsHelper.java
        GoogleDriveSource.java
      - test
        java
        gobblin
        ingestion
        google
        webmaster
        GoogleWebmasterDataFetcherImplTest.java
        GoogleWebmasterExtractorIteratorTest.java
        GoogleWebmasterExtractorTest.java
        ProducerJobTest.java
        SimpleProducerJobTest.java
        TrieBasedProducerJobTest.java
        UrlTriePostOrderIteratorTest.java
        UrlTriePrefixGrouperTest.java
        UrlTrieTest.java
        source
        extractor
        extract
        google
        GoogleAnalyticsUnsampledExtractorTest.java
        GoogleDriveFileSystemTest.java
        GoogleDriveFsHelperTest.java
        filebased
        GoogleDriveSourceTest.java
- gobblin-rest-service
  - gobblin-rest-client
    - src
      - main
        java
        gobblin
        rest
        JobExecutionInfoClient.java
  - gobblin-rest-server
    - src
      - main
        java
        gobblin
        rest
        JobExecutionInfoResource.java
        JobExecutionInfoServer.java
      - test
        java
        gobblin
        rest
        JobExecutionInfoServerTest.java
- gobblin-restli
  - gobblin-flow-config-service
    - gobblin-flow-config-service-client
      - src
        main
        java
        gobblin
        service
        FlowConfigClient.java
        FlowStatusClient.java
        test
        java
        gobblin
        service
        FlowConfigTest.java
        FlowStatusTest.java
    - gobblin-flow-config-service-server
      - src
        main
        java
        gobblin
        service
        FlowConfigsResource.java
        FlowStatusResource.java
        validator
        CronValidator.java
        TemplateUriValidator.java
  - gobblin-restli-utils
    - src
      - main
        java
        gobblin
        restli
        EmbeddedRestliServer.java
        SharedRestClientFactory.java
        SharedRestClientKey.java
        UriRestClientKey.java
  - gobblin-throttling-service
    - gobblin-throttling-service-client
      - src
        main
        java
        gobblin
        util
        limiter
        BatchedPermitsRequester.java
        RedirectAwareRestClientRequestSender.java
        RequestSender.java
        RestClientRequestSender.java
        RestliLimiterFactory.java
        RestliServiceBasedLimiter.java
        stressTest
        FixedOperationsStressor.java
        MRStressTest.java
        RandomDelayStartStressor.java
        RandomRuntimeStressor.java
        RateComputingLimiterContainer.java
        StressTestUtils.java
        Stressor.java
        test
        java
        gobblin
        restli
        throttling
        LocalStressTest.java
        ThrottlingClientTest.java
        util
        limiter
        BatchedPermitsRequesterTest.java
        MockRequester.java
        RestliServiceBasedLimiterTest.java
    - gobblin-throttling-service-server
      - src
        main
        java
        gobblin
        restli
        throttling
        ConfigClientBasedPolicyFactory.java
        CountBasedPolicy.java
        DynamicTokenBucket.java
        LeaderFinder.java
        LimiterServerResource.java
        NoopPolicy.java
        QPSPolicy.java
        ThrottlingGuiceServletConfig.java
        ThrottlingPolicy.java
        ThrottlingPolicyFactory.java
        ThrottlingServerScopes.java
        TokenBucket.java
        URIMetadata.java
        ZookeeperLeaderElection.java
        test
        java
        gobblin
        restli
        throttling
        ConfigStoreBasedPolicyTest.java
        DynamicTokenBucketTest.java
        LimiterServerResourceTest.java
        TestFailover.java
        TokenBucketTest.java
- gobblin-runtime
  - src
- gobblin-runtime-hadoop
  - src
    - main
      - java
        gobblin
        runtime
        instance
        plugin
        hadoop
        HadoopKerberosKeytabAuthenticationPlugin.java
    - test
      - java
        gobblin
        runtime
        instance
        plugin
        hadoop
        TestHadoopKerberosKeytabAuthenticationPlugin.java
- gobblin-salesforce
  - src
    - main
      - java
        gobblin
        salesforce
        SalesforceConfigurationKeys.java
        SalesforceConnector.java
        SalesforceExtractor.java
        SalesforceSource.java
    - test
      - java
        gobblin
        salesforce
        SalesforceSourceTest.java
- gobblin-service
  - src
    - main
      - java
        gobblin
        service
        HelixUtils.java
        ServiceConfigKeys.java
        ServiceMetricNames.java
        modules
        core
        GobblinServiceManager.java
        flow
        IdentityFlowToJobSpecCompiler.java
        orchestration
        Orchestrator.java
        scheduler
        GobblinServiceJobScheduler.java
        topology
        ConfigBasedTopologySpecFactory.java
        TopologySpecFactory.java
    - test
      - java
        gobblin
        service
        modules
        core
        GobblinServiceHATest.java
        GobblinServiceManagerTest.java
        IdentityFlowToJobSpecCompilerTest.java
        orchestration
        OrchestratorTest.java
        topology
        ConfigBasedTopologySpecFactoryTest.java
- gobblin-test-harness
  - src
    - main
      - java
        gobblin
        test
        execution
        operator
        SetupOperator.java
        validator
        ValidationRule.java
        setup
        config
        ConfigStepsGenerator.java
        Step.java
        TestHarnessLauncher.java
    - test
      - java
        gobblin
        test
        integration
        data
        management
        CopyIntegrationTest.java
- gobblin-test-utils
  - src
    - main
      - java
        gobblin
        test
        ConstantTimingType.java
        ErrorManager.java
        NthTimingType.java
        TestUtils.java
        TimingManager.java
        TimingResult.java
        TimingType.java
        crypto
        InsecureShiftCodec.java
        TestEncryptionProvider.java
    - test
      - java
        gobblin
        test
        ErrorManagerTest.java
- gobblin-tunnel
  - src
    - main
      - java
        gobblin
        tunnel
        AcceptHandler.java
        Config.java
        HandlerState.java
        ProxySetupHandler.java
        ReadWriteHandler.java
        Tunnel.java
    - test
      - java
        gobblin
        tunnel
        ConnectProxyServer.java
        DoubleEchoServer.java
        EasyThread.java
        MockServer.java
        TalkFirstDoubleEchoServer.java
        TalkPastServer.java
        TestTunnelWithArbitraryTCPTraffic.java
        TunnelTest.java
- gobblin-utility
  - src
    - main
      - java
        gobblin
        broker
        BrokerConfigurationKeyGenerator.java
        DefaultBrokerCache.java
        EmptyKey.java
        KeyedScopedConfigViewImpl.java
        NonExtendableBrokerView.java
        ScopeWrapper.java
        SharedResourcesBrokerFactory.java
        SharedResourcesBrokerImpl.java
        SharedResourcesBrokerUtils.java
        package-info.java
        data
        management
        copy
        hive
        WhitelistBlacklist.java
        util
        ApplicationLauncherUtils.java
        AutoCloseableLock.java
        AutoReturnableObject.java
        AvroFlattener.java
        AvroUtils.java
        AzkabanTags.java
        CLIPasswordEncryptor.java
        ClusterNameTags.java
        ClustersNames.java
        ConfigUtils.java
        DatasetFilterUtils.java
        DatePartitionType.java
        Either.java
        EmailUtils.java
        EmptyIterable.java
        ExecutorsUtils.java
        ExponentialBackoff.java
        FileListUtils.java
        ForkOperatorUtils.java
        HadoopUtils.java
        HeapDumpForTaskUtils.java
        HiveJdbcConnector.java
        HostUtils.java
        Id.java
        ImmutableProperties.java
        JobConfigurationUtils.java
        JobLauncherUtils.java
        JvmUtils.java
        LoggingUncaughtExceptionHandler.java
        NoopCloseable.java
        ParallelRunner.java
        PathUtils.java
        PortUtils.java
        PropertiesUtils.java
        ProxiedFileSystemCache.java
        ProxiedFileSystemUtils.java
        ProxiedFileSystemWrapper.java
        PublisherUtils.java
        PullFileLoader.java
        RateControlledFileSystem.java
        SerializationUtils.java
        StringParsingUtils.java
        TemplateUtils.java
        TimeRangeChecker.java
        WritableShimSerialization.java
        WriterUtils.java
        binpacking
        FieldWeighter.java
        WorstFitDecreasingBinPacking.java
        callbacks
        Callback.java
        CallbackResult.java
        CallbacksDispatcher.java
        package-info.java
        concurrent
        AutoResetEvent.java
        CancellableTask.java
        HashedWheelTimerTaskScheduler.java
        ScheduledExecutorServiceTaskScheduler.java
        ScheduledTask.java
        TaskScheduler.java
        TaskSchedulerFactory.java
        TaskSchedulerType.java
        dataset
        DatasetUtils.java
        deprecation
        DeprecationUtils.java
        executors
        ForceQueuePolicy.java
        IteratorExecutor.java
        MDCPropagatingCallable.java
        MDCPropagatingExecutorService.java
        MDCPropagatingRunnable.java
        MDCPropagatingScheduledExecutorService.java
        ScalingQueue.java
        ScalingThreadPoolExecutor.java
        filesystem
        ExceptionCatchingPathAlterationListenerDecorator.java
        FileStatusEntry.java
        FileSystemDecorator.java
        FileSystemFactory.java
        FileSystemInstrumentation.java
        FileSystemInstrumentationFactory.java
        FileSystemKey.java
        FileSystemLimiterKey.java
        InstrumentedFileSystem.java
        InstrumentedFileSystemUtils.java
        InstrumentedHDFSFileSystem.java
        InstrumentedLocalFileSystem.java
        InstrumentedWebHDFSFileSystem.java
        PathAlterationListener.java
        PathAlterationListenerAdaptor.java
        PathAlterationObserver.java
        PathAlterationObserverScheduler.java
        ThrottledFileSystem.java
        filters
        AndPathFilter.java
        HiddenFilter.java
        RegexPathFilter.java
        TarGpgPathFilter.java
        guid
        Guid.java
        HasGuid.java
        hadoop
        TokenUtils.java
        io
        AdditionalCloseableInputStream.java
        BatchedMeterDecorator.java
        CloseableHttpConn.java
        FilterStreamUnpacker.java
        GsonInterfaceAdapter.java
        MeteredInputStream.java
        MeteredOutputStream.java
        MeteredStream.java
        SeekableFSInputStream.java
        StreamCopier.java
        StreamCopierSharedLimiterKey.java
        StreamThrottler.java
        StreamUtils.java
        ThrottledInputStream.java
        iterators
        InterruptibleIterator.java
        jdbc
        DataSourceBuilder.java
        DataSourceModule.java
        DataSourceProvider.java
        json
        JsonUtils.java
        limiter
        BaseLimiterType.java
        CountBasedLimiter.java
        DefaultLimiterFactory.java
        Limiter.java
        LimiterFactory.java
        MultiLimiter.java
        NonRefillableLimiter.java
        NoopLimiter.java
        NotEnoughPermitsException.java
        PoolBasedLimiter.java
        RateBasedLimiter.java
        TimeBasedLimiter.java
        broker
        SharedLimiterFactory.java
        SharedLimiterKey.java
        logs
        Log4jConfigurationHelper.java
        LogCopier.java
        recordcount
        CompactionRecordCountProvider.java
        IngestionRecordCountProvider.java
        LateFileRecordCountProvider.java
        reflection
        GobblinConstructorUtils.java
        request_allocation
        AllocatedRequestsIterator.java
        AllocatedRequestsIteratorBase.java
        BruteForceAllocator.java
        ConcurrentBoundedPriorityIterable.java
        GreedyAllocator.java
        HierarchicalAllocator.java
        HierarchicalPrioritizer.java
        PreOrderAllocator.java
        PriorityIterableBasedRequestAllocator.java
        PriorityMultiIterator.java
        PushDownRequestor.java
        Request.java
        RequestAllocator.java
        RequestAllocatorConfig.java
        RequestAllocatorUtils.java
        Requestor.java
        ResourceEstimator.java
        ResourcePool.java
        ResourceRequirement.java
        SimpleHierarchicalPrioritizer.java
        VectorAlgebra.java
        service
        StandardServiceConfig.java
        test
        HelloWorldSource.java
        StdoutWriter.java
        TestingSource.java
    - test
      - java
        gobblin
        broker
        AutoscopedFactoryTest.java
        DefaultGobblinBrokerTest.java
        GobblinBrokerConfTest.java
        GobblinBrokerCreationTest.java
        KeyedScopedConfigViewImplTest.java
        SharedResourcesBrokerFactoryTest.java
        TestFactory.java
        TestFactoryWithRedirect.java
        TestResourceKey.java
        util
        AvroFlattenerTest.java
        AvroUtilsTest.java
        ClustersNamesTest.java
        ConfigUtilsTest.java
        ExecutorsUtilsTest.java
        FileListUtilsTest.java
        ForkOperatorUtilsTest.java
        HadoopUtilsTest.java
        HeapDumpForTaskUtilsTest.java
        JobLauncherUtilsTest.java
        LoggingUncaughtExceptionHandlerTest.java
        ParallelRunnerTest.java
        PortUtilsTest.java
        PropertiesUtilsTest.java
        PullFileLoaderTest.java
        RatedControlledFileSystemTest.java
        SerializationUtilsTest.java
        StringParsingUtilsTest.java
        TestImmutableProperties.java
        TimeRangeCheckerTest.java
        WriterUtilsTest.java
        binpacking
        WorstFitDecreasingBinPackingTest.java
        callbacks
        TestCallbacksDispatcher.java
        concurrent
        HashedWheelTimerTaskSchedulerTest.java
        ScheduledExecutorServiceTaskSchedulerTest.java
        TaskSchedulerFactoryTest.java
        TaskSchedulerTest.java
        dataset
        DatasetUtilsTest.java
        executors
        IteratorExecutorTest.java
        filesystem
        FileSystemFactoryTest.java
        InstrumentedLocalFileSystemTest.java
        ThrottledFileSystemTest.java
        filters
        RegexPathFilterTest.java
        guid
        GuidTest.java
        io
        GsonInterfaceAdapterTest.java
        MeteredInputStreamTest.java
        MeteredOutputStreamTest.java
        StreamCopierTest.java
        StreamUtilsTest.java
        ThrottledInputStreamTest.java
        limiter
        CountBasedLimiterTest.java
        DefaultLimiterFactoryTest.java
        MultiLimiterTest.java
        RateBasedLimiterTest.java
        TimeBasedLimiterTest.java
        broker
        SharedLimiterFactoryTest.java
        recordcount
        CompactionRecordCountProviderTest.java
        IngestionRecordCountProviderTest.java
        reflection
        GobblinConstructorUtilsTest.java
        request_allocation
        BruteForceAllocatorTest.java
        ConcurrentBoundedPriorityIterableTest.java
        GreedyAllocatorTest.java
        HierarchicalAllocatorTest.java
        PreOrderAllocatorTest.java
        ResourcePoolTest.java
        StringRequest.java
        StringRequestor.java
        VectorAlgebraTest.java
        test
        BaseClass.java
        ExtendedClass.java
        TestClass.java
        TestHelloWorldSource.java
- gobblin-yarn
  - src
    - main
      - java
        gobblin
        yarn
        GobblinApplicationMaster.java
        GobblinYarnAppLauncher.java
        GobblinYarnConfigurationKeys.java
        GobblinYarnEventConstants.java
        GobblinYarnLogSource.java
        GobblinYarnMetricTagNames.java
        GobblinYarnTaskRunner.java
        HelixMessageSubTypes.java
        YarnAppSecurityManager.java
        YarnContainerSecurityManager.java
        YarnHelixUtils.java
        YarnService.java
        event
        ApplicationReportArrivalEvent.java
        ContainerShutdownRequest.java
        DelegationTokenUpdatedEvent.java
        GetApplicationReportFailureEvent.java
        NewContainerRequest.java
    - test
      - java
        gobblin
        yarn
        GobblinYarnAppLauncherTest.java
        YarnSecurityManagerTest.java

/*
 * Licensed to the Apache Software Foundation (ASF) under one or more
 * contributor license agreements.  See the NOTICE file distributed with
 * this work for additional information regarding copyright ownership.
 * The ASF licenses this file to You under the Apache License, Version 2.0
 * (the "License"); you may not use this file except in compliance with
 * the License.  You may obtain a copy of the License at
 *
 *    http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package gobblin.data.management.conversion.hive.query;

import java.io.IOException;
import java.util.Collections;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import java.util.Set;

import lombok.ToString;
import lombok.extern.slf4j.Slf4j;

import org.apache.avro.AvroRuntimeException;
import org.apache.avro.Schema;
import org.apache.commons.lang3.StringUtils;
import org.apache.hadoop.hive.metastore.api.FieldSchema;
import org.apache.hadoop.hive.metastore.api.Table;
import org.apache.hadoop.hive.serde.serdeConstants;
import org.apache.hadoop.hive.serde2.objectinspector.ObjectInspector;
import org.apache.hadoop.hive.serde2.typeinfo.ListTypeInfo;
import org.apache.hadoop.hive.serde2.typeinfo.MapTypeInfo;
import org.apache.hadoop.hive.serde2.typeinfo.StructTypeInfo;
import org.apache.hadoop.hive.serde2.typeinfo.TypeInfo;
import org.apache.hadoop.hive.serde2.typeinfo.TypeInfoUtils;
import org.apache.hadoop.hive.serde2.typeinfo.UnionTypeInfo;

import com.google.common.base.Function;
import com.google.common.base.Joiner;
import com.google.common.base.Optional;
import com.google.common.base.Preconditions;
import com.google.common.collect.ImmutableMap;
import com.google.common.collect.ImmutableSet;
import com.google.common.collect.Iterables;
import com.google.common.collect.Lists;
import com.google.common.collect.Maps;
import com.google.common.collect.Sets;
import com.google.gson.Gson;
import com.google.gson.GsonBuilder;

import gobblin.configuration.State;
import gobblin.data.management.conversion.hive.entities.QueryBasedHivePublishEntity;


/***
 * Generate Hive queries
 */
@Slf4j
public class HiveAvroORCQueryGenerator {

  private static final String SERIALIZED_PUBLISH_TABLE_COMMANDS = "serialized.publish.table.commands";
  private static final Gson GSON = new GsonBuilder().setPrettyPrinting().create();

  // Table properties keys
  public static final String ORC_COMPRESSION_KEY                 = "orc.compress";
  public static final String ORC_ROW_INDEX_STRIDE_KEY            = "orc.row.index.stride";

  // Default values for Hive DDL / DML query generation
  private static final String DEFAULT_DB_NAME                     = "default";
  private static final String DEFAULT_ROW_FORMAT_SERDE            = "org.apache.hadoop.hive.ql.io.orc.OrcSerde";
  private static final String DEFAULT_ORC_INPUT_FORMAT            = "org.apache.hadoop.hive.ql.io.orc.OrcInputFormat";
  private static final String DEFAULT_ORC_OUTPUT_FORMAT           = "org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat";
  private static final String DEFAULT_ORC_COMPRESSION             = "ZLIB";
  private static final String DEFAULT_ORC_ROW_INDEX_STRIDE        = "268435456";
  private static final Properties DEFAULT_TBL_PROPERTIES = new Properties();
  static {
        DEFAULT_TBL_PROPERTIES.setProperty(ORC_COMPRESSION_KEY, DEFAULT_ORC_COMPRESSION);
        DEFAULT_TBL_PROPERTIES.setProperty(ORC_ROW_INDEX_STRIDE_KEY, DEFAULT_ORC_ROW_INDEX_STRIDE);
      }

  // Avro to Hive schema mapping
  private static final Map<Schema.Type, String> AVRO_TO_HIVE_COLUMN_MAPPING_V_12 = ImmutableMap
      .<Schema.Type, String>builder()
      .put(Schema.Type.NULL,    "void")
      .put(Schema.Type.BOOLEAN, "boolean")
      .put(Schema.Type.INT,     "int")
      .put(Schema.Type.LONG,    "bigint")
      .put(Schema.Type.FLOAT,   "float")
      .put(Schema.Type.DOUBLE,  "double")
      .put(Schema.Type.BYTES,   "binary")
      .put(Schema.Type.STRING,  "string")
      .put(Schema.Type.RECORD,  "struct")
      .put(Schema.Type.MAP,     "map")
      .put(Schema.Type.ARRAY,   "array")
      .put(Schema.Type.UNION,   "uniontype")
      .put(Schema.Type.ENUM,    "string")
      .put(Schema.Type.FIXED,   "binary")
      .build();

  // Hive evolution types supported
  private static final Map<String, Set<String>> HIVE_COMPATIBLE_TYPES = ImmutableMap
      .<String, Set<String>>builder()
      .put("tinyint", ImmutableSet.<String>builder()
          .add("smallint", "int", "bigint", "float", "double", "decimal", "string", "varchar").build())
      .put("smallint",  ImmutableSet.<String>builder().add("int", "bigint", "float", "double", "decimal", "string",
          "varchar").build())
      .put("int",       ImmutableSet.<String>builder().add("bigint", "float", "double", "decimal", "string", "varchar")
          .build())
      .put("bigint",    ImmutableSet.<String>builder().add("float", "double", "decimal", "string", "varchar").build())
      .put("float",     ImmutableSet.<String>builder().add("double", "decimal", "string", "varchar").build())
      .put("double",    ImmutableSet.<String>builder().add("decimal", "string", "varchar").build())
      .put("decimal",   ImmutableSet.<String>builder().add("string", "varchar").build())
      .put("string",    ImmutableSet.<String>builder().add("double", "decimal", "varchar").build())
      .put("varchar",   ImmutableSet.<String>builder().add("double", "string", "varchar").build())
      .put("timestamp", ImmutableSet.<String>builder().add("string", "varchar").build())
      .put("date",      ImmutableSet.<String>builder().add("string", "varchar").build())
      .put("binary",    Sets.<String>newHashSet())
      .put("boolean",    Sets.<String>newHashSet()).build();

  @ToString
  public static enum COLUMN_SORT_ORDER {
    ASC ("ASC"),
    DESC ("DESC");

    private final String order;

    COLUMN_SORT_ORDER(String s) {
      order = s;
    }
  }

  /***
   * Generate DDL query to create a different format (default: ORC) Hive table for a given Avro Schema
   * @param schema Avro schema to use to generate the DDL for new Hive table
   * @param tblName New Hive table name
   * @param tblLocation New hive table location
   * @param optionalDbName Optional DB name, if not specified it defaults to 'default'
   * @param optionalPartitionDDLInfo Optional partition info in form of map of partition key, partition type pair
   *                                 If not specified, the table is assumed to be un-partitioned ie of type snapshot
   * @param optionalClusterInfo Optional cluster info
   * @param optionalSortOrderInfo Optional sort order
   * @param optionalNumOfBuckets Optional number of buckets
   * @param optionalRowFormatSerde Optional row format serde, default is ORC
   * @param optionalInputFormat Optional input format serde, default is ORC
   * @param optionalOutputFormat Optional output format serde, default is ORC
   * @param tableProperties Optional table properties
   * @param isEvolutionEnabled If schema evolution is turned on
   * @param destinationTableMeta Optional destination table metadata  @return Generated DDL query to create new Hive table
   */
  public static String generateCreateTableDDL(Schema schema,
      String tblName,
      String tblLocation,
      Optional<String> optionalDbName,
      Optional<Map<String, String>> optionalPartitionDDLInfo,
      Optional<List<String>> optionalClusterInfo,
      Optional<Map<String, COLUMN_SORT_ORDER>> optionalSortOrderInfo,
      Optional<Integer> optionalNumOfBuckets,
      Optional<String> optionalRowFormatSerde,
      Optional<String> optionalInputFormat,
      Optional<String> optionalOutputFormat,
      Properties tableProperties,
      boolean isEvolutionEnabled,
      Optional<Table> destinationTableMeta,
      Map<String, String> hiveColumns) {

    Preconditions.checkNotNull(schema);
    Preconditions.checkArgument(StringUtils.isNotBlank(tblName));
    Preconditions.checkArgument(StringUtils.isNotBlank(tblLocation));

    String dbName = optionalDbName.isPresent() ? optionalDbName.get() : DEFAULT_DB_NAME;
    String rowFormatSerde = optionalRowFormatSerde.isPresent() ? optionalRowFormatSerde.get() : DEFAULT_ROW_FORMAT_SERDE;
    String inputFormat = optionalInputFormat.isPresent() ? optionalInputFormat.get() : DEFAULT_ORC_INPUT_FORMAT;
    String outputFormat = optionalOutputFormat.isPresent() ? optionalOutputFormat.get() : DEFAULT_ORC_OUTPUT_FORMAT;
    tableProperties = getTableProperties(tableProperties);

    // Start building Hive DDL
    // Refer to Hive DDL manual for explanation of clauses:
    // https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-Create/Drop/TruncateTable
    StringBuilder ddl = new StringBuilder();

    // Create statement
    ddl.append(String.format("CREATE EXTERNAL TABLE IF NOT EXISTS `%s`.`%s` ", dbName, tblName));
    // .. open bracket for CREATE
    ddl.append("( \n");

    // 1. If evolution is enabled, and destination table does not exists
    //    .. use columns from new schema
    //    (evolution does not matter if its new destination table)
    // 2. If evolution is enabled, and destination table does exists
    //    .. use columns from new schema
    //    (alter table will be used before moving data from staging to final table)
    // 3. If evolution is disabled, and destination table does not exists
    //    .. use columns from new schema
    //    (evolution does not matter if its new destination table)
    // 4. If evolution is disabled, and destination table does exists
    //    .. use columns from destination schema
    if (isEvolutionEnabled || !destinationTableMeta.isPresent()) {
      log.info("Generating DDL using source schema");
      ddl.append(generateAvroToHiveColumnMapping(schema, Optional.of(hiveColumns), true));
    } else {
      log.info("Generating DDL using destination schema");
      ddl.append(generateDestinationToHiveColumnMapping(Optional.of(hiveColumns), destinationTableMeta.get()));
    }

    // .. close bracket for CREATE
    ddl.append(") \n");

    // Partition info
    if (optionalPartitionDDLInfo.isPresent() && optionalPartitionDDLInfo.get().size() > 0) {
      ddl.append("PARTITIONED BY ( ");
      boolean isFirst = true;
      Map<String, String> partitionInfoMap = optionalPartitionDDLInfo.get();
      for (Map.Entry<String, String> partitionInfo : partitionInfoMap.entrySet()) {
        if (isFirst) {
          isFirst = false;
        } else {
          ddl.append(", ");
        }
        ddl.append(String.format("`%s` %s", partitionInfo.getKey(), partitionInfo.getValue()));
      }
      ddl.append(" ) \n");
    }

    if (optionalClusterInfo.isPresent()) {
      if (!optionalNumOfBuckets.isPresent()) {
        throw new IllegalArgumentException(("CLUSTERED BY requested, but no NUM_BUCKETS specified"));
      }
      ddl.append("CLUSTERED BY ( ");
      boolean isFirst = true;
      for (String clusterByCol : optionalClusterInfo.get()) {
        if (!hiveColumns.containsKey(clusterByCol)) {
          throw new IllegalArgumentException(String.format("Requested CLUSTERED BY column: %s "
              + "is not present in schema", clusterByCol));
        }
        if (isFirst) {
          isFirst = false;
        } else {
          ddl.append(", ");
        }
        ddl.append(String.format("`%s`", clusterByCol));
      }
      ddl.append(" ) ");

      if (optionalSortOrderInfo.isPresent() && optionalSortOrderInfo.get().size() > 0) {
        Map<String, COLUMN_SORT_ORDER> sortOrderInfoMap = optionalSortOrderInfo.get();
        ddl.append("SORTED BY ( ");
        isFirst = true;
        for (Map.Entry<String, COLUMN_SORT_ORDER> sortOrderInfo : sortOrderInfoMap.entrySet()){
          if (!hiveColumns.containsKey(sortOrderInfo.getKey())) {
            throw new IllegalArgumentException(String.format(
                "Requested SORTED BY column: %s " + "is not present in schema", sortOrderInfo.getKey()));
          }
          if (isFirst) {
            isFirst = false;
          } else {
            ddl.append(", ");
          }
          ddl.append(String.format("`%s` %s", sortOrderInfo.getKey(), sortOrderInfo.getValue()));
        }
        ddl.append(" ) ");
      }
      ddl.append(String.format(" INTO %s BUCKETS %n", optionalNumOfBuckets.get()));
    } else {
      if (optionalSortOrderInfo.isPresent()) {
        throw new IllegalArgumentException("SORTED BY requested, but no CLUSTERED BY specified");
      }
    }

    // Field Terminal
    ddl.append("ROW FORMAT SERDE \n");
    ddl.append(String.format("  '%s' %n", rowFormatSerde));

    // Stored as ORC
    ddl.append("STORED AS INPUTFORMAT \n");
    ddl.append(String.format("  '%s' %n", inputFormat));
    ddl.append("OUTPUTFORMAT \n");
    ddl.append(String.format("  '%s' %n", outputFormat));

    // Location
    ddl.append("LOCATION \n");
    ddl.append(String.format("  '%s' %n", tblLocation));

    // Table properties
    if (null != tableProperties && tableProperties.size() > 0) {
      ddl.append("TBLPROPERTIES ( \n");
      boolean isFirst = true;
      for (String property : tableProperties.stringPropertyNames()) {
        if (isFirst) {
          isFirst = false;
        } else {
          ddl.append(", \n");
        }
        ddl.append(String.format("  '%s'='%s'", property, tableProperties.getProperty(property)));
      }
      ddl.append(") \n");
    }

    return ddl.toString();
  }

  private static Properties getTableProperties(Properties tableProperties) {
    if (null == tableProperties || tableProperties.size() == 0) {
      return DEFAULT_TBL_PROPERTIES;
    }

    for (String property : DEFAULT_TBL_PROPERTIES.stringPropertyNames()) {
      if (!tableProperties.containsKey(property)) {
        tableProperties.put(property, DEFAULT_TBL_PROPERTIES.get(property));
      }
    }

    return tableProperties;
  }

  /***
   * Generate DDL query to create a Hive partition pointing at specific location.
   * @param dbName Hive database name.
   * @param tableName Hive table name.
   * @param partitionLocation Physical location of partition.
   * @param partitionsDMLInfo Partitions DML info - a map of partition name and partition value.
   * @param format Hive partition file format
   * @return Commands to create a partition.
   */
  public static List<String> generateCreatePartitionDDL(String dbName, String tableName, String partitionLocation,
      Map<String, String> partitionsDMLInfo, Optional<String> format) {

    if (null == partitionsDMLInfo || partitionsDMLInfo.size() == 0) {
      return Collections.emptyList();
    }

    // Partition details
    StringBuilder partitionSpecs = new StringBuilder();
    partitionSpecs.append("PARTITION (");
    boolean isFirstPartitionSpec = true;
    for (Map.Entry<String, String> partition : partitionsDMLInfo.entrySet()) {
      if (isFirstPartitionSpec) {
        isFirstPartitionSpec = false;
      } else {
        partitionSpecs.append(", ");
      }
      partitionSpecs.append(String.format("`%s`='%s'", partition.getKey(), partition.getValue()));
    }
    partitionSpecs.append(") \n");

    // Create statement
    List<String> ddls = Lists.newArrayList();
    // Note: Hive does not support fully qualified Hive table names such as db.table for ALTER TABLE in v0.13
    // .. hence specifying 'use dbName' as a precursor to rename
    // Refer: HIVE-2496
    ddls.add(String.format("USE %s%n", dbName));
    if (format.isPresent()) {
      ddls.add(String
          .format("ALTER TABLE `%s` ADD IF NOT EXISTS %s FILEFORMAT %s LOCATION '%s' ", tableName, partitionSpecs,
              format.get(), partitionLocation));
    } else {
      ddls.add(String.format("ALTER TABLE `%s` ADD IF NOT EXISTS %s LOCATION '%s' ", tableName, partitionSpecs,
          partitionLocation));
    }

    return ddls;
  }

  public static List<String> generateCreatePartitionDDL(String dbName, String tableName, String partitionLocation,
      Map<String, String> partitionsDMLInfo) {
    return generateCreatePartitionDDL(dbName, tableName, partitionLocation, partitionsDMLInfo,
        Optional.<String>absent());
  }

  /***
   * Generate DDL query to drop a Hive table.
   * @param dbName Hive database name.
   * @param tableName Hive table name.
   * @return Command to drop the table.
   */
  public static String generateDropTableDDL(String dbName, String tableName) {
    return String.format("DROP TABLE IF EXISTS `%s`.`%s`", dbName, tableName);
  }

  /***
   * Adapt Avro schema / types to Hive column types
   * @param schema Schema to adapt and generate Hive columns with corresponding types
   * @param hiveColumns Optional Map to populate with the generated hive columns for reference of caller
   * @param topLevel If this is first level
   * @return Generate Hive columns with types for given Avro schema
   */
  private static String generateAvroToHiveColumnMapping(Schema schema,
      Optional<Map<String, String>> hiveColumns,
      boolean topLevel) {
    if (topLevel && !schema.getType().equals(Schema.Type.RECORD)) {
      throw new IllegalArgumentException(String.format("Schema for table must be of type RECORD. Received type: %s",
          schema.getType()));
    }

    StringBuilder columns = new StringBuilder();
    boolean isFirst;
    switch (schema.getType()) {
      case RECORD:
        isFirst = true;
        if (topLevel) {
          for (Schema.Field field : schema.getFields()) {
            if (isFirst) {
              isFirst = false;
            } else {
              columns.append(", \n");
            }
            String type = generateAvroToHiveColumnMapping(field.schema(), hiveColumns, false);
            if (hiveColumns.isPresent()) {
              hiveColumns.get().put(field.name(), type);
            }
            String flattenSource = field.getProp("flatten_source");
            if (StringUtils.isBlank(flattenSource)) {
              flattenSource = field.name();
            }
            columns.append(String.format("  `%s` %s COMMENT 'from flatten_source %s'", field.name(), type,flattenSource));
          }
        } else {
          columns.append(AVRO_TO_HIVE_COLUMN_MAPPING_V_12.get(schema.getType())).append("<");
          for (Schema.Field field : schema.getFields()) {
            if (isFirst) {
              isFirst = false;
            } else {
              columns.append(",");
            }
            String type = generateAvroToHiveColumnMapping(field.schema(), hiveColumns, false);
            columns.append("`").append(field.name()).append("`").append(":").append(type);
          }
          columns.append(">");
        }
        break;
      case UNION:
        Optional<Schema> optionalType = isOfOptionType(schema);
        if (optionalType.isPresent()) {
          Schema optionalTypeSchema = optionalType.get();
          columns.append(generateAvroToHiveColumnMapping(optionalTypeSchema, hiveColumns, false));
        } else {
          columns.append(AVRO_TO_HIVE_COLUMN_MAPPING_V_12.get(schema.getType())).append("<");
          isFirst = true;
          for (Schema unionMember : schema.getTypes()) {
            if (Schema.Type.NULL.equals(unionMember.getType())) {
              continue;
            }
            if (isFirst) {
              isFirst = false;
            } else {
              columns.append(",");
            }
            columns.append(generateAvroToHiveColumnMapping(unionMember, hiveColumns, false));
          }
          columns.append(">");
        }
        break;
      case MAP:
        columns.append(AVRO_TO_HIVE_COLUMN_MAPPING_V_12.get(schema.getType())).append("<");
        columns.append("string,").append(generateAvroToHiveColumnMapping(schema.getValueType(), hiveColumns, false));
        columns.append(">");
        break;
      case ARRAY:
        columns.append(AVRO_TO_HIVE_COLUMN_MAPPING_V_12.get(schema.getType())).append("<");
        columns.append(generateAvroToHiveColumnMapping(schema.getElementType(), hiveColumns, false));
        columns.append(">");
        break;
      case NULL:
        break;
      case BYTES:
      case DOUBLE:
      case ENUM:
      case FIXED:
      case FLOAT:
      case INT:
      case LONG:
      case STRING:
      case BOOLEAN:
        columns.append(AVRO_TO_HIVE_COLUMN_MAPPING_V_12.get(schema.getType()));
        break;
      default:
        String exceptionMessage = String.format("DDL query generation failed for \"%s\" ", schema);
        log.error(exceptionMessage);
        throw new AvroRuntimeException(exceptionMessage);
    }

    return columns.toString();
  }

  /***
   * Use destination table schema to generate column mapping
   * @param hiveColumns Optional Map to populate with the generated hive columns for reference of caller
   * @param destinationTableMeta destination table metadata
   * @return Generate Hive columns with types for given Avro schema
   */
  private static String generateDestinationToHiveColumnMapping(
      Optional<Map<String, String>> hiveColumns,
      Table destinationTableMeta) {
    StringBuilder columns = new StringBuilder();
    boolean isFirst = true;
    List<FieldSchema> fieldList = destinationTableMeta.getSd().getCols();
    for (FieldSchema field : fieldList) {
      if (isFirst) {
        isFirst = false;
      } else {
        columns.append(", \n");
      }
      String name = field.getName();
      String type = escapeHiveType(field.getType());
      String comment = field.getComment();
      if (hiveColumns.isPresent()) {
        hiveColumns.get().put(name, type);
      }
      columns.append(String.format("  `%s` %s COMMENT '%s'", name, type, comment));
    }

    return columns.toString();
  }

  /***
   * Escape the Hive nested field names.
   * @param type Primitive or nested Hive type.
   * @return Escaped Hive nested field.
   */
  public static String escapeHiveType(String type) {
    TypeInfo typeInfo = TypeInfoUtils.getTypeInfoFromTypeString(type);

    // Primitve
    if (ObjectInspector.Category.PRIMITIVE.equals(typeInfo.getCategory())) {
      return type;
    }
    // List
    else if (ObjectInspector.Category.LIST.equals(typeInfo.getCategory())) {
      ListTypeInfo listTypeInfo = (ListTypeInfo) typeInfo;
      return org.apache.hadoop.hive.serde.serdeConstants.LIST_TYPE_NAME + "<"
          + escapeHiveType(listTypeInfo.getListElementTypeInfo().getTypeName()) + ">";
    }
    // Map
    else if (ObjectInspector.Category.MAP.equals(typeInfo.getCategory())) {
      MapTypeInfo mapTypeInfo = (MapTypeInfo) typeInfo;
      return org.apache.hadoop.hive.serde.serdeConstants.MAP_TYPE_NAME + "<"
          + escapeHiveType(mapTypeInfo.getMapKeyTypeInfo().getTypeName()) + ","
          + escapeHiveType(mapTypeInfo.getMapValueTypeInfo().getTypeName()) + ">";
    }
    // Struct
    else if (ObjectInspector.Category.STRUCT.equals(typeInfo.getCategory())) {
      StructTypeInfo structTypeInfo = (StructTypeInfo) typeInfo;
      List<String> allStructFieldNames = structTypeInfo.getAllStructFieldNames();
      List<TypeInfo> allStructFieldTypeInfos = structTypeInfo.getAllStructFieldTypeInfos();
      StringBuilder sb = new StringBuilder();
      sb.append(serdeConstants.STRUCT_TYPE_NAME + "<");
      for (int i = 0; i < allStructFieldNames.size(); i++) {
        if (i > 0) {
          sb.append(",");
        }
        sb.append("`");
        sb.append(allStructFieldNames.get(i));
        sb.append("`");
        sb.append(":");
        sb.append(escapeHiveType(allStructFieldTypeInfos.get(i).getTypeName()));
      }
      sb.append(">");
      return sb.toString();
    }
    // Union
    else if (ObjectInspector.Category.UNION.equals(typeInfo.getCategory())) {
      UnionTypeInfo unionTypeInfo = (UnionTypeInfo) typeInfo;
      List<TypeInfo> allUnionObjectTypeInfos = unionTypeInfo.getAllUnionObjectTypeInfos();

      StringBuilder sb = new StringBuilder();
      sb.append(serdeConstants.UNION_TYPE_NAME + "<");
      for (int i = 0; i < allUnionObjectTypeInfos.size(); i++) {
        if (i > 0) {
          sb.append(",");
        }
        sb.append(escapeHiveType(allUnionObjectTypeInfos.get(i).getTypeName()));
      }
      sb.append(">");
      return sb.toString();
    } else {
      throw new RuntimeException("Unknown type encountered: " + type);
    }
  }

  /***
   * Check if the Avro Schema is of type OPTION
   * ie. [null, TYPE] or [TYPE, null]
   * @param schema Avro Schema to check
   * @return Optional Avro Typed data if schema is of type OPTION
   */
  private static Optional<Schema> isOfOptionType(Schema schema) {
    Preconditions.checkNotNull(schema);

    // If not of type UNION, cant be an OPTION
    if (!Schema.Type.UNION.equals(schema.getType())) {
      return Optional.<Schema>absent();
    }

    // If has more than two members, can't be an OPTION
    List<Schema> types = schema.getTypes();
    if (null != types && types.size() == 2) {
      Schema first = types.get(0);
      Schema second = types.get(1);

      // One member should be of type NULL and other of non NULL type
      if (Schema.Type.NULL.equals(first.getType()) && !Schema.Type.NULL.equals(second.getType())) {
        return Optional.of(second);
      } else if (!Schema.Type.NULL.equals(first.getType()) && Schema.Type.NULL.equals(second.getType())) {
        return Optional.of(first);
      }
    }

    return Optional.<Schema>absent();
  }

  /***
   * Generate DML mapping query to populate output schema table by selecting from input schema table
   * This method assumes that each output schema field has a corresponding source input table's field reference
   * .. in form of 'flatten_source' property
   * @param inputAvroSchema Input schema that was used to obtain output schema (next argument)
   * @param outputOrcSchema Output schema (flattened or nested) that was generated using input schema
   *                        .. and has lineage information compatible with input schema
   * @param inputTblName Input table name
   * @param outputTblName Output table name
   * @param optionalInputDbName Optional input DB name, if not specified it will default to 'default'
   * @param optionalOutputDbName Optional output DB name, if not specified it will default to 'default'
   * @param optionalPartitionDMLInfo Optional partition info in form of map of partition key, partition value pairs
   * @param optionalOverwriteTable Optional overwrite table, if not specified it is set to true
   * @param optionalCreateIfNotExists Optional create if not exists, if not specified it is set to false
   * @param isEvolutionEnabled If schema evolution is turned on
   * @param destinationTableMeta Optional destination table metadata
   * @param rowLimit Optional row limit
   * @return DML query
   */
  public static String generateTableMappingDML(Schema inputAvroSchema,
      Schema outputOrcSchema,
      String inputTblName,
      String outputTblName,
      Optional<String> optionalInputDbName,
      Optional<String> optionalOutputDbName,
      Optional<Map<String, String>> optionalPartitionDMLInfo,
      Optional<Boolean> optionalOverwriteTable,
      Optional<Boolean> optionalCreateIfNotExists,
      boolean isEvolutionEnabled,
      Optional<Table> destinationTableMeta,
      Optional<Integer> rowLimit) {
    Preconditions.checkNotNull(inputAvroSchema);
    Preconditions.checkNotNull(outputOrcSchema);
    Preconditions.checkArgument(StringUtils.isNotBlank(inputTblName));
    Preconditions.checkArgument(StringUtils.isNotBlank(outputTblName));

    String inputDbName = optionalInputDbName.isPresent() ? optionalInputDbName.get() : DEFAULT_DB_NAME;
    String outputDbName = optionalOutputDbName.isPresent() ? optionalOutputDbName.get() : DEFAULT_DB_NAME;
    boolean shouldOverwriteTable = optionalOverwriteTable.isPresent() ? optionalOverwriteTable.get() : true;
    boolean shouldCreateIfNotExists = optionalCreateIfNotExists.isPresent() ? optionalCreateIfNotExists.get() : false;

    log.debug("Input Schema: " + inputAvroSchema.toString());
    log.debug("Output Schema: " + outputOrcSchema.toString());

    // Start building Hive DML
    // Refer to Hive DDL manual for explanation of clauses:
    // https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML#LanguageManualDML-InsertingdataintoHiveTablesfromqueries
    StringBuilder dmlQuery = new StringBuilder();

    // Insert query
    if (shouldOverwriteTable) {
      dmlQuery.append(String.format("INSERT OVERWRITE TABLE `%s`.`%s` %n", outputDbName, outputTblName));
    } else {
      dmlQuery.append(String.format("INSERT INTO TABLE `%s`.`%s` %n", outputDbName, outputTblName));
    }

    // Partition details
    if (optionalPartitionDMLInfo.isPresent()) {
      if (optionalPartitionDMLInfo.get().size()  > 0) {
        dmlQuery.append("PARTITION (");
        boolean isFirstPartitionSpec = true;
        for (Map.Entry<String, String> partition : optionalPartitionDMLInfo.get().entrySet()) {
          if (isFirstPartitionSpec) {
            isFirstPartitionSpec = false;
          } else {
            dmlQuery.append(", ");
          }
          dmlQuery.append(String.format("`%s`='%s'", partition.getKey(), partition.getValue()));
        }
        dmlQuery.append(") \n");
      }
    }

    // If not exists
    if (shouldCreateIfNotExists) {
      dmlQuery.append(" IF NOT EXISTS \n");
    }

    // Select query
    dmlQuery.append("SELECT \n");

    // 1. If evolution is enabled, and destination table does not exists
    //    .. use columns from new schema
    //    (evolution does not matter if its new destination table)
    // 2. If evolution is enabled, and destination table does exists
    //    .. use columns from new schema
    //    (alter table will be used before moving data from staging to final table)
    // 3. If evolution is disabled, and destination table does not exists
    //    .. use columns from new schema
    //    (evolution does not matter if its new destination table)
    // 4. If evolution is disabled, and destination table does exists
    //    .. use columns from destination schema
    if (isEvolutionEnabled || !destinationTableMeta.isPresent()) {
      log.info("Generating DML using source schema");
      boolean isFirst = true;
      List<Schema.Field> fieldList = outputOrcSchema.getFields();
      for (Schema.Field field : fieldList) {
        String flattenSource = field.getProp("flatten_source");
        String colName;
        if (StringUtils.isNotBlank(flattenSource)) {
          colName = flattenSource;
        } else {
          colName = field.name();
        }
        // Escape the column name
        colName = colName.replaceAll("\\.", "`.`");

        if (isFirst) {
          isFirst = false;
        } else {
          dmlQuery.append(", \n");
        }
        dmlQuery.append(String.format("  `%s`", colName));
      }
    } else {
      log.info("Generating DML using destination schema");
      boolean isFirst = true;
      List<FieldSchema> fieldList = destinationTableMeta.get().getSd().getCols();
      for (FieldSchema field : fieldList) {
        String colName = StringUtils.EMPTY;
        if (field.isSetComment() && field.getComment().startsWith("from flatten_source ")) {
          // Retrieve from column (flatten_source) from comment
          colName = field.getComment().replaceAll("from flatten_source ", "").trim();
        } else {
          // Or else find field in flattened schema
          List<Schema.Field> evolvedFieldList = outputOrcSchema.getFields();
          for (Schema.Field evolvedField : evolvedFieldList) {
            if (evolvedField.name().equalsIgnoreCase(field.getName())) {
              String flattenSource = evolvedField.getProp("flatten_source");
              if (StringUtils.isNotBlank(flattenSource)) {
                colName = flattenSource;
              } else {
                colName = evolvedField.name();
              }
              break;
            }
          }
        }
        // Escape the column name
        colName = colName.replaceAll("\\.", "`.`");

        // colName can be blank if it is deleted in new evolved schema, so we shouldn't try to fetch it
        if (StringUtils.isNotBlank(colName)) {
          if (isFirst) {
            isFirst = false;
          } else {
            dmlQuery.append(", \n");
          }
          dmlQuery.append(String.format("  `%s`", colName));
        }
      }
    }

    dmlQuery.append(String.format(" %n FROM `%s`.`%s` ", inputDbName, inputTblName));

    // Partition details
    if (optionalPartitionDMLInfo.isPresent()) {
      if (optionalPartitionDMLInfo.get().size() > 0) {
        dmlQuery.append("WHERE ");
        boolean isFirstPartitionSpec = true;
        for (Map.Entry<String, String> partition : optionalPartitionDMLInfo.get().entrySet()) {
          if (isFirstPartitionSpec) {
            isFirstPartitionSpec = false;
          } else {
            dmlQuery.append(" AND ");
          }
          dmlQuery.append(String.format("`%s`='%s'",
              partition.getKey(), partition.getValue()));
        }
        dmlQuery.append(" \n");
      }
    }

    // Limit clause
    if (rowLimit.isPresent()) {
      dmlQuery.append(String.format("LIMIT %s", rowLimit.get()));
    }

    return dmlQuery.toString();
  }

  public static Schema readSchemaFromString(String schemaStr)
      throws IOException {
    return new Schema.Parser().parse(schemaStr);
  }

  /***
   * Generate DDLs to evolve final destination table.
   * @param stagingTableName Staging table.
   * @param finalTableName Un-evolved final destination table.
   * @param optionalStagingDbName Optional staging database name, defaults to default.
   * @param optionalFinalDbName Optional final database name, defaults to default.
   * @param evolvedSchema Evolved Avro Schema.
   * @param isEvolutionEnabled Is schema evolution enabled.
   * @param evolvedColumns Evolved columns in Hive format.
   * @param destinationTableMeta Destination table metadata.
   * @return DDLs to evolve final destination table.
   */
  public static List<String> generateEvolutionDDL(String stagingTableName,
      String finalTableName,
      Optional<String> optionalStagingDbName,
      Optional<String> optionalFinalDbName,
      Schema evolvedSchema,
      boolean isEvolutionEnabled,
      Map<String, String> evolvedColumns,
      Optional<Table> destinationTableMeta) {
    // If schema evolution is disabled, then do nothing OR
    // If destination table does not exists, then do nothing
    if (!isEvolutionEnabled || !destinationTableMeta.isPresent()) {
      return Collections.emptyList();
    }

    String stagingDbName = optionalStagingDbName.isPresent() ? optionalStagingDbName.get() : DEFAULT_DB_NAME;
    String finalDbName = optionalFinalDbName.isPresent() ? optionalFinalDbName.get() : DEFAULT_DB_NAME;

    List<String> ddl = Lists.newArrayList();

    // Evolve schema
    Table destinationTable = destinationTableMeta.get();
    if (destinationTable.getSd().getCols().size() == 0) {
      log.warn("Desination Table: " + destinationTable + " does not has column details in StorageDescriptor. "
          + "It is probably of Avro type. Cannot evolve via traditional HQL, so skipping evolution checks.");
      return ddl;
    }
    for (Map.Entry<String, String> evolvedColumn : evolvedColumns.entrySet()) {
      // Find evolved column in destination table
      boolean found = false;
      for (FieldSchema destinationField : destinationTable.getSd().getCols()) {
        if (destinationField.getName().equalsIgnoreCase(evolvedColumn.getKey())) {
          // If evolved column is found, but type is evolved - evolve it
          // .. if incompatible, isTypeEvolved will throw an exception
          if (isTypeEvolved(evolvedColumn.getValue(), destinationField.getType())) {
            ddl.add(String.format("USE %s%n", finalDbName));
            ddl.add(String.format("ALTER TABLE `%s` CHANGE COLUMN %s %s %s COMMENT '%s'",
                finalTableName, evolvedColumn.getKey(), evolvedColumn.getKey(), evolvedColumn.getValue(),
                destinationField.getComment()));
          }
          found = true;
          break;
        }
      }
      if (!found) {
        // If evolved column is not found ie. its new, add this column
        String flattenSource = evolvedSchema.getField(evolvedColumn.getKey()).getProp("flatten_source");
        if (StringUtils.isBlank(flattenSource)) {
          flattenSource = evolvedSchema.getField(evolvedColumn.getKey()).name();
        }
        // Note: Hive does not support fully qualified Hive table names such as db.table for ALTER TABLE in v0.13
        // .. hence specifying 'use dbName' as a precursor to rename
        // Refer: HIVE-2496
        ddl.add(String.format("USE %s%n", finalDbName));
        ddl.add(String.format("ALTER TABLE `%s` ADD COLUMNS (%s %s COMMENT 'from flatten_source %s')",
            finalTableName, evolvedColumn.getKey(), evolvedColumn.getValue(), flattenSource));
      }
    }

    return ddl;
  }

  /**
   * Generate DDL for dropping partitions of a table.
   * <p>
   * ALTER TABLE finalTableName DROP IF EXISTS PARTITION partition_spec, PARTITION partition_spec, ...;
   * </p>
   * @param finalTableName Table name where partitions are dropped
   * @param partitionsDMLInfo Partitions to be dropped
   * @return DDL to drop partitions in <code>finalTableName</code>
   */
  public static List<String> generateDropPartitionsDDL(final String dbName, final String finalTableName,
      final Map<String, String> partitionsDMLInfo) {

    if (null == partitionsDMLInfo || partitionsDMLInfo.isEmpty()) {
      return Collections.emptyList();
    }

    // Partition details
    StringBuilder partitionSpecs = new StringBuilder();
    partitionSpecs.append("PARTITION (");
    boolean isFirstPartitionSpec = true;
    for (Map.Entry<String, String> partition : partitionsDMLInfo.entrySet()) {
      if (isFirstPartitionSpec) {
        isFirstPartitionSpec = false;
      } else {
        partitionSpecs.append(", ");
      }
      partitionSpecs.append(String.format("`%s`='%s'", partition.getKey(), partition.getValue()));
    }
    partitionSpecs.append(") ");

    List<String> ddls = Lists.newArrayList();
    // Note: Hive does not support fully qualified Hive table names such as db.table for ALTER TABLE in v0.13
    // .. hence specifying 'use dbName' as a precursor to rename
    // Refer: HIVE-2496
    ddls.add(String.format("USE %s%n", dbName));
    ddls.add(String.format("ALTER TABLE %s DROP IF EXISTS %s", finalTableName, partitionSpecs));

    return ddls;
  }

  /**
   * Generate DDL for dropping partitions of a table.
   * <p>
   * ALTER TABLE finalTableName DROP IF EXISTS PARTITION partition_spec, PARTITION partition_spec, ...;
   * </p>
   * @param finalTableName Table name where partitions are dropped
   * @param partitionDMLInfos list of Partition to be dropped
   * @return DDL to drop partitions in <code>finalTableName</code>
   */
  public static List<String> generateDropPartitionsDDL(final String dbName, final String finalTableName,
      final List<Map<String, String>> partitionDMLInfos) {

    if (partitionDMLInfos.isEmpty()) {
      return Collections.emptyList();
    }

    List<String> ddls = Lists.newArrayList();
    ddls.add(String.format("USE %s %n", dbName));
    // Join the partition specs
    ddls.add(String.format("ALTER TABLE %s DROP IF EXISTS %s", finalTableName,
        Joiner.on(",").join(Iterables.transform(partitionDMLInfos, PARTITION_SPEC_GENERATOR))));

    return ddls;
  }

  /***
   * Generate DDL for creating and updating view over a table.
   *
   * Create view:
   * <p>
   *   CREATE VIEW IF NOT EXISTS db.viewName AS SELECT * FROM db.tableName
   * </p>
   *
   * Update view:
   * <p>
   *   ALTER VIEW db.viewName AS SELECT * FROM db.tableName
   * </p>
   *
   * @param tableDbName       Database for the table over which view has to be created.
   * @param tableName         Table over which view has to be created.
   * @param viewDbName        Database for the view to be created.
   * @param viewName          View to be created.
   * @param shouldUpdateView  If view should be forced re-built.
   * @return DDLs to create and / or update view over a table
   */
  public static List<String> generateCreateOrUpdateViewDDL(final String tableDbName, final String tableName,
      final String viewDbName, final String viewName, final boolean shouldUpdateView) {

    Preconditions.checkArgument(StringUtils.isNotBlank(tableName), "Table name should not be empty");
    Preconditions.checkArgument(StringUtils.isNotBlank(viewName), "View name should not be empty");

    // Resolve defaults
    String resolvedTableDbName = (StringUtils.isBlank(tableDbName)) ? DEFAULT_DB_NAME : tableDbName;
    String resolvedViewDbName = (StringUtils.isBlank(viewDbName)) ? DEFAULT_DB_NAME : viewDbName;

    List<String> ddls = Lists.newArrayList();

    // No-op if view already exists
    ddls.add(String.format("CREATE VIEW IF NOT EXISTS `%s`.`%s` AS SELECT * FROM `%s`.`%s`",
        resolvedViewDbName, viewName,
        resolvedTableDbName, tableName));

    // This will force re-build the view
    if (shouldUpdateView) {
      ddls.add(String.format("ALTER VIEW `%s`.`%s` AS SELECT * FROM `%s`.`%s`",
          resolvedViewDbName, viewName,
          resolvedTableDbName, tableName));
    }

    return ddls;
  }

  /***
   * Generate DDL for updating file format of table or partition.
   * If partition spec is absent, DDL query to change storage format of Table is generated.
   *
   * Query syntax:
   * <p>
   *   ALTER TABLE tableName [PARTITION partition_spec] SET FILEFORMAT fileFormat
   * </p>
   *
   * @param dbName            Database for the table for which storage format needs to be changed.
   * @param tableName         Table for which storage format needs to be changed.
   * @param partitionsDMLInfo Optional partition spec for which storage format needs to be changed.
   * @param format            Storage format.
   * @return DDL to change storage format for Table or Partition.
   */
  public static List<String> generateAlterTableOrPartitionStorageFormatDDL(final String dbName,
      final String tableName,
      final Optional<Map<String, String>> partitionsDMLInfo,
      String format) {
    Preconditions.checkArgument(StringUtils.isNotBlank(tableName), "Table name should not be empty");
    Preconditions.checkArgument(StringUtils.isNotBlank(format), "Format should not be empty");

    // Resolve defaults
    String resolvedDbName = (StringUtils.isBlank(dbName)) ? DEFAULT_DB_NAME : dbName;

    // Partition details
    StringBuilder partitionSpecs = new StringBuilder();

    if (partitionsDMLInfo.isPresent()) {
      partitionSpecs.append("PARTITION (");
      boolean isFirstPartitionSpec = true;
      for (Map.Entry<String, String> partition : partitionsDMLInfo.get().entrySet()) {
        if (isFirstPartitionSpec) {
          isFirstPartitionSpec = false;
        } else {
          partitionSpecs.append(", ");
        }
        partitionSpecs.append(String.format("`%s`='%s'", partition.getKey(), partition.getValue()));
      }
      partitionSpecs.append(") ");
    }

    List<String> ddls = Lists.newArrayList();


    // Note: Hive does not support fully qualified Hive table names such as db.table for ALTER TABLE in v0.13
    // .. hence specifying 'use dbName' as a precursor to rename
    // Refer: HIVE-2496
    ddls.add(String.format("USE %s%n", resolvedDbName));
    ddls.add(String.format("ALTER TABLE %s %s SET FILEFORMAT %s", tableName, partitionSpecs, format));

    return ddls;
  }

  /***
   * Serialize a {@link QueryBasedHivePublishEntity} into a {@link State} at {@link #SERIALIZED_PUBLISH_TABLE_COMMANDS}.
   * @param state {@link State} to serialize entity into.
   * @param queryBasedHivePublishEntity to carry to publisher.
   */
  public static void serializePublishCommands(State state, QueryBasedHivePublishEntity queryBasedHivePublishEntity) {
    state.setProp(HiveAvroORCQueryGenerator.SERIALIZED_PUBLISH_TABLE_COMMANDS,
        GSON.toJson(queryBasedHivePublishEntity));
  }

  /***
   * Deserialize the publish entity from a {@link State} at {@link #SERIALIZED_PUBLISH_TABLE_COMMANDS}.
   * @param state {@link State} to look into for serialized entity.
   * @return Publish table entity.
   */
  public static QueryBasedHivePublishEntity deserializePublishCommands(State state) {
    QueryBasedHivePublishEntity queryBasedHivePublishEntity =
        GSON.fromJson(state.getProp(HiveAvroORCQueryGenerator.SERIALIZED_PUBLISH_TABLE_COMMANDS),
            QueryBasedHivePublishEntity.class);
    return queryBasedHivePublishEntity == null ? new QueryBasedHivePublishEntity() : queryBasedHivePublishEntity;
  }

  public static boolean isTypeEvolved(String evolvedType, String destinationType) {
    if (evolvedType.equalsIgnoreCase(destinationType)) {
      // Same type, not evolved
      return false;
    }
    // Look for compatibility in evolved type
    if (HIVE_COMPATIBLE_TYPES.containsKey(destinationType)) {
      if (HIVE_COMPATIBLE_TYPES.get(destinationType).contains(evolvedType)) {
        return true;
      } else {
        throw new RuntimeException(String.format("Incompatible type evolution from: %s to: %s",
            destinationType, evolvedType));
      }
    } else {
      // We assume all complex types are compatible
      // TODO: Add compatibility check when ORC evolution supports complex types
      return true;
    }
  }

  /**
   * Generate partition spec in Hive standard syntax. (partition_column=partition_col_value, partition_column=partition_col_value, ...)
   */
  private static final Function<Map<String, String>, String> PARTITION_SPEC_GENERATOR = new Function<Map<String, String>, String>() {
    @Override
    public String apply(Map<String, String> partitionDMLInfo) {

      if (partitionDMLInfo == null) {
        return StringUtils.EMPTY;
      }
      return String.format(" PARTITION (%s)", Joiner.on(",").withKeyValueSeparator("=").join(Maps.transformValues(partitionDMLInfo, QUOTE_PARTITION_VALUES)));
    }
  };

  private static final Function<String, String> QUOTE_PARTITION_VALUES = new Function<String, String>() {

    @Override
    public String apply(String value) {
      return String.format("'%s'", value);
    }
  };
}