ExecutePySpark.java example

Explorer

kylo-master
- commons
  - commons-feed-util
    - src
      - main
        java
        com
        thinkbiganalytics
        support
        FeedNameUtil.java
  - commons-hive
    - src
      - main
        java
        com
        thinkbiganalytics
        hive
        util
        HiveUtils.java
      - test
        java
        com
        thinkbiganalytics
        hive
        util
        HiveUtilsTest.java
  - commons-jdbc
    - src
      - main
        java
        com
        thinkbiganalytics
        jdbc
        util
        DatabaseType.java
  - commons-jpa
    - src
      - main
        java
        com
        thinkbiganalytics
        jpa
        AbstractAuditedEntity.java
        AbstractJpaProvider.java
        AuditTimestampListener.java
        AuditedEntity.java
        BaseJpaId.java
        BaseJpaProvider.java
        JsonAttributeConverter.java
        LongColumnDateTimeMapper.java
        PathAttributeConverter.java
        PersistentDateTimeAsMillisLong.java
        PrincipalConverter.java
        TruncateStringUserType.java
        UriConverter.java
  - commons-rest-client
    - src
      - main
        java
        com
        thinkbiganalytics
        rest
        JacksonObjectMapperProvider.java
        JerseyClientConfig.java
        JerseyRestClient.java
        JodaTimeMapperProvider.java
  - commons-rest-model
    - src
      - main
        java
        com
        thinkbiganalytics
        rest
        model
        LabelValue.java
        RestResponseStatus.java
        ValidationError.java
        beanvalidation
        UUID.java
  - commons-spark
    - commons-scala-2.10
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        SparkInterpreterBuilder210.java
    - commons-scala-2.11
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        SparkInterpreterBuilder211.java
    - commons-scala-api
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        SparkInterpreterBuilder.java
    - commons-spark-1.6
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        DataSet16.java
        SparkContextService16.java
    - commons-spark-2.0
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        DataSet20.java
        SparkContextService20.java
    - commons-spark-api
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        DataSet.java
        SparkContextService.java
    - commons-spark-repl
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        repl
        ForwardingClassLoader.java
        ScriptEngine.java
        SparkScriptEngine.java
        util
        ArrayUtils.java
        test
        java
        com
        thinkbiganalytics
        spark
        repl
        SparkScriptEngineTest.java
    - commons-spark-shell-api
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        shell
        AbstractDatasourceProvider.java
        DatasourceProvider.java
        DatasourceProviderFactory.java
    - commons-spark-shell-v1
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        shell
        DatasourceProviderFactoryV1.java
        DatasourceProviderV1.java
    - commons-spark-shell-v2
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        shell
        DatasourceProviderFactoryV2.java
        DatasourceProviderV2.java
  - commons-test
    - src
      - main
        java
        com
        thinkbiganalytics
        test
        security
        WithMockJaasUser.java
  - commons-test-persistence
    - src
      - main
        java
        com
        thinkbiganalytics
        testing
        jpa
        TestPersistenceConfiguration.java
  - commons-util
    - src
      - main
        java
        com
        thinkbiganalytics
        DateTimeUtil.java
        Formatters.java
        KyloVersion.java
        KyloVersionUtil.java
        annotations
        AnnotatedFieldProperty.java
        AnnotationFieldNameResolver.java
        json
        ObjectMapperSerializer.java
        scheduler
        util
        CronExpressionUtil.java
        TimerToCronExpression.java
        spring
        CommonsSpringConfiguration.java
        FileResourceService.java
        SpringApplicationContext.java
      - test
        java
        com
        thinkbiganalytics
        DateTimeUtilTest.java
        scheduler
        quartz
        CronExpressionTest.java
- core
  - alerts
    - alerts-api
      - src
        main
        java
        com
        thinkbiganalytics
        alerts
        api
        Alert.java
        AlertChangeEvent.java
        AlertCriteria.java
        AlertListener.java
        AlertNotfoundException.java
        AlertProvider.java
        AlertResponder.java
        AlertResponse.java
        sla
        AssessmentAlerts.java
        spi
        AlertDescriptor.java
        AlertManager.java
        AlertNotifyReceiver.java
        AlertSource.java
        AlertSourceAggregator.java
    - alerts-core
      - src
        main
        java
        com
        thinkbiganalytics
        alerts
        api
        core
        AggregatingAlertProvider.java
        AlertProviderConfiguration.java
        BaseAlertCriteria.java
        spi
        mem
        InMemoryAlertManager.java
        test
        java
        com
        thinkbiganalytics
        alerts
        api
        core
        AggregatingAlertProviderTest.java
        spi
        mem
        InMemoryAlertManagerTest.java
    - alerts-default
      - src
        main
        java
        com
        thinkbiganalytics
        alerts
        spi
        defaults
        DefaultAlertManager.java
        DefaultAlertManagerConfig.java
        metadata
        jpa
        alerts
        JpaAlert.java
        JpaAlertChangeEvent.java
        JpaAlertRepository.java
        package-info.java
        test
        java
        com
        thinkbiganalytics
        alerts
        spi
        defaults
        DefaultAlertManagerTest.java
  - classname-change
    - classname-change-api
      - src
        main
        java
        com
        thinkbiganalytics
        classnameregistry
        ClassNameChange.java
    - classname-change-core
      - src
        main
        java
        com
        thinkbiganalytics
        classnameregistry
        ClassNameChangeRegistry.java
        ClassNameChangeSpringConfiguration.java
  - cluster-manager
    - cluster-manager-api
      - src
        main
        java
        com
        thinkbiganalytics
        cluster
        ClusterMessage.java
        ClusterService.java
        ClusterServiceListener.java
        ClusterServiceMessageReceiver.java
        NiFiFlowCacheUpdateType.java
        StandardClusterMessage.java
    - cluster-manager-core
      - src
        main
        java
        com
        thinkbiganalytics
        cluster
        JGroupsClusterService.java
        config
        ClusterServiceConfig.java
  - field-policy
    - field-policy-api
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        BaseFieldPolicy.java
        standardization
        StandardizationPolicy.java
        Standardizer.java
        validation
        ValidationPolicy.java
        Validator.java
  - hadoop-authorization
    - hadoop-authorization-api
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        config
        AuthorizationConfiguration.java
        model
        HadoopAuthorizationGroup.java
        service
        HadoopAuthorizationService.java
        test
        java
        com
        thinkbiganalytics
        datalake
        authorization
        service
        HadoopAuthorizationServiceTest.java
    - hadoop-authorization-core
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        model
        HDFSPolicy.java
        HivePolicy.java
        SearchPolicy.java
        service
        BaseHadoopAuthorizationService.java
  - job-repository
    - job-repository-api
      - src
        main
        java
        com
        thinkbiganalytics
        jobrepo
        common
        constants
        CheckDataStepConstants.java
        FeedConstants.java
        query
        model
        CheckDataJob.java
        ExecutedFeed.java
        ExecutedJob.java
        ExecutedStep.java
        ExecutionStatus.java
        FeedHealth.java
        FeedStatus.java
        FeedSummary.java
        JobStatusCount.java
        SearchResult.java
        security
        OperationsAccessControl.java
        service
        JobExecutionException.java
        JobService.java
    - job-repository-core
      - src
        main
        java
        com
        thinkbiganalytics
        jobrepo
        query
        model
        DataConfidenceSummary.java
        DefaultCheckDataJob.java
        DefaultExecutedFeed.java
        DefaultExecutedJob.java
        DefaultExecutedStep.java
        DefaultFeedHealth.java
        DefaultFeedStatus.java
        DefaultFeedSummary.java
        ExitStatus.java
        JobStatusCountResult.java
        SearchResultImpl.java
        transform
        FeedModelTransform.java
        JobModelTransform.java
        JobStatusTransform.java
        ModelUtils.java
        support
        FeedHealthUtil.java
  - kerberos
    - kerberos-core
      - src
        main
        java
        com
        thinkbiganalytics
        kerberos
        KerberosTicketConfiguration.java
        KerberosTicketGenerator.java
        KerberosUtil.java
    - kerberos-test-client
      - src
        main
        java
        com
        thinkbiganalytics
        kerberos
        TestKerberosKinit.java
  - operational-metadata
    - operational-metadata-api
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        api
        SearchCriteria.java
        app
        KyloVersionProvider.java
        cluster
        NiFiFlowCacheClusterSync.java
        NiFiFlowCacheClusterUpdateItem.java
        common
        ItemLastModified.java
        ItemLastModifiedProvider.java
        feed
        BatchFeedSummaryCounts.java
        DeleteFeedListener.java
        FeedHealth.java
        LatestFeedJobExecution.java
        OpsManagerFeed.java
        OpsManagerFeedProvider.java
        security
        FeedOpsAccessControlProvider.java
        jobrepo
        ExecutionConstants.java
        job
        BatchJobExecution.java
        BatchJobExecutionContextValue.java
        BatchJobExecutionFilters.java
        BatchJobExecutionParameter.java
        BatchJobExecutionProvider.java
        BatchJobInstance.java
        JobStatusCount.java
        nifi
        NifiEvent.java
        NifiEventJobExecution.java
        NifiEventStepExecution.java
        NifiFeedProcessorStatisticsProvider.java
        NifiFeedProcessorStats.java
        NifiRelatedRootFlowFiles.java
        step
        BatchStepExecution.java
        BatchStepExecutionContextValue.java
        BatchStepExecutionProvider.java
        FailedStepExecutionListener.java
    - operational-metadata-jpa
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        config
        OperationalMetadataConfig.java
        OperationalMetadataTransactionTemplateMetadataAccess.java
        RoleSetExposingSecurityEvaluationContextExtension.java
        RoleSetExposingSecurityExpressionRoot.java
        jpa
        app
        JpaKyloVersion.java
        JpaKyloVersionConfig.java
        JpaKyloVersionProvider.java
        KyloVersionRepository.java
        cluster
        JpaNiFiFlowCacheClusterSync.java
        JpaNiFiFlowCacheClusterUpdateItem.java
        NiFiFlowCacheClusterUpdateItemRepository.java
        NiFiFlowCacheClusterUpdateProvider.java
        NiFiFlowCacheClusterUpdateRepository.java
        common
        ItemLastModifiedRepository.java
        JpaItemLastModified.java
        JpaItemLastModifiedProvider.java
        feed
        AugmentableQueryRepository.java
        AugmentableQueryRepositoryFactory.java
        AugmentableQueryRepositoryFactoryBean.java
        AugmentableQueryRepositoryImpl.java
        BatchFeedSummaryCountsRepository.java
        FeedAclIndexQueryAugmentor.java
        FeedHealthRepository.java
        FeedHealthSecuringRepository.java
        FeedSecuringQueryAugmentor.java
        FeedSecuringRepository.java
        JpaBatchFeedSummaryCounts.java
        JpaLatestFeedJobExecution.java
        JpaOpsManagerFeed.java
        JpaOpsManagerFeedHealth.java
        LatestFeedJobExectionRepository.java
        LatestFeedJobExectionSecuringRepository.java
        OpsFeedManagerFeedProvider.java
        OpsManagerFeedId.java
        OpsManagerFeedRepository.java
        QueryAugmentor.java
        RepositoryType.java
        security
        FeedOpsAccessControlConfig.java
        FeedOpsAccessControlRepository.java
        JpaFeedOpsAccessControlProvider.java
        JpaFeedOpsAclEntry.java
        jobrepo
        AbstractBatchExecutionContextValue.java
        job
        BatchJobExecutionRepository.java
        BatchJobExecutionSecuringQueryAugmentor.java
        BatchJobExecutionSecuringRepository.java
        BatchJobInstanceRepository.java
        BatchJobInstanceSecuringQueryAugmentor.java
        BatchJobInstanceSecuringRepository.java
        BatchJobParametersRepository.java
        JpaBatchJobExecution.java
        JpaBatchJobExecutionContextValue.java
        JpaBatchJobExecutionParameter.java
        JpaBatchJobExecutionProvider.java
        JpaBatchJobExecutionStatusCounts.java
        JpaBatchJobInstance.java
        nifi
        JpaNifiEvent.java
        JpaNifiEventJobExecution.java
        JpaNifiEventStepExecution.java
        JpaNifiFeedProcessorStats.java
        JpaNifiRelatedRootFlowFiles.java
        NifiEventProvider.java
        NifiEventRepository.java
        NifiEventStepExecutionRepository.java
        NifiFeedProcessorStatisticsProvider.java
        NifiFeedProcessorStatisticsRepository.java
        NifiRelatedRootFlowFilesRepository.java
        step
        BatchStepExecutionRepository.java
        JpaBatchStepExecution.java
        JpaBatchStepExecutionContextValue.java
        JpaBatchStepExecutionProvider.java
        sla
        JpaMetricAssessment.java
        JpaObligationAssessment.java
        JpaServiceLevelAssessment.java
        JpaServiceLevelAssessmentProvider.java
        JpaServiceLevelAssessmentRepository.java
        JpaServiceLevelAssessor.java
        support
        CommonFilterTranslations.java
        GenericQueryDslFilter.java
        QueryDslFetchJoin.java
        QueryDslPagingSupport.java
        QueryDslPathInspector.java
        package-info.java
        test
        java
        com
        thinkbiganalytics
        metadata
        jpa
        TestJpaConfiguration.java
        feed
        AbandonFeedJobsStoredProcedureMock.java
        FeedHealthRepositoryTest.java
        JpaBatchJobExecutionProviderTest.java
        JpaFeedProviderTest.java
        OpsManagerFeedRepositoryTest.java
        TestFeedSecuringRepository.java
        TestOpsManagerFeedRepository.java
        security
        JpaFeedOpsAccessControlProviderTest.java
        job
        JpaBatchJobExecutionTest.java
  - precondition
    - precondition-api
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        precondition
        DependentFeedPrecondition.java
        Precondition.java
        PreconditionPolicy.java
  - schema-discovery
    - schema-discovery-api
      - src
        main
        java
        com
        thinkbiganalytics
        discovery
        parser
        FileSchemaParser.java
        SchemaParser.java
        schema
        DataTypeDescriptor.java
        DatabaseMetadata.java
        Field.java
        FileSchema.java
        HiveTableSchema.java
        QueryResult.java
        QueryResultColumn.java
        Schema.java
        TableSchema.java
        util
        ParserHelper.java
        TableSchemaType.java
        test
        java
        com
        thinkbiganalytics
        discovery
        api
        DatabaseMetadata.java
        util
        ParserHelperTest.java
        TestField.java
    - schema-discovery-rdbms
      - src
        main
        java
        com
        thinkbiganalytics
        schema
        DBSchemaParser.java
        test
        java
        com
        thinkbiganalytics
        schema
        DBSchemaParserTest.java
        TestDbSchemaConfig.java
  - service-monitor
    - service-monitor-api
      - src
        main
        java
        com
        thinkbiganalytics
        servicemonitor
        check
        ServiceStatusCheck.java
        ServicesStatusCheck.java
        model
        ServiceAlert.java
        ServiceComponent.java
        ServiceStatusResponse.java
    - service-monitor-core
      - src
        main
        java
        com
        thinkbiganalytics
        servicemonitor
        model
        DefaultServiceAlert.java
        DefaultServiceComponent.java
        DefaultServiceStatusResponse.java
        support
        ServiceMonitorCheckUtil.java
  - sla
    - sla-api
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        sla
        api
        AgreementNotFoundException.java
        AssessmentResult.java
        DuplicateAgreementNameException.java
        Metric.java
        MetricAssessment.java
        Obligation.java
        ObligationAssessment.java
        ObligationGroup.java
        ServiceLevelAgreement.java
        ServiceLevelAgreementAction.java
        ServiceLevelAgreementActionConfig.java
        ServiceLevelAgreementActionConfiguration.java
        ServiceLevelAgreementActionValidation.java
        ServiceLevelAgreementException.java
        ServiceLevelAgreementMetric.java
        ServiceLevelAssessment.java
        ServiceLevelAssessmentException.java
        spi
        AssessorNotFoundException.java
        MetricAssessmentBuilder.java
        MetricAssessor.java
        ObligationAssessmentBuilder.java
        ObligationAssessor.java
        ObligationBuilder.java
        ObligationGroupBuilder.java
        ServiceLevelAgreementBuilder.java
        ServiceLevelAgreementCheck.java
        ServiceLevelAgreementCheckBuilder.java
        ServiceLevelAgreementChecker.java
        ServiceLevelAgreementProvider.java
        ServiceLevelAgreementScheduler.java
        ServiceLevelAssessmentProvider.java
        ServiceLevelAssessor.java
    - sla-core
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        sla
        alerts
        AssessmentAlertGenerator.java
        AssessmentAlertResponder.java
        BaseServiceLevelAgreementActionConfiguration.java
        ServiceLevelAgreementActionUtil.java
        ServiceLevelAssessmentAlertUtil.java
        spi
        core
        DefaultServiceLevelAgreementChecker.java
        InMemorySLAProvider.java
        SimpleMetricAssessment.java
        SimpleObligationAssessment.java
        SimpleServiceLevelAssessment.java
        SimpleServiceLevelAssessor.java
        test
        java
        com
        thinkbiganalytics
        metadata
        sla
        spi
        core
        InMemorySLAProviderTest.java
        SimpleServiceLevelAssessmentCompareTest.java
        SimpleServiceLevelAssessorTest.java
        TestMetric.java
        TestMetricAssessor.java
        TestObligatinAssessor.java
    - sla-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        rest
        model
        sla
        MetricAssessment.java
        Obligation.java
        ObligationAssessment.java
        ObligationGroup.java
        ServiceLevelAgreement.java
        ServiceLevelAgreementCheck.java
        ServiceLevelAssessment.java
  - ui-annotation
    - ui-annotation-api
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        FeedPropertySection.java
        FeedPropertyType.java
        MetadataField.java
        policy
        PolicyProperty.java
        PolicyPropertyRef.java
        PolicyPropertyTypes.java
        PropertyLabelValue.java
    - ui-annotation-core
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        BasePolicyAnnotationTransformer.java
        PolicyTransformException.java
        PolicyTransformer.java
        ReflectionPolicyAnnotationDiscoverer.java
    - ui-annotation-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        rest
        model
        BasePolicyRuleBuilder.java
        BaseUiPolicyRule.java
        FieldRuleProperty.java
        FieldRulePropertyBuilder.java
        GenericBaseUiPolicyRuleBuilder.java
- integrations
  - input-format
    - input-format-omniture
      - src
        main
        java
        com
        thinkbiganalytics
        inputformat
        hadoop
        mapred
        EscapedLineReader.java
        OmnitureDataFileInputFormat.java
        OmnitureDataFileRecordReader.java
  - jira
    - jira-rest-client
      - src
        main
        java
        com
        thinkbiganalytics
        jira
        JiraClient.java
        JiraException.java
        JiraJerseyClient.java
        JiraRestClientConfig.java
        domain
        AvatarUrls.java
        BasicIssue.java
        Comment.java
        Comments.java
        Component.java
        CreateIssue.java
        CreateMeta.java
        Fields.java
        GetIssue.java
        InwardIssue.java
        Issue.java
        IssueBuilder.java
        IssueLink.java
        IssueType.java
        OutwardIssue.java
        Priority.java
        Progress.java
        Project.java
        ProjectCategory.java
        Resolution.java
        ServerInfo.java
        Status.java
        StatusCategory.java
        TimeTracking.java
        Type.java
        User.java
        Version.java
        Votes.java
        Watches.java
        Worklog.java
        util
        UriUtil.java
        test
        java
        com
        thinkbiganalytics
        jira
        JerseyClientTest.java
        JiraClientComponentTest.java
        JiraSpringTestConfig.java
  - nifi
    - nifi-framework
      - nifi-framework-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        logging
        ComponentLogFactory.java
        processor
        AbstractNiFiProcessor.java
      - nifi-framework-v1
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v1
        logging
        ComponentLogFactoryV1.java
    - nifi-jms
      - src
        main
        java
        com
        thinkbiganalytics
        nifi
        activemq
        Queues.java
        Topics.java
    - nifi-nar-bundles
      - nifi-core-bundle
        nifi-core-processors
        src
        main
        java
        com
        thinkbiganalytics
        ingest
        GetTableDataSupport.java
        StripHeaderSupport.java
        TableMergeSyncSupport.java
        TableRegisterSupport.java
        nifi
        v2
        common
        BaseProcessor.java
        CommonProperties.java
        FeedIdNotFoundException.java
        FeedProcessor.java
        core
        watermark
        HighWaterMarkProcessor.java
        LoadHighWaterMark.java
        ReleaseHighWaterMark.java
        ingest
        DropFeedTables.java
        GetTableData.java
        IngestProperties.java
        MergeTable.java
        RegisterFeedTables.java
        RouteOnRegistration.java
        StripHeader.java
        UpdateRegistration.java
        init
        CompleteInitializeFeed.java
        InitializeFeed.java
        RouteOnRegistration.java
        metadata
        AbstractFeedProcessor.java
        AbstractTerminateFeed.java
        BeginFeed.java
        DataChangeEventFlowTrigger.java
        DirectoryProperties.java
        HiveTableProperties.java
        PutFeedMetadata.java
        TerminateDirectoryFeed.java
        TerminateHiveTableFeed.java
        TriggerCleanup.java
        TriggerFeed.java
        util
        ColumnSpec.java
        ComponentAttributes.java
        InputStreamReaderRunnable.java
        JdbcCommon.java
        PartitionBatch.java
        PartitionKey.java
        PartitionSpec.java
        ResultSetAdapter.java
        ResultSetMetaAdapter.java
        TableRegisterConfiguration.java
        TableType.java
        test
        java
        com
        thinkbiganalytics
        ingest
        GetTableDataSupportTest.java
        HiveShellTableMergeSyncSupport.java
        StripHeaderSupportTest.java
        TableMergeSyncSupportTest.java
        TableRegisterSupportTest.java
        nifi
        v2
        ingest
        DropFeedTablesTest.java
        GetTableDataTest.java
        RegisterFeedTablesTest.java
        StripHeaderTest.java
        metadata
        PutFeedMetadataTest.java
        TriggerCleanupTest.java
        TriggerFeedTest.java
        security
        rest
        model
        PermissionsChangeTest.java
        util
        ColumnSpecTest.java
        JdbcCommonTest.java
      - nifi-elasticsearch-bundle
        nifi-elasticsearch-processors
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v2
        elasticsearch
        IndexElasticSearch.java
        MergeHiveTableMetadata.java
        test
        java
        com
        thinkbiganalytics
        nifi
        IndexElasticSearchTest.java
        MergeHiveTableMetadataTest.java
      - nifi-hadoop-bundle
        nifi-hadoop-processors
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v2
        hdfs
        AbstractHadoopProcessor.java
        ComputeHDFSChecksums.java
        CreateHDFSFolder.java
        DistCopyHDFS.java
        HDFSSupport.java
        RemoveHDFSFolder.java
        sqoop
        core
        ExportSqoop.java
        ImportSqoop.java
        enums
        CompressionAlgorithm.java
        ExportNullInterpretationStrategy.java
        ExtractDataFormat.java
        HiveDelimStrategy.java
        HiveNullEncodingStrategy.java
        SqoopLoadStrategy.java
        TargetHdfsDirExistsStrategy.java
        process
        SqoopExportProcessRunner.java
        SqoopExportThreadedStreamHandler.java
        SqoopProcessResult.java
        SqoopProcessRunner.java
        SqoopThreadedStreamHandler.java
        security
        DecryptPassword.java
        EncryptPassword.java
        EncryptPasswordConfiguration.java
        KerberosConfig.java
        utils
        SqoopBuilder.java
        SqoopExportBuilder.java
        SqoopUtils.java
        thrift
        ExecuteHQL.java
        ExecuteHQLStatement.java
        util
        JdbcCommon.java
        ResultSetAdapter.java
        ResultSetMetaAdapter.java
        test
        java
        com
        thinkbiganalytics
        nifi
        v2
        hdfs
        ComputeHDFSChecksumsTest.java
        DistCopyHDFSTest.java
        RemoveHDFSFolderTest.java
      - nifi-provenance-repo-bundle
        nifi-provenance-repo
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        provenance
        FeedFlowFileNotFoundException.java
        ProvenanceEventCollector.java
        ProvenanceEventObjectFactory.java
        ProvenanceEventObjectPool.java
        ProvenanceEventRecordConverter.java
        ProvenanceFeedLookup.java
        ProvenanceStatsCalculator.java
        cache
        FeedFlowFileCacheListener.java
        FeedFlowFileCacheUtil.java
        FeedFlowFileGuavaCache.java
        FeedFlowFileMapDbCache.java
        config
        NifiProvenanceConfig.java
        jms
        JmsSendListener.java
        ProvenanceEventActiveMqWriter.java
        reporting
        KyloProvenanceEventReportingTask.java
        KyloReportingTaskJmsListeners.java
        NodeIdStrategy.java
        util
        SpringApplicationContext.java
        test
        java
        TestConfig.java
        nifi-provenance-repo-v1
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        provenance
        reporting
        NodeIdStrategyV1.java
      - nifi-spark-bundle
        nifi-spark-processors
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        pyspark
        core
        ExecutePySpark.java
        utils
        PySparkUtils.java
        util
        InputStreamReaderRunnable.java
        v2
        spark
        ExecuteSparkJob.java
        test
        java
        com
        thinkbiganalytics
        nifi
        v2
        spark
        ExecuteSparkJobTest.java
      - nifi-standard-services
        nifi-core-service-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        core
        api
        cleanup
        CleanupEventConsumer.java
        CleanupEventService.java
        CleanupListener.java
        metadata
        KyloNiFiFlowProvider.java
        MetadataConstants.java
        MetadataProvider.java
        MetadataProviderService.java
        MetadataRecorder.java
        WaterMarkActiveException.java
        precondition
        FeedPreconditionEventService.java
        PreconditionEventConsumer.java
        PreconditionListener.java
        spring
        SpringContextService.java
        nifi-core-service-bundle
        nifi-core-service
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v2
        core
        cleanup
        CleanupJmsConfiguration.java
        JmsCleanupEventConsumer.java
        JmsCleanupEventService.java
        metadata
        KyloProvenanceClientProvider.java
        MetadataClientProvider.java
        MetadataClientRecorder.java
        MetadataProviderSelectorService.java
        precondition
        JmsFeedPreconditionEventService.java
        JmsPreconditionEventConsumer.java
        PreconditionJmsConfiguration.java
        spring
        SpringContextLoaderService.java
        test
        java
        com
        thinkbiganalytics
        controller
        metadata
        MetadataClientProviderTest.java
        MetadataProviderSelectorServiceTest.java
        nifi
        v2
        core
        cleanup
        JmsCleanupEventConsumerTest.java
        JmsCleanupEventServiceTest.java
        nifi-hadoop-service-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        thrift
        api
        AbstractRowVisitor.java
        RowVisitor.java
        v2
        sqoop
        PasswordMode.java
        SqoopConnectionService.java
        thrift
        ThriftService.java
        nifi-hadoop-service-bundle
        nifi-hadoop-service
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v2
        sqoop
        StandardSqoopConnectionService.java
        thrift
        DriverShim.java
        RefreshableDataSource.java
        ThriftConnectionPool.java
    - nifi-provenance-constants
      - src
        main
        java
        com
        thinkbiganalytics
        nifi
        provenance
        KyloProcessorFlowType.java
        NiFiProvenanceConstants.java
    - nifi-provenance-model
      - src
        main
        java
        com
        thinkbiganalytics
        nifi
        provenance
        AggregationEventProcessingStats.java
        model
        BatchFeedProcessorEvents.java
        FeedFlowFile.java
        ProvenanceEventRecordDTO.java
        ProvenanceEventRecordDTOHolder.java
        stats
        AggregatedFeedProcessorStatistics.java
        AggregatedFeedProcessorStatisticsHolder.java
        AggregatedProcessorStatistics.java
        BaseStatistics.java
        GroupedStats.java
        util
        ProvenanceEventRecordDTOComparator.java
        ProvenanceEventUtil.java
    - nifi-rest
      - nifi-flow-visitor-model
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        rest
        model
        flow
        NiFiFlowConnectionConverter.java
        NiFiFlowProcessorConnection.java
        NifiFlowConnection.java
        NifiFlowDeserializer.java
        NifiFlowProcessGroup.java
        NifiFlowProcessor.java
        visitor
        NifiFlowBuilder.java
        NifiFlowVisitor.java
        NifiVisitable.java
        NifiVisitableConnection.java
        NifiVisitableProcessGroup.java
        NifiVisitableProcessor.java
      - nifi-rest-client
        nifi-rest-client-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        feedmgr
        ConfigurationPropertyReplacer.java
        FeedCreationException.java
        FeedRollbackException.java
        InputOutputPort.java
        NifiEnvironmentProperties.java
        ReusableTemplateCreationCallback.java
        TemplateCreationException.java
        TemplateCreationHelper.java
        TemplateInstanceCreator.java
        rest
        client
        AbstractNiFiConnectionsRestClient.java
        AbstractNiFiControllerServicesRestClient.java
        AbstractNiFiProcessGroupsRestClient.java
        AbstractNiFiTemplatesRestClient.java
        DefaultNiFiFlowVisitorClient.java
        LegacyNifiRestClient.java
        NiFiComponentState.java
        NiFiConnectionsRestClient.java
        NiFiControllerServicesRestClient.java
        NiFiFlowVisitorClient.java
        NiFiPortsRestClient.java
        NiFiProcessGroupsRestClient.java
        NiFiProcessorsRestClient.java
        NiFiReportingTaskRestClient.java
        NiFiRestClient.java
        NiFiTemplatesRestClient.java
        NifiRestClientConfig.java
        NifiRestClientExceptionTranslator.java
        layout
        AbstractRenderer.java
        AlignComponentsConfig.java
        AlignNiFiComponents.java
        AlignProcessGroupComponents.java
        ColumnRenderer.java
        LayoutGroup.java
        ProcessGroupAndConnections.java
        SingleRowRenderer.java
        TopBottomRowsRenderer.java
        config
        NifiRestClientAroundAspect.java
        SpringNifiRestConfiguration.java
        visitor
        NifiConnectionOrderVisitor.java
        NifiConnectionOrderVisitorCache.java
        NifiConnectionOrderVisitorCachedItem.java
        test
        java
        com
        thinkbiganalytics
        nifi
        rest
        client
        AbstractNiFiConnectionsRestClientTest.java
        AbstractNiFiControllerServicesRestClientTest.java
        AbstractNiFiProcessGroupsRestClientTest.java
        AbstractNiFiTemplatesRestClientTest.java
        nifi-rest-client-v1
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v1
        rest
        client
        NiFiConnectionsRestClientV1.java
        NiFiControllerServicesRestClientV1.java
        NiFiPortsRestClientV1.java
        NiFiProcessGroupsRestClientV1.java
        NiFiProcessorsRestClientV1.java
        NiFiReportingTaskRestClientV1.java
        NiFiRestClientV1.java
        NiFiTemplatesRestClientV1.java
        config
        SpringNiFiRestConfigurationV1.java
        model
        NiFiPropertyDescriptorTransformV1.java
        test
        java
        com
        thinkbiganalytics
        nifi
        feedmgr
        TemplateCreationHelperTest.java
      - nifi-rest-common-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        rest
        client
        NifiClientRuntimeException.java
        NifiComponentNotFoundException.java
        NifiConnectionException.java
        support
        NifiConstants.java
      - nifi-rest-common-util
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        rest
        support
        NifiConnectionUtil.java
        NifiProcessUtil.java
        NifiTemplateNameUtil.java
        NifiTemplateUtil.java
        test
        java
        com
        thinkbiganalytics
        nifi
        rest
        support
        TestNifiTemplateNameUtil.java
      - nifi-rest-model
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        rest
        model
        NiFiAllowableValue.java
        NiFiClusterSummary.java
        NiFiComponentErrors.java
        NiFiPropertyDescriptor.java
        NiFiPropertyDescriptorTransform.java
        NifiError.java
        NifiProcessGroup.java
        NifiProcessorSchedule.java
        NifiProperty.java
        support
        NifiFeedConstants.java
        NifiProcessorValidationUtil.java
        NifiPropertyUtil.java
        test
        java
        com
        thinkbiganalytics
        nifi
        rest
        model
        visitor
        TestFlowBuilder.java
    - nifi-security
      - nifi-security-api
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        security
        AbstractKerberosProperties.java
        ApplySecurityPolicy.java
        KerberosProperties.java
        KerberosTicketRenewer.java
        SecurityUtil.java
        SpringSecurityContextLoader.java
      - nifi-security-v1
        src
        main
        java
        com
        thinkbiganalytics
        nifi
        v1
        security
        KerberosPropertiesV1.java
        SpringSecurityConfigurationV1.java
  - spark
    - spark-interpreter
      - spark-interpreter-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        interpreter
        App.java
    - spark-job-cleanup
      - spark-job-cleanup-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        cleanup
        Cleanup.java
    - spark-job-dataquality
      - spark-job-dataquality-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        dataquality
        checker
        DataQualityChecker.java
    - spark-job-profiler
      - spark-job-profiler-api
        src
        main
        java
        com
        thinkbiganalytics
        spark
        dataprofiler
        ColumnStatistics.java
        Profiler.java
        ProfilerConfiguration.java
        StatisticsModel.java
        output
        OutputRow.java
      - spark-job-profiler-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        dataprofiler
        core
        Profiler.java
        ProfilerApp.java
        output
        OutputWriter.java
      - spark-job-profiler-core
        src
        main
        java
        com
        thinkbiganalytics
        spark
        dataprofiler
        config
        ProfilerConfig.java
      - spark-job-profiler-model
        src
        main
        java
        com
        thinkbiganalytics
        spark
        dataprofiler
        columns
        BigDecimalColumnStatistics.java
        BooleanColumnStatistics.java
        ByteColumnStatistics.java
        DateColumnStatistics.java
        DoubleColumnStatistics.java
        FloatColumnStatistics.java
        IntegerColumnStatistics.java
        LongColumnStatistics.java
        ShortColumnStatistics.java
        StandardColumnStatistics.java
        StringColumnStatistics.java
        TimestampColumnStatistics.java
        UnsupportedColumnStatistics.java
        model
        MetricType.java
        StandardStatisticsModel.java
        topn
        TopNDataItem.java
        TopNDataList.java
      - spark-job-profiler-tests
        src
        test
        java
        com
        thinkbiganalytics
        spark
        dataprofiler
        core
        ProfilerTest.java
        SpringTestConfigV1.java
        SpringTestConfigV2.java
        testcases
        BigDecimalColumnCase1Test.java
        BooleanColumnCase1Test.java
        ByteColumnCase1Test.java
        CommandLineArgsTestCase.java
        DateColumnCase1Test.java
        DoubleColumnCase1Test.java
        FloatColumnCase1Test.java
        IntegerColumnCase1Test.java
        IntegerColumnCase2Test.java
        LongColumnCase1Test.java
        ShortColumnCase1Test.java
        StringColumnCase1Test.java
        StringColumnCase2Test.java
        StringColumnCase3Test.java
        StringColumnCase4Test.java
        TimestampColumnCase1Test.java
        TimestampColumnCase2Test.java
        TopNCase1Test.java
        TopNCase2Test.java
        TopNCase3Test.java
    - spark-shell-client
      - spark-shell-client-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        SparkShellApp.java
        rest
        SparkShellTransformController.java
        service
        TransformService.java
        test
        java
        com
        thinkbiganalytics
        spark
        rest
        SparkShellTransformControllerTest.java
        service
        TransformServiceTest.java
      - spark-shell-client-v1
        src
        main
        java
        com
        thinkbiganalytics
        spark
        config
        SparkShellConfig16.java
      - spark-shell-client-v2
        src
        main
        java
        com
        thinkbiganalytics
        spark
        config
        SparkShellConfig20.java
    - spark-validate-cleanse
      - spark-validate-cleanse-api
        src
        main
        java
        com
        thinkbiganalytics
        spark
        policy
        FieldPolicyLoader.java
        util
        InvalidFormatException.java
        validation
        HCatDataType.java
        test
        java
        com
        thinkbiganalytics
        spark
        validation
        HCatDataTypeTest.java
      - spark-validate-cleanse-app
        src
        main
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        CleansedRowResult.java
        CommandLineParams.java
        IValidatorStrategy.java
        Param.java
        ParameterConverter.java
        StandardizationAndValidationResult.java
        Validator.java
        functions
        SumPartitionLevelCounts.java
        test
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        ValidatorTest.java
      - spark-validate-cleanse-spark-v1
        src
        main
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        ValidatorStrategyV1.java
        functions
        PartitionLevelCountsV1.java
        test
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        ValidatorV1Test.java
      - spark-validate-cleanse-spark-v2
        src
        main
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        ValidatorStrategyV2.java
        functions
        PartitionLevelCountsV2.java
        test
        java
        com
        thinkbiganalytics
        spark
        datavalidator
        ValidatorV2Test.java
- metadata
- plugins
  - field-policy-default
    - src
      - main
        java
        com
        thinkbiganalytics
        policy
        standardization
        AcceptsEmptyValues.java
        DateTimeStandardizer.java
        DefaultValueStandardizer.java
        LowercaseStandardizer.java
        MaskLeavingLastFourDigitStandardizer.java
        RemoveControlCharsStandardizer.java
        SimpleRegexReplacer.java
        StripNonNumeric.java
        UppercaseStandardizer.java
        validation
        CharacterValidator.java
        CreditCardValidator.java
        DateValidator.java
        EmailValidator.java
        IPAddressValidator.java
        LengthValidator.java
        LookupValidator.java
        NotNullValidator.java
        RangeValidator.java
        RegexValidator.java
        TimestampValidator.java
        USPhoneValidator.java
        USZipCodeValidator.java
        ValidationResult.java
      - test
        java
        com
        thinkbiganalytics
        policy
        standardization
        DateTimeStandardizerTest.java
        DefaultValueStandardizerTest.java
        MaskLeavingLastFourDigitStandardizerTest.java
        RemoveControlCharsStandardizerTest.java
        SimpleRegexReplacerTest.java
        StripNonNumericTest.java
        UppercaseStandardizerTest.java
        validation
        DateValidatorTest.java
        EmailValidatorTest.java
        IPAddressValidatorTest.java
        LengthValidatorTest.java
        LookupValidatorTest.java
        NotNullValidatorTest.java
        RangeValidatorTest.java
        TimestampValidatorTest.java
        USPhoneValidatorTest.java
        USZipCodeValidatorTest.java
  - hadoop-authorization-ranger-default
    - hadoop-authorization-ranger
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        RangerAuthorizationService.java
        config
        RangerConfiguration.java
        RangerConnection.java
        test
        java
        com
        thinkbiganalytics
        datalake
        authorization
        RangerAuthorizationServiceTest.java
    - ranger-rest-client
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        rest
        client
        RangerRestClient.java
        RangerRestClientConfig.java
        RangerRestClientException.java
        model
        RangerCreateOrUpdatePolicy.java
        RangerDeletePolicy.java
        RangerGroup.java
        RangerGroups.java
        RangerPolicies.java
        RangerPolicy.java
  - hadoop-authorization-sentry-default
    - hadoop-authorization-sentry
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        SentryAuthorizationService.java
        config
        SentryConfiguration.java
        SentryConnection.java
    - sentry-client
      - src
        main
        java
        com
        thinkbiganalytics
        datalake
        authorization
        client
        SentryClient.java
        SentryClientConfig.java
        SentryClientException.java
        hdfs
        HDFSUtil.java
        model
        SentryGroup.java
        SentryGroups.java
        SentrySearchPolicy.java
        SentrySearchPolicyMapper.java
  - precondition-default
    - src
      - main
        java
        com
        thinkbiganalytics
        policy
        precondition
        FeedExecutedSinceFeeds.java
        FeedExecutedSinceFeedsOrTime.java
        PreconditionPolicyConstants.java
  - schema-discovery-default
    - src
      - main
        java
        com
        thinkbiganalytics
        discovery
        parsers
        csv
        CSVAutoDetect.java
        CSVFileSchemaParser.java
        hadoop
        AbstractSparkFileSchemaParser.java
        AvroFileSchemaParser.java
        JsonFileSchemaParser.java
        OrcFileSchemaParser.java
        ParquetFileSchemaParser.java
        SparkFileSchemaParserService.java
      - test
        java
        com
        thinkbiganalytics
        discovery
        parsers
        csv
        CSVFileSchemaParserTest.java
        hadoop
        SparkFileSchemaParserServiceTest.java
  - service-monitor-ambari
    - src
      - main
        java
        com
        thinkbiganalytics
        servicemonitor
        check
        AmbariServicesStatusCheck.java
        AmbariSpringConfiguration.java
        rest
        client
        RestCommand.java
        ambari
        AmbariAlertsCommand.java
        AmbariClient.java
        AmbariGetClustersCommand.java
        AmbariJerseyClient.java
        AmbariJerseyRestClientConfig.java
        AmbariServiceCheckRestCommand.java
        AmbariServicesComponentInfoCommand.java
        model
        ambari
        Alert.java
        AlertItem.java
        AlertSummary.java
        Cluster.java
        ClusterItem.java
        ClusterList.java
        HostComponent.java
        HostRoles.java
        ServiceComponentInfo.java
        ServiceComponentInfoItem.java
        ServiceComponentInfoSummary.java
  - service-monitor-cloudera
    - service-monitor-cloudera-service
      - src
        main
        java
        com
        thinkbiganalytics
        servicemonitor
        ClouderaSpringConfiguration.java
        check
        ClouderaServicesStatusCheck.java
        rest
        client
        RestClientConfig.java
        cdh
        ClouderaClient.java
        ClouderaClientConfig.java
        ClouderaRootResource.java
        ClouderaRootResourceManager.java
        DefaultClouderaRootResource.java
  - service-monitor-kylo-cluster
    - src
      - main
        java
        com
        thinkbiganalytics
        cluster
        ClusterServiceStatusCheck.java
        ClusterServiceStatusCheckConfiguration.java
  - service-monitor-nifi
    - src
      - main
        java
        com
        thinkbiganalytics
        servicemonitor
        nifi
        NifiServiceStatusCheck.java
        config
        NifiServiceCheckSpringConfiguration.java
  - service-monitor-pipeline-db
    - src
      - main
        java
        com
        thinkbiganalytics
        servicemonitor
        check
        PipelineDatabaseServiceStatusCheck.java
        db
        PipelineDbSpringConfiguration.java
        dao
        DatabaseServiceCheckDao.java
  - sla-email
    - src
      - main
        java
        com
        thinkbiganalytics
        metadata
        sla
        EmailConfiguration.java
        EmailServiceLevelAgreementAction.java
        EmailServiceLevelAgreementActionConfiguration.java
        SlaEmailService.java
        config
        DeveloperEmailConfiguration.java
        EmailServiceLevelAgreementSpringConfiguration.java
      - test
        java
        com
        thinkbiganalytics
        metadata
        sla
        TestConfiguration.java
        TestEmail.java
  - sla-jira
    - src
      - main
        java
        com
        thinkbiganalytics
        metadata
        sla
        JiraServiceLevelAgreementAction.java
        JiraServiceLevelAgreementActionConfiguration.java
        config
        DeveloperJiraConfiguration.java
        JiraSpringConfiguration.java
      - test
        java
        com
        thinkbiganalytics
        metadata
        sla
        TestJira.java
  - sla-metrics-default
    - src
      - main
        java
        com
        thinkbiganalytics
        metadata
        sla
        api
        core
        FeedFailedMetric.java
        FeedFailureMetricAssessor.java
        FeedFailureService.java
        FeedOnTimeArrivalMetric.java
        FeedOnTimeArrivalMetricAssessor.java
        config
        DefaultServiceLevelAgreementConfiguration.java
      - test
        java
        com
        thinkbiganalytics
        metadata
        sla
        spi
        core
        FeedOnTimeArrivalMetricAssessorTest.java
- samples
  - plugins
    - example-auth-custom
      - src
        main
        java
        com
        example
        kylo
        plugin
        ExampleLoginConfig.java
        ExampleLoginModule.java
        test
        java
        com
        example
        kylo
        plugin
        AppTest.java
- security
  - oauth-server
    - src
      - main
        java
        com
        thinkbiganalytics
        oauth
        DataLakeOauthServerApplication.java
  - security-api
    - src
      - main
        java
        com
        thinkbiganalytics
        security
        AccessController.java
        BasePrincipal.java
        GroupPrincipal.java
        RolePrincipal.java
        ServiceGroupPrincipal.java
        UsernamePrincipal.java
        action
        Action.java
        AllowableAction.java
        AllowedActions.java
        AllowedEntityActionsProvider.java
        ImmutableAction.java
        config
        ActionBuilder.java
        ActionsModuleBuilder.java
        ActionsTreeBuilder.java
        role
        ImmutableAllowableAction.java
        ImmutableAllowedActions.java
        ImmutableSecurityRole.java
        SecurityRole.java
        SecurityRoleProvider.java
  - security-auth
    - src
      - main
        java
        com
        thinkbiganalytics
        auth
        DefaultPrincipalAuthorityGranter.java
        GroupPrincipalAuthorityGranter.java
        ServiceAuthenticationToken.java
        UserPrincipalAuthorityGranter.java
        UsernameAuthenticationToken.java
        concurrent
        ServiceSecurityContextRunnable.java
        config
        JwtProperties.java
        SecurityConfig.java
        jaas
        AbstractLoginModule.java
        LoginConfiguration.java
        LoginConfigurationBuilder.java
        UsernameJaasAuthenticationProvider.java
        config
        DefaultLoginConfigurationBuilder.java
        JaasAuthConfig.java
        jwt
        JwtRememberMeServices.java
      - test
        java
        com
        thinkbiganalytics
        auth
        jwt
        JwtRememberMeServicesTest.java
  - security-auth-file
    - src
      - main
        java
        com
        thinkbiganalytics
        auth
        file
        FileAuthConfig.java
  - security-auth-kerberos
    - src
      - main
        java
        com
        thinkbiganalytics
        security
        auth
        kerberos
        KerberosLoginConfiguration.java
        KerberosSpnegoConfiguration.java
        SpnegoValidationUserAuthenticationFilter.java
  - security-auth-kylo-local
    - src
      - main
        java
        com
        thinkbiganalytics
        auth
        kylo
        KyloAuthConfig.java
        KyloLoginModule.java
  - security-auth-kylo-rest
    - src
      - main
        java
        com
        thinkbiganalytics
        auth
        rest
        KyloRestAuthConfig.java
        KyloRestLoginModule.java
        LoginJerseyClientConfig.java
      - test
        java
        com
        thinkbiganalytics
        auth
        rest
        KyloRestLoginModuleTest.java
  - security-auth-ldap
    - src
      - main
        java
        com
        thinkbiganalytics
        security
        auth
        ad
        ActiveDirectoryAuthConfig.java
        ActiveDirectoryLoginModule.java
        ldap
        LdapAuthConfig.java
        LdapLoginModule.java
        org
        springframework
        security
        ldap
        authentication
        ad
        DelegatingActiveDirectoryLdapAuthenticationProvider.java
      - test
        java
        com
        thinkbiganalytics
        security
        auth
        ad
        ActiveDirectoryLoginModuleTest.java
        ActiveDirectoryLoginModuleTestConfig.java
        ldap
        LdapLoginModuleTest.java
        LdapLoginModuleTestConfig.java
  - security-auth-simple
    - src
      - main
        java
        com
        thinkbiganalytics
        auth
        AuthServiceAuthenticationProvider.java
        AuthServiceLoginModule.java
        AuthenticationService.java
        SimpleAuthConfig.java
        SimpleAuthenticationService.java
- services
  - alerts-service
    - alerts-controller
      - src
        main
        java
        com
        thinkbiganalytics
        alerts
        rest
        controller
        AlertsController.java
    - alerts-model
      - src
        main
        java
        com
        thinkbiganalytics
        alerts
        rest
        model
        Alert.java
        AlertChangeEvent.java
        AlertCreateRequest.java
        AlertRange.java
        AlertUpdateRequest.java
  - audit-logging-service
    - audit-logging-api
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        api
        audit
        AuditLogEntry.java
        AuditLogProvider.java
    - audit-logging-controller
      - src
        main
        java
        com
        thinkbiganalytics
        audit
        rest
        controller
        AuditLogController.java
    - audit-logging-core
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        audit
        core
        AuditLoggingService.java
        AuditLoggingServiceConfig.java
    - audit-logging-jpa
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        jpa
        audit
        AuditLogProviderConfig.java
        AuditLogRepository.java
        JpaAuditLogEntry.java
        JpaAuditLogProvider.java
        test
        java
        com
        thinkbiganalytics
        metadata
        jpa
        audit
        JpaAuditLogProviderTest.java
    - audit-logging-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        audit
        rest
        model
        AuditLogEntry.java
  - feed-manager-service
    - feed-manager-api
      - src
        main
        java
        com
        thinkbiganalytics
        feedmgr
        InvalidOperationException.java
        security
        FeedServicesAccessControl.java
    - feed-manager-controller
      - src
        main
        java
        com
        thinkbiganalytics
        db
        PoolingDataSourceService.java
        es
        ElasticSearch.java
        ElasticSearchClientConfig.java
        IndexMappingDTO.java
        SearchResult.java
        TypeMappingDTO.java
        feedmgr
        config
        FeedManagerConfiguration.java
        FeedManagerSecurityConfiguration.java
        nifi
        CleanupStaleFeedRevisions.java
        CreateFeedBuilder.java
        DBCPConnectionPoolTableInfo.java
        NifiConnectionListener.java
        NifiConnectionService.java
        NifiControllerServiceProperties.java
        NifiTemplateParser.java
        PropertyExpressionResolver.java
        SpringCloudContextEnvironmentChangedListener.java
        SpringEnvironmentProperties.java
        cache
        NifiFlowCache.java
        NifiFlowCacheClusterManager.java
        NifiFlowCacheClusterNifiFlowProcessor.java
        NifiFlowCacheClusterUpdateMessage.java
        NifiFlowCacheFeedUpdate.java
        NifiFlowCacheSimpleFeedUpdate.java
        NifiFlowCacheSimpleProcessorDTO.java
        rest
        FeedLineageBuilder.java
        Model.java
        beanvalidation
        NewFeedCategory.java
        controller
        AdminController.java
        AdminControllerV2.java
        DatasourceController.java
        ElasticSearchRestController.java
        FeedCategoryRestController.java
        FeedMetadataPropertiesRestController.java
        FeedRestController.java
        FeedsController.java
        HadoopAuthorizationController.java
        NifiIntegrationRestController.java
        NifiProvenanceRestController.java
        ServiceLevelAgreementRestController.java
        TemplatesRestController.java
        UtilityRestController.java
        service
        AccessControlledEntityTransform.java
        DefaultJobService.java
        EncryptionService.java
        FeedCleanupFailedException.java
        FeedCleanupTimeoutException.java
        FeedManagerMetadataService.java
        FileObjectPersistence.java
        MetadataService.java
        UIService.java
        UploadProgressService.java
        UserPropertyTransform.java
        category
        CategoryModelTransform.java
        DefaultFeedManagerCategoryService.java
        FeedManagerCategoryService.java
        InMemoryFeedManagerCategoryService.java
        datasource
        DatasourceConstants.java
        DatasourceModelTransform.java
        DatasourceService.java
        feed
        DefaultFeedManagerFeedService.java
        DuplicateFeedNameException.java
        ExportImportFeedService.java
        FeedManagerFeedService.java
        FeedManagerPreconditionService.java
        FeedModelTransform.java
        ImportFeedException.java
        InMemoryFeedManagerFeedService.java
        datasource
        DerivedDatasourceFactory.java
        security
        DefaultSecurityService.java
        SecurityService.java
        template
        AbstractFeedManagerTemplateService.java
        DefaultFeedManagerTemplateService.java
        ExportImportTemplateService.java
        FeedManagerTemplateService.java
        InMemoryFeedManagerTemplateService.java
        RegisteredTemplateService.java
        RegisteredTemplateUtil.java
        TemplateModelTransform.java
        sla
        ServiceLevelAgreementActionConfigTransformer.java
        ServiceLevelAgreementActionUiConfigurationItem.java
        ServiceLevelAgreementGroup.java
        ServiceLevelAgreementMetricTransformer.java
        ServiceLevelAgreementMetricTransformerHelper.java
        ServiceLevelAgreementModelTransform.java
        ServiceLevelAgreementRule.java
        ServiceLevelAgreementService.java
        ServiceLevelAgreementTransformer.java
        support
        ZipFileUtil.java
        util
        ImportUtil.java
        test
        java
        com
        thinkbiganalytics
        feedmgr
        config
        TestSpringConfiguration.java
        nifi
        PropertyExpressionResolverConfig.java
        PropertyExpressionResolverTest.java
        service
        UserPropertyTransformTest.java
        sla
        TestServiceLevelAgreementActionConfigTransform.java
        TestServiceLevelAgreementMetricPolicyTransform.java
    - feed-manager-core
      - src
        main
        java
        com
        thinkbiganalytics
        feedmgr
        MetadataFieldAnnotationFieldNameResolver.java
        MetadataFields.java
        metadata
        core
        feed
        FeedPreconditionService.java
    - feed-manager-precondition-policy
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        precondition
        AvailablePolicies.java
        PreconditionPolicyRuleCache.java
        transform
        PreconditionAnnotationTransformer.java
        PreconditionPolicyTransformer.java
        PreconditionTransformer.java
        test
        java
        com
        thinkbiganalytics
        policy
        precondition
        TestPreconditionPolicyTransform.java
    - feed-manager-precondition-policy-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        rest
        model
        PreconditionRule.java
        PreconditionRuleBuilder.java
    - feed-manager-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        feedmgr
        rest
        ImportComponent.java
        ImportSection.java
        ImportType.java
        model
        EditFeedEntity.java
        EntityAccessRoleMembership.java
        FeedCategory.java
        FeedCategoryBuilder.java
        FeedDataTransformation.java
        FeedMetadata.java
        FeedSchedule.java
        FeedSummary.java
        HadoopSecurityGroup.java
        IconColor.java
        ImportComponentOption.java
        ImportFeedOptions.java
        ImportFeedProperty.java
        ImportOptions.java
        ImportProperty.java
        ImportTemplateOptions.java
        NiFiTemplateFlowRequest.java
        NiFiTemplateFlowResponse.java
        NifiFeed.java
        RegisteredTemplate.java
        RegisteredTemplateRequest.java
        ReusableTemplateConnectionInfo.java
        Tag.java
        TemplateDtoWrapper.java
        TemplateOrder.java
        TemplateProcessorDatasourceDefinition.java
        UIFeed.java
        UploadProgress.java
        UploadProgressMessage.java
        UserField.java
        UserFieldCollection.java
        UserProperty.java
        VisualQuery.java
        json
        UserPropertyDeserializer.java
        schema
        EditFeedAction.java
        FeedProcessingOptions.java
        PartitionField.java
        TableOptions.java
        TableSetup.java
        support
        SystemNamingService.java
        test
        java
        com
        thinkbiganalytics
        feedmgr
        rest
        model
        schema
        TableSetupTest.java
        support
        SystemNamingServiceTest.java
  - field-policy-service
    - field-policy-controller
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        FieldPolicyCache.java
        rest
        controller
        FieldPolicyRestController.java
    - field-policy-core
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        AvailablePolicies.java
        FieldPoliciesJsonTransformer.java
        FieldPolicy.java
        FieldPolicyBuilder.java
        FieldPolicyTransformer.java
        FieldPolicyTransformerListener.java
        standardization
        transform
        StandardizationAnnotationTransformer.java
        StandardizationTransformer.java
        validation
        transform
        ValidationTransformer.java
        ValidatorAnnotationTransformer.java
        test
        java
        com
        thinkbiganalytics
        policy
        AvailablePoliciesTest.java
        TestJsonPolicies.java
        standardization
        TestStandardizationTransform.java
        validation
        TestValidationTransformation.java
        ValidatorTests.java
    - field-policy-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        policy
        rest
        model
        FieldPolicy.java
        FieldPolicyBuilder.java
        FieldStandardizationRule.java
        FieldStandardizationRuleBuilder.java
        FieldValidationRule.java
        FieldValidationRuleBuilder.java
  - jms-service
    - activemq-core
      - src
        main
        java
        com
        thinkbiganalytics
        activemq
        ObjectMapperSerializer.java
        SendJmsMessage.java
        config
        ActiveMqConfig.java
        ActiveMqConstants.java
  - job-repository-service
    - job-repository-controller
      - src
        main
        java
        com
        thinkbiganalytics
        jobrepo
        rest
        controller
        DataConfidenceRestController.java
        FeedsRestController.java
        JobsRestController.java
        NifiFeedProcessorStatisticsRestController.java
        OperationsSecurityConfiguration.java
    - job-repository-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        jobrepo
        repository
        rest
        model
        JobAction.java
  - metadata-service
    - metadata-jms
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        event
        jms
        MetadataJmsConfig.java
        MetadataQueues.java
        MetadataTopics.java
    - metadata-rest-client-spring
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        rest
        client
        DatasourceBuilder.java
        DirectoryDatasourceBuilder.java
        FeedBuilder.java
        HiveTableDatasourceBuilder.java
        MetadataClient.java
        WebResponseException.java
        test
        java
        com
        thinkbiganalytics
        metadata
        rest
        client
        MetadataClientTest.java
        ServiceLevelAgreementClientTest.java
    - metadata-rest-controller
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        event
        jms
        JmsChangeEventDispatcher.java
        rest
        ExtensiblesModel.java
        MetadataModelTransform.java
        MetadataServiceConfiguration.java
        api
        DateTimeConverterProvider.java
        DebugController.java
        ExtensionsController.java
        server
        ServerConfiguration.java
        ServerConfigurationInitialization.java
    - metadata-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        rest
        model
        Propertied.java
        Taggable.java
        data
        Datasource.java
        DatasourceCriteria.java
        DatasourceDefinition.java
        DatasourceDefinitions.java
        DerivedDatasource.java
        DirectoryDatasource.java
        FilePattern.java
        HiveTableColumn.java
        HiveTableDatasource.java
        HiveTablePartition.java
        JdbcDatasource.java
        UserDatasource.java
        event
        DatasourceChangeEvent.java
        FeedCleanupTriggerEvent.java
        FeedPreconditionTriggerEvent.java
        extension
        ExtensibleTypeDescriptor.java
        FieldDescriptor.java
        feed
        Feed.java
        FeedCategory.java
        FeedCriteria.java
        FeedDependencyGraph.java
        FeedDestination.java
        FeedLineage.java
        FeedLineageStyle.java
        FeedPrecondition.java
        FeedSource.java
        FieldCleansor.java
        FieldPolicy.java
        FieldValidator.java
        InitializationStatus.java
        transform
        FieldCleansor.java
        FieldPolicy.java
        FieldValidator.java
        FieldsPolicy.java
        nifi
        NiFiFlowCacheConnectionData.java
        NiFiFlowCacheSync.java
        NifiFlowCacheSnapshot.java
        op
        ChangeSet.java
        DataOperation.java
        Dataset.java
        FeedOperation.java
        FileList.java
        HiveTablePartitions.java
        sla
        FeedServiceLevelAgreement.java
    - metadata-service-api
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        datasource
        Datasource.java
        JdbcDatasource.java
        UserDatasource.java
  - operational-metadata-service
    - operational-metadata-integration-service
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        config
        OperationlMetadataServiceSpringConfiguration.java
        jobrepo
        nifi
        provenance
        NifiBulletinExceptionExtractor.java
        NifiStatsJmsReceiver.java
        ProvenanceEventReceiver.java
        sla
        DefaultServiceLevelAgreementScheduler.java
        JpaJcrServiceLevelAgreementChecker.java
        ScheduledServiceLevelAgreementClusterMessage.java
        ServiceLevelAgreementActionAlertResponderFactory.java
        SlaQuartzJobBean.java
    - operational-metadata-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        rest
        feed
        OpsManagerFeed.java
        jobrepo
        nifi
        NifiFeedProcessorStats.java
        NifiFeedProcessorStatsTransform.java
    - operational-metadata-upgrade-service
      - src
        main
        java
        com
        thinkbiganalytics
        metadata
        upgrade
        KyloUpgrader.java
        UpgradeException.java
        UpgradeKyloConfig.java
        UpgradeKyloService.java
        UpgradeState.java
        version_0_7_1
        UpgradeAction.java
  - scheduler-service
    - scheduler-api
      - src
        main
        java
        com
        thinkbiganalytics
        scheduler
        JobIdentifier.java
        JobInfo.java
        JobScheduler.java
        JobSchedulerEvent.java
        JobSchedulerException.java
        JobSchedulerListener.java
        ScheduleIdentifier.java
        ScheduledJob.java
        TriggerIdentifier.java
        TriggerInfo.java
    - scheduler-controller
      - src
        main
        java
        com
        thinkbiganalytics
        scheduler
        rest
        Model.java
        controller
        SchedulerRestController.java
    - scheduler-core
      - src
        main
        java
        com
        thinkbiganalytics
        scheduler
        model
        DefaultJobIdentifier.java
        DefaultJobInfo.java
        DefaultScheduleIdentifier.java
        DefaultTriggerIdentifier.java
        DefaultTriggerInfo.java
        support
        IdentifierUtil.java
        ScheduledJobState.java
        test
        java
        com
        thinkbiganalytics
        scheduler
        JobInfoImplTest.java
        JobSchedulerExceptionTest.java
        ScheduleIdentifierTest.java
        SchedulerObjectSerializatoinTest.java
        TriggerInfoImplTest.java
        support
        IdentifierUtilTest.java
        JavaBeanTester.java
    - scheduler-quartz
      - src
        main
        java
        com
        thinkbiganalytics
        scheduler
        AutowiringSpringBeanJobFactory.java
        CustomQuartzSchedulerBean.java
        QuartzClusterMessage.java
        QuartzClusterMessageReceiver.java
        QuartzClusterMessageSender.java
        QuartzScheduledJob.java
        QuartzScheduler.java
        QuartzSchedulerClusterListener.java
        QuartzSpringConfiguration.java
        SimpleSchedulerQuartzJobBeanSetup.java
        SimpleSchedulerSetup.java
        test
        java
        com
        thinkbiganalytics
        scheduler
        AutowiringSpringBeanJobFactoryTest.java
        QuartzSchedulerTest.java
        quartz
        CustomQuartzSchedulerBeanTest.java
        MockJob.java
        QuartzSpringConfigurationTest.java
        QuartzTestConfiguration.java
        SimpleSchedulerQuartzJobBeanSetupTest.java
        SimpleSchedulerSetupTest.java
    - scheduler-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        scheduler
        rest
        model
        JobInfo.java
        ScheduleIdentifier.java
        ScheduledJob.java
        TriggerInfo.java
  - schema-discovery-service
    - schema-discovery-controller
      - src
        main
        java
        com
        thinkbiganalytics
        discovery
        FileParserFactory.java
        rest
        controller
        SchemaDiscoveryRestController.java
        SchemaParserAnnotationTransformer.java
        test
        java
        com
        thinkbiganalytics
        discovery
        rest
        controller
        MockSchemaParser1.java
        MockSchemaParser2.java
        SchemaDiscoveryRestControllerTest.java
    - schema-discovery-model
      - src
        main
        java
        com
        thinkbiganalytics
        discovery
        model
        AbstractSchema.java
        DefaultDataTypeDescriptor.java
        DefaultDatabaseMetadata.java
        DefaultField.java
        DefaultFileSchema.java
        DefaultHiveSchema.java
        DefaultQueryResult.java
        DefaultQueryResultColumn.java
        DefaultTableSchema.java
        SchemaParserDescriptor.java
        test
        java
        com
        thinkbiganalytics
        discovery
        model
        DefaultFieldTest.java
  - security-service
    - security-controller
      - src
        main
        java
        com
        thinkbiganalytics
        security
        rest
        controller
        AccessControlConfig.java
        AccessControlController.java
        GroupsController.java
        RolesController.java
        SecurityModelTransform.java
        UsersController.java
        service
        role
        DefaultSecurityRoleService.java
        SecurityRoleService.java
        user
        UserConfig.java
        UserMetadataService.java
        UserModelTransform.java
        UserService.java
        UsersGroupsAccessContol.java
        UsersGroupsSecurityConfiguration.java
    - security-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        security
        rest
        model
        Action.java
        ActionGroup.java
        EntityAccessControl.java
        GroupPrincipal.java
        PermissionsChange.java
        Role.java
        RoleMembership.java
        RoleMembershipChange.java
        UserPrincipal.java
  - service-app
    - src
      - main
        java
        com
        thinkbiganalytics
        config
        rest
        controller
        ConfigurationController.java
        kerberos
        KerberosConfiguration.java
        liquibase
        LiquibaseConfiguration.java
        rest
        JerseyConfig.java
        SpringJerseyConfiguration.java
        controller
        AboutKyloController.java
        exception
        AccessControlExceptionMapper.java
        BaseExceptionMapper.java
        IllegalArgumentExceptionMapper.java
        ImportFeedExceptionMapper.java
        ThrowableMapper.java
        UnsupportedOperationExceptionMapper.java
        ValidationExceptionMapper.java
        WebApplicationExceptionMapper.java
        nifi
        FeedCreationExceptionMapper.java
        FeedRollbackExceptionMapper.java
        NifiClientRuntimeExceptionMapper.java
        NifiComponentNotFoundExceptionMapper.java
        NifiConnectionExceptionMapper.java
        TemplateCreationExceptionMapper.java
        server
        DatabaseConfiguration.java
        DefaultWebSecurityConfigurer.java
        KerberosWebSecurityConfigurer.java
        KyloServerApplication.java
        KyloUpgradeDatabaseVersionChecker.java
        KyloUpgradeDatabaseVersionConfig.java
        service
        ClusterServiceStartupListener.java
        DefaultServicesApplicationStartup.java
        ServicesAppConfiguration.java
      - test
        java
        com
        thinkbiganalytics
        integration
        IntegrationTestBase.java
        IntegrationTestConfig.java
        KyloConfig.java
        SendJmsMessageIT.java
        SshConfig.java
        UserContext.java
        access
        EntityLevelAccessIT.java
        feed
        FeedIT.java
        servicemonitor
        ServiceMonitorRestControllerIT.java
        nifi
        rest
        NifiRestTest.java
        NifiRestTest2.java
  - service-app-api
    - src
      - main
        java
        com
        thinkbiganalytics
        app
        ServicesApplicationStartup.java
        ServicesApplicationStartupListener.java
  - service-monitor-service
    - service-monitor-controller
      - src
        main
        java
        com
        thinkbiganalytics
        servicemonitor
        DefaultServiceMonitorRepository.java
        ServiceMonitorManager.java
        ServiceMonitorRepository.java
        rest
        controller
        ServiceMonitorRestController.java
  - spark-shell-service
    - spark-shell-api
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        shell
        SparkShellProcess.java
        SparkShellProcessManager.java
        SparkShellRestClient.java
    - spark-shell-controller
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        rest
        controller
        SparkShellProxyController.java
    - spark-shell-core
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        conf
        SparkShellConfiguration.java
        model
        KerberosSparkProperties.java
        SparkShellProperties.java
        SparkShellServerProperties.java
        shell
        JerseySparkShellRestClient.java
        ServerProcessManager.java
    - spark-shell-rest-model
      - src
        main
        java
        com
        thinkbiganalytics
        spark
        rest
        model
        Datasource.java
        JdbcDatasource.java
        RegistrationRequest.java
        TransformRequest.java
        TransformResponse.java
        UserDatasource.java
  - thrift-proxy-service
    - thrift-proxy-controller
      - src
        main
        java
        com
        thinkbiganalytics
        hive
        rest
        controller
        HiveRestController.java
    - thrift-proxy-core
      - src
        main
        java
        com
        thinkbiganalytics
        hive
        config
        HiveDataSourceConfiguration.java
        service
        HiveMetastoreService.java
        HiveService.java
        RefreshableDataSource.java
- ui
  - swagger-ui
    - src
      - main
        java
        com
        thinkbiganalytics
        swagger
        config
        SwaggerResourceConfiguration.java
  - ui-app
    - src
      - main
        java
        com
        thinkbiganalytics
        KyloUiApplication.java
        ui
        AngularParams.java
        FeedManagerWebMvcConfigurerAdapter.java
        OpsManagerWebMvcConfigurerAdapter.java
        WebMvcConfig.java
        config
        DefaultWebSecurityConfigurer.java
        KerberosWebSecurityConfigurer.java

package com.thinkbiganalytics.nifi.pyspark.core;

/*-
 * #%L
 * thinkbig-nifi-spark-processors
 * %%
 * Copyright (C) 2017 ThinkBig Analytics
 * %%
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 * 
 *     http://www.apache.org/licenses/LICENSE-2.0
 * 
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 * #L%
 */

import com.thinkbiganalytics.nifi.processor.AbstractNiFiProcessor;
import com.thinkbiganalytics.nifi.pyspark.utils.PySparkUtils;
import com.thinkbiganalytics.nifi.security.ApplySecurityPolicy;
import com.thinkbiganalytics.nifi.security.KerberosProperties;
import com.thinkbiganalytics.nifi.security.SecurityUtil;
import com.thinkbiganalytics.nifi.security.SpringSecurityContextLoader;
import com.thinkbiganalytics.nifi.util.InputStreamReaderRunnable;

import org.apache.commons.lang3.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.nifi.annotation.behavior.EventDriven;
import org.apache.nifi.annotation.documentation.CapabilityDescription;
import org.apache.nifi.annotation.documentation.Tags;
import org.apache.nifi.components.PropertyDescriptor;
import org.apache.nifi.components.ValidationContext;
import org.apache.nifi.components.ValidationResult;
import org.apache.nifi.components.Validator;
import org.apache.nifi.flowfile.FlowFile;
import org.apache.nifi.flowfile.attributes.CoreAttributes;
import org.apache.nifi.logging.ComponentLog;
import org.apache.nifi.logging.LogLevel;
import org.apache.nifi.processor.ProcessContext;
import org.apache.nifi.processor.ProcessSession;
import org.apache.nifi.processor.ProcessorInitializationContext;
import org.apache.nifi.processor.Relationship;
import org.apache.nifi.processor.exception.ProcessException;
import org.apache.nifi.processor.util.StandardValidators;
import org.apache.spark.launcher.SparkLauncher;

import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collection;
import java.util.Collections;
import java.util.HashSet;
import java.util.List;
import java.util.Set;

import javax.annotation.Nonnull;

/**
 * A NiFi processor to execute a PySpark job
 */
@EventDriven
@Tags({"spark", "thinkbig", "pyspark"})
@CapabilityDescription("Execute a PySpark job.")
public class ExecutePySpark extends AbstractNiFiProcessor {

    /* Processor properties */
    public static final PropertyDescriptor HADOOP_CONFIGURATION_RESOURCES = new PropertyDescriptor.Builder()
        .name("Hadoop Configuration Resources")
        .description("A file or comma separated list of files which contains the Hadoop file system configuration. Without this, Hadoop "
                     + "will search the classpath for a 'core-site.xml' and 'hdfs-site.xml' file or will revert to a default configuration. "
                     + "NOTE: This value is also required for a Kerberized cluster.")
        .required(false)
        .addValidator(multipleFilesExistValidator())
        .build();
    public static final PropertyDescriptor PYSPARK_APP_FILE = new PropertyDescriptor.Builder()
        .name("PySpark App File")
        .description("Full path for PySpark application file (having Python code to be executed)")
        .required(true)
        .addValidator(new StandardValidators.FileExistsValidator(true))
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor PYSPARK_APP_ARGS = new PropertyDescriptor.Builder()
        .name("PySpark App Args")
        .description("Comma separated arguments to be passed to the PySpark application. "
                     + "NOTE: Ensure that no spaces are present between the comma separated arguments.")
        .required(false)
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor PYSPARK_APP_NAME = new PropertyDescriptor.Builder()
        .name("PySpark App Name")
        .description("A name for the PySpark application")
        .required(true)
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .defaultValue("PySpark-App")
        .build();
    public static final PropertyDescriptor PYSPARK_ADDITIONAL_FILES = new PropertyDescriptor.Builder()
        .name("Additional Python files/zips/eggs")
        .description("(Comma separated) Full path for additional Python files/zips/eggs to be submitted with the application. "
                     + "NOTE: Ensure that no spaces are present between the comma separated file locations.")
        .required(false)
        .addValidator(multipleFilesExistValidator())
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor SPARK_MASTER = new PropertyDescriptor.Builder()
        .name("Spark Master")
        .description("The Spark master. NOTE: Please ensure that you have not set this in your application.")
        .required(true)
        .defaultValue("local")
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor SPARK_YARN_DEPLOY_MODE = new PropertyDescriptor.Builder()
        .name("Spark YARN Deploy Mode")
        .description("The deploy mode for YARN master (client, cluster). Only applicable for yarn mode. "
                     + "NOTE: Please ensure that you have not set this in your application.")
        .required(false)
        .defaultValue("client")
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor YARN_QUEUE = new PropertyDescriptor.Builder()
        .name("YARN Queue")
        .description("The name of the YARN queue to which the job is submitted. Only applicable for yarn mode.")
        .required(false)
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor SPARK_HOME = new PropertyDescriptor.Builder()
        .name("Spark Home")
        .description("Spark installation location")
        .required(true)
        .defaultValue("/usr/hdp/current/spark-client/")
        .addValidator(new StandardValidators.DirectoryExistsValidator(true, false))
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor DRIVER_MEMORY = new PropertyDescriptor.Builder()
        .name("Driver Memory")
        .description("Amount of memory (RAM) to allocate to the driver (e.g. 512m, 2g).  Consider cluster capacity when setting value.")
        .required(true)
        .defaultValue("512m")
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor EXECUTOR_MEMORY = new PropertyDescriptor.Builder()
        .name("Executor Memory")
        .description("Amount of memory (RAM) to allocate to an executor (e.g. 512m, 2g).  Consider cluster capacity when setting value.")
        .required(true)
        .defaultValue("512m")
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor EXECUTOR_INSTANCES = new PropertyDescriptor.Builder()
        .name("Executor Instances")
        .description("The number of executors to use for job execution. Consider cluster capacity when setting value.")
        .required(true)
        .defaultValue("1")
        .addValidator(StandardValidators.createLongValidator(1L, 1000L, true))
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor EXECUTOR_CORES = new PropertyDescriptor.Builder()
        .name("Executor Cores")
        .description("The number of CPU cores to be used on each executor. Consider cluster capacity when setting value.")
        .required(true)
        .defaultValue("1")
        .addValidator(StandardValidators.createLongValidator(1L, 100L, true))
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor NETWORK_TIMEOUT = new PropertyDescriptor.Builder()
        .name("Network Timeout")
        .description("Default timeout for all network interactions. "
                     + "This config will be used in place of spark.core.connection.ack.wait.timeout, "
                     + "spark.akka.timeout, spark.storage.blockManagerSlaveTimeoutMs, "
                     + "spark.shuffle.io.connectionTimeout, spark.rpc.askTimeout "
                     + "or spark.rpc.lookupTimeout if they are not configured.")
        .required(true)
        .defaultValue("120s")
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    public static final PropertyDescriptor ADDITIONAL_SPARK_CONFIG_OPTIONS = new PropertyDescriptor.Builder()
        .name("Additional Spark Configuration")
        .description("Additional configuration options to pass to the Spark job. "
                     + "These would be key=value pairs separated by comma. "
                     + "Note that the configuration option would start with 'spark.' "
                     + "e.g. spark.ui.port=4040 "
                     + "NOTE: Ensure that no spaces are present between the comma-separated key=value pairs.")
        .required(false)
        .addValidator(StandardValidators.NON_EMPTY_VALIDATOR)
        .expressionLanguageSupported(true)
        .build();
    /* Processor relationships */
    public static final Relationship REL_SUCCESS = new Relationship.Builder()
        .name("success")
        .description("PySpark job execution success")
        .build();
    public static final Relationship REL_FAILURE = new Relationship.Builder()
        .name("failure")
        .description("PySpark job execution failure")
        .build();
    /* Spark configuration */
    private static final String CONFIG_PROP_SPARK_YARN_KEYTAB = "spark.yarn.keytab";
    private static final String CONFIG_PROP_SPARK_YARN_PRINCIPAL = "spark.yarn.principal";
    private static final String CONFIG_PROP_SPARK_NETWORK_TIMEOUT = "spark.network.timeout";
    private static final String CONFIG_PROP_SPARK_YARN_QUEUE = "spark.yarn.queue";
    private static final String CONFIG_PROP_SPARK_EXECUTOR_INSTANCES = "spark.executor.instances";
    /* Properties for Kerberos service keytab and principal */
    private PropertyDescriptor KERBEROS_KEYTAB;
    private PropertyDescriptor KERBEROS_PRINCIPAL;

    private List<PropertyDescriptor> properties;
    private Set<Relationship> relationships;

    /* Validates that one or more files exist, as specified in a single property (comma-separated values) */
    public static Validator multipleFilesExistValidator() {
        return new Validator() {
            @Override
            public ValidationResult validate(String subject, String input, ValidationContext context) {
                try {
                    final String[] files = input.split(",");

                    for (String filename : files) {
                        try {
                            final File file = new File(filename.trim());
                            if (!file.exists()) {
                                final String message = "file " + filename + " does not exist.";
                                return new ValidationResult.Builder()
                                    .subject(this.getClass().getSimpleName())
                                    .input(input)
                                    .valid(false)
                                    .explanation(message)
                                    .build();
                            } else if (!file.isFile()) {
                                final String message = filename + " is not a file.";
                                return new ValidationResult.Builder()
                                    .subject(this.getClass().getSimpleName())
                                    .input(input)
                                    .valid(false)
                                    .explanation(message)
                                    .build();
                            } else if (!file.canRead()) {
                                final String message = "could not read " + filename;
                                return new ValidationResult.Builder()
                                    .subject(this.getClass().getSimpleName())
                                    .input(input)
                                    .valid(false)
                                    .explanation(message)
                                    .build();
                            }
                        } catch (SecurityException e) {
                            final String message = "unable to access " + filename + " due to " + e.getMessage();
                            return new ValidationResult.Builder()
                                .subject(this.getClass().getSimpleName())
                                .input(input)
                                .valid(false)
                                .explanation(message)
                                .build();
                        }
                    }
                } catch (Exception e) {
                    return new ValidationResult.Builder()
                        .subject(this.getClass().getSimpleName())
                        .input(input)
                        .valid(false)
                        .explanation("error evaluating value. Please sure that value is provided as file1,file2,file3 and so on. "
                                     + "Also, the files should exist and be readable.")
                        .build();
                }

                return new ValidationResult.Builder()
                    .subject(this.getClass().getSimpleName())
                    .input(input)
                    .valid(true)
                    .build();
            }
        };
    }

    @Override
    protected void init(@Nonnull final ProcessorInitializationContext context) {
        super.init(context);

        /* Create Kerberos properties */
        final SpringSecurityContextLoader securityContextLoader = SpringSecurityContextLoader.create(context);
        final KerberosProperties kerberosProperties = securityContextLoader.getKerberosProperties();
        KERBEROS_KEYTAB = kerberosProperties.createKerberosKeytabProperty();
        KERBEROS_PRINCIPAL = kerberosProperties.createKerberosPrincipalProperty();

        /* Create list of properties */
        final List<PropertyDescriptor> properties = new ArrayList<>();
        properties.add(KERBEROS_PRINCIPAL);
        properties.add(KERBEROS_KEYTAB);
        properties.add(HADOOP_CONFIGURATION_RESOURCES);
        properties.add(PYSPARK_APP_FILE);
        properties.add(PYSPARK_APP_ARGS);
        properties.add(PYSPARK_APP_NAME);
        properties.add(PYSPARK_ADDITIONAL_FILES);
        properties.add(SPARK_MASTER);
        properties.add(SPARK_YARN_DEPLOY_MODE);
        properties.add(YARN_QUEUE);
        properties.add(SPARK_HOME);
        properties.add(DRIVER_MEMORY);
        properties.add(EXECUTOR_MEMORY);
        properties.add(EXECUTOR_INSTANCES);
        properties.add(EXECUTOR_CORES);
        properties.add(NETWORK_TIMEOUT);
        properties.add(ADDITIONAL_SPARK_CONFIG_OPTIONS);
        this.properties = Collections.unmodifiableList(properties);

         /* Create list of relationships */
        final Set<Relationship> relationships = new HashSet<>();
        relationships.add(REL_SUCCESS);
        relationships.add(REL_FAILURE);
        this.relationships = Collections.unmodifiableSet(relationships);
    }

    @Override
    protected List<PropertyDescriptor> getSupportedPropertyDescriptors() {
        return properties;
    }

    @Override
    public Set<Relationship> getRelationships() {
        return relationships;
    }

    @Override
    public void onTrigger(ProcessContext context, ProcessSession session) throws ProcessException {
        final ComponentLog logger = getLog();
        FlowFile flowFile = session.get();

        if (flowFile == null) {
            flowFile = session.create();
            logger.info("Created a flow file having uuid: {}", new Object[]{flowFile.getAttribute(CoreAttributes.UUID.key())});
        } else {
            logger.info("Using an existing flow file having uuid: {}", new Object[]{flowFile.getAttribute(CoreAttributes.UUID.key())});
        }
        try {
            final String kerberosPrincipal = context.getProperty(KERBEROS_PRINCIPAL).getValue();
            final String kerberosKeyTab = context.getProperty(KERBEROS_KEYTAB).getValue();
            final String hadoopConfigurationResources = context.getProperty(HADOOP_CONFIGURATION_RESOURCES).getValue();
            final String pySparkAppFile = context.getProperty(PYSPARK_APP_FILE).evaluateAttributeExpressions(flowFile).getValue();
            final String pySparkAppArgs = context.getProperty(PYSPARK_APP_ARGS).evaluateAttributeExpressions(flowFile).getValue();
            final String pySparkAppName = context.getProperty(PYSPARK_APP_NAME).evaluateAttributeExpressions(flowFile).getValue();
            final String pySparkAdditionalFiles = context.getProperty(PYSPARK_ADDITIONAL_FILES).evaluateAttributeExpressions(flowFile).getValue();
            final String sparkMaster = context.getProperty(SPARK_MASTER).evaluateAttributeExpressions(flowFile).getValue().trim().toLowerCase();
            final String sparkYarnDeployMode = context.getProperty(SPARK_YARN_DEPLOY_MODE).evaluateAttributeExpressions(flowFile).getValue();
            final String yarnQueue = context.getProperty(YARN_QUEUE).evaluateAttributeExpressions(flowFile).getValue();
            final String sparkHome = context.getProperty(SPARK_HOME).evaluateAttributeExpressions(flowFile).getValue();
            final String driverMemory = context.getProperty(DRIVER_MEMORY).evaluateAttributeExpressions(flowFile).getValue();
            final String executorMemory = context.getProperty(EXECUTOR_MEMORY).evaluateAttributeExpressions(flowFile).getValue();
            final String executorInstances = context.getProperty(EXECUTOR_INSTANCES).evaluateAttributeExpressions(flowFile).getValue();
            final String executorCores = context.getProperty(EXECUTOR_CORES).evaluateAttributeExpressions(flowFile).getValue();
            final String networkTimeout = context.getProperty(NETWORK_TIMEOUT).evaluateAttributeExpressions(flowFile).getValue();
            final String additionalSparkConfigOptions = context.getProperty(ADDITIONAL_SPARK_CONFIG_OPTIONS).evaluateAttributeExpressions(flowFile).getValue();

            PySparkUtils pySparkUtils = new PySparkUtils();

            /* Get app arguments */
            String[] pySparkAppArgsArray = null;
            if (!StringUtils.isEmpty(pySparkAppArgs)) {
                pySparkAppArgsArray = pySparkUtils.getCsvValuesAsArray(pySparkAppArgs);
                logger.info("Provided application arguments: {}", new Object[]{pySparkUtils.getCsvStringFromArray(pySparkAppArgsArray)});
            }

            /* Get additional python files */
            String[] pySparkAdditionalFilesArray = null;
            if (!StringUtils.isEmpty(pySparkAdditionalFiles)) {
                pySparkAdditionalFilesArray = pySparkUtils.getCsvValuesAsArray(pySparkAdditionalFiles);
                logger.info("Provided python files: {}", new Object[]{pySparkUtils.getCsvStringFromArray(pySparkAdditionalFilesArray)});
            }

            /* Get additional config key-value pairs */
            String[] additionalSparkConfigOptionsArray = null;
            if (!StringUtils.isEmpty(additionalSparkConfigOptions)) {
                additionalSparkConfigOptionsArray = pySparkUtils.getCsvValuesAsArray(additionalSparkConfigOptions);
                logger.info("Provided spark config options: {}", new Object[]{pySparkUtils.getCsvStringFromArray(additionalSparkConfigOptionsArray)});
            }

            /* Determine if Kerberos is enabled */
            boolean kerberosEnabled = false;
            if (!StringUtils.isEmpty(kerberosPrincipal) && !StringUtils.isEmpty(kerberosKeyTab) && !StringUtils.isEmpty(hadoopConfigurationResources)) {
                kerberosEnabled = true;
                logger.info("Kerberos is enabled");
            }

            /* For Kerberized cluster, attempt user authentication */
            if (kerberosEnabled) {
                logger.info("Attempting user authentication for Kerberos");
                ApplySecurityPolicy applySecurityObject = new ApplySecurityPolicy();
                Configuration configuration;
                try {
                    logger.info("Getting Hadoop configuration from " + hadoopConfigurationResources);
                    configuration = ApplySecurityPolicy.getConfigurationFromResources(hadoopConfigurationResources);

                    if (SecurityUtil.isSecurityEnabled(configuration)) {
                        logger.info("Security is enabled");

                        if (kerberosPrincipal.equals("") && kerberosKeyTab.equals("")) {
                            logger.error("Kerberos Principal and Keytab provided with empty values for a Kerberized cluster.");
                            session.transfer(flowFile, REL_FAILURE);
                            return;
                        }

                        try {
                            logger.info("User authentication initiated");

                            boolean authenticationStatus = applySecurityObject.validateUserWithKerberos(logger, hadoopConfigurationResources, kerberosPrincipal, kerberosKeyTab);
                            if (authenticationStatus) {
                                logger.info("User authenticated successfully.");
                            } else {
                                logger.error("User authentication failed.");
                                session.transfer(flowFile, REL_FAILURE);
                                return;
                            }

                        } catch (Exception unknownException) {
                            logger.error("Unknown exception occurred while validating user :" + unknownException.getMessage());
                            session.transfer(flowFile, REL_FAILURE);
                            return;
                        }
                    }
                } catch (IOException e1) {
                    logger.error("Unknown exception occurred while authenticating user :" + e1.getMessage());
                    session.transfer(flowFile, REL_FAILURE);
                    return;
                }
            }

            /* Build and launch PySpark Job */
            logger.info("Configuring PySpark job for execution");
            SparkLauncher pySparkLauncher = new SparkLauncher()
                .setAppResource(pySparkAppFile);
            logger.info("PySpark app file set to: {}", new Object[]{pySparkAppFile});

            if (pySparkAppArgsArray != null && pySparkAppArgsArray.length > 0) {
                pySparkLauncher = pySparkLauncher
                    .addAppArgs(pySparkAppArgsArray);
                logger.info("App arguments set to: {}", new Object[]{pySparkUtils.getCsvStringFromArray(pySparkAppArgsArray)});
            }

            pySparkLauncher = pySparkLauncher
                .setAppName(pySparkAppName)
                .setMaster(sparkMaster);

            logger.info("App name set to: {}", new Object[]{pySparkAppName});
            logger.info("Spark master set to: {}", new Object[]{sparkMaster});

            if (pySparkAdditionalFilesArray != null && pySparkAdditionalFilesArray.length > 0) {
                for (String pySparkAdditionalFile : pySparkAdditionalFilesArray) {
                    pySparkLauncher = pySparkLauncher
                        .addPyFile(pySparkAdditionalFile);
                    logger.info("Additional python file set to: {}", new Object[]{pySparkAdditionalFile});
                }
            }

            if (sparkMaster.equals("yarn")) {
                pySparkLauncher = pySparkLauncher
                    .setDeployMode(sparkYarnDeployMode);
                logger.info("YARN deploy mode set to: {}", new Object[]{sparkYarnDeployMode});
            }

            pySparkLauncher = pySparkLauncher
                .setSparkHome(sparkHome)
                .setConf(SparkLauncher.DRIVER_MEMORY, driverMemory)
                .setConf(SparkLauncher.EXECUTOR_MEMORY, executorMemory)
                .setConf(CONFIG_PROP_SPARK_EXECUTOR_INSTANCES, executorInstances)
                .setConf(SparkLauncher.EXECUTOR_CORES, executorCores)
                .setConf(CONFIG_PROP_SPARK_NETWORK_TIMEOUT, networkTimeout);

            logger.info("Spark home set to: {} ", new Object[]{sparkHome});
            logger.info("Driver memory set to: {} ", new Object[]{driverMemory});
            logger.info("Executor memory set to: {} ", new Object[]{executorMemory});
            logger.info("Executor instances set to: {} ", new Object[]{executorInstances});
            logger.info("Executor cores set to: {} ", new Object[]{executorCores});
            logger.info("Network timeout set to: {} ", new Object[]{networkTimeout});

            if (kerberosEnabled) {
                pySparkLauncher = pySparkLauncher
                    .setConf(CONFIG_PROP_SPARK_YARN_PRINCIPAL, kerberosPrincipal);
                pySparkLauncher = pySparkLauncher
                    .setConf(CONFIG_PROP_SPARK_YARN_KEYTAB, kerberosKeyTab);
                logger.info("Kerberos principal set to: {} ", new Object[]{kerberosPrincipal});
                logger.info("Kerberos keytab set to: {} ", new Object[]{kerberosKeyTab});
            }

            if (!StringUtils.isEmpty(yarnQueue)) {
                pySparkLauncher = pySparkLauncher
                    .setConf(CONFIG_PROP_SPARK_YARN_QUEUE, yarnQueue);
                logger.info("YARN queue set to: {} ", new Object[]{yarnQueue});
            }

            if (additionalSparkConfigOptionsArray != null && additionalSparkConfigOptionsArray.length > 0) {
                for (String additionalSparkConfigOption : additionalSparkConfigOptionsArray) {
                    String[] confKeyValue = additionalSparkConfigOption.split("=");
                    if (confKeyValue.length == 2) {
                        pySparkLauncher = pySparkLauncher
                            .setConf(confKeyValue[0], confKeyValue[1]);
                        logger.info("Spark additional config option set to: {}={}", new Object[]{confKeyValue[0], confKeyValue[1]});
                    }
                }
            }

            logger.info("Starting execution of PySpark job");
            Process pySparkProcess = pySparkLauncher.launch();

            InputStreamReaderRunnable inputStreamReaderRunnable = new InputStreamReaderRunnable(LogLevel.INFO, logger, pySparkProcess.getInputStream());
            Thread inputThread = new Thread(inputStreamReaderRunnable, "stream input");
            inputThread.start();

            InputStreamReaderRunnable errorStreamReaderRunnable = new InputStreamReaderRunnable(LogLevel.INFO, logger, pySparkProcess.getErrorStream());
            Thread errorThread = new Thread(errorStreamReaderRunnable, "stream error");
            errorThread.start();

            logger.info("Waiting for PySpark job to complete");

            int exitCode = pySparkProcess.waitFor();
            if (exitCode != 0) {
                logger.info("Finished execution of PySpark job [FAILURE] [Status code: {}]", new Object[]{exitCode});
                session.transfer(flowFile, REL_FAILURE);
            } else {
                logger.info("Finished execution of PySpark job [SUCCESS] [Status code: {}]", new Object[]{exitCode});
                session.transfer(flowFile, REL_SUCCESS);
            }
        } catch (final Exception e) {
            logger.error("Unable to execute PySpark job [FAILURE]", new Object[]{flowFile, e});
            session.transfer(flowFile, REL_FAILURE);
        }
    }

    @Override
    protected Collection<ValidationResult> customValidate(ValidationContext validationContext) {
        final List<ValidationResult> results = new ArrayList<>();
        final String sparkMaster = validationContext.getProperty(SPARK_MASTER).evaluateAttributeExpressions().getValue().trim().toLowerCase();
        final String sparkYarnDeployMode = validationContext.getProperty(SPARK_YARN_DEPLOY_MODE).evaluateAttributeExpressions().getValue();
        final String pySparkAppArgs = validationContext.getProperty(PYSPARK_APP_ARGS).evaluateAttributeExpressions().getValue();
        final String additionalSparkConfigOptions = validationContext.getProperty(ADDITIONAL_SPARK_CONFIG_OPTIONS).evaluateAttributeExpressions().getValue();

        PySparkUtils pySparkUtils = new PySparkUtils();

        if ((!sparkMaster.contains("local")) && (!sparkMaster.equals("yarn")) && (!sparkMaster.contains("mesos")) && (!sparkMaster.contains("spark"))) {
            results.add(new ValidationResult.Builder()
                            .subject(this.getClass().getSimpleName())
                            .valid(false)
                            .explanation("invalid spark master provided. Valid values will have local, local[n], local[*], yarn, mesos, spark")
                            .build());

        }

        if (sparkMaster.equals("yarn")) {
            if (!(sparkYarnDeployMode.equals("client") || sparkYarnDeployMode.equals("cluster"))) {
                results.add(new ValidationResult.Builder()
                                .subject(this.getClass().getSimpleName())
                                .valid(false)
                                .explanation("yarn master requires a deploy mode to be specified as either 'client' or 'cluster'")
                                .build());
            }
        }

        if (!StringUtils.isEmpty(pySparkAppArgs)) {
            if (!pySparkUtils.validateCsvArgs(pySparkAppArgs)) {
                results.add(new ValidationResult.Builder()
                                .subject(this.getClass().getSimpleName())
                                .valid(false)
                                .explanation("app args in invalid format. They should be provided as arg1,arg2,arg3 and so on.")
                                .build());

            }
        }

        if (!StringUtils.isEmpty(additionalSparkConfigOptions)) {
            if (!pySparkUtils.validateKeyValueArgs(additionalSparkConfigOptions)) {
                results.add(new ValidationResult.Builder()
                                .subject(this.getClass().getSimpleName())
                                .valid(false)
                                .explanation("additional spark config options in invalid format. They should be provided as config1=value1,config2=value2 and so on.")
                                .build());

            }
        }

        return results;
    }
}