WebHdfsPersistWriter.java example

Explorer

incubator-streams-master
- streams-components
  - streams-converters
    - src
      - main
        java
        org
        apache
        streams
        converter
        ActivityConverterProcessor.java
        ActivityConverterUtil.java
        ActivityObjectConverterProcessor.java
        ActivityObjectConverterUtil.java
        BaseDocumentClassifier.java
        BaseObjectNodeActivityConverter.java
        BaseObjectNodeActivityObjectConverter.java
        BaseStringActivityConverter.java
        BaseStringActivityObjectConverter.java
        FieldConstants.java
        HoconConverterProcessor.java
        HoconConverterUtil.java
        LineReadWriteUtil.java
        TypeConverterProcessor.java
        TypeConverterUtil.java
      - test
        java
        org
        apache
        streams
        converter
        test
        BaseActivityConverterProcessorTest.java
        BaseActivityObjectConverterProcessorTest.java
        CustomActivityConverter.java
        CustomActivityConverterProcessorTest.java
        CustomActivityObjectConverter.java
        CustomActivityObjectConverterProcessorTest.java
        CustomDocumentClassifier.java
        CustomType.java
        HoconConverterProcessorTest.java
        HoconConverterTest.java
        NoConfigActivityConverterProcessorTest.java
        TestLineReadWriteUtil.java
        TypeConverterProcessorTest.java
  - streams-filters
    - src
      - main
        java
        org
        apache
        streams
        filters
        VerbDefinitionDropFilter.java
        VerbDefinitionKeepFilter.java
      - test
        java
        org
        apache
        streams
        filters
        test
        VerbDefinitionFilterTest.java
  - streams-http
    - src
      - main
        java
        org
        apache
        streams
        components
        http
        persist
        SimpleHTTPPostPersistWriter.java
        processor
        SimpleHTTPGetProcessor.java
        SimpleHTTPPostProcessor.java
        provider
        SimpleHttpProvider.java
      - test
        java
        SimpleHTTPPostPersistWriterTest.java
- streams-config
  - src
    - main
      - java
        org
        apache
        streams
        config
        ComponentConfigurator.java
        StreamsConfigurator.java
    - test
      - java
        org
        apache
        streams
        config
        test
        ComponentConfiguratorTest.java
        StreamsConfiguratorTest.java
- streams-contrib
  - streams-amazon-aws
    - streams-persist-kinesis
      - src
        main
        java
        org
        apache
        streams
        amazon
        kinesis
        KinesisPersistReader.java
        KinesisPersistReaderTask.java
        KinesisPersistWriter.java
    - streams-persist-s3
      - src
        main
        java
        org
        apache
        streams
        s3
        S3ObjectInputStreamWrapper.java
        S3OutputStreamWrapper.java
        S3PersistReader.java
        S3PersistReaderTask.java
        S3PersistWriter.java
        test
        java
        org
        apache
        streams
        s3
        S3PersistWriterTest.java
  - streams-persist-cassandra
    - src
      - main
        java
        org
        apache
        streams
        cassandra
        CassandraClient.java
        CassandraPersistReader.java
        CassandraPersistWriter.java
      - test
        java
        org
        apache
        streams
        cassandra
        test
        CassandraPersistIT.java
  - streams-persist-console
    - src
      - main
        java
        org
        apache
        streams
        console
        ConsolePersistReader.java
        ConsolePersistWriter.java
        ConsolePersistWriterTask.java
  - streams-persist-elasticsearch
    - src
      - main
        java
        org
        apache
        streams
        elasticsearch
        ElasticsearchClientManager.java
        ElasticsearchMetadataUtil.java
        ElasticsearchPersistDeleter.java
        ElasticsearchPersistReader.java
        ElasticsearchPersistUpdater.java
        ElasticsearchPersistWriter.java
        ElasticsearchQuery.java
        processor
        DatumFromMetadataAsDocumentProcessor.java
        DatumFromMetadataProcessor.java
        DocumentToMetadataProcessor.java
        MetadataFromDocumentProcessor.java
        PercolateTagProcessor.java
      - test
        java
        org
        apache
        streams
        elasticsearch
        processor
        PercolateTagProcessorTest.java
        test
        DatumFromMetadataProcessorIT.java
        ElasticsearchParentChildUpdaterIT.java
        ElasticsearchParentChildWriterIT.java
        ElasticsearchPersistUpdaterIT.java
        ElasticsearchPersistWriterIT.java
        TestDocumentToMetadataProcessor.java
        TestMetadataFromDocumentProcessor.java
  - streams-persist-filebuffer
    - src
      - main
        java
        org
        apache
        streams
        filebuffer
        FileBufferPersistReader.java
        FileBufferPersistWriter.java
      - test
        java
        org
        apache
        streams
        filebuffer
        test
        FileBufferPersistIT.java
        TestFileBufferPersist.java
  - streams-persist-graph
    - src
      - main
        java
        org
        apache
        streams
        graph
        GraphHelper.java
        HttpGraphHelper.java
        QueryGraphHelper.java
  - streams-persist-hbase
    - src
      - main
        java
        org
        apache
        streams
        hbase
        HbasePersistReader.java
        HbasePersistReaderTask.java
        HbasePersistWriter.java
        HbasePersistWriterTask.java
      - test
        java
        org
        apache
        streams
        hbase
        test
        HbasePersistReaderIT.java
        HbasePersistWriterIT.java
  - streams-persist-hdfs
    - src
      - main
        java
        org
        apache
        streams
        hdfs
        HdfsConstants.java
        WebHdfsPersistReader.java
        WebHdfsPersistReaderTask.java
        WebHdfsPersistWriter.java
        WebHdfsPersistWriterTask.java
      - test
        java
        org
        apache
        streams
        hdfs
        test
        HdfsPersistConfigTest.java
        TestHdfsPersist.java
  - streams-persist-kafka
    - src
      - main
        java
        org
        apache
        streams
        kafka
        KafkaPersistReader.java
        KafkaPersistReaderTask.java
        KafkaPersistWriter.java
        KafkaPersistWriterTask.java
  - streams-persist-mongo
    - src
      - main
        java
        org
        apache
        streams
        mongo
        MongoPersistReader.java
        MongoPersistWriter.java
      - test
        java
        org
        apache
        streams
        mongo
        test
        MongoPersistIT.java
  - streams-persist-neo4j
    - src
      - main
        java
        org
        apache
        streams
        neo4j
        CypherQueryGraphHelper.java
        Neo4jPersistUtil.java
        bolt
        Neo4jBoltClient.java
        Neo4jBoltPersistReader.java
        Neo4jBoltPersistWriter.java
        http
        Neo4jHttpClient.java
        Neo4jHttpGraphHelper.java
        Neo4jHttpPersistReader.java
        Neo4jHttpPersistWriter.java
      - test
        java
        org
        apache
        streams
        neo4j
        test
        Neo4jBoltPersistIT.java
        Neo4jHttpPersistIT.java
        TestCypherQueryGraphHelper.java
  - streams-persist-riak
    - src
      - main
        java
        org
        apache
        streams
        riak
        binary
        RiakBinaryClient.java
        RiakBinaryPersistReader.java
        RiakBinaryPersistWriter.java
        http
        RiakHttpClient.java
        RiakHttpPersistReader.java
        RiakHttpPersistWriter.java
      - test
        java
        org
        apache
        streams
        riak
        test
        RiakBinaryPersistIT.java
        RiakHttpPersistIT.java
  - streams-processor-jackson
    - src
      - main
        java
        org
        apache
        streams
        jackson
        CleanAdditionalPropertiesProcessor.java
        JsonUtil.java
        TypeConverterProcessor.java
      - test
        java
        org
        apache
        streams
        jackson
        test
        TypeConverterProcessorTest.java
  - streams-processor-json
    - src
      - main
        java
        org
        apache
        streams
        json
        JsonPathExtractor.java
        JsonPathFilter.java
      - test
        java
        org
        apache
        streams
        json
        test
        JsonPathExtractorTest.java
  - streams-processor-peoplepattern
    - src
      - main
        java
        org
        apache
        streams
        peoplepattern
        AccountTypeProcessor.java
        DemographicsProcessor.java
  - streams-processor-regex
    - src
      - main
        java
        org
        apache
        streams
        regex
        AbstractRegexExtensionExtractor.java
        RegexHashtagExtractor.java
        RegexMentionsExtractor.java
        RegexUrlExtractor.java
        RegexUtils.java
      - test
        java
        org
        apache
        streams
        regex
        RegexHashtagExtractorTest.java
        RegexMentionExtractorTest.java
        RegexUrlExtractorTest.java
        RegexUtilsTest.java
  - streams-processor-urls
    - src
      - main
        java
        org
        apache
        streams
        urls
        LinkResolver.java
        LinkResolverHelperFunctions.java
        LinkResolverProcessor.java
      - test
        java
        org
        apache
        streams
        urls
        LinkHelperFunctionsTest.java
        TestLinkUnwinderProcessor.java
  - streams-provider-facebook
    - src
      - main
        java
        org
        apache
        streams
        facebook
        api
        FacebookPageActivitySerializer.java
        FacebookPostActivitySerializer.java
        feed
        FacebookPublicFeedXmlActivitySerializer.java
        processor
        FacebookTypeConverter.java
        provider
        FacebookDataCollector.java
        FacebookEventClassifier.java
        FacebookFriendFeedProvider.java
        FacebookFriendUpdatesProvider.java
        FacebookProvider.java
        FacebookUserInformationProvider.java
        FacebookUserstreamProvider.java
        page
        FacebookPageDataCollector.java
        FacebookPageProvider.java
        pagefeed
        FacebookPageFeedDataCollector.java
        FacebookPageFeedProvider.java
        serializer
        FacebookActivityUtil.java
        FacebookStreamsPostSerializer.java
      - test
        java
        org
        apache
        streams
        facebook
        test
        FacebookEventClassifierTest.java
        SimplePageTest.java
        TestPage.java
        data
        FacebookActivityActorSerDeIT.java
        FacebookActivitySerDeIT.java
        FacebookPageSerDeIT.java
        FacebookPostSerDeIT.java
        providers
        TestFacebookProvider.java
        page
        FacebookPageProviderIT.java
        pagefeed
        FacebookPageFeedProviderIT.java
  - streams-provider-google
    - google-gmail
      - src
        main
        java
        org
        apache
        streams
        gmail
        provider
        GMailImapProviderTask.java
        GMailMessageActivitySerializer.java
        GMailProvider.java
        test
        java
        org
        apache
        streams
        gmail
        test
        GMailMessageSerDeTest.java
    - google-gplus
      - src
        main
        java
        org
        apache
        streams
        gplus
        processor
        GooglePlusCommentProcessor.java
        GooglePlusTypeConverter.java
        provider
        AbstractGPlusProvider.java
        GPlusActivitySerializer.java
        GPlusDataCollector.java
        GPlusUserActivityCollector.java
        GPlusUserActivityProvider.java
        GPlusUserDataCollector.java
        GPlusUserDataProvider.java
        serializer
        util
        GPlusActivityDeserializer.java
        GPlusCommentDeserializer.java
        GPlusEventClassifier.java
        GPlusPersonDeserializer.java
        GooglePlusActivityUtil.java
        test
        java
        org
        apache
        streams
        gplus
        GooglePlusCommentSerDeIT.java
        GooglePlusPersonSerDeIT.java
        processors
        GooglePlusActivitySerDeIT.java
        GooglePlusTypeConverterIT.java
        providers
        GPlusUserActivityProviderIT.java
        GPlusUserDataProviderIT.java
        TestAbstractGPlusProvider.java
        TestGPlusUserActivityCollector.java
        TestGPlusUserDataCollector.java
        serializer
        util
        GPlusEventClassifierTest.java
  - streams-provider-instagram
    - src
      - main
        java
        org
        apache
        streams
        instagram
        api
        Instagram.java
        InstagramOAuthRequestSigner.java
        InstagramRetryHandler.java
        Media.java
        Users.java
        processor
        InstagramTypeConverter.java
        provider
        InstagramAbstractProvider.java
        InstagramDataCollector.java
        InstagramProviderUtil.java
        recentmedia
        InstagramRecentMediaCollector.java
        InstagramRecentMediaProvider.java
        userinfo
        InstagramUserInfoCollector.java
        InstagramUserInfoProvider.java
        serializer
        InstagramMediaFeedDataConverter.java
        InstagramUserInfoDataConverter.java
        util
        InstagramActivityUtil.java
      - test
        java
        org
        apache
        streams
        instagram
        test
        api
        InstagramOAuthRequestSignerTest.java
        data
        InstagramMediaFeedDataConverterIT.java
        InstagramUserInfoDataConverterIT.java
        providers
        InstagramRecentMediaProviderIT.java
        InstagramUserInfoProviderIT.java
  - streams-provider-moreover
    - src
      - main
        java
        org
        apache
        streams
        moreover
        MoreoverClient.java
        MoreoverJsonActivitySerializer.java
        MoreoverProvider.java
        MoreoverProviderTask.java
        MoreoverResult.java
        MoreoverUtils.java
        MoreoverXmlActivitySerializer.java
      - test
        java
        org
        apache
        streams
        moreover
        MoreoverTestUtil.java
        test
        MoreoverJsonActivitySerializerIT.java
        MoreoverXmlActivitySerializerIT.java
        provider
        MoreoverProviderIT.java
  - streams-provider-rss
    - src
      - main
        java
        org
        apache
        streams
        rss
        processor
        RssTypeConverter.java
        provider
        RssEventProcessor.java
        RssStreamProvider.java
        RssStreamProviderTask.java
        perpetual
        RssFeedScheduler.java
        serializer
        SyndEntryActivitySerializer.java
        SyndEntrySerializer.java
      - test
        java
        org
        apache
        streams
        rss
        provider
        RssStreamProviderTaskIT.java
        RssStreamProviderTest.java
        perpetual
        RssFeedSchedulerTest.java
        test
        RssStreamProviderIT.java
        RssTypeConverterTest.java
        SyndEntryActivitySerializerIT.java
  - streams-provider-sysomos
    - src
      - main
        java
        org
        apache
        streams
        sysomos
        SysomosException.java
        conversion
        SysomosBeatActivityConverter.java
        data
        HeartbeatInfo.java
        SysomosTagDefinition.java
        processor
        SysomosTypeConverter.java
        provider
        AbstractRequestBuilder.java
        ContentRequestBuilder.java
        RequestBuilder.java
        SysomosClient.java
        SysomosHeartbeatStream.java
        SysomosProvider.java
        util
        SysomosUtils.java
      - test
        java
        org
        apache
        streams
        sysomos
        test
        SysomosJsonSerDeIT.java
        SysomosXmlSerDeIT.java
        provider
        SysomosProviderIT.java
  - streams-provider-twitter
    - src
      - main
        java
        org
        apache
        streams
        twitter
        api
        Followers.java
        Friends.java
        Statuses.java
        Twitter.java
        TwitterOAuthRequestInterceptor.java
        TwitterRetryHandler.java
        Users.java
        converter
        StreamsTwitterMapper.java
        TwitterDateTimeFormat.java
        TwitterDocumentClassifier.java
        TwitterFollowActivityConverter.java
        TwitterJsonDeleteActivityConverter.java
        TwitterJsonRetweetActivityConverter.java
        TwitterJsonTweetActivityConverter.java
        TwitterJsonUserActivityConverter.java
        TwitterJsonUserActivityObjectConverter.java
        TwitterJsonUserstreameventActivityConverter.java
        util
        TwitterActivityUtil.java
        processor
        FetchAndReplaceTwitterProcessor.java
        TwitterTypeConverter.java
        TwitterUrlApiProcessor.java
        provider
        TwitterFollowersIdsProviderTask.java
        TwitterFollowersListProviderTask.java
        TwitterFollowingProvider.java
        TwitterFriendsIdsProviderTask.java
        TwitterFriendsListProviderTask.java
        TwitterProviderUtil.java
        TwitterStreamHelper.java
        TwitterStreamProvider.java
        TwitterTimelineProvider.java
        TwitterTimelineProviderTask.java
        TwitterUserInformationProvider.java
        TwitterUserInformationProviderTask.java
      - test
        java
        org
        apache
        streams
        twitter
        test
        api
        TwitterOAuthRequestInterceptorTest.java
        data
        TwitterObjectMapperIT.java
        providers
        TwitterFollowingProviderIT.java
        TwitterStreamProviderIT.java
        TwitterTimelineProviderIT.java
        TwitterUserInformationProviderIT.java
        utils
        TwitterActivityConvertersTest.java
        TwitterActivityObjectsConvertersTest.java
        TwitterDocumentClassifierTest.java
  - streams-provider-youtube
    - src
      - main
        java
        org
        apache
        streams
        youtube
        processor
        YoutubeTypeConverter.java
        provider
        YoutubeChannelDataCollector.java
        YoutubeChannelProvider.java
        YoutubeDataCollector.java
        YoutubeProvider.java
        YoutubeUserActivityCollector.java
        YoutubeUserActivityProvider.java
        serializer
        YoutubeActivityUtil.java
        YoutubeChannelDeserializer.java
        YoutubeEventClassifier.java
        YoutubeVideoDeserializer.java
      - test
        java
        org
        apache
        streams
        youtube
        processor
        YoutubeTypeConverterTest.java
        provider
        YoutubeChannelDataCollectorTest.java
        YoutubeProviderTest.java
        YoutubeUserActivityCollectorTest.java
        serializer
        YoutubeEventClassifierTest.java
        YoutubeVideoSerDeTest.java
        test
        providers
        YoutubeChannelProviderIT.java
        YoutubeUserActivityProviderIT.java
- streams-core
  - src
    - main
      - java
        org
        apache
        streams
        core
        DatumStatus.java
        DatumStatusCountable.java
        DatumStatusCounter.java
        StreamBuilder.java
        StreamsDatum.java
        StreamsOperation.java
        StreamsPersistReader.java
        StreamsPersistWriter.java
        StreamsProcessor.java
        StreamsProvider.java
        StreamsResultSet.java
        util
        DatumUtils.java
- streams-monitoring
  - src
    - main
      - java
        org
        apache
        streams
        jackson
        DatumStatusCounterDeserializer.java
        MemoryUsageDeserializer.java
        StreamsTaskCounterDeserializer.java
        ThroughputQueueDeserializer.java
        monitoring
        persist
        MessagePersister.java
        impl
        BroadcastMessagePersister.java
        LogstashUdpMessagePersister.java
        Slf4jMessagePersister.java
        tasks
        BroadcastMonitorThread.java
    - test
      - java
        org
        apache
        streams
        jackson
        MemoryUsageDeserializerTest.java
        monitoring
        persist
        impl
        BroadcastMessagePersisterTest.java
        LogstashUdpMessagePersisterTest.java
        tasks
        BroadcastMonitorThreadTest.java
- streams-plugins
  - streams-plugin-cassandra
    - src
      - main
        java
        org
        apache
        streams
        plugins
        cassandra
        StreamsCassandraGenerationConfig.java
        StreamsCassandraResourceGenerator.java
        StreamsCassandraResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        cassandra
        test
        StreamsCassandraResourceGeneratorCLITest.java
        StreamsCassandraResourceGeneratorMojoIT.java
        StreamsCassandraResourceGeneratorTest.java
  - streams-plugin-elasticsearch
    - src
      - main
        java
        org
        apache
        streams
        plugins
        elasticsearch
        StreamsElasticsearchGenerationConfig.java
        StreamsElasticsearchResourceGenerator.java
        StreamsElasticsearchResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        elasticsearch
        test
        StreamsElasticsearchResourceGeneratorCLITest.java
        StreamsElasticsearchResourceGeneratorMojoIT.java
        StreamsElasticsearchResourceGeneratorTest.java
  - streams-plugin-hbase
    - src
      - main
        java
        org
        apache
        streams
        plugins
        hbase
        StreamsHbaseGenerationConfig.java
        StreamsHbaseResourceGenerator.java
        StreamsHbaseResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsHbaseResourceGeneratorCLITest.java
        StreamsHbaseResourceGeneratorMojoIT.java
        StreamsHbaseResourceGeneratorTest.java
  - streams-plugin-hive
    - src
      - main
        java
        org
        apache
        streams
        plugins
        hive
        StreamsHiveGenerationConfig.java
        StreamsHiveResourceGenerator.java
        StreamsHiveResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsHiveResourceGeneratorCLITest.java
        StreamsHiveResourceGeneratorMojoIT.java
        StreamsHiveResourceGeneratorTest.java
  - streams-plugin-pig
    - src
      - main
        java
        org
        apache
        streams
        plugins
        pig
        StreamsPigGenerationConfig.java
        StreamsPigResourceGenerator.java
        StreamsPigResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        pig
        test
        StreamsPigResourceGeneratorCLITest.java
        StreamsPigResourceGeneratorMojoIT.java
        StreamsPigResourceGeneratorTest.java
  - streams-plugin-pojo
    - src
      - main
        java
        org
        apache
        streams
        plugins
        StreamsPojoGenerationConfig.java
        StreamsPojoSourceGenerator.java
        StreamsPojoSourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsPojoSourceGeneratorCLITest.java
        StreamsPojoSourceGeneratorMojoIT.java
        StreamsPojoSourceGeneratorTest.java
  - streams-plugin-scala
    - src
      - main
        java
        org
        apache
        streams
        plugins
        StreamsScalaGenerationConfig.java
        StreamsScalaSourceGenerator.java
        StreamsScalaSourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsScalaSourceGeneratorCLITest.java
        StreamsScalaSourceGeneratorMojoIT.java
        StreamsScalaSourceGeneratorTest.java
- streams-pojo
  - src
    - main
      - java
        org
        apache
        streams
        data
        ActivityConverter.java
        ActivityObjectConverter.java
        ActivitySerializer.java
        DocumentClassifier.java
        util
        ActivityUtil.java
        RFC3339Utils.java
        exceptions
        ActivityConversionException.java
        ActivitySerializerException.java
        jackson
        StreamsDateTimeDeserializer.java
        StreamsDateTimeFormat.java
        StreamsDateTimeSerializer.java
        StreamsJacksonMapper.java
        StreamsJacksonModule.java
        StreamsPeriodDeserializer.java
        StreamsPeriodSerializer.java
    - test
      - java
        org
        apache
        streams
        pojo
        test
        ActivitySerDeTest.java
        CustomDateTimeFormatTest.java
        DateTimeSerDeTest.java
        RFC3339UtilsTest.java
- streams-pojo-extensions
  - src
    - main
      - java
        org
        apache
        streams
        pojo
        extensions
        ExtensionUtil.java
    - test
      - java
        org
        apache
        streams
        pojo
        extensions
        test
        ExtensionUtilTest.java
- streams-runtimes
  - streams-runtime-dropwizard
    - src
      - main
        java
        org
        apache
        streams
        dropwizard
        GenericWebhookResource.java
        StreamDropwizardBuilder.java
        StreamsApplication.java
        StreamsDropwizardModule.java
      - test
        java
        org
        apache
        streams
        dropwizard
        test
        GenericWebhookResourceTest.java
        StreamsApplicationIT.java
        TestStreamsApplication.java
  - streams-runtime-local
    - src
      - main
        java
        org
        apache
        streams
        local
        builders
        InvalidStreamException.java
        LocalStreamBuilder.java
        StreamComponent.java
        counters
        DatumStatusCounter.java
        DatumStatusCounterMXBean.java
        StreamsTaskCounter.java
        StreamsTaskCounterMXBean.java
        executors
        ShutdownStreamOnUnhandleThrowableThreadPoolExecutor.java
        queues
        ThroughputQueue.java
        ThroughputQueueMXBean.java
        tasks
        BaseStreamsTask.java
        LocalStreamProcessMonitorThread.java
        StatusCounterMonitorRunnable.java
        StatusCounterMonitorThread.java
        StreamsMergeTask.java
        StreamsPersistWriterTask.java
        StreamsProcessorTask.java
        StreamsProviderTask.java
        StreamsTask.java
      - test
        java
        org
        apache
        streams
        local
        builders
        LocalStreamBuilderTest.java
        ToyLocalBuilderExample.java
        counters
        DatumStatusCounterTest.java
        StreamsTaskCounterTest.java
        executors
        ShutdownStreamOnUnhandledThrowableThreadPoolExecutorTest.java
        queues
        ThroughputQueueMultiThreadTest.java
        ThroughputQueueSingleThreadTest.java
        tasks
        BasicTasksTest.java
        StreamsProviderTaskTest.java
        test
        processors
        DoNothingProcessor.java
        PassthroughDatumCounterProcessor.java
        SlowProcessor.java
        providers
        EmptyResultSetProvider.java
        NumericMessageProvider.java
        writer
        DatumCounterWriter.java
        DoNothingWriter.java
        SystemOutWriter.java
        test
        component
        ExpectedDatumsPersistWriter.java
        FileReaderProvider.java
        StreamsDatumConverter.java
        StringToDocumentConverter.java
        tests
        TestComponentsLocalStream.java
        TestExpectedDatumsPersitWriter.java
        TestFileReaderProvider.java
- streams-schemas
  - streams-schema-activitystreams
    - src
      - test
        java
        org
        w3c
        activitystreams
        test
        SchemaValidationTest.java
  - streams-schema-activitystreams2
    - src
      - test
        java
        org
        w3c
        activitystreams
        test
        ExamplesSerDeIT.java
- streams-util
  - src
    - main
      - java
        org
        apache
        streams
        util
        ComponentUtils.java
        GuidUtils.java
        PropertyUtil.java
        SerializationUtil.java
        api
        requests
        backoff
        AbstractBackOffStrategy.java
        BackOffException.java
        BackOffStrategy.java
        impl
        ConstantTimeBackOffStrategy.java
        ExponentialBackOffStrategy.java
        LinearTimeBackOffStrategy.java
        oauth
        tokens
        AbstractOauthToken.java
        tokenmanager
        SimpleTokenManager.java
        impl
        BasicTokenManager.java
        schema
        FieldType.java
        FieldUtil.java
        FileUtil.java
        GenerationConfig.java
        Schema.java
        SchemaStore.java
        SchemaStoreImpl.java
        SchemaUtil.java
        UriUtil.java
    - test
      - java
        org
        apache
        streams
        util
        api
        requests
        backoff
        BackOffStrategyTest.java
        ConstantTimeBackOffStrategyTest.java
        ExponentialBackOffStrategyTest.java
        LinearTimeBackOffStrategyTest.java
        files
        StreamsScannerUtil.java
        oauth
        tokens
        tokenmanager
        TestBasicTokenManager.java
        schema
        test
        PropertyUtilTest.java
        SchemaOrderingTest.java
        SchemaStoreTest.java
- streams-verbs
  - src
    - main
      - java
        org
        apache
        streams
        verbs
        ObjectCombinationGenericOrdering.java
        ObjectCombinationSpecificOrdering.java
        VerbDefinitionMatchUtil.java
        VerbDefinitionResolver.java
        VerbDefinitionTemplateUtil.java
    - test
      - java
        org
        apache
        streams
        verbs
        ObjectCombinationGenericOrderingTest.java
        ObjectCombinationSpecificOrderingTest.java
        VerbDefinitionResolverTest.java
        VerbDefinitionTemplateTest.java
        VerbDefinitionTest.java

/*
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 *
 *   http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing,
 * software distributed under the License is distributed on an
 * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 * KIND, either express or implied.  See the License for the
 * specific language governing permissions and limitations
 * under the License.
 */

package org.apache.streams.hdfs;

import org.apache.streams.config.ComponentConfigurator;
import org.apache.streams.config.StreamsConfigurator;
import org.apache.streams.converter.LineReadWriteUtil;
import org.apache.streams.core.DatumStatus;
import org.apache.streams.core.DatumStatusCountable;
import org.apache.streams.core.DatumStatusCounter;
import org.apache.streams.core.StreamsDatum;
import org.apache.streams.core.StreamsPersistWriter;
import org.apache.streams.jackson.StreamsJacksonMapper;

import com.fasterxml.jackson.databind.ObjectMapper;
import org.apache.commons.lang3.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.CommonConfigurationKeysPublic;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.security.UserGroupInformation;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.Closeable;
import java.io.Flushable;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.net.URI;
import java.net.URISyntaxException;
import java.security.PrivilegedExceptionAction;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import java.util.Queue;
import java.util.zip.GZIPOutputStream;

/**
 * WebHdfsPersistWriter writes to hdfs.
 */
public class WebHdfsPersistWriter implements StreamsPersistWriter, Flushable, Closeable, DatumStatusCountable {

  public static final String STREAMS_ID = "WebHdfsPersistWriter";

  private static final Logger LOGGER = LoggerFactory.getLogger(WebHdfsPersistWriter.class);

  private FileSystem client;
  private Path path;
  private int linesPerFile;
  private int totalRecordsWritten = 0;
  private final List<Path> writtenFiles = new ArrayList<>();
  private int fileLineCounter = 0;
  private OutputStreamWriter currentWriter = null;

  private static final int BYTES_IN_MB = 1024 * 1024;
  private static final int BYTES_BEFORE_FLUSH = 64 * BYTES_IN_MB;
  private volatile int totalByteCount = 0;
  private volatile int byteCount = 0;

  public boolean terminate = false;

  protected volatile Queue<StreamsDatum> persistQueue;

  private ObjectMapper mapper;
  private LineReadWriteUtil lineWriterUtil;

  protected HdfsWriterConfiguration hdfsConfiguration;

  public WebHdfsPersistWriter() {
    this(new ComponentConfigurator<>(HdfsWriterConfiguration.class).detectConfiguration(StreamsConfigurator.getConfig().getConfig("hdfs")));
  }

  public WebHdfsPersistWriter(HdfsWriterConfiguration hdfsConfiguration) {
    this.hdfsConfiguration = hdfsConfiguration;
    this.linesPerFile = hdfsConfiguration.getLinesPerFile().intValue();
  }

  /**
   * getURI from hdfsConfiguration.
   * @return URI
   * @throws URISyntaxException URISyntaxException
   */
  // TODO: combine with WebHdfsPersistReader.getURI
  public URI getURI() throws URISyntaxException {
    StringBuilder uriBuilder = new StringBuilder();
    uriBuilder.append(hdfsConfiguration.getScheme());
    uriBuilder.append("://");
    if (StringUtils.isNotEmpty(hdfsConfiguration.getHost())) {
      uriBuilder.append(hdfsConfiguration.getHost() + ":" + hdfsConfiguration.getPort());
    } else {
      uriBuilder.append("/");
    }
    return new URI(uriBuilder.toString());
  }

  /**
   * isConnected.
   * @return true if connected, false otherwise
   */
  // TODO: combine with WebHdfsPersistReader.isConnected
  public boolean isConnected() {
    return (client != null);
  }

  /**
   * getFileSystem.
   * @return FileSystem
   */
  // TODO: combine with WebHdfsPersistReader.getFileSystem
  public final synchronized FileSystem getFileSystem() {
    // Check to see if we are connected.
    if (!isConnected()) {
      connectToWebHDFS();
    }
    return this.client;
  }

  private synchronized void connectToWebHDFS() {
    try {
      LOGGER.info("User : {}", this.hdfsConfiguration.getUser());
      UserGroupInformation ugi = UserGroupInformation.createRemoteUser(this.hdfsConfiguration.getUser());
      ugi.setAuthenticationMethod(UserGroupInformation.AuthenticationMethod.SIMPLE);

      ugi.doAs(new PrivilegedExceptionAction<Void>() {
        public Void run() throws Exception {
          Configuration conf = new Configuration();
          conf.set(CommonConfigurationKeysPublic.HADOOP_SECURITY_AUTHENTICATION, "kerberos");
          LOGGER.info("WebURI : {}", getURI().toString());
          client = FileSystem.get(getURI(), conf);
          LOGGER.info("Connected to WebHDFS");

          /*
          * ************************************************************************************************
          * This code is an example of how you would work with HDFS and you weren't going over
          * the webHDFS protocol.
          *
          * Smashew: 2013-10-01
          * ************************************************************************************************
          conf.set("fs.defaultFS", "hdfs://hadoop.mdigitallife.com:8020/user/" + userName);
          conf.set("namenode.host","0.0.0.0");
          conf.set("hadoop.job.ugi", userName);
          conf.set(DFSConfigKeys.DFS_NAMENODE_USER_NAME_KEY, "runner");
          fileSystem.createNewFile(new Path("/user/"+ userName + "/test"));
          FileStatus[] status = fs.listStatus(new Path("/user/" + userName));
          for(int i=0;i<status.length;i++)
          {
              LOGGER.info("Directory: {}", status[i].getPath());
          }
          */

          return null;
        }
      });
    } catch (Exception ex) {
      LOGGER.error("There was an error connecting to WebHDFS, please check your settings and try again", ex);
      throw new RuntimeException(ex);
    }
  }

  @Override
  public String getId() {
    return STREAMS_ID;
  }

  @Override
  public void write(StreamsDatum streamsDatum) {

    synchronized (this) {
      // Check to see if we need to reset the file that we are currently working with
      if (this.currentWriter == null || (this.fileLineCounter > this.linesPerFile)) {
        resetFile();
      }
      String line = lineWriterUtil.convertResultToString(streamsDatum);
      writeInternal(line);
      if ( !line.endsWith(this.hdfsConfiguration.getLineDelimiter())) {
        writeInternal(this.hdfsConfiguration.getLineDelimiter());
      }
      int bytesInLine = line.getBytes().length;

      totalRecordsWritten++;
      totalByteCount += bytesInLine;
      byteCount += bytesInLine;

      if (byteCount > BYTES_BEFORE_FLUSH) {
        try {
          flush();
        } catch (IOException ex) {
          LOGGER.warn("Error flushing to HDFS. Creating a new file and continuing execution.  WARNING: There could be data loss.", ex);
        }
      }
      this.fileLineCounter++;
    }
  }

  private void writeInternal(String line) {
    try {
      this.currentWriter.write(line);
    } catch (IOException ex) {
      LOGGER.warn("Error writing to HDFS.  Attempting to try a new file", ex);
      try {
        resetFile();
        this.currentWriter.write(line);
      } catch (Exception e2) {
        LOGGER.warn("Failed to write even after creating a new file.  Attempting to reconnect", e2);
        try {
          connectToWebHDFS();
          resetFile();
          this.currentWriter.write(line);
        } catch (Exception e3) {
          LOGGER.error("Failed to write to HDFS after reconnecting client. Terminating writer.", e3);
          throw new RuntimeException(e3);
        }
      }

    }
  }

  @Override
  public void flush() throws IOException {
    if (this.currentWriter != null && byteCount > BYTES_BEFORE_FLUSH) {
      this.currentWriter.flush();
      byteCount = 0;
    }
  }

  private synchronized void resetFile() {
    // this will keep it thread safe, so we don't create too many files
    if (this.fileLineCounter == 0 && this.currentWriter != null) {
      return;
    }

    // Create the path for where the file is going to live.
    Path filePath = this.path.suffix("/" + hdfsConfiguration.getWriterFilePrefix() + "-" + new Date().getTime());

    if ( hdfsConfiguration.getCompression().equals(HdfsWriterConfiguration.Compression.GZIP)) {
      filePath = filePath.suffix(".gz");
    } else {
      filePath = filePath.suffix(".tsv");
    }

    try {

      // if there is a current writer, we must close it first.
      if (this.currentWriter != null) {
        flush();
        close();
      }

      this.fileLineCounter = 0;

      // Check to see if a file of the same name exists, if it does, then we are not going to be able to proceed.
      if (client.exists(filePath)) {
        throw new RuntimeException("Unable to create file: " + filePath);
      }

      if ( hdfsConfiguration.getCompression().equals(HdfsWriterConfiguration.Compression.GZIP)) {
        this.currentWriter = new OutputStreamWriter(new GZIPOutputStream(client.create(filePath)));
      } else {
        this.currentWriter = new OutputStreamWriter(client.create(filePath));
      }

      // Add another file to the list of written files.
      writtenFiles.add(filePath);

      LOGGER.info("File Created: {}", filePath);
    } catch (Exception ex) {
      LOGGER.error("COULD NOT CreateFile: {}", filePath);
      LOGGER.error(ex.getMessage());
      throw new RuntimeException(ex);
    }
  }

  @Override
  public synchronized void close() throws IOException {
    if (this.currentWriter != null) {
      this.currentWriter.flush();
      this.currentWriter.close();
      this.currentWriter = null;
      LOGGER.info("File Closed");
    }
  }

  @Override
  public void prepare(Object configurationObject) {
    mapper = StreamsJacksonMapper.getInstance();
    lineWriterUtil = LineReadWriteUtil.getInstance(hdfsConfiguration);
    connectToWebHDFS();
    path = new Path(hdfsConfiguration.getPath() + "/" + hdfsConfiguration.getWriterPath());
  }

  @Override
  public void cleanUp() {
    try {
      flush();
    } catch (IOException ex) {
      LOGGER.error("Error flushing on cleanup", ex);
    }
    try {
      close();
    } catch (IOException ex) {
      LOGGER.error("Error closing on cleanup", ex);
    }
  }

  @Override
  public DatumStatusCounter getDatumStatusCounter() {
    DatumStatusCounter counters = new DatumStatusCounter();
    counters.incrementAttempt(this.totalRecordsWritten);
    counters.incrementStatus(DatumStatus.SUCCESS, this.totalRecordsWritten);
    return counters;
  }
}