RegexHbaseEventSerializer.java example

Explorer

flume-master
- flume-trunk
  - flume-ng-auth
    - src
      - main
        java
        org
        apache
        flume
        api
        SecureRpcClientFactory.java
        SecureThriftRpcClient.java
        auth
        FlumeAuthenticationUtil.java
        FlumeAuthenticator.java
        KerberosAuthenticator.java
        KerberosUser.java
        PrivilegedExecutor.java
        SecurityException.java
        SimpleAuthenticator.java
        UGIExecutor.java
      - test
        java
        org
        apache
        flume
        auth
        TestFlumeAuthenticator.java
  - flume-ng-channels
    - flume-file-channel
      - src
        main
        java
        org
        apache
        flume
        channel
        file
        BadCheckpointException.java
        CheckpointRebuilder.java
        Commit.java
        CorruptEventException.java
        EventQueueBackingStore.java
        EventQueueBackingStoreFactory.java
        EventQueueBackingStoreFile.java
        EventQueueBackingStoreFileV2.java
        EventQueueBackingStoreFileV3.java
        EventUtils.java
        FileChannel.java
        FileChannelConfiguration.java
        FlumeEvent.java
        FlumeEventPointer.java
        FlumeEventQueue.java
        Log.java
        LogFile.java
        LogFileFactory.java
        LogFileRetryableIOException.java
        LogFileV2.java
        LogFileV3.java
        LogRecord.java
        LogUtils.java
        NoopRecordException.java
        Pair.java
        Put.java
        ReplayHandler.java
        Rollback.java
        Serialization.java
        Take.java
        TransactionEventRecord.java
        TransactionIDOracle.java
        Writable.java
        WritableUtils.java
        WriteOrderOracle.java
        encryption
        AESCTRNoPaddingProvider.java
        CipherProvider.java
        CipherProviderFactory.java
        CipherProviderType.java
        DecryptionFailureException.java
        EncryptionConfiguration.java
        JCEFileKeyProvider.java
        KeyProvider.java
        KeyProviderFactory.java
        KeyProviderType.java
        instrumentation
        FileChannelCounter.java
        FileChannelCounterMBean.java
        proto
        ProtosFactory.java
        test
        java
        org
        apache
        flume
        channel
        file
        CountingSinkRunner.java
        CountingSourceRunner.java
        TestCheckpoint.java
        TestCheckpointRebuilder.java
        TestEventQueueBackingStoreFactory.java
        TestEventUtils.java
        TestFileChannel.java
        TestFileChannelBase.java
        TestFileChannelFormatRegression.java
        TestFileChannelRestart.java
        TestFileChannelRollback.java
        TestFlumeEvent.java
        TestFlumeEventPointer.java
        TestFlumeEventQueue.java
        TestIntegration.java
        TestLog.java
        TestLogFile.java
        TestLogRecord.java
        TestTransactionEventRecordV2.java
        TestTransactionEventRecordV3.java
        TestTransactionIDOracle.java
        TestUtils.java
        TestWriteOrderOracle.java
        encryption
        CipherProviderTestSuite.java
        EncryptionTestUtils.java
        TestAESCTRNoPaddingProvider.java
        TestFileChannelEncryption.java
        TestJCEFileKeyProvider.java
    - flume-jdbc-channel
      - src
        main
        java
        org
        apache
        flume
        channel
        jdbc
        ConfigurationConstants.java
        DatabaseType.java
        JdbcChannel.java
        JdbcChannelException.java
        JdbcChannelProvider.java
        JdbcChannelProviderFactory.java
        TransactionIsolation.java
        impl
        DerbySchemaHandler.java
        JdbcChannelProviderImpl.java
        JdbcTransactionFactory.java
        JdbcTransactionImpl.java
        MySQLSchemaHandler.java
        PersistableEvent.java
        SchemaHandler.java
        SchemaHandlerFactory.java
        test
        java
        org
        apache
        flume
        channel
        jdbc
        BaseJdbcChannelProviderTest.java
        MockEvent.java
        MockEventUtils.java
        TestDatabaseTypeEnum.java
        TestDerbySchemaHandlerQueries.java
        TestJdbcChannelProvider.java
        TestJdbcChannelProviderNoFK.java
        TestPersistentEvent.java
        TestTransactionIsolationLevelEnum.java
    - flume-kafka-channel
      - src
        main
        java
        org
        apache
        flume
        channel
        kafka
        KafkaChannel.java
        KafkaChannelConfiguration.java
        test
        java
        org
        apache
        flume
        channel
        kafka
        TestKafkaChannel.java
    - flume-spillable-memory-channel
      - src
        main
        java
        org
        apache
        flume
        channel
        SpillableMemoryChannel.java
        test
        java
        org
        apache
        flume
        channel
        TestSpillableMemoryChannel.java
  - flume-ng-clients
    - flume-ng-log4jappender
      - src
        main
        java
        org
        apache
        flume
        clients
        log4jappender
        LoadBalancingLog4jAppender.java
        Log4jAppender.java
        Log4jAvroHeaders.java
        test
        java
        org
        apache
        flume
        clients
        log4jappender
        TestLoadBalancingLog4jAppender.java
        TestLog4jAppender.java
        TestLog4jAppenderWithAvro.java
  - flume-ng-configuration
    - src
      - main
        java
        org
        apache
        flume
        Context.java
        conf
        BasicConfigurationConstants.java
        ComponentConfiguration.java
        ComponentConfigurationFactory.java
        ConfigurationException.java
        FlumeConfiguration.java
        FlumeConfigurationError.java
        FlumeConfigurationErrorType.java
        LogPrivacyUtil.java
        channel
        ChannelConfiguration.java
        ChannelSelectorConfiguration.java
        ChannelSelectorType.java
        ChannelType.java
        sink
        SinkConfiguration.java
        SinkGroupConfiguration.java
        SinkProcessorConfiguration.java
        SinkProcessorType.java
        SinkType.java
        source
        SourceConfiguration.java
        SourceType.java
      - test
        java
        org
        apache
        flume
        conf
        TestFlumeConfiguration.java
        source
        TestSourceConfiguration.java
  - flume-ng-core
    - src
      - main
        java
        org
        apache
        flume
        Channel.java
        ChannelException.java
        ChannelFactory.java
        ChannelFullException.java
        ChannelSelector.java
        Clock.java
        Constants.java
        CounterGroup.java
        EventDrivenSource.java
        NamedComponent.java
        PollableSource.java
        Sink.java
        SinkFactory.java
        SinkProcessor.java
        SinkRunner.java
        Source.java
        SourceFactory.java
        SourceRunner.java
        SystemClock.java
        Transaction.java
        VersionAnnotation.java
        annotations
        Disposable.java
        InterfaceAudience.java
        InterfaceStability.java
        Recyclable.java
        channel
        AbstractChannel.java
        AbstractChannelSelector.java
        BasicChannelSemantics.java
        BasicTransactionSemantics.java
        ChannelProcessor.java
        ChannelSelectorFactory.java
        ChannelUtils.java
        DefaultChannelFactory.java
        MemoryChannel.java
        MultiplexingChannelSelector.java
        PseudoTxnMemoryChannel.java
        ReplicatingChannelSelector.java
        client
        avro
        AvroCLIClient.java
        EventReader.java
        ReliableEventReader.java
        ReliableSpoolingFileEventReader.java
        SimpleTextLineEventReader.java
        conf
        Configurable.java
        ConfigurableComponent.java
        Configurables.java
        event
        EventHelper.java
        formatter
        output
        BucketPath.java
        DefaultPathManager.java
        EventFormatter.java
        PathManager.java
        PathManagerFactory.java
        PathManagerType.java
        RollTimePathManager.java
        TextDelimitedOutputFormatter.java
        instrumentation
        ChannelCounter.java
        ChannelCounterMBean.java
        ChannelProcessorCounter.java
        GangliaServer.java
        MonitorService.java
        MonitoredCounterGroup.java
        MonitoringType.java
        SinkCounter.java
        SinkCounterMBean.java
        SinkProcessorCounter.java
        SourceCounter.java
        SourceCounterMBean.java
        http
        HTTPMetricsServer.java
        kafka
        KafkaChannelCounter.java
        KafkaChannelCounterMBean.java
        KafkaSinkCounter.java
        KafkaSinkCounterMBean.java
        KafkaSourceCounter.java
        KafkaSourceCounterMBean.java
        util
        JMXPollUtil.java
        interceptor
        HostInterceptor.java
        Interceptor.java
        InterceptorBuilderFactory.java
        InterceptorChain.java
        InterceptorType.java
        RegexExtractorInterceptor.java
        RegexExtractorInterceptorMillisSerializer.java
        RegexExtractorInterceptorPassThroughSerializer.java
        RegexExtractorInterceptorSerializer.java
        RegexFilteringInterceptor.java
        RemoveHeaderInterceptor.java
        SearchAndReplaceInterceptor.java
        StaticInterceptor.java
        TimestampInterceptor.java
        lifecycle
        LifecycleAware.java
        LifecycleController.java
        LifecycleException.java
        LifecycleState.java
        LifecycleSupervisor.java
        serialization
        AbstractAvroEventSerializer.java
        AvroEventDeserializer.java
        AvroEventSerializerConfigurationConstants.java
        BodyTextEventSerializer.java
        DecodeErrorPolicy.java
        DurablePositionTracker.java
        EventDeserializer.java
        EventDeserializerFactory.java
        EventDeserializerType.java
        EventSerDe.java
        EventSerializer.java
        EventSerializerFactory.java
        EventSerializerType.java
        FlumeEventAvroEventSerializer.java
        HeaderAndBodyTextEventSerializer.java
        LengthMeasurable.java
        LineDeserializer.java
        PositionTracker.java
        RemoteMarkable.java
        Resettable.java
        ResettableFileInputStream.java
        ResettableInputStream.java
        Seekable.java
        sink
        AbstractRpcSink.java
        AbstractSink.java
        AbstractSinkProcessor.java
        AbstractSinkSelector.java
        AvroSink.java
        DefaultSinkFactory.java
        DefaultSinkProcessor.java
        FailoverSinkProcessor.java
        LoadBalancingSinkProcessor.java
        LoggerSink.java
        NullSink.java
        RollingFileSink.java
        SinkGroup.java
        SinkProcessorFactory.java
        ThriftSink.java
        source
        AbstractEventDrivenSource.java
        AbstractPollableSource.java
        AbstractSource.java
        AvroSource.java
        BasicSourceSemantics.java
        DefaultSourceFactory.java
        EventDrivenSourceRunner.java
        ExecSource.java
        ExecSourceConfigurationConstants.java
        MultiportSyslogTCPSource.java
        NetcatSource.java
        NetcatSourceConfigurationConstants.java
        PollableSourceConstants.java
        PollableSourceRunner.java
        SequenceGeneratorSource.java
        SpoolDirectorySource.java
        SpoolDirectorySourceConfigurationConstants.java
        StressSource.java
        SyslogParser.java
        SyslogSourceConfigurationConstants.java
        SyslogTcpSource.java
        SyslogUDPSource.java
        SyslogUtils.java
        ThriftSource.java
        http
        BLOBHandler.java
        HTTPBadRequestException.java
        HTTPSource.java
        HTTPSourceConfigurationConstants.java
        HTTPSourceHandler.java
        JSONHandler.java
        tools
        DirectMemoryUtils.java
        GetJavaProperty.java
        HTTPServerConstraintUtil.java
        PlatformDetect.java
        TimestampRoundDownUtil.java
        VersionInfo.java
      - test
        java
        org
        apache
        flume
        TestContext.java
        TestCounterGroup.java
        channel
        AbstractBasicChannelSemanticsTest.java
        MockChannel.java
        MockEvent.java
        TestBasicChannelSemantics.java
        TestChannelProcessor.java
        TestChannelUtils.java
        TestMemoryChannel.java
        TestMemoryChannelConcurrency.java
        TestMemoryChannelTransaction.java
        TestMultiplexingChannelSelector.java
        TestReplicatingChannelSelector.java
        client
        avro
        TestBufferedLineReader.java
        TestReliableSpoolingFileEventReader.java
        TestSpoolingFileLineReader.java
        event
        TestEventHelper.java
        formatter
        output
        TestBucketPath.java
        instrumentation
        TestMonitoredCounterGroup.java
        http
        TestHTTPMetricsServer.java
        kafka
        KafkaSourceCounterTest.java
        util
        JMXTestUtils.java
        TestJMXPollUtil.java
        interceptor
        CensoringInterceptor.java
        RemoveHeaderInterceptorTest.java
        TestCensoringInterceptor.java
        TestHostInterceptor.java
        TestRegexExtractorInterceptor.java
        TestRegexExtractorInterceptorMillisSerializer.java
        TestRegexExtractorInterceptorPassThroughSerializer.java
        TestRegexFilteringInterceptor.java
        TestSearchAndReplaceInterceptor.java
        TestStaticInterceptor.java
        TestTimestampInterceptor.java
        lifecycle
        TestLifecycleController.java
        TestLifecycleSupervisor.java
        serialization
        ResettableTestStringInputStream.java
        SyslogAvroEventSerializer.java
        TestAvroEventDeserializer.java
        TestBodyTextEventSerializer.java
        TestDurablePositionTracker.java
        TestFlumeEventAvroEventSerializer.java
        TestHeaderAndBodyTextEventSerializer.java
        TestLineDeserializer.java
        TestResettableFileInputStream.java
        TestSyslogAvroEventSerializer.java
        TransientPositionTracker.java
        sink
        FixedOrderSelector.java
        SinkProcessorFactoryTest.java
        TestAvroSink.java
        TestDefaultSinkFactory.java
        TestFailoverSinkProcessor.java
        TestLoadBalancingSinkProcessor.java
        TestLoggerSink.java
        TestRollingFileSink.java
        TestThriftSink.java
        source
        MockSource.java
        TestAbstractPollableSource.java
        TestAvroSource.java
        TestBasicSourceSemantics.java
        TestDefaultSourceFactory.java
        TestExecSource.java
        TestMultiportSyslogTCPSource.java
        TestNetcatSource.java
        TestPollableSourceRunner.java
        TestSequenceGeneratorSource.java
        TestSpoolDirectorySource.java
        TestStressSource.java
        TestSyslogParser.java
        TestSyslogTcpSource.java
        TestSyslogUdpSource.java
        TestSyslogUtils.java
        TestThriftSource.java
        http
        FlumeHttpServletRequestWrapper.java
        TestBLOBHandler.java
        TestHTTPSource.java
        TestJSONHandler.java
        tools
        TestTimestampRoundDownUtil.java
        TestVersionInfo.java
  - flume-ng-embedded-agent
    - src
      - main
        java
        org
        apache
        flume
        agent
        embedded
        EmbeddedAgent.java
        EmbeddedAgentConfiguration.java
        EmbeddedSource.java
        MaterializedConfigurationProvider.java
        MemoryConfigurationProvider.java
        package-info.java
      - test
        java
        org
        apache
        flume
        agent
        embedded
        TestEmbeddedAgent.java
        TestEmbeddedAgentConfiguration.java
        TestEmbeddedAgentEmbeddedSource.java
        TestEmbeddedAgentState.java
  - flume-ng-legacy-sources
    - flume-avro-source
      - src
        main
        java
        org
        apache
        flume
        source
        avroLegacy
        AvroLegacySource.java
        test
        java
        org
        apache
        flume
        source
        avroLegacy
        TestLegacyAvroSource.java
    - flume-thrift-source
      - src
        main
        java
        com
        cloudera
        flume
        handlers
        thrift
        EventStatus.java
        Priority.java
        ThriftFlumeEvent.java
        ThriftFlumeEventServer.java
        org
        apache
        flume
        source
        thriftLegacy
        ThriftLegacySource.java
        test
        java
        org
        apache
        flume
        source
        thriftLegacy
        TestThriftLegacySource.java
  - flume-ng-node
    - src
      - main
        java
        org
        apache
        flume
        node
        AbstractConfigurationProvider.java
        AbstractZooKeeperConfigurationProvider.java
        Application.java
        ConfigurationProvider.java
        EnvVarResolverProperties.java
        MaterializedConfiguration.java
        PollingPropertiesFileConfigurationProvider.java
        PollingZooKeeperConfigurationProvider.java
        PropertiesFileConfigurationProvider.java
        SimpleMaterializedConfiguration.java
        StaticZooKeeperConfigurationProvider.java
      - test
        java
        org
        apache
        flume
        node
        TestAbstractConfigurationProvider.java
        TestAbstractZooKeeperConfigurationProvider.java
        TestApplication.java
        TestEnvVarResolverProperties.java
        TestPollingPropertiesFileConfigurationProvider.java
        TestPollingZooKeeperConfigurationProvider.java
        TestPropertiesFileConfigurationProvider.java
        TestStaticZooKeeperConfigurationProvider.java
        source
        TestNetcatSource.java
  - flume-ng-sdk
    - src
      - main
        java
        org
        apache
        flume
        Event.java
        EventDeliveryException.java
        FlumeException.java
        api
        AbstractRpcClient.java
        FailoverRpcClient.java
        HostInfo.java
        LoadBalancingRpcClient.java
        NettyAvroRpcClient.java
        RpcClient.java
        RpcClientConfigurationConstants.java
        RpcClientFactory.java
        ThriftRpcClient.java
        event
        EventBuilder.java
        JSONEvent.java
        SimpleEvent.java
        thrift
        Status.java
        ThriftFlumeEvent.java
        ThriftSourceProtocol.java
        util
        OrderSelector.java
        RandomOrderSelector.java
        RoundRobinOrderSelector.java
        SpecificOrderIterator.java
      - test
        java
        org
        apache
        flume
        api
        RpcTestUtils.java
        TestFailoverRpcClient.java
        TestLoadBalancingRpcClient.java
        TestNettyAvroRpcClient.java
        TestRpcClientFactory.java
        TestThriftRpcClient.java
        ThriftTestingSource.java
        event
        TestEventBuilder.java
  - flume-ng-sinks
    - flume-dataset-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        kite
        DatasetSink.java
        DatasetSinkConstants.java
        NonRecoverableEventException.java
        parser
        AvroParser.java
        EntityParser.java
        EntityParserFactory.java
        policy
        FailurePolicy.java
        FailurePolicyFactory.java
        RetryPolicy.java
        SavePolicy.java
        test
        java
        org
        apache
        flume
        sink
        kite
        TestDatasetSink.java
    - flume-hdfs-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        hdfs
        AbstractHDFSWriter.java
        AvroEventSerializer.java
        BucketClosedException.java
        BucketWriter.java
        HDFSCompressedDataStream.java
        HDFSDataStream.java
        HDFSEventSink.java
        HDFSSequenceFile.java
        HDFSTextSerializer.java
        HDFSWritableSerializer.java
        HDFSWriter.java
        HDFSWriterFactory.java
        KerberosUser.java
        SequenceFileSerializer.java
        SequenceFileSerializerFactory.java
        SequenceFileSerializerType.java
        test
        java
        org
        apache
        flume
        sink
        hdfs
        HDFSBadDataStream.java
        HDFSTestSeqWriter.java
        HDFSTestWriterFactory.java
        MockDataStream.java
        MockFileSystem.java
        MockFsDataOutputStream.java
        MockHDFSWriter.java
        MyCustomSerializer.java
        TestAvroEventSerializer.java
        TestBucketWriter.java
        TestHDFSCompressedDataStream.java
        TestHDFSEventSink.java
        TestHDFSEventSinkOnMiniCluster.java
        TestSequenceFileSerializerFactory.java
        TestUseRawLocalFileSystem.java
    - flume-hive-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        hive
        Config.java
        HiveDelimitedTextSerializer.java
        HiveEventSerializer.java
        HiveJsonSerializer.java
        HiveSink.java
        HiveWriter.java
        test
        java
        org
        apache
        flume
        sink
        hive
        TestHiveSink.java
        TestHiveWriter.java
        TestUtil.java
    - flume-http-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        http
        HttpSink.java
        package-info.java
        test
        java
        org
        apache
        flume
        sink
        http
        TestHttpSink.java
        TestHttpSinkIT.java
    - flume-irc-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        irc
        IRCSink.java
        test
        java
        org
        apache
        flume
        sink
        irc
        TestIRCSink.java
    - flume-ng-elasticsearch-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        elasticsearch
        AbstractElasticSearchIndexRequestBuilderFactory.java
        ContentBuilderUtil.java
        ElasticSearchDynamicSerializer.java
        ElasticSearchEventSerializer.java
        ElasticSearchIndexRequestBuilderFactory.java
        ElasticSearchLogStashEventSerializer.java
        ElasticSearchSink.java
        ElasticSearchSinkConstants.java
        EventSerializerIndexRequestBuilderFactory.java
        IndexNameBuilder.java
        SimpleIndexNameBuilder.java
        TimeBasedIndexNameBuilder.java
        TimestampedEvent.java
        client
        ElasticSearchClient.java
        ElasticSearchClientFactory.java
        ElasticSearchRestClient.java
        ElasticSearchTransportClient.java
        NoSuchClientTypeException.java
        RoundRobinList.java
        test
        java
        org
        apache
        flume
        sink
        elasticsearch
        AbstractElasticSearchSinkTest.java
        TestElasticSearchDynamicSerializer.java
        TestElasticSearchIndexRequestBuilderFactory.java
        TestElasticSearchLogStashEventSerializer.java
        TestElasticSearchSink.java
        TestElasticSearchSinkCreation.java
        TimeBasedIndexNameBuilderTest.java
        TimestampedEventTest.java
        client
        RoundRobinListTest.java
        TestElasticSearchClientFactory.java
        TestElasticSearchRestClient.java
        TestElasticSearchTransportClient.java
    - flume-ng-hbase-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        hbase
        AsyncHBaseSink.java
        AsyncHbaseEventSerializer.java
        BatchAware.java
        HBaseSink.java
        HBaseSinkConfigurationConstants.java
        HbaseEventSerializer.java
        RegexHbaseEventSerializer.java
        SimpleAsyncHbaseEventSerializer.java
        SimpleHbaseEventSerializer.java
        SimpleRowKeyGenerator.java
        test
        java
        org
        apache
        flume
        sink
        hbase
        IncrementAsyncHBaseSerializer.java
        IncrementHBaseSerializer.java
        MockSimpleHbaseEventSerializer.java
        TestAsyncHBaseSink.java
        TestHBaseSink.java
        TestHBaseSinkCreation.java
        TestRegexHbaseEventSerializer.java
    - flume-ng-kafka-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        kafka
        KafkaSink.java
        KafkaSinkConstants.java
        test
        java
        org
        apache
        flume
        sink
        kafka
        TestConstants.java
        TestKafkaSink.java
        util
        KafkaConsumer.java
        KafkaLocal.java
        TestUtil.java
        ZooKeeperLocal.java
    - flume-ng-morphline-solr-sink
      - src
        main
        java
        org
        apache
        flume
        sink
        solr
        morphline
        BlobDeserializer.java
        BlobHandler.java
        MorphlineHandler.java
        MorphlineHandlerImpl.java
        MorphlineInterceptor.java
        MorphlineSink.java
        MorphlineSolrSink.java
        UUIDInterceptor.java
        test
        java
        org
        apache
        flume
        sink
        solr
        morphline
        EmbeddedSource.java
        FlumeHttpServletRequestWrapper.java
        ResettableTestStringInputStream.java
        TestBlobDeserializer.java
        TestBlobHandler.java
        TestEnvironment.java
        TestMorphlineInterceptor.java
        TestMorphlineSolrSink.java
        TestUUIDInterceptor.java
  - flume-ng-sources
    - flume-jms-source
      - src
        main
        java
        org
        apache
        flume
        source
        jms
        DefaultJMSMessageConverter.java
        InitialContextFactory.java
        JMSDestinationLocator.java
        JMSDestinationType.java
        JMSMessageConsumer.java
        JMSMessageConsumerFactory.java
        JMSMessageConverter.java
        JMSSource.java
        JMSSourceConfiguration.java
        test
        java
        org
        apache
        flume
        source
        jms
        JMSMessageConsumerTestBase.java
        TestDefaultJMSMessageConverter.java
        TestIntegrationActiveMQ.java
        TestJMSMessageConsumer.java
        TestJMSSource.java
        TestJMSSourceCreation.java
    - flume-kafka-source
      - src
        main
        java
        org
        apache
        flume
        source
        kafka
        KafkaSource.java
        KafkaSourceConstants.java
        test
        java
        org
        apache
        flume
        source
        kafka
        KafkaSourceEmbeddedKafka.java
        KafkaSourceEmbeddedZookeeper.java
        TestKafkaSource.java
    - flume-scribe-source
      - src
        main
        java
        org
        apache
        flume
        source
        scribe
        LogEntry.java
        ResultCode.java
        Scribe.java
        ScribeSource.java
        test
        java
        org
        apache
        flume
        source
        scribe
        TestScribeSource.java
    - flume-taildir-source
      - src
        main
        java
        org
        apache
        flume
        source
        taildir
        ReliableTaildirEventReader.java
        TailFile.java
        TaildirMatcher.java
        TaildirSource.java
        TaildirSourceConfigurationConstants.java
        test
        java
        org
        apache
        flume
        source
        taildir
        TestTaildirEventReader.java
        TestTaildirMatcher.java
        TestTaildirSource.java
    - flume-twitter-source
      - src
        main
        java
        org
        apache
        flume
        source
        twitter
        TwitterSource.java
        test
        java
        org
        apache
        flume
        source
        twitter
        TestTwitterSource.java
  - flume-ng-tests
    - src
      - main
        java
        org
        apache
        flume
        Dummy.java
      - test
        java
        org
        apache
        flume
        test
        agent
        TestFileChannel.java
        TestRpcClient.java
        TestRpcClientCommunicationFailure.java
        TestSpooldirSource.java
        TestSyslogSource.java
        util
        StagedInstall.java
        SyslogAgent.java
  - flume-shared
    - flume-shared-kafka-test
      - src
        main
        java
        org
        apache
        flume
        shared
        kafka
        test
        KafkaPartitionTestUtil.java
        PartitionOption.java
        PartitionTestScenario.java
  - flume-tools
    - src
      - main
        java
        org
        apache
        flume
        tools
        EventValidator.java
        FileChannelIntegrityTool.java
        FlumeTool.java
        FlumeToolType.java
        FlumeToolsMain.java
      - test
        java
        org
        apache
        flume
        tools
        TestFileChannelIntegrityTool.java

/*
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 * with the License.  You may obtain a copy of the License at
 *
 * http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing,
 * software distributed under the License is distributed on an
 * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 * KIND, either express or implied.  See the License for the
 * specific language governing permissions and limitations
 * under the License.
 */
package org.apache.flume.sink.hbase;

import com.google.common.base.Charsets;
import com.google.common.collect.Lists;
import org.apache.commons.lang.RandomStringUtils;
import org.apache.flume.Context;
import org.apache.flume.Event;
import org.apache.flume.FlumeException;
import org.apache.flume.conf.ComponentConfiguration;
import org.apache.hadoop.hbase.client.Increment;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Row;

import java.nio.charset.Charset;
import java.util.Calendar;
import java.util.List;
import java.util.Map;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * An {@link HbaseEventSerializer} which parses columns based on a supplied
 * regular expression and column name list.
 * <p>
 * Note that if the regular expression does not return the correct number of
 * groups for a particular event, or it does not correctly match an event,
 * the event is silently dropped.
 * <p>
 * Row keys for each event consist of a timestamp concatenated with an
 * identifier which enforces uniqueness of keys across flume agents.
 * <p>
 * See static constant variables for configuration options.
 */
public class RegexHbaseEventSerializer implements HbaseEventSerializer {
  // Config vars
  /** Regular expression used to parse groups from event data. */
  public static final String REGEX_CONFIG = "regex";
  public static final String REGEX_DEFAULT = "(.*)";

  /** Whether to ignore case when performing regex matches. */
  public static final String IGNORE_CASE_CONFIG = "regexIgnoreCase";
  public static final boolean INGORE_CASE_DEFAULT = false;

  /** Comma separated list of column names to place matching groups in. */
  public static final String COL_NAME_CONFIG = "colNames";
  public static final String COLUMN_NAME_DEFAULT = "payload";

  /** Index of the row key in matched regex groups */
  public static final String ROW_KEY_INDEX_CONFIG = "rowKeyIndex";

  /** Placeholder in colNames for row key */
  public static final String ROW_KEY_NAME = "ROW_KEY";

  /** Whether to deposit event headers into corresponding column qualifiers */
  public static final String DEPOSIT_HEADERS_CONFIG = "depositHeaders";
  public static final boolean DEPOSIT_HEADERS_DEFAULT = false;

  /** What charset to use when serializing into HBase's byte arrays */
  public static final String CHARSET_CONFIG = "charset";
  public static final String CHARSET_DEFAULT = "UTF-8";

  /* This is a nonce used in HBase row-keys, such that the same row-key
   * never gets written more than once from within this JVM. */
  protected static final AtomicInteger nonce = new AtomicInteger(0);
  protected static String randomKey = RandomStringUtils.randomAlphanumeric(10);

  protected byte[] cf;
  private byte[] payload;
  private List<byte[]> colNames = Lists.newArrayList();
  private Map<String, String> headers;
  private boolean regexIgnoreCase;
  private boolean depositHeaders;
  private Pattern inputPattern;
  private Charset charset;
  private int rowKeyIndex;

  @Override
  public void configure(Context context) {
    String regex = context.getString(REGEX_CONFIG, REGEX_DEFAULT);
    regexIgnoreCase = context.getBoolean(IGNORE_CASE_CONFIG,
        INGORE_CASE_DEFAULT);
    depositHeaders = context.getBoolean(DEPOSIT_HEADERS_CONFIG,
        DEPOSIT_HEADERS_DEFAULT);
    inputPattern = Pattern.compile(regex, Pattern.DOTALL
        + (regexIgnoreCase ? Pattern.CASE_INSENSITIVE : 0));
    charset = Charset.forName(context.getString(CHARSET_CONFIG,
        CHARSET_DEFAULT));

    String colNameStr = context.getString(COL_NAME_CONFIG, COLUMN_NAME_DEFAULT);
    String[] columnNames = colNameStr.split(",");
    for (String s : columnNames) {
      colNames.add(s.getBytes(charset));
    }

    //Rowkey is optional, default is -1
    rowKeyIndex = context.getInteger(ROW_KEY_INDEX_CONFIG, -1);
    //if row key is being used, make sure it is specified correct
    if (rowKeyIndex >= 0) {
      if (rowKeyIndex >= columnNames.length) {
        throw new IllegalArgumentException(ROW_KEY_INDEX_CONFIG + " must be " +
            "less than num columns " + columnNames.length);
      }
      if (!ROW_KEY_NAME.equalsIgnoreCase(columnNames[rowKeyIndex])) {
        throw new IllegalArgumentException("Column at " + rowKeyIndex + " must be "
            + ROW_KEY_NAME + " and is " + columnNames[rowKeyIndex]);
      }
    }
  }

  @Override
  public void configure(ComponentConfiguration conf) {
  }

  @Override
  public void initialize(Event event, byte[] columnFamily) {
    this.headers = event.getHeaders();
    this.payload = event.getBody();
    this.cf = columnFamily;
  }

  /**
   * Returns a row-key with the following format:
   * [time in millis]-[random key]-[nonce]
   */
  protected byte[] getRowKey(Calendar cal) {
    /* NOTE: This key generation strategy has the following properties:
     * 
     * 1) Within a single JVM, the same row key will never be duplicated.
     * 2) Amongst any two JVM's operating at different time periods (according
     *    to their respective clocks), the same row key will never be 
     *    duplicated.
     * 3) Amongst any two JVM's operating concurrently (according to their
     *    respective clocks), the odds of duplicating a row-key are non-zero
     *    but infinitesimal. This would require simultaneous collision in (a) 
     *    the timestamp (b) the respective nonce and (c) the random string.
     *    The string is necessary since (a) and (b) could collide if a fleet
     *    of Flume agents are restarted in tandem.
     *    
     *  Row-key uniqueness is important because conflicting row-keys will cause
     *  data loss. */
    String rowKey = String.format("%s-%s-%s", cal.getTimeInMillis(),
        randomKey, nonce.getAndIncrement());
    return rowKey.getBytes(charset);
  }

  protected byte[] getRowKey() {
    return getRowKey(Calendar.getInstance());
  }

  @Override
  public List<Row> getActions() throws FlumeException {
    List<Row> actions = Lists.newArrayList();
    byte[] rowKey;
    Matcher m = inputPattern.matcher(new String(payload, charset));
    if (!m.matches()) {
      return Lists.newArrayList();
    }

    if (m.groupCount() != colNames.size()) {
      return Lists.newArrayList();
    }

    try {
      if (rowKeyIndex < 0) {
        rowKey = getRowKey();
      } else {
        rowKey = m.group(rowKeyIndex + 1).getBytes(Charsets.UTF_8);
      }
      Put put = new Put(rowKey);

      for (int i = 0; i < colNames.size(); i++) {
        if (i != rowKeyIndex) {
          put.add(cf, colNames.get(i), m.group(i + 1).getBytes(Charsets.UTF_8));
        }
      }
      if (depositHeaders) {
        for (Map.Entry<String, String> entry : headers.entrySet()) {
          put.add(cf, entry.getKey().getBytes(charset), entry.getValue().getBytes(charset));
        }
      }
      actions.add(put);
    } catch (Exception e) {
      throw new FlumeException("Could not get row key!", e);
    }
    return actions;
  }

  @Override
  public List<Increment> getIncrements() {
    return Lists.newArrayList();
  }

  @Override
  public void close() {
  }
}