LinkResolver.java example

Explorer

incubator-streams-master
- streams-components
  - streams-converters
    - src
      - main
        java
        org
        apache
        streams
        converter
        ActivityConverterProcessor.java
        ActivityConverterUtil.java
        ActivityObjectConverterProcessor.java
        ActivityObjectConverterUtil.java
        BaseDocumentClassifier.java
        BaseObjectNodeActivityConverter.java
        BaseObjectNodeActivityObjectConverter.java
        BaseStringActivityConverter.java
        BaseStringActivityObjectConverter.java
        FieldConstants.java
        HoconConverterProcessor.java
        HoconConverterUtil.java
        LineReadWriteUtil.java
        TypeConverterProcessor.java
        TypeConverterUtil.java
      - test
        java
        org
        apache
        streams
        converter
        test
        BaseActivityConverterProcessorTest.java
        BaseActivityObjectConverterProcessorTest.java
        CustomActivityConverter.java
        CustomActivityConverterProcessorTest.java
        CustomActivityObjectConverter.java
        CustomActivityObjectConverterProcessorTest.java
        CustomDocumentClassifier.java
        CustomType.java
        HoconConverterProcessorTest.java
        HoconConverterTest.java
        NoConfigActivityConverterProcessorTest.java
        TestLineReadWriteUtil.java
        TypeConverterProcessorTest.java
  - streams-filters
    - src
      - main
        java
        org
        apache
        streams
        filters
        VerbDefinitionDropFilter.java
        VerbDefinitionKeepFilter.java
      - test
        java
        org
        apache
        streams
        filters
        test
        VerbDefinitionFilterTest.java
  - streams-http
    - src
      - main
        java
        org
        apache
        streams
        components
        http
        persist
        SimpleHTTPPostPersistWriter.java
        processor
        SimpleHTTPGetProcessor.java
        SimpleHTTPPostProcessor.java
        provider
        SimpleHttpProvider.java
      - test
        java
        SimpleHTTPPostPersistWriterTest.java
- streams-config
  - src
    - main
      - java
        org
        apache
        streams
        config
        ComponentConfigurator.java
        StreamsConfigurator.java
    - test
      - java
        org
        apache
        streams
        config
        test
        ComponentConfiguratorTest.java
        StreamsConfiguratorTest.java
- streams-contrib
  - streams-amazon-aws
    - streams-persist-kinesis
      - src
        main
        java
        org
        apache
        streams
        amazon
        kinesis
        KinesisPersistReader.java
        KinesisPersistReaderTask.java
        KinesisPersistWriter.java
    - streams-persist-s3
      - src
        main
        java
        org
        apache
        streams
        s3
        S3ObjectInputStreamWrapper.java
        S3OutputStreamWrapper.java
        S3PersistReader.java
        S3PersistReaderTask.java
        S3PersistWriter.java
        test
        java
        org
        apache
        streams
        s3
        S3PersistWriterTest.java
  - streams-persist-cassandra
    - src
      - main
        java
        org
        apache
        streams
        cassandra
        CassandraClient.java
        CassandraPersistReader.java
        CassandraPersistWriter.java
      - test
        java
        org
        apache
        streams
        cassandra
        test
        CassandraPersistIT.java
  - streams-persist-console
    - src
      - main
        java
        org
        apache
        streams
        console
        ConsolePersistReader.java
        ConsolePersistWriter.java
        ConsolePersistWriterTask.java
  - streams-persist-elasticsearch
    - src
      - main
        java
        org
        apache
        streams
        elasticsearch
        ElasticsearchClientManager.java
        ElasticsearchMetadataUtil.java
        ElasticsearchPersistDeleter.java
        ElasticsearchPersistReader.java
        ElasticsearchPersistUpdater.java
        ElasticsearchPersistWriter.java
        ElasticsearchQuery.java
        processor
        DatumFromMetadataAsDocumentProcessor.java
        DatumFromMetadataProcessor.java
        DocumentToMetadataProcessor.java
        MetadataFromDocumentProcessor.java
        PercolateTagProcessor.java
      - test
        java
        org
        apache
        streams
        elasticsearch
        processor
        PercolateTagProcessorTest.java
        test
        DatumFromMetadataProcessorIT.java
        ElasticsearchParentChildUpdaterIT.java
        ElasticsearchParentChildWriterIT.java
        ElasticsearchPersistUpdaterIT.java
        ElasticsearchPersistWriterIT.java
        TestDocumentToMetadataProcessor.java
        TestMetadataFromDocumentProcessor.java
  - streams-persist-filebuffer
    - src
      - main
        java
        org
        apache
        streams
        filebuffer
        FileBufferPersistReader.java
        FileBufferPersistWriter.java
      - test
        java
        org
        apache
        streams
        filebuffer
        test
        FileBufferPersistIT.java
        TestFileBufferPersist.java
  - streams-persist-graph
    - src
      - main
        java
        org
        apache
        streams
        graph
        GraphHelper.java
        HttpGraphHelper.java
        QueryGraphHelper.java
  - streams-persist-hbase
    - src
      - main
        java
        org
        apache
        streams
        hbase
        HbasePersistReader.java
        HbasePersistReaderTask.java
        HbasePersistWriter.java
        HbasePersistWriterTask.java
      - test
        java
        org
        apache
        streams
        hbase
        test
        HbasePersistReaderIT.java
        HbasePersistWriterIT.java
  - streams-persist-hdfs
    - src
      - main
        java
        org
        apache
        streams
        hdfs
        HdfsConstants.java
        WebHdfsPersistReader.java
        WebHdfsPersistReaderTask.java
        WebHdfsPersistWriter.java
        WebHdfsPersistWriterTask.java
      - test
        java
        org
        apache
        streams
        hdfs
        test
        HdfsPersistConfigTest.java
        TestHdfsPersist.java
  - streams-persist-kafka
    - src
      - main
        java
        org
        apache
        streams
        kafka
        KafkaPersistReader.java
        KafkaPersistReaderTask.java
        KafkaPersistWriter.java
        KafkaPersistWriterTask.java
  - streams-persist-mongo
    - src
      - main
        java
        org
        apache
        streams
        mongo
        MongoPersistReader.java
        MongoPersistWriter.java
      - test
        java
        org
        apache
        streams
        mongo
        test
        MongoPersistIT.java
  - streams-persist-neo4j
    - src
      - main
        java
        org
        apache
        streams
        neo4j
        CypherQueryGraphHelper.java
        Neo4jPersistUtil.java
        bolt
        Neo4jBoltClient.java
        Neo4jBoltPersistReader.java
        Neo4jBoltPersistWriter.java
        http
        Neo4jHttpClient.java
        Neo4jHttpGraphHelper.java
        Neo4jHttpPersistReader.java
        Neo4jHttpPersistWriter.java
      - test
        java
        org
        apache
        streams
        neo4j
        test
        Neo4jBoltPersistIT.java
        Neo4jHttpPersistIT.java
        TestCypherQueryGraphHelper.java
  - streams-persist-riak
    - src
      - main
        java
        org
        apache
        streams
        riak
        binary
        RiakBinaryClient.java
        RiakBinaryPersistReader.java
        RiakBinaryPersistWriter.java
        http
        RiakHttpClient.java
        RiakHttpPersistReader.java
        RiakHttpPersistWriter.java
      - test
        java
        org
        apache
        streams
        riak
        test
        RiakBinaryPersistIT.java
        RiakHttpPersistIT.java
  - streams-processor-jackson
    - src
      - main
        java
        org
        apache
        streams
        jackson
        CleanAdditionalPropertiesProcessor.java
        JsonUtil.java
        TypeConverterProcessor.java
      - test
        java
        org
        apache
        streams
        jackson
        test
        TypeConverterProcessorTest.java
  - streams-processor-json
    - src
      - main
        java
        org
        apache
        streams
        json
        JsonPathExtractor.java
        JsonPathFilter.java
      - test
        java
        org
        apache
        streams
        json
        test
        JsonPathExtractorTest.java
  - streams-processor-peoplepattern
    - src
      - main
        java
        org
        apache
        streams
        peoplepattern
        AccountTypeProcessor.java
        DemographicsProcessor.java
  - streams-processor-regex
    - src
      - main
        java
        org
        apache
        streams
        regex
        AbstractRegexExtensionExtractor.java
        RegexHashtagExtractor.java
        RegexMentionsExtractor.java
        RegexUrlExtractor.java
        RegexUtils.java
      - test
        java
        org
        apache
        streams
        regex
        RegexHashtagExtractorTest.java
        RegexMentionExtractorTest.java
        RegexUrlExtractorTest.java
        RegexUtilsTest.java
  - streams-processor-urls
    - src
      - main
        java
        org
        apache
        streams
        urls
        LinkResolver.java
        LinkResolverHelperFunctions.java
        LinkResolverProcessor.java
      - test
        java
        org
        apache
        streams
        urls
        LinkHelperFunctionsTest.java
        TestLinkUnwinderProcessor.java
  - streams-provider-facebook
    - src
      - main
        java
        org
        apache
        streams
        facebook
        api
        FacebookPageActivitySerializer.java
        FacebookPostActivitySerializer.java
        feed
        FacebookPublicFeedXmlActivitySerializer.java
        processor
        FacebookTypeConverter.java
        provider
        FacebookDataCollector.java
        FacebookEventClassifier.java
        FacebookFriendFeedProvider.java
        FacebookFriendUpdatesProvider.java
        FacebookProvider.java
        FacebookUserInformationProvider.java
        FacebookUserstreamProvider.java
        page
        FacebookPageDataCollector.java
        FacebookPageProvider.java
        pagefeed
        FacebookPageFeedDataCollector.java
        FacebookPageFeedProvider.java
        serializer
        FacebookActivityUtil.java
        FacebookStreamsPostSerializer.java
      - test
        java
        org
        apache
        streams
        facebook
        test
        FacebookEventClassifierTest.java
        SimplePageTest.java
        TestPage.java
        data
        FacebookActivityActorSerDeIT.java
        FacebookActivitySerDeIT.java
        FacebookPageSerDeIT.java
        FacebookPostSerDeIT.java
        providers
        TestFacebookProvider.java
        page
        FacebookPageProviderIT.java
        pagefeed
        FacebookPageFeedProviderIT.java
  - streams-provider-google
    - google-gmail
      - src
        main
        java
        org
        apache
        streams
        gmail
        provider
        GMailImapProviderTask.java
        GMailMessageActivitySerializer.java
        GMailProvider.java
        test
        java
        org
        apache
        streams
        gmail
        test
        GMailMessageSerDeTest.java
    - google-gplus
      - src
        main
        java
        org
        apache
        streams
        gplus
        processor
        GooglePlusCommentProcessor.java
        GooglePlusTypeConverter.java
        provider
        AbstractGPlusProvider.java
        GPlusActivitySerializer.java
        GPlusDataCollector.java
        GPlusUserActivityCollector.java
        GPlusUserActivityProvider.java
        GPlusUserDataCollector.java
        GPlusUserDataProvider.java
        serializer
        util
        GPlusActivityDeserializer.java
        GPlusCommentDeserializer.java
        GPlusEventClassifier.java
        GPlusPersonDeserializer.java
        GooglePlusActivityUtil.java
        test
        java
        org
        apache
        streams
        gplus
        GooglePlusCommentSerDeIT.java
        GooglePlusPersonSerDeIT.java
        processors
        GooglePlusActivitySerDeIT.java
        GooglePlusTypeConverterIT.java
        providers
        GPlusUserActivityProviderIT.java
        GPlusUserDataProviderIT.java
        TestAbstractGPlusProvider.java
        TestGPlusUserActivityCollector.java
        TestGPlusUserDataCollector.java
        serializer
        util
        GPlusEventClassifierTest.java
  - streams-provider-instagram
    - src
      - main
        java
        org
        apache
        streams
        instagram
        api
        Instagram.java
        InstagramOAuthRequestSigner.java
        InstagramRetryHandler.java
        Media.java
        Users.java
        processor
        InstagramTypeConverter.java
        provider
        InstagramAbstractProvider.java
        InstagramDataCollector.java
        InstagramProviderUtil.java
        recentmedia
        InstagramRecentMediaCollector.java
        InstagramRecentMediaProvider.java
        userinfo
        InstagramUserInfoCollector.java
        InstagramUserInfoProvider.java
        serializer
        InstagramMediaFeedDataConverter.java
        InstagramUserInfoDataConverter.java
        util
        InstagramActivityUtil.java
      - test
        java
        org
        apache
        streams
        instagram
        test
        api
        InstagramOAuthRequestSignerTest.java
        data
        InstagramMediaFeedDataConverterIT.java
        InstagramUserInfoDataConverterIT.java
        providers
        InstagramRecentMediaProviderIT.java
        InstagramUserInfoProviderIT.java
  - streams-provider-moreover
    - src
      - main
        java
        org
        apache
        streams
        moreover
        MoreoverClient.java
        MoreoverJsonActivitySerializer.java
        MoreoverProvider.java
        MoreoverProviderTask.java
        MoreoverResult.java
        MoreoverUtils.java
        MoreoverXmlActivitySerializer.java
      - test
        java
        org
        apache
        streams
        moreover
        MoreoverTestUtil.java
        test
        MoreoverJsonActivitySerializerIT.java
        MoreoverXmlActivitySerializerIT.java
        provider
        MoreoverProviderIT.java
  - streams-provider-rss
    - src
      - main
        java
        org
        apache
        streams
        rss
        processor
        RssTypeConverter.java
        provider
        RssEventProcessor.java
        RssStreamProvider.java
        RssStreamProviderTask.java
        perpetual
        RssFeedScheduler.java
        serializer
        SyndEntryActivitySerializer.java
        SyndEntrySerializer.java
      - test
        java
        org
        apache
        streams
        rss
        provider
        RssStreamProviderTaskIT.java
        RssStreamProviderTest.java
        perpetual
        RssFeedSchedulerTest.java
        test
        RssStreamProviderIT.java
        RssTypeConverterTest.java
        SyndEntryActivitySerializerIT.java
  - streams-provider-sysomos
    - src
      - main
        java
        org
        apache
        streams
        sysomos
        SysomosException.java
        conversion
        SysomosBeatActivityConverter.java
        data
        HeartbeatInfo.java
        SysomosTagDefinition.java
        processor
        SysomosTypeConverter.java
        provider
        AbstractRequestBuilder.java
        ContentRequestBuilder.java
        RequestBuilder.java
        SysomosClient.java
        SysomosHeartbeatStream.java
        SysomosProvider.java
        util
        SysomosUtils.java
      - test
        java
        org
        apache
        streams
        sysomos
        test
        SysomosJsonSerDeIT.java
        SysomosXmlSerDeIT.java
        provider
        SysomosProviderIT.java
  - streams-provider-twitter
    - src
      - main
        java
        org
        apache
        streams
        twitter
        api
        Followers.java
        Friends.java
        Statuses.java
        Twitter.java
        TwitterOAuthRequestInterceptor.java
        TwitterRetryHandler.java
        Users.java
        converter
        StreamsTwitterMapper.java
        TwitterDateTimeFormat.java
        TwitterDocumentClassifier.java
        TwitterFollowActivityConverter.java
        TwitterJsonDeleteActivityConverter.java
        TwitterJsonRetweetActivityConverter.java
        TwitterJsonTweetActivityConverter.java
        TwitterJsonUserActivityConverter.java
        TwitterJsonUserActivityObjectConverter.java
        TwitterJsonUserstreameventActivityConverter.java
        util
        TwitterActivityUtil.java
        processor
        FetchAndReplaceTwitterProcessor.java
        TwitterTypeConverter.java
        TwitterUrlApiProcessor.java
        provider
        TwitterFollowersIdsProviderTask.java
        TwitterFollowersListProviderTask.java
        TwitterFollowingProvider.java
        TwitterFriendsIdsProviderTask.java
        TwitterFriendsListProviderTask.java
        TwitterProviderUtil.java
        TwitterStreamHelper.java
        TwitterStreamProvider.java
        TwitterTimelineProvider.java
        TwitterTimelineProviderTask.java
        TwitterUserInformationProvider.java
        TwitterUserInformationProviderTask.java
      - test
        java
        org
        apache
        streams
        twitter
        test
        api
        TwitterOAuthRequestInterceptorTest.java
        data
        TwitterObjectMapperIT.java
        providers
        TwitterFollowingProviderIT.java
        TwitterStreamProviderIT.java
        TwitterTimelineProviderIT.java
        TwitterUserInformationProviderIT.java
        utils
        TwitterActivityConvertersTest.java
        TwitterActivityObjectsConvertersTest.java
        TwitterDocumentClassifierTest.java
  - streams-provider-youtube
    - src
      - main
        java
        org
        apache
        streams
        youtube
        processor
        YoutubeTypeConverter.java
        provider
        YoutubeChannelDataCollector.java
        YoutubeChannelProvider.java
        YoutubeDataCollector.java
        YoutubeProvider.java
        YoutubeUserActivityCollector.java
        YoutubeUserActivityProvider.java
        serializer
        YoutubeActivityUtil.java
        YoutubeChannelDeserializer.java
        YoutubeEventClassifier.java
        YoutubeVideoDeserializer.java
      - test
        java
        org
        apache
        streams
        youtube
        processor
        YoutubeTypeConverterTest.java
        provider
        YoutubeChannelDataCollectorTest.java
        YoutubeProviderTest.java
        YoutubeUserActivityCollectorTest.java
        serializer
        YoutubeEventClassifierTest.java
        YoutubeVideoSerDeTest.java
        test
        providers
        YoutubeChannelProviderIT.java
        YoutubeUserActivityProviderIT.java
- streams-core
  - src
    - main
      - java
        org
        apache
        streams
        core
        DatumStatus.java
        DatumStatusCountable.java
        DatumStatusCounter.java
        StreamBuilder.java
        StreamsDatum.java
        StreamsOperation.java
        StreamsPersistReader.java
        StreamsPersistWriter.java
        StreamsProcessor.java
        StreamsProvider.java
        StreamsResultSet.java
        util
        DatumUtils.java
- streams-monitoring
  - src
    - main
      - java
        org
        apache
        streams
        jackson
        DatumStatusCounterDeserializer.java
        MemoryUsageDeserializer.java
        StreamsTaskCounterDeserializer.java
        ThroughputQueueDeserializer.java
        monitoring
        persist
        MessagePersister.java
        impl
        BroadcastMessagePersister.java
        LogstashUdpMessagePersister.java
        Slf4jMessagePersister.java
        tasks
        BroadcastMonitorThread.java
    - test
      - java
        org
        apache
        streams
        jackson
        MemoryUsageDeserializerTest.java
        monitoring
        persist
        impl
        BroadcastMessagePersisterTest.java
        LogstashUdpMessagePersisterTest.java
        tasks
        BroadcastMonitorThreadTest.java
- streams-plugins
  - streams-plugin-cassandra
    - src
      - main
        java
        org
        apache
        streams
        plugins
        cassandra
        StreamsCassandraGenerationConfig.java
        StreamsCassandraResourceGenerator.java
        StreamsCassandraResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        cassandra
        test
        StreamsCassandraResourceGeneratorCLITest.java
        StreamsCassandraResourceGeneratorMojoIT.java
        StreamsCassandraResourceGeneratorTest.java
  - streams-plugin-elasticsearch
    - src
      - main
        java
        org
        apache
        streams
        plugins
        elasticsearch
        StreamsElasticsearchGenerationConfig.java
        StreamsElasticsearchResourceGenerator.java
        StreamsElasticsearchResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        elasticsearch
        test
        StreamsElasticsearchResourceGeneratorCLITest.java
        StreamsElasticsearchResourceGeneratorMojoIT.java
        StreamsElasticsearchResourceGeneratorTest.java
  - streams-plugin-hbase
    - src
      - main
        java
        org
        apache
        streams
        plugins
        hbase
        StreamsHbaseGenerationConfig.java
        StreamsHbaseResourceGenerator.java
        StreamsHbaseResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsHbaseResourceGeneratorCLITest.java
        StreamsHbaseResourceGeneratorMojoIT.java
        StreamsHbaseResourceGeneratorTest.java
  - streams-plugin-hive
    - src
      - main
        java
        org
        apache
        streams
        plugins
        hive
        StreamsHiveGenerationConfig.java
        StreamsHiveResourceGenerator.java
        StreamsHiveResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsHiveResourceGeneratorCLITest.java
        StreamsHiveResourceGeneratorMojoIT.java
        StreamsHiveResourceGeneratorTest.java
  - streams-plugin-pig
    - src
      - main
        java
        org
        apache
        streams
        plugins
        pig
        StreamsPigGenerationConfig.java
        StreamsPigResourceGenerator.java
        StreamsPigResourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        pig
        test
        StreamsPigResourceGeneratorCLITest.java
        StreamsPigResourceGeneratorMojoIT.java
        StreamsPigResourceGeneratorTest.java
  - streams-plugin-pojo
    - src
      - main
        java
        org
        apache
        streams
        plugins
        StreamsPojoGenerationConfig.java
        StreamsPojoSourceGenerator.java
        StreamsPojoSourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsPojoSourceGeneratorCLITest.java
        StreamsPojoSourceGeneratorMojoIT.java
        StreamsPojoSourceGeneratorTest.java
  - streams-plugin-scala
    - src
      - main
        java
        org
        apache
        streams
        plugins
        StreamsScalaGenerationConfig.java
        StreamsScalaSourceGenerator.java
        StreamsScalaSourceGeneratorMojo.java
      - test
        java
        org
        apache
        streams
        plugins
        test
        StreamsScalaSourceGeneratorCLITest.java
        StreamsScalaSourceGeneratorMojoIT.java
        StreamsScalaSourceGeneratorTest.java
- streams-pojo
  - src
    - main
      - java
        org
        apache
        streams
        data
        ActivityConverter.java
        ActivityObjectConverter.java
        ActivitySerializer.java
        DocumentClassifier.java
        util
        ActivityUtil.java
        RFC3339Utils.java
        exceptions
        ActivityConversionException.java
        ActivitySerializerException.java
        jackson
        StreamsDateTimeDeserializer.java
        StreamsDateTimeFormat.java
        StreamsDateTimeSerializer.java
        StreamsJacksonMapper.java
        StreamsJacksonModule.java
        StreamsPeriodDeserializer.java
        StreamsPeriodSerializer.java
    - test
      - java
        org
        apache
        streams
        pojo
        test
        ActivitySerDeTest.java
        CustomDateTimeFormatTest.java
        DateTimeSerDeTest.java
        RFC3339UtilsTest.java
- streams-pojo-extensions
  - src
    - main
      - java
        org
        apache
        streams
        pojo
        extensions
        ExtensionUtil.java
    - test
      - java
        org
        apache
        streams
        pojo
        extensions
        test
        ExtensionUtilTest.java
- streams-runtimes
  - streams-runtime-dropwizard
    - src
      - main
        java
        org
        apache
        streams
        dropwizard
        GenericWebhookResource.java
        StreamDropwizardBuilder.java
        StreamsApplication.java
        StreamsDropwizardModule.java
      - test
        java
        org
        apache
        streams
        dropwizard
        test
        GenericWebhookResourceTest.java
        StreamsApplicationIT.java
        TestStreamsApplication.java
  - streams-runtime-local
    - src
      - main
        java
        org
        apache
        streams
        local
        builders
        InvalidStreamException.java
        LocalStreamBuilder.java
        StreamComponent.java
        counters
        DatumStatusCounter.java
        DatumStatusCounterMXBean.java
        StreamsTaskCounter.java
        StreamsTaskCounterMXBean.java
        executors
        ShutdownStreamOnUnhandleThrowableThreadPoolExecutor.java
        queues
        ThroughputQueue.java
        ThroughputQueueMXBean.java
        tasks
        BaseStreamsTask.java
        LocalStreamProcessMonitorThread.java
        StatusCounterMonitorRunnable.java
        StatusCounterMonitorThread.java
        StreamsMergeTask.java
        StreamsPersistWriterTask.java
        StreamsProcessorTask.java
        StreamsProviderTask.java
        StreamsTask.java
      - test
        java
        org
        apache
        streams
        local
        builders
        LocalStreamBuilderTest.java
        ToyLocalBuilderExample.java
        counters
        DatumStatusCounterTest.java
        StreamsTaskCounterTest.java
        executors
        ShutdownStreamOnUnhandledThrowableThreadPoolExecutorTest.java
        queues
        ThroughputQueueMultiThreadTest.java
        ThroughputQueueSingleThreadTest.java
        tasks
        BasicTasksTest.java
        StreamsProviderTaskTest.java
        test
        processors
        DoNothingProcessor.java
        PassthroughDatumCounterProcessor.java
        SlowProcessor.java
        providers
        EmptyResultSetProvider.java
        NumericMessageProvider.java
        writer
        DatumCounterWriter.java
        DoNothingWriter.java
        SystemOutWriter.java
        test
        component
        ExpectedDatumsPersistWriter.java
        FileReaderProvider.java
        StreamsDatumConverter.java
        StringToDocumentConverter.java
        tests
        TestComponentsLocalStream.java
        TestExpectedDatumsPersitWriter.java
        TestFileReaderProvider.java
- streams-schemas
  - streams-schema-activitystreams
    - src
      - test
        java
        org
        w3c
        activitystreams
        test
        SchemaValidationTest.java
  - streams-schema-activitystreams2
    - src
      - test
        java
        org
        w3c
        activitystreams
        test
        ExamplesSerDeIT.java
- streams-util
  - src
    - main
      - java
        org
        apache
        streams
        util
        ComponentUtils.java
        GuidUtils.java
        PropertyUtil.java
        SerializationUtil.java
        api
        requests
        backoff
        AbstractBackOffStrategy.java
        BackOffException.java
        BackOffStrategy.java
        impl
        ConstantTimeBackOffStrategy.java
        ExponentialBackOffStrategy.java
        LinearTimeBackOffStrategy.java
        oauth
        tokens
        AbstractOauthToken.java
        tokenmanager
        SimpleTokenManager.java
        impl
        BasicTokenManager.java
        schema
        FieldType.java
        FieldUtil.java
        FileUtil.java
        GenerationConfig.java
        Schema.java
        SchemaStore.java
        SchemaStoreImpl.java
        SchemaUtil.java
        UriUtil.java
    - test
      - java
        org
        apache
        streams
        util
        api
        requests
        backoff
        BackOffStrategyTest.java
        ConstantTimeBackOffStrategyTest.java
        ExponentialBackOffStrategyTest.java
        LinearTimeBackOffStrategyTest.java
        files
        StreamsScannerUtil.java
        oauth
        tokens
        tokenmanager
        TestBasicTokenManager.java
        schema
        test
        PropertyUtilTest.java
        SchemaOrderingTest.java
        SchemaStoreTest.java
- streams-verbs
  - src
    - main
      - java
        org
        apache
        streams
        verbs
        ObjectCombinationGenericOrdering.java
        ObjectCombinationSpecificOrdering.java
        VerbDefinitionMatchUtil.java
        VerbDefinitionResolver.java
        VerbDefinitionTemplateUtil.java
    - test
      - java
        org
        apache
        streams
        verbs
        ObjectCombinationGenericOrderingTest.java
        ObjectCombinationSpecificOrderingTest.java
        VerbDefinitionResolverTest.java
        VerbDefinitionTemplateTest.java
        VerbDefinitionTest.java

/*
 * Licensed to the Apache Software Foundation (ASF) under one
 * or more contributor license agreements.  See the NOTICE file
 * distributed with this work for additional information
 * regarding copyright ownership.  The ASF licenses this file
 * to you under the Apache License, Version 2.0 (the
 * "License"); you may not use this file except in compliance
 *
 *   http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing,
 * software distributed under the License is distributed on an
 * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 * KIND, either express or implied.  See the License for the
 * specific language governing permissions and limitations
 * under the License.
 */

package org.apache.streams.urls;

import org.apache.commons.codec.net.URLCodec;
import org.apache.commons.lang3.StringUtils;
import org.apache.commons.validator.routines.UrlValidator;
import org.joda.time.DateTime;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;
import java.io.Serializable;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.Collection;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Objects;

public class LinkResolver implements Serializable {

    /**
     * References:
     * Some helpful references to demonstrate the different types of browser re-directs that
     * can happen. If you notice a redirect that was not followed to the proper place please
     * submit a bug at :
     * https://issues.apache.org/jira/browse/STREAMS
     * <p/>
     * Purpose              URL
     * -------------        ----------------------------------------------------------------
     * [Status Codes]       http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html
     * [Test Cases]         http://greenbytes.de/tech/tc/httpredirects/
     * [t.co behavior]      https://dev.twitter.com/docs/tco-redirection-behavior
     */


    private final static Logger LOGGER = LoggerFactory.getLogger(LinkResolver.class);

    private static final int MAX_ALLOWED_REDIRECTS = 30;                // We will only chase the link to it's final destination a max of 30 times.
    private static final int DEFAULT_HTTP_TIMEOUT = 10000;              // We will only wait a max of 10,000 milliseconds (10 seconds) for any HTTP response
    private static final String LOCATION_IDENTIFIER = "location";
    private static final String SET_COOKIE_IDENTIFIER = "set-cookie";

    // if Bots are not 'ok' this is the spoof settings that we'll use
    private static final Map<String, String> SPOOF_HTTP_HEADERS = new HashMap<String, String>() {{
        put("Connection", "Keep-Alive");
        put("User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.48 Safari/537.36");
        put("Accept-Language", "en-US,en;q=0.8,zh;q=0.6");
    }};

    // These are the known domains that are 'bot' friendly.
    private static final Collection<String> BOTS_ARE_OK = new ArrayList<String>() {{
        add("t.co");
    }};

    // To help canonicalize the URL, these parts are 'known' to be 'ok' to remove
    private static final Collection<String> URL_TRACKING_TO_REMOVE = new ArrayList<String>() {{
        /*
         * Google uses parameters in the URL string to track referrers
         * on their Google Analytics and promotions. These are the
         * identified URL patterns.
         *
         * URL:
         * https://support.google.com/analytics/answer/1033867?hl=en
         *****************************************************************/

        // Required. Use utm_source to identify a search engine, newsletter name, or other source.
        add("([\\?&])utm_source(=)[^&?]*");

        // Required. Use utm_medium to identify a medium such as email or cost-per- click.
        add("([\\?&])utm_medium(=)[^&?]*");

        // Used for paid search. Use utm_term to note the keywords for this ad.
        add("([\\?&])utm_term(=)[^&?]*");

        // Used for A/B testing and content-targeted ads. Use utm_content to differentiate ads or links that point to the same
        add("([\\?&])utm_content(=)[^&?]*");

        // Used for keyword analysis. Use utm_campaign to identify a specific product promotion or strategic campaign.
        add("([\\?&])utm_campaign(=)[^&?]*");
    }};


    // This element holds all the information about all the re-directs that have taken place
    // and the steps and HTTP codes that occurred inside of each step.
    private final LinkDetails linkDetails;
    private Collection<String> domainsSensitiveTo = new HashSet<>();

    /**
     * Get the link details
     *
     * @return Detailed log of every redirection that took place with the browser along with it it's ultimate status code.
     */
    public LinkDetails getLinkDetails() {
        return linkDetails;
    }

    /**
     * Raw string input of the URL. If the URL is invalid, the response code that is returned will indicate such.
     *
     * @param originalURL The URL you wish to unwind represented as a string.
     */
    public LinkResolver(String originalURL) {
        linkDetails = new LinkDetails();
        linkDetails.setOriginalURL(originalURL);
    }

    public void run() {

        Objects.requireNonNull(linkDetails.getOriginalURL());

        linkDetails.setStartTime(DateTime.now());

        // we are going to try three times just in case we catch a slow server or one that needs
        // to be warmed up. This tends to happen many times with smaller private servers
        for (int i = 0; (i < 3) && linkDetails.getFinalURL() == null; i++)
            if (linkDetails.getLinkStatus() != LinkDetails.LinkStatus.SUCCESS)
                unwindLink(linkDetails.getOriginalURL());

        // because this is a POJO we need to make sure that we set this to false if it was never re-directed
        if(this.linkDetails.getRedirectCount() == 0 || this.linkDetails.getRedirected() == null)
            this.linkDetails.setRedirected(false);

        linkDetails.setFinalURL(cleanURL(linkDetails.getFinalURL()));
        if(StringUtils.isNotBlank(linkDetails.getFinalURL()))
            linkDetails.setNormalizedURL(normalizeURL(linkDetails.getFinalURL()));
        if(StringUtils.isNotBlank(linkDetails.getNormalizedURL()))
            linkDetails.setUrlParts(tokenizeURL(linkDetails.getNormalizedURL()));

        this.updateTookInMillis();
    }

    protected void updateTookInMillis() {
        Objects.requireNonNull(linkDetails.getStartTime());
        linkDetails.setTookInMills(DateTime.now().minus(linkDetails.getStartTime().getMillis()).getMillis());
    }

    public void unwindLink(String url) {
        Objects.requireNonNull(linkDetails);
        Objects.requireNonNull(url);

        // Check url validity
        UrlValidator urlValidator = new UrlValidator();
        if (!urlValidator.isValid(url)) {
            linkDetails.setLinkStatus(LinkDetails.LinkStatus.MALFORMED_URL);
            return;
        }

        // Check to see if they wound up in a redirect loop,
        // IE: 'A' redirects to 'B', then 'B' redirects to 'A'
        if ((linkDetails.getRedirectCount() != null && linkDetails.getRedirectCount() > 0 &&
                (linkDetails.getOriginalURL().equals(url) || linkDetails.getRedirects().contains(url)))
                || (linkDetails.getRedirectCount() != null && linkDetails.getRedirectCount() > MAX_ALLOWED_REDIRECTS)) {
            linkDetails.setLinkStatus(LinkDetails.LinkStatus.LOOP);
            return;
        }

        if (!linkDetails.getOriginalURL().equals(url))
            linkDetails.getRedirects().add(url);

        HttpURLConnection connection = null;

        // Store where the redirected link will go (if there is one)
        String reDirectedLink = null;

        try {
            // Turn the string into a URL
            URL thisURL = new URL(url);

            // Be sensitive to overloading domains STREAMS-77
            try {
                String host = thisURL.getHost().toLowerCase();
                if(!domainsSensitiveTo.contains(host)) {
                    domainsSensitiveTo.add(host);
                    long domainWait = LinkResolverHelperFunctions.waitTimeForDomain(thisURL.getHost());
                    if (domainWait > 0) {
                        LOGGER.debug("Waiting for domain: {}", domainWait);
                        Thread.sleep(domainWait);
                    }
                }
            } catch(Exception e) {
                // noOp
            }

            connection = (HttpURLConnection) new URL(url).openConnection();

            // now we are going to pretend that we are a browser...
            // This is the way my mac works.
            if (!BOTS_ARE_OK.contains(thisURL.getHost())) {
                connection.addRequestProperty("Host", thisURL.getHost());

                // Bots are not 'ok', so we need to spoof the headers
                for (String k : SPOOF_HTTP_HEADERS.keySet())
                    connection.addRequestProperty(k, SPOOF_HTTP_HEADERS.get(k));

                // the test to seattlemamadoc.com prompted this change.
                // they auto detect bots by checking the referrer chain and the 'user-agent'
                // this broke the t.co test. t.co URLs are EXPLICITLY ok with bots
                // there is a list for URLS that behave this way at the top in BOTS_ARE_OK
                // smashew 2013-13-2013
                if (linkDetails.getRedirectCount() > 0 && BOTS_ARE_OK.contains(thisURL.getHost()))
                    connection.addRequestProperty("Referrer", linkDetails.getOriginalURL());
            }

            connection.setReadTimeout(DEFAULT_HTTP_TIMEOUT);
            connection.setConnectTimeout(DEFAULT_HTTP_TIMEOUT);

            // we want to follow this behavior on our own to ensure that we are getting to the
            // proper place. This is especially true with links that are wounded by special
            // link winders,
            // IE:
            connection.setInstanceFollowRedirects(false);

            if (linkDetails.getCookies() != null)
                for (String cookie : linkDetails.getCookies())
                    connection.addRequestProperty("Cookie", cookie.split(";", 1)[0]);

            connection.connect();

            linkDetails.setFinalResponseCode((long) connection.getResponseCode());

            Map<String, List<String>> headers = createCaseInsensitiveMap(connection.getHeaderFields());
            /*
             * If they want us to set cookies, well, then we will set cookies
             * Example URL:
             * http://nyti.ms/1bCpesx
             *****************************************************************/
            if (headers.containsKey(SET_COOKIE_IDENTIFIER))
                linkDetails.getCookies().add(headers.get(SET_COOKIE_IDENTIFIER).get(0));

            switch (linkDetails.getFinalResponseCode().intValue()) {
                /*
                 * W3C HTTP Response Codes:
                 * http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html
                 */
                case 200: // HTTP OK
                    linkDetails.setFinalURL(connection.getURL().toString());
                    linkDetails.setDomain(new URL(linkDetails.getFinalURL()).getHost());
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.SUCCESS);
                    break;
                case 300: // Multiple choices
                case 301: // URI has been moved permanently
                case 302: // Found
                case 303: // Primarily for a HTTP Post
                case 304: // Not Modified
                case 306: // This status code is unused but in the redirect block.
                case 307: // Temporary re-direct
                    /*
                     * Author:
                     * Smashew
                     *
                     * Date: 2013-11-15
                     *
                     * Note:
                     * It is possible that we have already found our final URL. In
                     * the event that we have found our final URL, we are going to
                     * save this URL as long as it isn't the original URL.
                     * We are still going to ask the browser to re-direct, but in the
                     * case of yet another redirect, seen with the redbull test
                     * this can be followed by a 304, a browser, by W3C standards would
                     * still render the page with it's content, but for us to assert
                     * a success, we are really hoping for a 304 message.
                     *******************************************************************/
                    if (!linkDetails.getOriginalURL().toLowerCase().equals(connection.getURL().toString().toLowerCase()))
                        linkDetails.setFinalURL(connection.getURL().toString());
                    if (!headers.containsKey(LOCATION_IDENTIFIER)) {
                        LOGGER.info("Headers: {}", headers);
                        linkDetails.setLinkStatus(LinkDetails.LinkStatus.REDIRECT_ERROR);
                    } else {
                        linkDetails.setRedirected(Boolean.TRUE);
                        linkDetails.setRedirectCount(linkDetails.getRedirectCount() + 1);
                        reDirectedLink = connection.getHeaderField(LOCATION_IDENTIFIER);
                    }
                    break;
                case 305: // User must use the specified proxy (deprecated by W3C)
                    break;
                case 401: // Unauthorized (nothing we can do here)
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.UNAUTHORIZED);
                    break;
                case 403: // HTTP Forbidden (Nothing we can do here)
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.FORBIDDEN);
                    break;
                case 404: // Not Found (Page is not found, nothing we can do with a 404)
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.NOT_FOUND);
                    break;
                case 500: // Internal Server Error
                case 501: // Not Implemented
                case 502: // Bad Gateway
                case 503: // Service Unavailable
                case 504: // Gateway Timeout
                case 505: // Version not supported
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.HTTP_ERROR_STATUS);
                    break;
                default:
                    LOGGER.info("Unrecognized HTTP Response Code: {}", linkDetails.getFinalResponseCode());
                    linkDetails.setLinkStatus(LinkDetails.LinkStatus.NOT_FOUND);
                    break;
            }
        } catch (MalformedURLException e) {
            // the URL is trash, so, it can't load it.
            linkDetails.setLinkStatus(LinkDetails.LinkStatus.MALFORMED_URL);
        } catch (IOException ex) {
            // there was an issue we are going to set to error.
            linkDetails.setLinkStatus(LinkDetails.LinkStatus.ERROR);
        } catch (Exception ex) {
            // there was an unknown issue we are going to set to exception.
            linkDetails.setLinkStatus(LinkDetails.LinkStatus.EXCEPTION);
        } finally {
            // if the connection is not null, then we need to disconnect to close any underlying resources
            if (connection != null)
                connection.disconnect();
        }

        // If there was a redirection, then we have to keep going
        // Placing this code here should help to satisfy ensuring that the connection object
        // is closed successfully.
        if (reDirectedLink != null)
            unwindLink(reDirectedLink);

    }

    private Map<String, List<String>> createCaseInsensitiveMap(Map<String, List<String>> input) {
        Map<String, List<String>> toReturn = new HashMap<>();
        for (String k : input.keySet())
            if (k != null && input.get(k) != null)
                toReturn.put(k.toLowerCase(), input.get(k));
        return toReturn;
    }

    private String cleanURL(String url) {
        // If they pass us a null URL then we are going to pass that right back to them.
        if (url == null)
            return null;

        // remember how big the URL was at the start
        int startLength = url.length();

        // Iterate through all the known URL parameters of tracking URLs
        for (String pattern : URL_TRACKING_TO_REMOVE)
            url = url.replaceAll(pattern, "");

        // If the URL is smaller than when it came in. Then it had tracking information
        if (url.length() < startLength)
            linkDetails.setTracked(Boolean.TRUE);

        // return our url.
        return url;
    }

    /**
     * Removes the protocol, if it exists, from the front and
     * removes any random encoding characters
     * Extend this to do other url cleaning/pre-processing
     *
     * @param url - The String URL to normalize
     * @return normalizedUrl - The String URL that has no junk or surprises
     */
    public static String normalizeURL(String url) {
        // Decode URL to remove any %20 type stuff
        String normalizedUrl = url;
        try {

            // Replaced URLDecode with commons-codec b/c of failing tests

            URLCodec codec = new URLCodec();

            normalizedUrl = codec.decode(url);

            // Remove the protocol, http:// ftp:// or similar from the front
            if (normalizedUrl.contains("://"))
                normalizedUrl = normalizedUrl.split(":/{2}")[1];

        } catch (NullPointerException npe) {
            System.err.println("NPE Decoding URL. Decoding skipped.");
            npe.printStackTrace();
        } catch (Throwable e) {
            System.err.println("Misc error Decoding URL. Decoding skipped.");
            e.printStackTrace();
        }


        // Room here to do more pre-processing

        return normalizedUrl;
    }

    /**
     * Goal is to get the different parts of the URL path. This can be used
     * in a classifier to help us determine if we are working with
     * <p/>
     * Reference:
     * http://stackoverflow.com/questions/10046178/pattern-matching-for-url-classification
     *
     * @param url - Url to be tokenized
     * @return tokens - A String array of all the tokens
     */
    public static List<String> tokenizeURL(String url) {
        url = normalizeURL(url);
        // I assume that we're going to use the whole URL to find tokens in
        // If you want to just look in the GET parameters, or you want to ignore the domain
        // or you want to use the domain as a token itself, that would have to be
        // processed above the next line, and only the remaining parts split
        List<String> toReturn = new ArrayList<>();

        // Split the URL by forward slashes. Most modern browsers will accept a URL
        // this malformed such as http://www.smashew.com/hello//how////are/you
        // hence the '+' in the regular expression.
        for (String part : url.split("/+"))
            toReturn.add(part.toLowerCase());

        // return our object.
        return toReturn;

        // One could alternatively use a more complex regex to remove more invalid matches
        // but this is subject to your (?:in)?ability to actually write the regex you want

        // These next two get rid of tokens that are too short, also.

        // Destroys anything that's not alphanumeric and things that are
        // alphanumeric but only 1 character long
        //String[] tokens = url.split("(?:[\\W_]+\\w)*[\\W_]+");

        // Destroys anything that's not alphanumeric and things that are
        // alphanumeric but only 1 or 2 characters long
        //String[] tokens = url.split("(?:[\\W_]+\\w{1,2})*[\\W_]+");
    }


}