ApacheURLLister.java example

Explorer

ant-ivy-master
- src
  - example
    - chained-resolvers
      - chainedresolvers-project
        src
        example
        Hello.java
    - configurations
      - jdbc-example
        src
        example
        ConfigurationsExample.java
      - multi-projects
        filter-framework
        src
        filter
        FilterProvider.java
        IFilter.java
        ccimpl
        CCFilter.java
        hmimpl
        HMFilter.java
        test
        filter
        AbstractTestFilter.java
        ccimpl
        CCFilterTest.java
        hmimpl
        HMFilterTest.java
        myapp
        src
        myapp
        Main.java
    - dependence
      - dependee
        src
        standalone
        Main.java
      - depender
        src
        depending
        Main.java
    - dual
      - project
        src
        example
        Hello.java
    - hello-ivy
      - src
        example
        Hello.java
    - multi-project
      - projects
        console
        src
        console
        Main.java
        find
        src
        find
        FindFile.java
        Main.java
        list
        src
        list
        ListFile.java
        Main.java
        size
        src
        size
        FileSize.java
        sizewhere
        src
        sizewhere
        Main.java
        SizeWhere.java
        version
        src
        version
        Version.java
  - java
    - org
      - apache
        ivy
        Ivy.java
        Ivy14.java
        Main.java
        ant
        AddPathTask.java
        AntBuildTrigger.java
        AntCallTrigger.java
        AntMessageLogger.java
        AntWorkspaceResolver.java
        BuildOBRTask.java
        ConvertManifestTask.java
        FixDepsTask.java
        IvyAntSettings.java
        IvyAntVariableContainer.java
        IvyArtifactProperty.java
        IvyArtifactReport.java
        IvyBuildList.java
        IvyBuildNumber.java
        IvyCacheFileset.java
        IvyCachePath.java
        IvyCacheTask.java
        IvyCheck.java
        IvyCleanCache.java
        IvyConfigure.java
        IvyConflict.java
        IvyConvertPom.java
        IvyDeliver.java
        IvyDependency.java
        IvyDependencyArtifact.java
        IvyDependencyConf.java
        IvyDependencyExclude.java
        IvyDependencyInclude.java
        IvyDependencyTree.java
        IvyDependencyUpdateChecker.java
        IvyExclude.java
        IvyExtractFromSources.java
        IvyFindRevision.java
        IvyInfo.java
        IvyInstall.java
        IvyListModules.java
        IvyMakePom.java
        IvyOverride.java
        IvyPostResolveTask.java
        IvyPublish.java
        IvyReport.java
        IvyRepositoryReport.java
        IvyResolve.java
        IvyResources.java
        IvyRetrieve.java
        IvyTask.java
        IvyVar.java
        MapperAdapter.java
        PackageMapping.java
        core
        ExecutionRelativeUrlResolver.java
        IvyContext.java
        IvyPatternHelper.java
        IvyThread.java
        LogOptions.java
        NormalRelativeUrlResolver.java
        RelativeUrlResolver.java
        cache
        ArtifactOrigin.java
        CacheDownloadOptions.java
        CacheMetadataOptions.java
        CacheResourceOptions.java
        CacheUtil.java
        DefaultRepositoryCacheManager.java
        DefaultResolutionCacheManager.java
        DownloadListener.java
        ModuleDescriptorMemoryCache.java
        ModuleDescriptorProvider.java
        ModuleDescriptorWriter.java
        ParserSettingsMonitor.java
        RepositoryCacheManager.java
        ResolutionCacheManager.java
        check
        CheckEngine.java
        CheckEngineSettings.java
        deliver
        DefaultPublishingDRResolver.java
        DeliverEngine.java
        DeliverEngineSettings.java
        DeliverOptions.java
        PublishingDependencyRevisionResolver.java
        event
        EventManager.java
        FilteredIvyListener.java
        IvyEvent.java
        IvyEventFilter.java
        IvyListener.java
        download
        DownloadEvent.java
        EndArtifactDownloadEvent.java
        NeedArtifactEvent.java
        PrepareDownloadEvent.java
        StartArtifactDownloadEvent.java
        publish
        EndArtifactPublishEvent.java
        PublishEvent.java
        StartArtifactPublishEvent.java
        resolve
        EndResolveDependencyEvent.java
        EndResolveEvent.java
        ResolveDependencyEvent.java
        ResolveEvent.java
        StartResolveDependencyEvent.java
        StartResolveEvent.java
        retrieve
        EndRetrieveArtifactEvent.java
        EndRetrieveEvent.java
        RetrieveArtifactEvent.java
        RetrieveEvent.java
        StartRetrieveArtifactEvent.java
        StartRetrieveEvent.java
        install
        InstallEngine.java
        InstallEngineSettings.java
        InstallOptions.java
        module
        descriptor
        AbstractArtifact.java
        AbstractIncludeExcludeRule.java
        Artifact.java
        Configuration.java
        ConfigurationAware.java
        ConfigurationGroup.java
        ConfigurationIntersection.java
        DefaultArtifact.java
        DefaultDependencyArtifactDescriptor.java
        DefaultDependencyDescriptor.java
        DefaultExcludeRule.java
        DefaultExtendsDescriptor.java
        DefaultIncludeRule.java
        DefaultModuleDescriptor.java
        DefaultWorkspaceModuleDescriptor.java
        DependencyArtifactDescriptor.java
        DependencyDescriptor.java
        DependencyDescriptorMediator.java
        ExcludeRule.java
        ExtendsDescriptor.java
        ExtraInfoHolder.java
        IncludeRule.java
        InheritableItem.java
        License.java
        MDArtifact.java
        ModuleDescriptor.java
        OverrideDependencyDescriptorMediator.java
        WorkspaceModuleDescriptor.java
        id
        ArtifactId.java
        ArtifactRevisionId.java
        MatcherLookup.java
        ModuleId.java
        ModuleRevisionId.java
        ModuleRules.java
        status
        Status.java
        StatusManager.java
        pack
        ArchivePacking.java
        OsgiBundlePacking.java
        Pack200Packing.java
        PackagingManager.java
        PackingRegistry.java
        StreamPacking.java
        ZipPacking.java
        publish
        PublishEngine.java
        PublishEngineSettings.java
        PublishOptions.java
        report
        ArtifactDownloadReport.java
        ConfigurationResolveReport.java
        DownloadReport.java
        DownloadStatus.java
        MetadataArtifactDownloadReport.java
        ResolveReport.java
        repository
        RepositoryManagementEngine.java
        RepositoryManagementEngineSettings.java
        resolve
        DownloadOptions.java
        IvyNode.java
        IvyNodeBlacklist.java
        IvyNodeCallers.java
        IvyNodeEviction.java
        IvyNodeUsage.java
        ResolveData.java
        ResolveEngine.java
        ResolveEngineSettings.java
        ResolveOptions.java
        ResolveProcessException.java
        ResolvedModuleRevision.java
        RestartResolveProcess.java
        VisitData.java
        VisitNode.java
        retrieve
        FileNameMapper.java
        RetrieveEngine.java
        RetrieveEngineSettings.java
        RetrieveOptions.java
        RetrieveReport.java
        search
        ModuleEntry.java
        OrganisationEntry.java
        RevisionEntry.java
        SearchEngine.java
        settings
        IvyPattern.java
        IvySettings.java
        IvyVariableContainer.java
        IvyVariableContainerImpl.java
        Validatable.java
        XmlSettingsParser.java
        sort
        CollectionOfModulesToSort.java
        MessageBasedNonMatchingVersionReporter.java
        ModuleDescriptorSorter.java
        ModuleInSort.java
        NonMatchingVersionReporter.java
        SilentNonMatchingVersionReporter.java
        SimpleSortEngineSettings.java
        SortEngine.java
        SortEngineSettings.java
        SortOptions.java
        WarningNonMatchingVersionReporter.java
        osgi
        core
        BundleArtifact.java
        BundleCapability.java
        BundleInfo.java
        BundleInfoAdapter.java
        BundleRequirement.java
        ExecutionEnvironmentProfile.java
        ExecutionEnvironmentProfileProvider.java
        ExportPackage.java
        ManifestHeaderElement.java
        ManifestHeaderValue.java
        ManifestParser.java
        OSGiManifestParser.java
        OsgiLatestStrategy.java
        filter
        AndFilter.java
        CompareFilter.java
        MultiOperatorFilter.java
        NotFilter.java
        OSGiFilter.java
        OSGiFilterParser.java
        OrFilter.java
        UniOperatorFilter.java
        obr
        OBRResolver.java
        xml
        Capability.java
        CapabilityAdapter.java
        CapabilityProperty.java
        OBRXMLParser.java
        OBRXMLWriter.java
        Requirement.java
        RequirementAdapter.java
        UnsupportedFilterException.java
        p2
        P2Artifact.java
        P2ArtifactParser.java
        P2CompositeParser.java
        P2Descriptor.java
        P2MetadataParser.java
        PropertiesParser.java
        XMLInputParser.java
        repo
        AbstractFSManifestIterable.java
        AbstractOSGiResolver.java
        AggregatedOSGiResolver.java
        AggregatedRepoDescriptor.java
        ArtifactReportManifestIterable.java
        BundleCapabilityAndLocation.java
        BundleRepoDescriptor.java
        EditableRepoDescriptor.java
        FSManifestIterable.java
        ManifestAndLocation.java
        ModuleDescriptorWrapper.java
        RelativeURLRepository.java
        RepoDescriptor.java
        RepositoryManifestIterable.java
        ResolverManifestIterable.java
        updatesite
        PluginAdapter.java
        UpdateSiteDescriptor.java
        UpdateSiteLoader.java
        UpdateSiteResolver.java
        xml
        Archive.java
        CategoryDef.java
        EclipseFeature.java
        EclipsePlugin.java
        EclipseUpdateSiteParser.java
        FeatureParser.java
        Require.java
        UpdateSite.java
        UpdateSiteDigestParser.java
        util
        DelegatingHandler.java
        ParseUtil.java
        Version.java
        VersionComparator.java
        VersionRange.java
        ZipUtil.java
        plugins
        IvySettingsAware.java
        circular
        AbstractCircularDependencyStrategy.java
        AbstractLogCircularDependencyStrategy.java
        CircularDependencyException.java
        CircularDependencyHelper.java
        CircularDependencyStrategy.java
        ErrorCircularDependencyStrategy.java
        IgnoreCircularDependencyStrategy.java
        WarnCircularDependencyStrategy.java
        conflict
        AbstractConflictManager.java
        ConflictManager.java
        FixedConflictManager.java
        LatestCompatibleConflictManager.java
        LatestConflictManager.java
        NoConflictManager.java
        RegexpConflictManager.java
        StrictConflictException.java
        StrictConflictManager.java
        latest
        AbstractLatestStrategy.java
        ArtifactInfo.java
        ComparatorLatestStrategy.java
        LatestLexicographicStrategy.java
        LatestRevisionStrategy.java
        LatestStrategy.java
        LatestTimeStrategy.java
        WorkspaceLatestStrategy.java
        lock
        AbstractLockStrategy.java
        ArtifactLockStrategy.java
        CreateFileLockStrategy.java
        DeleteOnExitHook.java
        FileBasedLockStrategy.java
        LockStrategy.java
        NIOFileLockStrategy.java
        NoLockStrategy.java
        matcher
        AbstractPatternMatcher.java
        AnyMatcher.java
        ExactOrRegexpPatternMatcher.java
        ExactPatternMatcher.java
        GlobPatternMatcher.java
        MapMatcher.java
        Matcher.java
        MatcherHelper.java
        NoMatcher.java
        PatternMatcher.java
        RegexpPatternMatcher.java
        namespace
        MRIDRule.java
        MRIDTransformationRule.java
        NameSpaceHelper.java
        Namespace.java
        NamespaceRule.java
        NamespaceTransformer.java
        parser
        AbstractModuleDescriptorParser.java
        ModuleDescriptorParser.java
        ModuleDescriptorParserRegistry.java
        ParserSettings.java
        m2
        DefaultPomDependencyMgt.java
        PomDependencyMgt.java
        PomModuleDescriptorBuilder.java
        PomModuleDescriptorParser.java
        PomModuleDescriptorWriter.java
        PomReader.java
        PomWriterOptions.java
        xml
        UpdateOptions.java
        XmlModuleDescriptorParser.java
        XmlModuleDescriptorUpdater.java
        XmlModuleDescriptorWriter.java
        report
        LogReportOutputter.java
        ReportOutputter.java
        XmlReportOutputter.java
        XmlReportParser.java
        XmlReportWriter.java
        repository
        AbstractRepository.java
        ArtifactResourceResolver.java
        BasicResource.java
        LazyResource.java
        LocalizableResource.java
        Repository.java
        RepositoryCopyProgressListener.java
        Resource.java
        ResourceDownloader.java
        ResourceHelper.java
        TransferEvent.java
        TransferListener.java
        file
        FileRepository.java
        FileResource.java
        jar
        JarRepository.java
        JarResource.java
        sftp
        SFTPRepository.java
        SFTPResource.java
        ssh
        AbstractSshBasedRepository.java
        RemoteScpException.java
        Scp.java
        SshCache.java
        SshRepository.java
        SshResource.java
        url
        ChainedRepository.java
        URLRepository.java
        URLResource.java
        vfs
        VfsRepository.java
        VfsResource.java
        vsftp
        VsftpRepository.java
        VsftpResource.java
        resolver
        AbstractPatternsBasedResolver.java
        AbstractResolver.java
        AbstractSshBasedResolver.java
        AbstractWorkspaceResolver.java
        BasicResolver.java
        BintrayResolver.java
        CacheResolver.java
        ChainResolver.java
        DependencyResolver.java
        DualResolver.java
        FileSystemResolver.java
        IBiblioResolver.java
        IvyRepResolver.java
        JarResolver.java
        MirroredURLResolver.java
        RepositoryResolver.java
        ResolverSettings.java
        SFTPResolver.java
        SshResolver.java
        URLResolver.java
        VfsResolver.java
        VsftpResolver.java
        WorkspaceChainResolver.java
        packager
        BuiltFileResource.java
        PackagerCacheEntry.java
        PackagerResolver.java
        util
        ApacheHttpURLLister.java
        FileURLLister.java
        HasLatestStrategy.java
        MDResolvedResource.java
        ResolvedResource.java
        ResolverHelper.java
        ResourceMDParser.java
        URLLister.java
        signer
        SignatureGenerator.java
        bouncycastle
        OpenPGPSignatureGenerator.java
        trigger
        AbstractTrigger.java
        LogTrigger.java
        Trigger.java
        version
        AbstractVersionMatcher.java
        ChainVersionMatcher.java
        ExactVersionMatcher.java
        LatestVersionMatcher.java
        Match.java
        PatternVersionMatcher.java
        SubVersionMatcher.java
        VersionMatcher.java
        VersionRangeMatcher.java
        tools
        analyser
        DependencyAnalyser.java
        JarJarDependencyAnalyser.java
        JarModule.java
        JarModuleFinder.java
        RepositoryAnalyser.java
        util
        AbstractMessageLogger.java
        Checks.java
        ChecksumHelper.java
        CollectionUtils.java
        ConfigurationUtils.java
        Configurator.java
        ContextualSAXHandler.java
        CopyProgressEvent.java
        CopyProgressListener.java
        Credentials.java
        CredentialsUtil.java
        DateUtil.java
        DefaultMessageLogger.java
        EncrytedProperties.java
        FileResolver.java
        FileUtil.java
        HexEncoder.java
        HostUtil.java
        MemoryUtil.java
        Message.java
        MessageLogger.java
        MessageLoggerEngine.java
        MessageLoggerHelper.java
        PropertiesFile.java
        StringUtils.java
        XMLHelper.java
        cli
        CommandLine.java
        CommandLineParser.java
        Option.java
        OptionBuilder.java
        ParseException.java
        extendable
        DefaultExtendableItem.java
        ExtendableItem.java
        ExtendableItemHelper.java
        UnmodifiableExtendableItem.java
        filter
        AndFilter.java
        ArtifactTypeFilter.java
        Filter.java
        FilterHelper.java
        NoFilter.java
        NotFilter.java
        OrFilter.java
        url
        AbstractURLHandler.java
        ApacheURLLister.java
        BasicURLHandler.java
        CredentialsStore.java
        HttpClientHandler.java
        IvyAuthenticator.java
        URLHandler.java
        URLHandlerDispatcher.java
        URLHandlerRegistry.java
- test
  - custom-classpath
    - org
      - apache
        ivy
        plugins
        resolver
        CustomResolver.java
  - java
    - org
      - apache
        ivy
        IvyTest.java
        MainTest.java
        TestFixture.java
        TestHelper.java
        ant
        AntBuildResolverTest.java
        AntBuildTriggerTest.java
        AntCallTriggerTest.java
        BuildOBRTaskTest.java
        FixDepsTaskTest.java
        IvyAntSettingsBuildFileTest.java
        IvyArtifactPropertyTest.java
        IvyArtifactReportTest.java
        IvyBuildListTest.java
        IvyBuildNumberTest.java
        IvyCacheFilesetTest.java
        IvyCachePathTest.java
        IvyCleanCacheTest.java
        IvyConfigureTest.java
        IvyConvertPomTest.java
        IvyDeliverTest.java
        IvyDependencyTreeTest.java
        IvyDependencyUpdateCheckerTest.java
        IvyFindRevisionTest.java
        IvyInfoRepositoryTest.java
        IvyInfoTest.java
        IvyInstallTest.java
        IvyListModulesTest.java
        IvyPostResolveTaskTest.java
        IvyPublishTest.java
        IvyReportTest.java
        IvyRepositoryReportTest.java
        IvyResolveTest.java
        IvyResourcesTest.java
        IvyRetrieveBuildFileTest.java
        IvyRetrieveTest.java
        IvyTaskTest.java
        IvyVarTest.java
        testutil
        AntTaskTestCase.java
        AntTestListener.java
        core
        NormalRelativeUrlResolverTest.java
        TestPerformance.java
        cache
        DefaultRepositoryCacheManagerTest.java
        ModuleDescriptorMemoryCacheTest.java
        deliver
        DeliverTest.java
        event
        IvyEventFilterTest.java
        install
        InstallTest.java
        module
        descriptor
        DefaultDependencyDescriptorTest.java
        id
        ModuleIdTest.java
        ModuleRevisionIdTest.java
        ModuleRulesTest.java
        publish
        PublishEngineTest.java
        PublishEventsTest.java
        report
        ResolveReportTest.java
        repository
        RepositoryManagementEngineTest.java
        resolve
        ResolveEngineTest.java
        ResolveTest.java
        retrieve
        RetrieveTest.java
        search
        SearchTest.java
        settings
        ConfigureTest.java
        IvySettingsTest.java
        OnlineXmlSettingsParserTest.java
        XmlSettingsParserTest.java
        sort
        SortTest.java
        osgi
        core
        AggregatedOSGiResolverTest.java
        ExecutionEnvironmentProfileLoaderTest.java
        ManifestHeaderTest.java
        ManifestParserTest.java
        OSGiManifestParserTest.java
        OsgiLatestStrategyTest.java
        filter
        OSGiFilterTest.java
        obr
        OBRParserTest.java
        OBRResolverTest.java
        OBRXMLWriterTest.java
        p2
        P2DescriptorTest.java
        repo
        BundleRepoTest.java
        updatesite
        UpdateSiteAndIbiblioResolverTest.java
        UpdateSiteLoaderTest.java
        UpdateSiteResolverTest.java
        util
        ParseUtilTest.java
        VersionRangeTest.java
        VersionTest.java
        plugins
        circular
        IgnoreCircularDependencyStrategyTest.java
        WarnCircularDependencyStrategyTest.java
        conflict
        LatestCompatibleConflictManagerTest.java
        LatestConflictManagerTest.java
        RegexpConflictManagerTest.java
        StrictConflictManagerTest.java
        latest
        LatestRevisionStrategyTest.java
        lock
        ArtifactLockStrategyTest.java
        matcher
        AbstractPatternMatcherTest.java
        ExactOrRegexpPatternMatcherTest.java
        ExactPatternMatcherTest.java
        GlobPatternMatcherTest.java
        RegexpPatternMatcherTest.java
        namespace
        MRIDTransformationRuleTest.java
        NameSpaceHelperTest.java
        parser
        AbstractModuleDescriptorParserTester.java
        ModuleDescriptorParserRegistryTest.java
        m2
        PomModuleDescriptorParserTest.java
        PomModuleDescriptorWriterTest.java
        xml
        XmlModuleDescriptorParserTest.java
        XmlModuleDescriptorWriterTest.java
        XmlModuleUpdaterTest.java
        report
        XmlReportParserTest.java
        XmlReportWriterTest.java
        repository
        vfs
        VfsRepositoryTest.java
        VfsResourceTest.java
        VfsTestHelper.java
        VfsURI.java
        resolver
        AbstractDependencyResolverTest.java
        BintrayResolverTest.java
        ChainResolverTest.java
        DualResolverTest.java
        FileSystemResolverTest.java
        IBiblioHelper.java
        IBiblioResolverTest.java
        IvyRepResolverTest.java
        JarResolverTest.java
        Maven2LocalTest.java
        MirroredURLResolverTest.java
        MockResolver.java
        PackagerResolverTest.java
        ResolverTestHelper.java
        URLResolverTest.java
        VfsResolverTest.java
        util
        ResolverHelperTest.java
        trigger
        LogTriggerTest.java
        version
        LatestVersionMatcherTest.java
        MockVersionMatcher.java
        PatternVersionMatcherTest.java
        VersionRangeMatcherTest.java
        util
        CacheCleaner.java
        ConfiguratorTest.java
        IvyPatternHelperTest.java
        MockMessageLogger.java
        StringUtilsTest.java
        url
        AbstractURLHandlerTest.java
        ApacheURLListerTest.java
        ArtifactoryListingTest.java
        BasicURLHandlerTest.java
        HttpclientURLHandlerTest.java

/*
 *  Licensed to the Apache Software Foundation (ASF) under one or more
 *  contributor license agreements.  See the NOTICE file distributed with
 *  this work for additional information regarding copyright ownership.
 *  The ASF licenses this file to You under the Apache License, Version 2.0
 *  (the "License"); you may not use this file except in compliance with
 *  the License.  You may obtain a copy of the License at
 *
 *      http://www.apache.org/licenses/LICENSE-2.0
 *
 *  Unless required by applicable law or agreed to in writing, software
 *  distributed under the License is distributed on an "AS IS" BASIS,
 *  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 *  See the License for the specific language governing permissions and
 *  limitations under the License.
 *
 */
package org.apache.ivy.util.url;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.ivy.util.FileUtil;
import org.apache.ivy.util.Message;
import org.apache.ivy.util.url.URLHandler.URLInfo;

/**
 * Utility class which helps to list urls under a given url. This has been tested with Apache 1.3.33
 * server listing, as the one used at ibiblio, and with Apache 2.0.53 server listing, as the one on
 * mirrors.sunsite.dk.
 */
public class ApacheURLLister {
    // ~ Static variables/initializers ------------------------------------------

    private static final Pattern PATTERN = Pattern.compile(
        "<a[^>]*href=\"([^\"]*)\"[^>]*>(?:<[^>]+>)*?([^<>]+?)(?:<[^>]+>)*?</a>",
        Pattern.CASE_INSENSITIVE);

    // ~ Methods ----------------------------------------------------------------

    /**
     * Returns a list of sub urls of the given url. The returned list is a list of URL.
     * 
     * @param url
     *            The base URL from which to retrieve the listing.
     * @return a list of sub urls of the given url.
     * @throws IOException
     *             If an error occures retrieving the HTML.
     */
    public List<URL> listAll(URL url) throws IOException {
        return retrieveListing(url, true, true);
    }

    /**
     * Returns a list of sub 'directories' of the given url. The returned list is a list of URL.
     * 
     * @param url
     *            The base URL from which to retrieve the listing.
     * @return a list of sub 'directories' of the given url.
     * @throws IOException
     *             If an error occures retrieving the HTML.
     */
    public List<URL> listDirectories(URL url) throws IOException {
        return retrieveListing(url, false, true);
    }

    /**
     * Returns a list of sub 'files' (in opposition to directories) of the given url. The returned
     * list is a list of URL.
     * 
     * @param url
     *            The base URL from which to retrieve the listing.
     * @return a list of sub 'files' of the given url.
     * @throws IOException
     *             If an error occures retrieving the HTML.
     */
    public List<URL> listFiles(URL url) throws IOException {
        return retrieveListing(url, true, false);
    }

    /**
     * Retrieves a {@link List} of {@link URL}s corresponding to the files and/or directories found
     * at the supplied base URL.
     * 
     * @param url
     *            The base URL from which to retrieve the listing.
     * @param includeFiles
     *            If true include files in the returned list.
     * @param includeDirectories
     *            If true include directories in the returned list.
     * @return A {@link List} of {@link URL}s.
     * @throws IOException
     *             If an error occures retrieving the HTML.
     */
    public List<URL> retrieveListing(URL url, boolean includeFiles, boolean includeDirectories)
            throws IOException {
        List<URL> urlList = new ArrayList<URL>();

        // add trailing slash for relative urls
        if (!url.getPath().endsWith("/") && !url.getPath().endsWith(".html")) {
            url = new URL(url.getProtocol(), url.getHost(), url.getPort(), url.getPath() + "/");
        }

        URLHandler urlHandler = URLHandlerRegistry.getDefault();
        URLInfo urlInfo = urlHandler.getURLInfo(url);
        if (urlInfo == URLHandler.UNAVAILABLE) {
            return urlList; // not found => return empty list
        }
        // here, urlInfo is valid
        String charset = urlInfo.getBodyCharset();

        InputStream contentStream = urlHandler.openStream(url);
        BufferedReader r = null;
        if (charset == null) {
            r = new BufferedReader(new InputStreamReader(contentStream));
        } else {
            r = new BufferedReader(new InputStreamReader(contentStream, charset));
        }

        String htmlText = FileUtil.readEntirely(r);

        Matcher matcher = PATTERN.matcher(htmlText);

        while (matcher.find()) {
            // get the href text and the displayed text
            String href = matcher.group(1);
            String text = matcher.group(2);

            if ((href == null) || (text == null)) {
                // the groups were not found (shouldn't happen, really)
                continue;
            }

            text = text.trim();

            // handle complete URL listings
            if (href.startsWith("http:") || href.startsWith("https:")) {
                try {
                    href = new URL(href).getPath();
                    if (!href.startsWith(url.getPath())) {
                        // ignore URLs which aren't children of the base URL
                        continue;
                    }
                    href = href.substring(url.getPath().length());
                } catch (Exception ignore) {
                    // incorrect URL, ignore
                    continue;
                }
            }

            if (href.startsWith("../")) {
                // we are only interested in sub-URLs, not parent URLs, so skip this one
                continue;
            }

            // absolute href: convert to relative one
            if (href.startsWith("/")) {
                int slashIndex = href.substring(0, href.length() - 1).lastIndexOf('/');
                href = href.substring(slashIndex + 1);
            }

            // relative to current href: convert to simple relative one
            if (href.startsWith("./")) {
                href = href.substring("./".length());
            }

            // exclude those where they do not match
            // href will never be truncated, text may be truncated by apache
            if (text.endsWith("..>")) {
                // text is probably truncated, we can only check if the href starts with text
                if (!href.startsWith(text.substring(0, text.length() - 3))) {
                    continue;
                }
            } else if (text.endsWith("..>")) {
                // text is probably truncated, we can only check if the href starts with text
                if (!href.startsWith(text.substring(0, text.length() - 6))) {
                    continue;
                }
            } else {
                // text is not truncated, so it must match the url after stripping optional
                // trailing slashes
                String strippedHref = href.endsWith("/") ? href.substring(0, href.length() - 1)
                        : href;
                String strippedText = text.endsWith("/") ? text.substring(0, text.length() - 1)
                        : text;
                if (!strippedHref.equalsIgnoreCase(strippedText)) {
                    continue;
                }
            }

            boolean directory = href.endsWith("/");

            if ((directory && includeDirectories) || (!directory && includeFiles)) {
                URL child = new URL(url, href);
                urlList.add(child);
                Message.debug("ApacheURLLister found URL=[" + child + "].");
            }
        }

        return urlList;
    }
}