TikaTextExtractor.java example

Explorer

modeshape-master
- checkstyle
  - src
    - main
      - java
        org
        modeshape
        checkstyle
        ExcludeTestPackages.java
        Header.java
        IllegalImport.java
        JavaDocUtil.java
        UnusedImports.java
- connectors
  - modeshape-connector-cmis
    - src
      - main
        java
        org
        modeshape
        connector
        cmis
        AclObjectId.java
        CmisConnector.java
        CmisConnectorBinary.java
        CmisLexicon.java
        Converter.java
        Nodes.java
        ObjectId.java
        Prefix.java
        Properties.java
      - test
        java
        org
        modeshape
        connector
        cmis
        CmisConnectorIT.java
        ObjectIdTest.java
        PropertyMapTest.java
  - modeshape-connector-git
    - src
      - main
        java
        org
        modeshape
        connector
        git
        CallSpecification.java
        GitBinaryValue.java
        GitBranches.java
        GitCommitDetails.java
        GitConnector.java
        GitFunction.java
        GitHistory.java
        GitI18n.java
        GitLexicon.java
        GitRoot.java
        GitTags.java
        GitTree.java
        PageableGitFunction.java
        Values.java
      - test
        java
        org
        modeshape
        connector
        git
        GitConnectorTest.java
        GitFunctionalTest.java
        GitI18nTest.java
  - modeshape-connector-jdbc-metadata
    - src
      - main
        java
        org
        modeshape
        connector
        meta
        jdbc
        AbstractMetadataRetriever.java
        CatalogRetriever.java
        ColumnMetadata.java
        ColumnRetriever.java
        DBMetadata.java
        DatabaseRetriever.java
        ForeignKeyMetadata.java
        ForeignKeyRetriever.java
        JdbcMetadataCollector.java
        JdbcMetadataConnector.java
        JdbcMetadataException.java
        JdbcMetadataI18n.java
        JdbcMetadataLexicon.java
        MetadataCollector.java
        ProcedureMetadata.java
        ProcedureRetriever.java
        SchemaRetriever.java
        SqlServerMetadataCollector.java
        TableMetadata.java
        TableRetriever.java
      - test
        java
        org
        modeshape
        connector
        meta
        jdbc
        DatasourceHelper.java
        JdbcMetadataConnectorTest.java
        JdbcMetadataI18nTest.java
- deploy
  - jbossas
    - modeshape-jbossas-subsystem
      - src
        main
        java
        org
        modeshape
        jboss
        lifecycle
        ContainerLifeCycleListener.java
        JBossLifeCycleListener.java
        metric
        GetDurationMetric.java
        GetValueMetric.java
        ModeShapeMetricHandler.java
        ModelMetrics.java
        MonitorService.java
        security
        JBossDomainAuthenticationProvider.java
        service
        AuthenticatorService.java
        BinaryStorage.java
        BinaryStorageService.java
        CompositeBinaryStorageService.java
        EngineService.java
        IndexDefinitionService.java
        IndexProviderService.java
        PersistenceService.java
        ReferenceFactoryService.java
        RepositoryService.java
        SequencerService.java
        SourceService.java
        TextExtractorService.java
        subsystem
        AbstractAddBinaryStorage.java
        AbstractModeShapeRemoveStepHandler.java
        AbstractRepositoryConfigWriteAttributeHandler.java
        AddAuthenticator.java
        AddBinaryStorage.java
        AddCassandraBinaryStorage.java
        AddCompositeBinaryStorage.java
        AddCustomBinaryStorage.java
        AddDatabaseBinaryStorage.java
        AddDatabasePersistence.java
        AddFileBinaryStorage.java
        AddFilePersistence.java
        AddIndexDefinition.java
        AddIndexProvider.java
        AddModeShapeSubsystem.java
        AddMongoBinaryStorage.java
        AddRepository.java
        AddS3BinaryStorage.java
        AddSequencer.java
        AddSource.java
        AddTextExtractor.java
        AddTransientBinaryStorage.java
        AddWebApp.java
        AddressContext.java
        Attribute.java
        AuthenticatorWriteAttributeHandler.java
        BinaryStorageWriteAttributeHandler.java
        DatabasePersistenceWriteAttributeHandler.java
        Element.java
        FilePersistenceWriteAttributeHandler.java
        IndexColumnsValidator.java
        IndexDefinitionWriteAttributeHandler.java
        IndexProviderWriteAttributeHandler.java
        MappedAttributeDefinition.java
        MappedAttributeDefinitionBuilder.java
        MappedListAttributeDefinition.java
        MappedSimpleAttributeDefinition.java
        ModeShapeAuthenticatorResource.java
        ModeShapeBinaryStorageResource.java
        ModeShapeCassandraBinaryStorageResource.java
        ModeShapeCompositeBinaryStorageResource.java
        ModeShapeCustomBinaryStorageResource.java
        ModeShapeDatabaseBinaryStorageResource.java
        ModeShapeDbPersistenceResource.java
        ModeShapeExtension.java
        ModeShapeFileBinaryStorageResource.java
        ModeShapeFilePersistenceResource.java
        ModeShapeIndexDefinitionResource.java
        ModeShapeIndexProviderResource.java
        ModeShapeJndiNames.java
        ModeShapeMongoBinaryStorageResource.java
        ModeShapeRepositoryResource.java
        ModeShapeRootResource.java
        ModeShapeS3BinaryStorageResource.java
        ModeShapeSequencerResource.java
        ModeShapeServiceNames.java
        ModeShapeSourceResource.java
        ModeShapeSubsystemXMLReader_3_0.java
        ModeShapeSubsystemXMLWriter.java
        ModeShapeTextExtractorResource.java
        ModeShapeTransientBinaryStorageResource.java
        ModeShapeWebAppResource.java
        ModelAttributes.java
        ModelKeys.java
        ModuleNamesProvider.java
        Namespace.java
        PathExpressionValidator.java
        ProjectionValidator.java
        RegexValidator.java
        RemoveAuthenticator.java
        RemoveBinaryStorage.java
        RemoveCompositeBinaryStorage.java
        RemoveDatabasePersistence.java
        RemoveFilePersistence.java
        RemoveIndexDefinition.java
        RemoveIndexProvider.java
        RemoveRepository.java
        RemoveSequencer.java
        RemoveSource.java
        RemoveTextExtractor.java
        RemoveWebApp.java
        RepositoryWriteAttributeHandler.java
        SequencerWriteAttributeHandler.java
        SourceWriteAttributeHandler.java
        StringSetValidator.java
        TextExtractorWriteAttributeHandler.java
        WebAppWriteAttributeHandler.java
        test
        java
        org
        modeshape
        jboss
        subsystem
        ModeShapeConfigurationTest.java
- extractors
  - modeshape-extractor-tika
    - src
      - main
        java
        org
        modeshape
        extractor
        tika
        TikaI18n.java
        TikaTextExtractor.java
        package-info.java
      - test
        java
        org
        modeshape
        extractor
        tika
        TikaI18nTest.java
        TikaTextExtractorRepositoryTest.java
        TikaTextExtractorTest.java
- index-providers
  - modeshape-elasticsearch-index-provider
    - src
      - main
        java
        org
        modeshape
        jcr
        index
        elasticsearch
        EsIndex.java
        EsIndexColumn.java
        EsIndexColumns.java
        EsIndexException.java
        EsIndexProvider.java
        EsManagedIndexBuilder.java
        Operations.java
        SearchResults.java
        client
        EsClient.java
        EsRequest.java
        EsResponse.java
        query
        AndQuery.java
        BoolQuery.java
        ExistsQuery.java
        MatchAllQuery.java
        MatchQuery.java
        NotQuery.java
        OrQuery.java
        Query.java
        RangeQuery.java
        StringQuery.java
        TermsQuery.java
        WildcardQuery.java
      - test
        java
        org
        modeshape
        jcr
        EsValidateQuery.java
        index
        elasticsearch
        EsIndexProviderTest.java
        EsIndexTest.java
        client
        EsClientTest.java
  - modeshape-lucene-index-provider
    - src
      - main
        java
        org
        modeshape
        jcr
        index
        lucene
        FieldUtil.java
        LuceneConfig.java
        LuceneIndex.java
        LuceneIndexException.java
        LuceneIndexProvider.java
        LuceneIndexProviderI18n.java
        LuceneManagedIndexBuilder.java
        MultiColumnIndex.java
        Searcher.java
        SingleColumnIndex.java
        TextIndex.java
        query
        CaseOperations.java
        CompareNameQuery.java
        ComparePathQuery.java
        CompareQuery.java
        CompareStringQuery.java
        ConstantScoreWeightQuery.java
        FieldExistsQuery.java
        LuceneQueryFactory.java
        RegexQuery.java
        RelikeQuery.java
      - test
        java
        org
        modeshape
        jcr
        index
        lucene
        AbstractIndexPersistenceTest.java
        AbstractLuceneIndexSearchTest.java
        LuceneIndexProviderI18nTest.java
        LuceneIndexProviderQueryTest.java
        LuceneIndexProviderTest.java
        LuceneRepositoryTest.java
        MultiColumnIndexPersistenceTest.java
        MultiColumnIndexSearchTest.java
        PropertiesTestUtil.java
        SingleColumnIndexPersistenceTest.java
        SingleColumnIndexSearchTest.java
        TextIndexPersistenceTest.java
        TextIndexSearchTest.java
- integration
  - modeshape-jbossas-integration-tests
    - src
      - main
        java
        org
        modeshape
        test
        integration
        BackupRestoreBean.java
        CDIRepositoryConsumer.java
        CDIRepositoryProvider.java
        CustomAuthenticationProvider.java
        CustomTransientBinaryStore.java
        RepositoryOperation.java
        RepositoryProvider.java
        SingletonRepositoryProvider.java
        StartupRepositoryProvider1.java
        StartupRepositoryProvider2.java
        StatelessBeanManagedTransactionBean.java
        StatelessRepositoryProvider.java
        TransactionalOperationExecutor.java
      - test
        java
        org
        modeshape
        test
        integration
        BackupRestoreTest.java
        CDITest.java
        ClusteredConfigurationIntegrationTest.java
        CompositeBinaryStoreIntegrationTest.java
        DataSourceIntegrationTest.java
        EsIndexIntegrationTest.java
        ExternalDependenciesIntegrationTest.java
        FederationIntegrationTest.java
        JDBCRepositoryIntegrationTest.java
        JdbcDriverIntegrationTest.java
        ModeShapeWebdavStoreIntegrationTest.java
        PreconfiguredRepositoryIntegrationTest.java
        QueryIntegrationTest.java
        ReindexingIntegrationTest.java
        SecurityIntegrationTest.java
        SequencersIntegrationTest.java
        SingletonRepositoryProviderIntegrationTest.java
        StatelessBeanManagedTransactionIntegrationTest.java
        StatelessRepositoryProviderIntegrationTest.java
        TikaTextExtractorIntegrationTest.java
        TransactionsTest.java
        resources
        sequencer
        java_file.java
  - modeshape-jbossas-kit-tests
    - src
      - test
        java
        org
        modeshape
        test
        kit
        JBossASKitIT.java
- modeshape-common
  - src
    - main
      - java
        org
        modeshape
        common
        CommonI18n.java
        SystemFailureException.java
        annotation
        AllowedValues.java
        Category.java
        Description.java
        GuardedBy.java
        Immutable.java
        Label.java
        NotThreadSafe.java
        ReadOnly.java
        ThreadSafe.java
        collection
        AbstractMultimap.java
        AbstractProblems.java
        ArrayListMultimap.java
        CloseableSupplier.java
        Collections.java
        DelegateIterable.java
        DelegateIterator.java
        EmptyIterator.java
        HashMultimap.java
        ImmutableAppendedList.java
        ImmutableMapEntry.java
        ImmutableProblems.java
        LinkedHashMultimap.java
        LinkedListMultimap.java
        ListMultimap.java
        MultiIterator.java
        Multimap.java
        Problem.java
        Problems.java
        ReadOnlyIterator.java
        SequentialIterator.java
        SimpleProblems.java
        SingleIterator.java
        Supplier.java
        ThreadSafeProblems.java
        UnmodifiableProperties.java
        package-info.java
        ring
        BlockingWaitStrategy.java
        Consumer.java
        Cursor.java
        DependentOnPointers.java
        GarbageCollectingConsumer.java
        Pointer.java
        PointerBarrier.java
        Pointers.java
        RingBuffer.java
        RingBufferBuilder.java
        SingleProducerCursor.java
        StandardConsumerAdapter.java
        TrailingPointer.java
        WaitStrategy.java
        package-info.java
        database
        DatabaseType.java
        DatabaseUtil.java
        function
        Consumer.java
        Function.java
        Predicate.java
        i18n
        ClasspathLocalizationRepository.java
        I18n.java
        I18nResource.java
        TextI18n.java
        package-info.java
        logging
        LogFactory.java
        Logger.java
        jdk
        JdkLoggerFactory.java
        JdkLoggerImpl.java
        log4j
        Log4jLoggerFactory.java
        Log4jLoggerImpl.java
        slf4j
        SLF4JLoggerFactory.java
        SLF4JLoggerImpl.java
        math
        DoubleOperations.java
        Duration.java
        DurationOperations.java
        FloatOperations.java
        IntegerOperations.java
        LongOperations.java
        MathOperations.java
        ShortOperations.java
        package-info.java
        naming
        SingletonInitialContext.java
        SingletonInitialContextFactory.java
        package-info.java
        package-info.java
        statistic
        DetailedStatistics.java
        Histogram.java
        SimpleStatistics.java
        Stopwatch.java
        package-info.java
        text
        FilenameEncoder.java
        Inflector.java
        Jsr283Encoder.java
        NoOpEncoder.java
        ParsingException.java
        Position.java
        QuoteEncoder.java
        SecureHashTextEncoder.java
        TextDecoder.java
        TextEncoder.java
        TokenStream.java
        UrlEncoder.java
        XmlNameEncoder.java
        XmlValueEncoder.java
        package-info.java
        util
        Base64.java
        CheckArg.java
        ClassUtil.java
        DateTimeUtil.java
        DelegatingClassLoader.java
        FileUtil.java
        HashCode.java
        ImmediateFuture.java
        IoUtil.java
        NamedThreadFactory.java
        ObjectUtil.java
        Reflection.java
        ResourceLookup.java
        SecureHash.java
        SelfClosingInputStream.java
        SizeMeasuringInputStream.java
        SizeMeasuringReader.java
        StringURLClassLoader.java
        StringUtil.java
        ThreadPoolFactory.java
        ThreadPools.java
        TimeBasedKeys.java
        package-info.java
        xml
        SimpleNamespaceContext.java
        StreamingContentHandler.java
        XmlCharacters.java
        package-info.java
    - test
      - java
        org
        modeshape
        common
        AbstractI18nTest.java
        CommonI18nTest.java
        FixFor.java
        annotation
        Performance.java
        collection
        AbstractMultimapTest.java
        AbstractProblemsTest.java
        ArrayListMultimapTest.java
        CollectionsTest.java
        ImmutableAppendedListTest.java
        IsIteratorContaining.java
        LinkedHashMultimapTest.java
        LinkedListMultimapTest.java
        ProblemTest.java
        SimpleProblemsTest.java
        ThreadSafeProblemsTest.java
        ring
        RingBufferTest.java
        i18n
        I18nTest.java
        MockI18n.java
        MockI18nTest.java
        junit
        SkipLongRunning.java
        SkipOnOS.java
        SkipTestRule.java
        logging
        LoggerTest.java
        math
        DoubleOperationsTest.java
        DurationTest.java
        FloatOperationsTest.java
        IntegerOperationsTest.java
        LongOperationsTest.java
        naming
        SingletonInitialContextTest.java
        statistic
        DetailedStatisticsTest.java
        HistogramTest.java
        SimpleStatisticsTest.java
        StopwatchTest.java
        text
        InflectorTest.java
        Jsr283EncoderTest.java
        NoOpEncoderTest.java
        PositionTest.java
        SampleSqlParser.java
        SecureHashTextEncoderTest.java
        StringMatcher.java
        TokenStreamBasicTokenizerTest.java
        TokenStreamTest.java
        UrlEncoderTest.java
        XmlNameEncoderTest.java
        XmlValueEncoderTest.java
        util
        ArgCheckTest.java
        Base64Test.java
        ClassUtilTest.java
        DelegatingClassLoaderTest.java
        HashCodeTest.java
        IoUtilTest.java
        ReflectionTest.java
        SecureHashTest.java
        StringURLClassLoaderTest.java
        StringUtilTest.java
        TestUtil.java
        TimeBasedKeysTest.java
        xml
        XmlCharactersTest.java
- modeshape-jca
  - src
    - main
      - java
        org
        modeshape
        jca
        JcaI18n.java
        JcrConnectionManager.java
        JcrConnectionRequestInfo.java
        JcrLocalTransaction.java
        JcrManagedConnection.java
        JcrManagedConnectionFactory.java
        JcrManagedConnectionMetaData.java
        JcrRepositoryHandle.java
        JcrResourceAdapter.java
        JcrSessionHandle.java
    - test
      - java
        org
        modeshape
        jca
        ConnectorTestCase.java
        JcaI18nTest.java
- modeshape-jcr
  - src
    - main
      - java
        org
        modeshape
        connector
        filesystem
        FileSystemConnector.java
        InclusionExclusionFilenameFilter.java
        JsonSidecarExtraPropertyStore.java
        LargeFileSystemConnector.java
        LegacySidecarExtraPropertyStore.java
        jcr
        AbstractJcrExporter.java
        AbstractJcrItem.java
        AbstractJcrNode.java
        AbstractJcrProperty.java
        AccessControlManagerImpl.java
        BackupDocumentReader.java
        BackupDocumentWriter.java
        BackupObserver.java
        BackupService.java
        CndI18n.java
        CndImporter.java
        CndTokenizer.java
        ConfigurationException.java
        Connectors.java
        DefinitionCache.java
        Environment.java
        ExecutionContext.java
        ExtensionLogger.java
        GraphI18n.java
        InitialContentImporter.java
        JcrChildNodeIterator.java
        JcrContentHandler.java
        JcrDocumentViewExporter.java
        JcrEmptyNodeIterator.java
        JcrEmptyPropertyIterator.java
        JcrI18n.java
        JcrItemDefinition.java
        JcrItemDefinitionTemplate.java
        JcrLexicon.java
        JcrLockManager.java
        JcrMixLexicon.java
        JcrMultiValueProperty.java
        JcrNamespaceRegistry.java
        JcrNode.java
        JcrNodeDefinition.java
        JcrNodeDefinitionTemplate.java
        JcrNodeIterator.java
        JcrNodeListIterator.java
        JcrNodeType.java
        JcrNodeTypeDelegate.java
        JcrNodeTypeIterator.java
        JcrNodeTypeManager.java
        JcrNodeTypeTemplate.java
        JcrNtLexicon.java
        JcrObservationManager.java
        JcrProblems.java
        JcrPropertyDefinition.java
        JcrPropertyDefinitionTemplate.java
        JcrPropertyIterator.java
        JcrQueryManager.java
        JcrRepositoriesContainer.java
        JcrRepository.java
        JcrRepositoryFactory.java
        JcrRepositoryManager.java
        JcrRepositoryMonitor.java
        JcrRootNode.java
        JcrSession.java
        JcrSharedNode.java
        JcrSharedNodeCache.java
        JcrSingleNodeIterator.java
        JcrSingleValueProperty.java
        JcrSvLexicon.java
        JcrSystemNode.java
        JcrSystemViewExporter.java
        JcrValue.java
        JcrValueFactory.java
        JcrVersionHistoryNode.java
        JcrVersionManager.java
        JcrVersionNode.java
        JcrWorkspace.java
        JndiRepositoryFactory.java
        LocalEnvironment.java
        ModeShape.java
        ModeShapeEngine.java
        ModeShapeFederationManager.java
        ModeShapeLexicon.java
        ModeShapePermissions.java
        ModeShapeRoles.java
        NoSuchRepositoryException.java
        NodeDefinitionId.java
        NodeTypeExistsException.java
        NodeTypeSchemata.java
        NodeTypes.java
        NodeTypesImporter.java
        PropertyDefinitionId.java
        RepositoryConfiguration.java
        RepositoryEnvironment.java
        RepositoryI18n.java
        RepositoryIndexColumnDefinition.java
        RepositoryIndexColumnDefinitionTemplate.java
        RepositoryIndexDefinition.java
        RepositoryIndexDefinitionTemplate.java
        RepositoryIndexManager.java
        RepositoryIndexes.java
        RepositoryLockManager.java
        RepositoryNodeTypeManager.java
        RepositoryQueryManager.java
        RepositoryStatistics.java
        Sequencers.java
        SequencingRunner.java
        SystemContent.java
        SystemContentInitializer.java
        SystemNamespaceRegistry.java
        TextExtractors.java
        TimeoutException.java
        Upgrades.java
        XmlNodeTypeReader.java
        bus
        BusI18n.java
        ChangeBus.java
        ClusteredChangeBus.java
        RepositoryChangeBus.java
        RepositoryCursor.java
        RepositoryRingBufferBuilder.java
        cache
        AllPathsCache.java
        CachedNode.java
        CachedNodeSupplier.java
        ChildReference.java
        ChildReferences.java
        DocumentAlreadyExistsException.java
        DocumentNotFoundException.java
        DocumentStoreException.java
        LockFailureException.java
        MutableCachedNode.java
        NodeCache.java
        NodeKey.java
        NodeNotFoundException.java
        NodeNotFoundInParentException.java
        PathCache.java
        PathNotFoundException.java
        PropertyTypeUtil.java
        ReferentialIntegrityException.java
        ReferrerCounts.java
        RepositoryCache.java
        RepositoryPathCache.java
        SessionCache.java
        SessionCacheWrapper.java
        SiblingCounter.java
        WorkspaceNotFoundException.java
        WrappedException.java
        change
        AbstractNodeChange.java
        AbstractPropertyChange.java
        AbstractSequencingChange.java
        BinaryValueUnused.java
        BinaryValueUsageChange.java
        BinaryValueUsed.java
        Change.java
        ChangeSet.java
        ChangeSetAdapter.java
        ChangeSetListener.java
        Changes.java
        NodeAdded.java
        NodeChanged.java
        NodeMoved.java
        NodeRemoved.java
        NodeRenamed.java
        NodeReordered.java
        NodeSequenced.java
        NodeSequencingFailure.java
        Observable.java
        PropertyAdded.java
        PropertyChanged.java
        PropertyRemoved.java
        RecordingChanges.java
        RepositoryMetadataChanged.java
        WorkspaceAdded.java
        WorkspaceRemoved.java
        document
        AbstractChildReferences.java
        AbstractSessionCache.java
        BucketId.java
        BucketedChildReferences.java
        DelegatingIterator.java
        DocumentCache.java
        DocumentConstants.java
        DocumentOptimizer.java
        DocumentStore.java
        DocumentTranslator.java
        ImmutableChildReferences.java
        LazyCachedNode.java
        LocalDocumentStore.java
        MutableChildReferences.java
        NodeCacheIterator.java
        PatternIterator.java
        ReadOnlySessionCache.java
        SessionChildReferences.java
        SessionNode.java
        TransactionalWorkspaceCache.java
        TransactionalWorkspaceCaches.java
        UnionIterator.java
        WorkspaceCache.java
        WritableSessionCache.java
        clustering
        ClusteringI18n.java
        ClusteringService.java
        MessageConsumer.java
        federation
        ConnectorChangeSetImpl.java
        FederatedDocumentChanges.java
        FederatedDocumentReader.java
        FederatedDocumentStore.java
        FederatedDocumentWriter.java
        NoExtraPropertiesStorage.java
        index
        local
        IndexUpdater.java
        IndexValues.java
        LocalDuplicateIndex.java
        LocalEnumeratedIndex.java
        LocalIndex.java
        LocalIndexBuilder.java
        LocalIndexException.java
        LocalIndexProvider.java
        LocalMapIndex.java
        LocalUniqueIndex.java
        MapDB.java
        Operations.java
        journal
        ChangeJournal.java
        ClusteredJournal.java
        JournalRecord.java
        LocalJournal.java
        locking
        AbstractLockingService.java
        DbLockingService.java
        JGroupsLockingService.java
        LockingService.java
        StandaloneLockingService.java
        mimetype
        ContentDetector.java
        DefaultMimeTypeDetector.java
        MimeTypeDetector.java
        MimeTypeDetectors.java
        NameOnlyDetector.java
        NullMimeTypeDetector.java
        TikaMimeTypeDetector.java
        package-info.java
        tika
        TikaContentDetector.java
        TikaMimeTypeDetector.java
        TikaNameOnlyDetector.java
        query
        BufferManager.java
        CancellableQuery.java
        CompositeIndexWriter.java
        JcrAbstractQuery.java
        JcrQuery.java
        JcrQueryContext.java
        JcrQueryResult.java
        JcrSqlQueryResult.java
        JcrTypeSystem.java
        NodeSequence.java
        PseudoColumns.java
        QueryBuilder.java
        QueryContext.java
        QueryEngine.java
        QueryEngineBuilder.java
        QueryResults.java
        RowExtractors.java
        Tuples.java
        XPathQueryResult.java
        engine
        IndexPlan.java
        IndexPlanners.java
        IndexQueryEngine.java
        NoOpQueryIndexWriter.java
        QuerySources.java
        QueryUtil.java
        Results.java
        ScanningQueryEngine.java
        package-info.java
        process
        AbstractNodeKeysSequence.java
        BufferedRows.java
        BufferingSequence.java
        CountableSequence.java
        DelegatingSequence.java
        DependentQuery.java
        DistinctSequence.java
        ExceptSequence.java
        HashJoinSequence.java
        IntersectSequence.java
        JoinSequence.java
        PartialMemoryCountableSequence.java
        RestartableSequence.java
        SecureSequence.java
        SortingSequence.java
        package-info.java
        model
        AllNodes.java
        And.java
        ArithmeticOperand.java
        ArithmeticOperator.java
        Between.java
        BindVariableName.java
        Cast.java
        ChildCount.java
        ChildNode.java
        ChildNodeJoinCondition.java
        Column.java
        Command.java
        Comparison.java
        Constraint.java
        DescendantNode.java
        DescendantNodeJoinCondition.java
        DynamicOperand.java
        EquiJoinCondition.java
        FullTextSearch.java
        FullTextSearchScore.java
        Join.java
        JoinCondition.java
        JoinType.java
        LanguageObject.java
        Length.java
        Limit.java
        Literal.java
        LiteralValue.java
        LowerCase.java
        NamedSelector.java
        NodeDepth.java
        NodeId.java
        NodeLocalName.java
        NodeName.java
        NodePath.java
        Not.java
        NullOrder.java
        Or.java
        Order.java
        Ordering.java
        PropertyExistence.java
        PropertyValue.java
        Query.java
        QueryCommand.java
        QueryObjectModel.java
        QueryObjectModelFactory.java
        Readable.java
        ReferenceValue.java
        Relike.java
        SameNode.java
        SameNodeJoinCondition.java
        SelectQuery.java
        Selector.java
        SelectorName.java
        SetCriteria.java
        SetQuery.java
        SetQueryObjectModel.java
        Source.java
        StaticOperand.java
        Subquery.java
        TypeSystem.java
        UpperCase.java
        Visitable.java
        Visitor.java
        Visitors.java
        package-info.java
        optimize
        AddAccessNodes.java
        AddIndexes.java
        AddJoinConditionColumnsToSources.java
        AddOrderingColumnsToSources.java
        ChooseJoinAlgorithm.java
        CopyCriteria.java
        JoinOrder.java
        Optimizer.java
        OptimizerRule.java
        OrderIndexesByCost.java
        PushProjects.java
        PushSelectCriteria.java
        RaiseSelectCriteria.java
        RaiseVariableName.java
        RemoveEmptyAccessNodes.java
        ReorderSortAndRemoveDuplicates.java
        ReplaceViews.java
        RewriteAsRangeCriteria.java
        RewriteIdentityJoins.java
        RewritePathAndNameCriteria.java
        RewritePseudoColumns.java
        RightOuterToLeftOuterJoins.java
        RuleBasedOptimizer.java
        package-info.java
        package-info.java
        parse
        BasicSqlQueryParser.java
        ColumnExpression.java
        FullTextSearchParser.java
        InvalidQueryException.java
        JcrQomQueryParser.java
        JcrSql2QueryParser.java
        JcrSqlQueryParser.java
        QueryParser.java
        QueryParsers.java
        package-info.java
        plan
        CanonicalPlanner.java
        JoinAlgorithm.java
        PlanHints.java
        PlanNode.java
        PlanUtil.java
        Planner.java
        package-info.java
        validate
        ImmutableColumn.java
        ImmutableKey.java
        ImmutableSchemata.java
        ImmutableTable.java
        ImmutableView.java
        Schemata.java
        Validator.java
        package-info.java
        xpath
        XPath.java
        XPathParser.java
        XPathQueryParser.java
        XPathToQueryTranslator.java
        package-info.java
        security
        AdvancedAuthorizationProvider.java
        AnonymousProvider.java
        AuthenticationProvider.java
        AuthenticationProviders.java
        AuthorizationProvider.java
        EnvironmentAuthenticationProvider.java
        JaasProvider.java
        JaasSecurityContext.java
        JaccSubjectResolver.java
        SecurityContext.java
        ServletProvider.java
        SimplePrincipal.java
        acl
        AccessControlEntryImpl.java
        AccessControlPolicyIteratorImpl.java
        JcrAccessControlList.java
        PrivilegeImpl.java
        Privileges.java
        package-info.java
        sequencer
        InvalidPathExpressionException.java
        InvalidSequencerPathExpression.java
        PathExpression.java
        SequencerPathExpression.java
        spi
        federation
        Connector.java
        ConnectorChangeSet.java
        ConnectorChangeSetFactory.java
        ConnectorException.java
        DocumentChanges.java
        DocumentReader.java
        DocumentWriter.java
        ExtraPropertiesStore.java
        PageKey.java
        PageWriter.java
        Pageable.java
        ReadOnlyConnector.java
        WritableConnector.java
        package-info.java
        index
        Index.java
        IndexConstraints.java
        IndexCostCalculator.java
        IndexDefinitionChanges.java
        IndexFeedback.java
        IndexManager.java
        IndexWriter.java
        WorkspaceChanges.java
        package-info.java
        provider
        Costable.java
        DefaultManagedIndex.java
        Filter.java
        IndexChangeAdapter.java
        IndexChangeAdapters.java
        IndexPlanner.java
        IndexProvider.java
        IndexProviderExistsException.java
        IndexUsage.java
        Lifecycle.java
        ManagedIndex.java
        ManagedIndexBuilder.java
        NoSuchProviderException.java
        NodeTypeMatcher.java
        ProvidedIndex.java
        Reindexable.java
        package-info.java
        text
        TextExtractorContext.java
        TextExtractorOutput.java
        package-info.java
        txn
        DefaultTransactionManagerLookup.java
        LocalTransaction.java
        LocalTransactionManager.java
        Transactions.java
        value
        BinaryFactory.java
        BinaryKey.java
        BinaryValue.java
        DateTimeFactory.java
        InvalidPathException.java
        IoException.java
        Location.java
        Name.java
        NameFactory.java
        NamespaceException.java
        NamespaceRegistry.java
        Path.java
        PathFactory.java
        PathNotFoundException.java
        Property.java
        PropertyFactory.java
        PropertyType.java
        Readable.java
        Reference.java
        ReferenceFactory.java
        StringFactory.java
        UriFactory.java
        ValueComparators.java
        ValueFactories.java
        ValueFactory.java
        ValueFormatException.java
        ValueTypeSystem.java
        WorkspaceAndPath.java
        basic
        AbstractPath.java
        AbstractValueFactories.java
        AbstractValueFactory.java
        BasicEmptyProperty.java
        BasicMultiValueProperty.java
        BasicName.java
        BasicNamespace.java
        BasicPath.java
        BasicPathSegment.java
        BasicProperty.java
        BasicPropertyFactory.java
        BasicSingleValueProperty.java
        BooleanValueFactory.java
        ChildPath.java
        DecimalValueFactory.java
        DoubleValueFactory.java
        IdentifierPath.java
        IdentifierPathSegment.java
        LocalNamespaceRegistry.java
        LongValueFactory.java
        ModeShapeDateTime.java
        ModeShapeDateTimeValueFactory.java
        NameValueFactory.java
        NamespaceRegistryWithAliases.java
        NodeIdentifierReferenceFactory.java
        NodeKeyReference.java
        ObjectValueFactory.java
        PathValueFactory.java
        ReferenceValueFactory.java
        RootPath.java
        SimpleNamespaceRegistry.java
        StringReference.java
        StringValueFactory.java
        ThreadSafeNamespaceRegistry.java
        UriValueFactory.java
        package-info.java
        binary
        AbstractBinary.java
        AbstractBinaryStore.java
        BinaryStore.java
        BinaryStoreException.java
        BinaryStoreValueFactory.java
        CassandraBinaryStore.java
        CompositeBinaryStore.java
        Database.java
        DatabaseBinaryStore.java
        EmptyBinaryValue.java
        ExternalBinaryValue.java
        FileLocks.java
        FileSystemBinaryStore.java
        FileUrlBinaryValue.java
        InMemoryBinaryValue.java
        MongodbBinaryStore.java
        NamedLocks.java
        S3BinaryStore.java
        SharedLockingInputStream.java
        StoredBinaryValue.java
        TransientBinaryStore.java
        UrlBinaryValue.java
        package-info.java
        xml
        NodeImportDestination.java
        NodeImportXmlHandler.java
        jmx
        Details.java
        DurationData.java
        EnumDescription.java
        HistoricalData.java
        RepositoryStatisticsBean.java
        RepositoryStatisticsMXBean.java
        StatisticalData.java
        sequencer
        cnd
        CndSequencer.java
        CndSequencerLexicon.java
    - test
      - java
        org
        modeshape
        connector
        PreconfiguredProjectionsTest.java
        filesystem
        FileSystemConnectorTest.java
        InclusionExclusionFilenameFilterTest.java
        mock
        MockConnector.java
        MockConnectorTest.java
        MockConnectorWithChanges.java
        jcr
        AbstractIndexProviderTest.java
        AbstractJcrAccessTest.java
        AbstractJcrItemTest.java
        AbstractJcrRepositoryTest.java
        AbstractSchematicDbTest.java
        AuthenticationAndAuthorizationTest.java
        BackupDocumentWriterAndReaderTest.java
        BinaryStorageIntegrationTest.java
        ClientLoad.java
        ClusteredRepositoryTest.java
        ClusteringHelper.java
        CndImporterTest.java
        CndTokenizerTest.java
        ConcurrentNodeLoadTest.java
        ConcurrentWriteTest.java
        ConnectorChangesTest.java
        ConnectorsTest.java
        ExecutionContextTest.java
        FederationConfigurationTest.java
        GraphI18nTest.java
        ImportExportTest.java
        InMemoryTestBinary.java
        ItemDefinitionTest.java
        JTATestUtil.java
        JaasTestUtil.java
        JcrChildNodeIteratorTest.java
        JcrEmptyNodeIteratorTest.java
        JcrEmptyPropertyIteratorTest.java
        JcrI18nTest.java
        JcrInitialContentTest.java
        JcrLockManagerTest.java
        JcrMultiValuePropertyTest.java
        JcrNamespaceRegistryTest.java
        JcrNodeTest.java
        JcrNodeTypeManagerTest.java
        JcrNodeTypesTest.java
        JcrObservationManagerTest.java
        JcrPropertyDefinitionTest.java
        JcrPropertyIteratorTest.java
        JcrPropertyTest.java
        JcrQueryManagerTest.java
        JcrReadingTest.java
        JcrRelikeQueryTest.java
        JcrRepositoriesContainerTest.java
        JcrRepositoryFactoryTest.java
        JcrRepositoryStartupTest.java
        JcrRepositoryTest.java
        JcrRootNodeTest.java
        JcrSessionTest.java
        JcrSingleValuePropertyTest.java
        JcrTckSuites.java
        JcrTckTest.java
        JcrToolsTest.java
        JcrUnorderedCollectionsTest.java
        JcrValueTest.java
        JcrVersioningTest.java
        JcrWorkspaceTest.java
        JcrWritingTest.java
        JndiRepositoryFactoryTest.java
        LocalEnvironmentTest.java
        LocalIndexProviderAsynchronousTest.java
        LocalIndexProviderQueryTest.java
        LocalIndexProviderTest.java
        MixinTest.java
        ModeShapeEngineTest.java
        ModeShapeRepositoryStub.java
        ModeShapeTckTest.java
        MultiPassAbstractTest.java
        MultiUseAbstractTest.java
        NodeTypeAssertion.java
        NodeTypeRegistrationTest.java
        QueryTest.java
        RepositoryBackupAndRestoreTest.java
        RepositoryBackupTest.java
        RepositoryConfigurationTest.java
        RepositoryI18nTest.java
        RepositoryNodeTypeManagerTest.java
        RepositoryPersistenceTest.java
        SequencingTest.java
        ShareableNodesTest.java
        SimpleListener.java
        SingleUseAbstractTest.java
        SrampIntegrationTest.java
        SystemContentTest.java
        TestLexicon.java
        TestSequencersHolder.java
        TestingEnvironment.java
        TestingUtil.java
        TransactionsTest.java
        TypeRegistrationTest.java
        UpgradesTest.java
        ValidateQuery.java
        bus
        AbstractChangeBusTest.java
        BusI18nTest.java
        ClusteredChangeBusTest.java
        RepositoryChangeBusTest.java
        cache
        change
        PrintingChangeSetListener.java
        document
        AbstractNodeCacheTest.java
        AbstractSessionCacheTest.java
        DocumentOptimizerTest.java
        LocalDocumentStoreTest.java
        NodeCacheIteratorTest.java
        ReadOnlySessionCacheTest.java
        TestRepositoryEnvironment.java
        WorkspaceCacheTest.java
        WritableSessionCacheTest.java
        clustering
        ClusteringI18nTest.java
        ClusteringServiceTest.java
        index
        local
        AbstractLocalIndexTest.java
        LocalDuplicateIndexTest.java
        LocalUniqueIndexTest.java
        journal
        ClusteredJournalTest.java
        LocalJournalTest.java
        locking
        JGroupsLockingServiceTest.java
        StandaloneLockingServiceTest.java
        mimetype
        ContentDetectorTest.java
        DefaultMimeTypeDetectorTest.java
        MimeTypeDetectorsTest.java
        NameOnlyDetectorTest.java
        tika
        ContentDetectorTest.java
        NameOnlyDetectorTest.java
        query
        AbstractNodeSequenceTest.java
        AbstractQueryTest.java
        BufferManagerTest.java
        NodeSequenceTest.java
        QueryBuilderTest.java
        XPathQueryResultTest.java
        engine
        process
        DistinctSequenceTest.java
        HashJoinSequenceTest.java
        RestartableSequenceTest.java
        SortingSequenceTest.java
        index
        QueryEngineTest.java
        model
        AbstractQueryObjectTest.java
        QueryTest.java
        SetQueryTest.java
        optimize
        AddAccessNodesTest.java
        AddJoinConditionColumnsToSourcesTest.java
        ChooseJoinAlgorithmTest.java
        PushSelectCriteriaTest.java
        ReplaceViewsTest.java
        RewriteAsRangeCriteriaTest.java
        RightOuterToLeftOuterJoinsTest.java
        RuleBasedOptimizerTest.java
        parse
        FullTextSearchParserTest.java
        JcrSql2QueryParserTest.java
        JcrSqlQueryParserTest.java
        QueryParsersTest.java
        SqlQueryParserTest.java
        SqlTokenizerTest.java
        plan
        CanonicalPlannerTest.java
        PlanHintsTest.java
        PlanNodeTest.java
        validate
        ImmutableSchemataBuilderTest.java
        xpath
        XPathParserTest.java
        XPathToQueryTranslatorTest.java
        security
        AccessControlManagerTest.java
        acl
        AccessControlPolicyIteratorImplTest.java
        JcrAccessControlListTest.java
        PrivilegeImplTest.java
        sequencer
        AbstractSequencerTest.java
        ManualSequencingTest.java
        SequencerPathExpressionTest.java
        store
        DataSourceConfig.java
        txn
        AtomikosTransactionManagerLookup.java
        DefaultTransactionManagerLookupTest.java
        LocalTransactionManagerTest.java
        value
        PropertyTypeTest.java
        basic
        AbstractNamespaceRegistryTest.java
        AbstractPathTest.java
        AbstractValueFactoryTest.java
        BaseValueFactoryTest.java
        BasicNameTest.java
        BasicNamespaceTest.java
        BasicPathOldTest.java
        BasicPathSegmentTest.java
        BasicPathTest.java
        BinaryContains.java
        BooleanValueFactoryTest.java
        ChildPathTest.java
        DecimalValueFactoryTest.java
        DoubleValueFactoryTest.java
        IsPathContaining.java
        LocalNamespaceRegistryTest.java
        LongValueFactoryTest.java
        ModeShapeDateTimeTest.java
        ModeShapeDateTimeValueFactoryTest.java
        NameValueFactoryTest.java
        PathValueFactoryTest.java
        RootPathTest.java
        SimpleNamespaceRegistryTest.java
        ThreadSafeNamespaceRegistryTest.java
        binary
        AbstractBinaryStoreTest.java
        BinaryKeyTest.java
        CassandraBinaryStoreTest.java
        CompositeBinaryStoreTest.java
        CustomBinaryStoreImpl.java
        CustomBinaryStoreTest.java
        DatabaseBinaryStoreTest.java
        FileSystemBinaryStoreTest.java
        InMemoryBinaryValueTest.java
        MongodbBinaryStoreTest.java
        NamedLocksTest.java
        S3BinaryStoreTest.java
        TransientBinaryStoreTest.java
        xml
        NodeImportXmlHandlerTest.java
        jmx
        RepositoryStatisticsMXBeanTest.java
        sequencer
        cnd
        CndSequencerTest.java
      - resources
        mimetype
        test.java
- modeshape-jcr-api
  - src
    - main
      - java
        org
        modeshape
        jcr
        api
        AnonymousCredentials.java
        BackupOptions.java
        Binary.java
        JaasCredentials.java
        JcrConstants.java
        JcrTools.java
        Logger.java
        NamedRepository.java
        NamespaceRegistry.java
        Namespaced.java
        Problem.java
        Problems.java
        Property.java
        PropertyType.java
        Repositories.java
        RepositoriesContainer.java
        Repository.java
        RepositoryFactory.java
        RepositoryManager.java
        RestoreOptions.java
        ServletCredentials.java
        Session.java
        ValueFactory.java
        Workspace.java
        federation
        FederationManager.java
        index
        IndexColumnDefinition.java
        IndexColumnDefinitionTemplate.java
        IndexDefinition.java
        IndexDefinitionTemplate.java
        IndexExistsException.java
        IndexManager.java
        InvalidIndexDefinitionException.java
        NoSuchIndexException.java
        monitor
        DurationActivity.java
        DurationMetric.java
        History.java
        RepositoryMonitor.java
        Statistics.java
        ValueMetric.java
        Window.java
        package-info.java
        nodetype
        NodeTypeManager.java
        package-info.java
        observation
        Event.java
        PropertyEvent.java
        package-info.java
        query
        Query.java
        QueryCancelledException.java
        QueryManager.java
        QueryResult.java
        package-info.java
        qom
        ArithmeticOperand.java
        Between.java
        Cast.java
        ChildCount.java
        Limit.java
        NodeDepth.java
        NodeId.java
        NodePath.java
        Operator.java
        Ordering.java
        QueryCommand.java
        QueryObjectModelConstants.java
        QueryObjectModelFactory.java
        ReferenceValue.java
        Relike.java
        SelectQuery.java
        SetCriteria.java
        SetQuery.java
        SetQueryObjectModel.java
        Subquery.java
        sequencer
        Sequencer.java
        package-info.java
        text
        TextExtractor.java
        txn
        TransactionManagerLookup.java
        value
        DateTime.java
        version
        VersionManager.java
- modeshape-jdbc
  - src
    - main
      - java
        org
        modeshape
        jdbc
        JcrDriver.java
        JdbcI18n.java
        delegate
        HttpQueryResult.java
        HttpRepositoryDelegate.java
        rest
        ChildNodeDefinition.java
        ItemDefinition.java
        JSONHelper.java
        JSONRestClient.java
        ModeShapeRestClient.java
        NodeType.java
        NodeTypes.java
        PropertyDefinition.java
        QueryResult.java
        Repositories.java
        Workspaces.java
    - test
      - java
        org
        modeshape
        jdbc
        JcrDriverHttpTest.java
        JcrDriverIntegrationTest.java
        JcrDriverTest.java
        JcrHttpDriverIntegrationTest.java
        JdbcI18nTest.java
        delegate
        HttpRepositoryDelegateTest.java
        rest
        ModeShapeRestClientTest.java
- modeshape-jdbc-local
  - src
    - main
      - java
        org
        modeshape
        jdbc
        DriverInfo.java
        JcrBlob.java
        JcrConnection.java
        JcrMetaData.java
        JcrResultSet.java
        JcrResultSetMetaData.java
        JcrRowId.java
        JcrStatement.java
        JcrType.java
        JdbcJcrValueFactory.java
        JdbcLocalI18n.java
        LocalJcrDriver.java
        ModeShapeMetaData.java
        Transform.java
        delegate
        AbstractRepositoryDelegate.java
        ConnectionInfo.java
        LocalRepositoryDelegate.java
        LocalSession.java
        RepositoryDelegate.java
        RepositoryDelegateFactory.java
        metadata
        JDBCColumnNames.java
        JDBCColumnPositions.java
        JDBCSQLTypeInfo.java
        MetaDataQueryResult.java
        MetadataProvider.java
        ResultSetMetaDataImpl.java
        ResultsMetadataConstants.java
        types
        BlobTransform.java
        BooleanTransform.java
        DateTransform.java
        DecimalTransform.java
        DoubleTransform.java
        LongTransform.java
        StringTransform.java
        TimeStampTransform.java
        UUIDTransform.java
        util
        TimestampWithTimezone.java
    - test
      - java
        org
        modeshape
        jdbc
        AbstractJdbcDriverIntegrationTest.java
        AbstractJdbcDriverTest.java
        ConnectionResultsComparator.java
        JcrConnectionTest.java
        JcrDriverIntegrationTest.java
        JcrDriverTest.java
        JcrMetaDataTeiidSupportTest.java
        JcrMetaDataTest.java
        JcrResultSetMetaDataTest.java
        JcrResultSetTest.java
        JcrStatementTest.java
        JdbcI18nTest.java
        TestUtil.java
        delegate
        LocalRepositoryDelegateTest.java
        RepositoryDelegateFactoryTest.java
        util
        MetadataReader.java
        ResultSetReader.java
        ResultsComparator.java
        StringLineReader.java
        TimestampWithTimezoneTest.java
- modeshape-performance-tests
  - src
    - test
      - java
        org
        modeshape
        test
        performance
        FSPerformanceTest.java
        InMemoryPerformanceTest.java
        JdbcGenericPerformanceTest.java
- modeshape-persistence-tests
  - src
    - test
      - java
        org
        modeshape
        jcr
        ModeshapePersistenceIT.java
        TestRepository.java
- modeshape-schematic
  - src
    - main
      - java
        org
        modeshape
        schematic
        Base64.java
        DocumentFactory.java
        DocumentLibrary.java
        Lifecycle.java
        Lockable.java
        SchemaLibrary.java
        Schematic.java
        SchematicDb.java
        SchematicDbProvider.java
        SchematicEntry.java
        TransactionListener.java
        annotation
        Immutable.java
        NotThreadSafe.java
        RequiresTransaction.java
        ThreadSafe.java
        document
        Array.java
        Binary.java
        Bson.java
        Changes.java
        Code.java
        CodeWithScope.java
        Document.java
        DocumentSequence.java
        EditableArray.java
        EditableDocument.java
        Editor.java
        Json.java
        JsonSchema.java
        MaxKey.java
        MinKey.java
        Null.java
        ObjectId.java
        ParsingException.java
        Path.java
        Symbol.java
        Timestamp.java
        internal
        HashCode.java
        InMemoryDocumentLibrary.java
        InMemorySchemaLibrary.java
        delta
        AddValueIfAbsentOperation.java
        AddValueOperation.java
        ArrayOperation.java
        ClearOperation.java
        DocumentObserver.java
        Operation.java
        PutIfAbsentOperation.java
        PutOperation.java
        RemoveAllValuesOperation.java
        RemoveAtIndexOperation.java
        RemoveOperation.java
        RemoveValueOperation.java
        RetainAllValuesOperation.java
        SetValueOperation.java
        document
        ArrayEditor.java
        BasicArray.java
        BasicDocument.java
        BsonReader.java
        BsonUtils.java
        BsonWriter.java
        CompactJsonWriter.java
        DefaultDocumentValueFactory.java
        DocumentEditor.java
        DocumentValueFactory.java
        ImmutableField.java
        IncrementalDocumentEditor.java
        IndexSequence.java
        JsonReader.java
        JsonWriter.java
        MutableArray.java
        MutableDocument.java
        ObservableArrayEditor.java
        ObservableDocumentEditor.java
        Paths.java
        PrettyJsonWriter.java
        Utility.java
        io
        BsonDataInput.java
        BsonDataOutput.java
        BufferCache.java
        schema
        DocumentTransformer.java
        JsonSchemaValidatorFactory.java
        Problems.java
        SchemaDocument.java
        SchemaDocumentCache.java
        ValidationProblem.java
        ValidationResult.java
        ValidationTypeMismatchProblem.java
        Validator.java
    - test
      - java
        org
        modeshape
        schematic
        AbstractSchematicDBTest.java
        internal
        annotation
        FixFor.java
        document
        BasicArrayTest.java
        BasicDocumentTest.java
        BsonReadingAndWritingTest.java
        CompactJsonWriterTest.java
        DocumentEditorTest.java
        JsonPerformanceTest.java
        JsonReaderParserTest.java
        JsonReaderTest.java
        JsonWriterTest.java
        PrettyJsonWriterTest.java
        io
        BsonDataOutputTest.java
        schema
        DocumentTransformerTest.java
        SchemaValidationTest.java
        SystemPropertyFactoryTest.java
- modeshape-unit-test
  - src
    - main
      - java
        org
        modeshape
        test
        ModeShapeMultiUseTest.java
        ModeShapeSingleUseTest.java
        package-info.java
    - test
      - java
        org
        modeshape
        test
        UnitTestsForModeShapeMultiUseTest.java
        UnitTestsForModeShapeSingleUseTest.java
- persistence
  - modeshape-persistence-file
    - src
      - main
        java
        org
        modeshape
        persistence
        file
        FileDb.java
        FileDbProvider.java
        FileProviderException.java
        package-info.java
      - test
        java
        org
        modeshape
        persistence
        file
        FileDbDiskTest.java
        FileDbMemTest.java
        FileDbProviderTest.java
  - modeshape-persistence-relational
    - src
      - main
        java
        org
        modeshape
        persistence
        relational
        DB2Statements.java
        DataSourceManager.java
        DefaultStatements.java
        OracleStatements.java
        RelationalDb.java
        RelationalDbConfig.java
        RelationalProvider.java
        RelationalProviderException.java
        RelationalProviderI18n.java
        SQLServerStatements.java
        Statements.java
        TransactionalCaches.java
        TransactionsHolder.java
        package-info.java
      - test
        java
        org
        modeshape
        persistence
        relational
        RelationalDbIT.java
        RelationalProviderI18nTest.java
        RelationalProviderTest.java
- sequencers
  - modeshape-sequencer-audio
    - src
      - main
        java
        org
        modeshape
        sequencer
        audio
        AudioMetadata.java
        AudioMetadataArtwork.java
        AudioMetadataLexicon.java
        AudioMetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        audio
        AudioMetadataSequencerTest.java
        AudioMetadataTest.java
  - modeshape-sequencer-ddl
    - src
      - main
        java
        org
        modeshape
        sequencer
        ddl
        DdlConstants.java
        DdlParser.java
        DdlParserProblem.java
        DdlParserScorer.java
        DdlParsers.java
        DdlSequencer.java
        DdlSequencerI18n.java
        DdlTokenStream.java
        StandardDdlLexicon.java
        StandardDdlParser.java
        datatype
        DataType.java
        DataTypeParser.java
        package-info.java
        dialect
        derby
        DerbyDdlConstants.java
        DerbyDdlLexicon.java
        DerbyDdlParser.java
        package-info.java
        mysql
        MySqlDdlConstants.java
        MySqlDdlLexicon.java
        MySqlDdlParser.java
        package-info.java
        oracle
        OracleDdlConstants.java
        OracleDdlLexicon.java
        OracleDdlParser.java
        package-info.java
        postgres
        PostgresDdlConstants.java
        PostgresDdlLexicon.java
        PostgresDdlParser.java
        package-info.java
        node
        AstNode.java
        AstNodeFactory.java
        package-info.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        ddl
        AbstractDdlSequencerTest.java
        DdlParserTestHelper.java
        DdlParsersTest.java
        DdlSequencerI18nTest.java
        DdlTokenStreamTest.java
        StandardDdlParserTest.java
        StandardDdlSequencerTest.java
        datatype
        DataTypeParserTest.java
        dialect
        derby
        DerbyDdlParserTest.java
        DerbyDdlSequencerTest.java
        mysql
        MySqlDdlParserTest.java
        oracle
        OracleDdlParserTest.java
        OracleDdlSequencerTest.java
        postgres
        PostgresDdlParserTest.java
        PostgresDdlSequencerTest.java
        node
        AstNodeFactoryTest.java
        AstNodeTest.java
  - modeshape-sequencer-epub
    - src
      - main
        java
        org
        modeshape
        sequencer
        epub
        EpubMetadata.java
        EpubMetadataLexicon.java
        EpubMetadataProperty.java
        EpubMetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        epub
        EpubMetadataSequencerTest.java
  - modeshape-sequencer-images
    - src
      - main
        java
        org
        modeshape
        sequencer
        image
        ImageMetadata.java
        ImageMetadataLexicon.java
        ImageMetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        image
        ImageMetadataSequencerTest.java
        ImageMetadataTest.java
  - modeshape-sequencer-java
    - src
      - main
        java
        org
        modeshape
        sequencer
        classfile
        ClassFileRecorder.java
        ClassFileSequencer.java
        ClassFileSequencerLexicon.java
        DefaultClassFileRecorder.java
        metadata
        AnnotationMetadata.java
        ClassFileMetadataReader.java
        ClassMetadata.java
        EnumMetadata.java
        FieldMetadata.java
        MethodMetadata.java
        Visibility.java
        package-info.java
        package-info.java
        javafile
        AbstractJavaMetadata.java
        ClassSourceFileRecorder.java
        CompilationUnitParser.java
        JavaFileI18n.java
        JavaFileSequencer.java
        JavaMetadataUtil.java
        JdtRecorder.java
        SourceFileRecorder.java
        metadata
        AbstractMetadata.java
        AnnotationMetadata.java
        EnumMetadata.java
        FieldMetadata.java
        ImportMetadata.java
        JavaMetadata.java
        MethodMetadata.java
        ModifierMetadata.java
        PackageMetadata.java
        TypeMetadata.java
        Variable.java
        package-info.java
        package-info.java
      - test
        java
        DefaultPackageClass.java
        org
        modeshape
        sequencer
        JavaSequencerHelper.java
        classfile
        ClassFileSequencerTest.java
        metadata
        ClassFileMetadataReaderTest.java
        javafile
        AnnotationTypeSequencerTest.java
        ClassTypeSequencerTest.java
        EnumTypeSequencerTest.java
        InterfaceTypeSequencerTest.java
        JavaFileSequencerTest.java
        JavaMetadataTest.java
        testdata
        AnnotationType.java
        ClassType.java
        EnumType.java
        MockClass.java
        MockEnum.java
        TwoOuterClasses.java
        resources
        org
        acme
        MySource.java
        annotation
        MyClassAnnotation.java
        MyPackageAnnotation.java
        package-info.java
  - modeshape-sequencer-mp3
    - src
      - main
        java
        org
        modeshape
        sequencer
        mp3
        Mp3Metadata.java
        Mp3MetadataLexicon.java
        Mp3MetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        mp3
        Mp3MetadataTest.java
        Mp3SequencerTest.java
  - modeshape-sequencer-msoffice
    - src
      - main
        java
        org
        modeshape
        sequencer
        msoffice
        MSOfficeMetadata.java
        MSOfficeMetadataLexicon.java
        MSOfficeMetadataReader.java
        MSOfficeMetadataSequencer.java
        excel
        ExcelMetadata.java
        ExcelMetadataReader.java
        ExcelSheetMetadata.java
        package-info.java
        package-info.java
        powerpoint
        PowerPointMetadataReader.java
        PowerpointMetadata.java
        SlideMetadata.java
        package-info.java
        word
        WordMetadata.java
        WordMetadataReader.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        msoffice
        MSOfficeMetadataSequencerTest.java
        MSOfficeMetadataTest.java
        excel
        ExcelMetadataReaderTest.java
        powerpoint
        PowerPointMetadataReaderTest.java
        word
        WordMetadataTest.java
  - modeshape-sequencer-odf
    - src
      - main
        java
        org
        modeshape
        sequencer
        odf
        OdfMetadata.java
        OdfMetadataLexicon.java
        OdfMetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        odf
        OdfMetadataSequencerTest.java
  - modeshape-sequencer-pdf
    - src
      - main
        java
        org
        modeshape
        sequencer
        pdf
        PdfAttachmentMetadata.java
        PdfBasicMetadata.java
        PdfMetadataLexicon.java
        PdfMetadataSequencer.java
        PdfPageMetadata.java
        PdfXmpMetadata.java
        XmpMetadataLexicon.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        pdf
        PdfMetadataSequencerTest.java
  - modeshape-sequencer-sramp
    - src
      - main
        java
        org
        modeshape
        sequencer
        sramp
        AbstractResolvingReader.java
        AbstractSrampSequencer.java
        NamespaceEntityResolver.java
        SrampLexicon.java
        SymbolSpace.java
        SymbolSpaceResolvers.java
        package-info.java
  - modeshape-sequencer-text
    - src
      - main
        java
        org
        modeshape
        sequencer
        text
        AbstractTextSequencer.java
        DefaultRowFactory.java
        DelimitedTextSequencer.java
        FixedWidthTextSequencer.java
        RowFactory.java
        TextSequencerLexicon.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        text
        AbstractTextSequencerTest.java
        CustomRowFactory.java
        DelimitedTextSequencerTest.java
        FixedWidthTextSequencerTest.java
  - modeshape-sequencer-video
    - src
      - main
        java
        org
        modeshape
        sequencer
        video
        StreamMetadata.java
        VideoMetadata.java
        VideoMetadataLexicon.java
        VideoMetadataSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        video
        VideoMetadataSequencerTest.java
  - modeshape-sequencer-wsdl
    - src
      - main
        java
        org
        modeshape
        sequencer
        wsdl
        Wsdl11Reader.java
        WsdlLexicon.java
        WsdlReader.java
        WsdlSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        wsdl
        WsdlSequencerTest.java
  - modeshape-sequencer-xml
    - src
      - main
        java
        org
        modeshape
        sequencer
        xml
        DtdLexicon.java
        InheritingXmlSequencer.java
        XmlLexicon.java
        XmlSequencer.java
        XmlSequencerHandler.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        xml
        AbstractXmlSequencerTest.java
        InheritingXmlSequencerTest.java
        XmlSequencerTest.java
  - modeshape-sequencer-xsd
    - src
      - main
        java
        org
        modeshape
        sequencer
        xsd
        XsdLexicon.java
        XsdReader.java
        XsdSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        xsd
        XsdSequencerTest.java
  - modeshape-sequencer-zip
    - src
      - main
        java
        org
        modeshape
        sequencer
        zip
        ZipLexicon.java
        ZipSequencer.java
        package-info.java
      - test
        java
        org
        modeshape
        sequencer
        zip
        ZipSequencerTest.java
- web
  - modeshape-web-cmis
    - src
      - main
        java
        org
        modeshape
        cmis
        JcrMsRepository.java
        JcrMsVersion.java
        JcrMsVersionNode.java
        JcrService.java
        JcrServiceFactory.java
        MsDocumentTypeHandler.java
        RepositoryConfig.java
        RepositoryInfoLocal.java
      - test
        java
        org
        modeshape
        cmis
        JcrServiceTest.java
  - modeshape-web-cmis-war
    - src
      - test
        java
        org
        modeshape
        cmis
        ModeShapeCmisClientTest.java
  - modeshape-web-explorer
    - src
      - main
        java
        org
        modeshape
        web
        AuthFilter.java
        BackupExportServlet.java
        BackupUploadServlet.java
        BinaryContentServlet.java
        BinaryContentUploadServlet.java
        InitialServlet.java
        LoginServlet.java
        client
        Console.java
        Footer.java
        Header.java
        HtmlHistory.java
        JcrService.java
        JcrServiceAsync.java
        JcrURL.java
        LoadingIcon.java
        admin
        AdminView.java
        BackupControl.java
        BackupDialog.java
        BackupDownloadControl.java
        BackupOptionsDialog.java
        Metrics.java
        RestoreControl.java
        RestoreDialog.java
        UploadBackupDialog.java
        UploadRestoreControl.java
        chart
        Chart.java
        contents
        AddNodeDialog.java
        AddPolicyDialog.java
        BinaryEditor.java
        ChildrenEditor.java
        Contents.java
        ContentsLayout.java
        DetailsLayout.java
        ExportDialog.java
        ImportDialog.java
        PathControl.java
        PermissionsEditor.java
        PropertiesEditor.java
        RefreshSessionDialog.java
        RenameNodeDialog.java
        Session.java
        WorkspacePanel.java
        grid
        BooleanField.java
        Grid.java
        Pager.java
        TabGrid.java
        TabsetGrid.java
        nt
        NodeTypesForm.java
        NodeTypesModalForm.java
        peditor
        BaseEditor.java
        BinaryValueEditor.java
        BooleanValueEditor.java
        DateValueEditor.java
        DefaultValueEditor.java
        MixinValueEditor.java
        ValueEditor.java
        query
        QueryForm.java
        QueryModalForm.java
        repo
        DescriptorForm.java
        DescriptorModalForm.java
        RepositoriesList.java
        RepositoryHeader.java
        server
        Connector.java
        JcrServiceImpl.java
        LRepository.java
        impl
        BackupUsrOptions.java
        ConnectorImpl.java
        JsonConfigConnectorImpl.java
        LRepositoryImpl.java
        MsDurationMetric.java
        MsValueMetric.java
        RepositoryList.java
        RestoreUsrOptions.java
        TimeUnit.java
        shared
        Acl.java
        Align.java
        BackupParams.java
        BaseCallback.java
        Columns.java
        DurationParameter.java
        Form.java
        JcrNode.java
        JcrNodeType.java
        JcrPermission.java
        JcrPolicy.java
        JcrProperty.java
        JcrRepositoryDescriptor.java
        ModalDialog.java
        ModalForm.java
        Param.java
        Policy.java
        RemoteException.java
        RepositoryName.java
        RestoreParams.java
        ResultSet.java
        Stats.java
  - modeshape-web-explorer-war
    - src
      - test
        java
        org
        modeshape
        web
        ExplorerTest.java
  - modeshape-web-jcr
    - src
      - main
        java
        org
        modeshape
        web
        jcr
        ModeShapeJcrDeployer.java
        NoSuchRepositoryException.java
        RepositoryManager.java
        WebJcrI18n.java
        WebLogger.java
        package-info.java
      - test
        java
        org
        modeshape
        web
        jcr
        RepositoryManagerTest.java
        WebJcrI18nTest.java
  - modeshape-web-jcr-rest
    - src
      - main
        java
        org
        modeshape
        web
        jcr
        rest
        JcrApplication.java
        ModeShapeExceptionMapper.java
        ModeShapeRestService.java
        RestHelper.java
        filter
        CleanupFilter.java
        LoggingFilter.java
        form
        FileUploadForm.java
        handler
        AbstractHandler.java
        ItemHandler.java
        RestBinaryHandler.java
        RestItemHandler.java
        RestNodeHandler.java
        RestNodeTypeHandler.java
        RestQueryHandler.java
        RestRepositoryHandler.java
        RestServerHandler.java
        model
        JSONAble.java
        RestException.java
        RestItem.java
        RestNode.java
        RestNodeType.java
        RestProperty.java
        RestPropertyType.java
        RestQueryPlanResult.java
        RestQueryResult.java
        RestRepositories.java
        RestWorkspaces.java
        Stringable.java
        output
        HtmlBodyWriter.java
        JSONBodyWriter.java
        TextBodyWriter.java
        package-info.java
  - modeshape-web-jcr-rest-war
    - src
      - test
        java
        org
        modeshape
        web
        jcr
        rest
        AbstractRestTest.java
        ModeShapeRestServiceTest.java
  - modeshape-web-jcr-webdav
    - src
      - main
        java
        org
        modeshape
        web
        jcr
        webdav
        ContentMapper.java
        DefaultContentMapper.java
        ModeShapeWebdavServlet.java
        ModeShapeWebdavStore.java
        MultiRepositoryRequestResolver.java
        RequestResolver.java
        ResolvedRequest.java
        SingleRepositoryRequestResolver.java
        WebdavI18n.java
        package-info.java
      - test
        java
        org
        modeshape
        web
        jcr
        webdav
        ModeShapeWebdavStoreTest.java
        MultiRepositoryRequestResolverTest.java
        WebdavI18nTest.java
  - modeshape-web-jcr-webdav-war
    - src
      - test
        java
        org
        modeshape
        web
        jcr
        webdav
        ModeShapeWebdavStoreClientTest.java
  - modeshape-webdav
    - src
      - main
        java
        org
        modeshape
        webdav
        IMethodExecutor.java
        IMimeTyper.java
        ITransaction.java
        IWebdavStore.java
        LocalFileSystemStore.java
        StoredObject.java
        WebDavServletBean.java
        WebdavServlet.java
        WebdavStatus.java
        exceptions
        AccessDeniedException.java
        LockFailedException.java
        ObjectAlreadyExistsException.java
        ObjectNotFoundException.java
        UnauthenticatedException.java
        WebdavException.java
        fromcatalina
        RequestUtil.java
        URLEncoder.java
        XMLHelper.java
        XMLWriter.java
        locking
        IResourceLocks.java
        LockedObject.java
        ResourceLocks.java
        methods
        AbstractMethod.java
        DeterminableMethod.java
        DoCopy.java
        DoDelete.java
        DoGet.java
        DoHead.java
        DoLock.java
        DoMkcol.java
        DoMove.java
        DoNotImplemented.java
        DoOptions.java
        DoPropfind.java
        DoProppatch.java
        DoPut.java
        DoUnlock.java
  - modeshape-webdav-war
    - src
      - test
        java
        org
        modeshape
        webdav
        WebdavStoreClientTest.java

/*
 * ModeShape (http://www.modeshape.org)
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *       http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.modeshape.extractor.tika;

import java.io.IOException;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;
import java.util.concurrent.atomic.AtomicReference;
import javax.jcr.RepositoryException;
import org.apache.tika.config.ServiceLoader;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.mime.MediaType;
import org.apache.tika.mime.MediaTypeRegistry;
import org.apache.tika.parser.DefaultParser;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.parser.Parser;
import org.apache.tika.sax.BodyContentHandler;
import org.modeshape.common.collection.Collections;
import org.modeshape.common.logging.Logger;
import org.modeshape.common.util.StringUtil;
import org.modeshape.jcr.api.Binary;
import org.modeshape.jcr.api.text.TextExtractor;
import org.xml.sax.ContentHandler;
import org.xml.sax.SAXException;

/**
 * A {@link TextExtractor} that uses the Apache Tika library.
 * <p>
 * This extractor will automatically discover all of the Tika {@link Parser} implementations that are defined in
 * <code>META-INF/services/org.apache.tika.parser.Parser</code> text files accessible via the current classloader and that contain
 * the class names of the Parser implementations (one class name per line in each file).
 * </p>
 * <p>
 * This text extractor can be configured in a ModeShape configuration by specifying several optional properties:
 * <ul>
 * <li><strong>excludedMimeTypes</strong> - The comma- or whitespace-separated list of MIME types that should be excluded from
 * text extraction, even if there is a Tika Parser available for that MIME type. By default, the MIME types for
 * {@link #DEFAULT_EXCLUDED_MIME_TYPES package files} are excluded, though explicitly setting any excluded MIME types will
 * override these default.</li>
 * <li><strong>includedMimeTypes</strong> - The comma- or whitespace-separated list of MIME types that should be included in text
 * extraction. This extractor will ignore any MIME types in this list that are not covered by Tika Parser implementations.</li>
 * </ul>
 * </p>
 */
public class TikaTextExtractor extends TextExtractor {

    protected static final Logger LOGGER = Logger.getLogger(TikaTextExtractor.class);

    /**
     * The MIME types that are excluded by default. Currently, this list consists of:
     * <ul>
     * <li>application/x-archive</li>
     * <li>application/x-bzip</li>
     * <li>application/x-bzip2</li>
     * <li>application/x-cpio</li>
     * <li>application/x-gtar</li>
     * <li>application/x-gzip</li>
     * <li>application/x-tar</li>
     * <li>application/zip</li>
     * <li>application/vnd.teiid.vdb</li>
     * <li>image/*</li>
     * <li>audio/*</li>
     * <li>video/*</li>
     * </ul>
     */
    protected static final Set<MediaType> DEFAULT_EXCLUDED_MIME_TYPES = Collections.unmodifiableSet(
            MediaType.application("x-archive"), MediaType.application("x-bzip"), MediaType.application("x-bzip2"),
            MediaType.application("x-cpio"), MediaType.application("x-gtar"), MediaType.application("x-gzip"),
            MediaType.application("x-tar"), MediaType.application("zip"), MediaType.application("vnd.teiid.vdb"),
            MediaType.image("*"), MediaType.audio("*"), MediaType.video("*"));

    private final Set<MediaType> excludedMediaTypes = new HashSet<>();
    private final Set<MediaType> includedMediaTypes = new HashSet<>();
    private final Set<MediaType> parserSupportedMediaTypes = new HashSet<>();

    /**
     * The write limit for the Tika parser, representing the maximum number of characters that should be extracted by the
     * TIKA parser; set via reflection
     */
    private Integer writeLimit;

    private final AtomicReference<DefaultParser> parser = new AtomicReference<>();

    /**
     * No-arg constructor is required because this is instantiated by reflection.
     */
    public TikaTextExtractor() {
        this.excludedMediaTypes.addAll(DEFAULT_EXCLUDED_MIME_TYPES);
    }

    @Override
    public boolean supportsMimeType( String mimeType ) {
        MediaType mediaType = MediaType.parse(mimeType);
        if (mediaType == null) {
            logger().debug("Invalid mime-type: {0}", mimeType);
            return false;
        }
        initialize();
        for (MediaType excludedMediaType : excludedMediaTypes) {
            if (excludedMediaType.equals(mediaType)) {
                return false;
            }
            if (excludedMediaType.getSubtype().equalsIgnoreCase("*") && mediaType.getType().equalsIgnoreCase(excludedMediaType.getType())) {
                return false;
            }
        }
        return includedMediaTypes.isEmpty() ? parserSupportedMediaTypes.contains(mediaType)
                                            : parserSupportedMediaTypes.contains(mediaType) && includedMediaTypes.contains(mediaType);
    }

    @Override
    public void extractFrom( final Binary binary,
                             final TextExtractor.Output output,
                             final Context context ) throws Exception {

        final DefaultParser parser = initialize();
        final Integer writeLimit = this.writeLimit;
        processStream(binary, stream -> {
            Metadata metadata = prepareMetadata(binary, context);
            //TODO author=Horia Chiorean date=1/30/13 description=//TIKA 1.2 TXTParser seems to have a bug, always adding 1 ignorable whitespace to the actual chars to be parsed
            //https://issues.apache.org/jira/browse/TIKA-1069
            ContentHandler textHandler = writeLimit == null ? new BodyContentHandler() : new BodyContentHandler(writeLimit + 1);
            try {
                LOGGER.debug("Using TikaTextExtractor to extract text");
                // Parse the input stream ...
                parser.parse(stream, textHandler, metadata, new ParseContext());
            } catch (SAXException sae) {
                LOGGER.warn(TikaI18n.parseExceptionWhileExtractingText, sae.getMessage());
            } catch (NoClassDefFoundError ncdfe) {
                LOGGER.warn(TikaI18n.warnNoClassDefFound, ncdfe.getMessage());
            } catch (Throwable e) {
                LOGGER.error(e, TikaI18n.errorWhileExtractingTextFrom, e.getMessage());
            } finally {
                // Record all of the text in the body ...
                String text = textHandler.toString().trim();
                if (!StringUtil.isBlank(text)) {
                    output.recordText(text);
                    LOGGER.debug("TikaTextExtractor found text: " + text);
                }
            }
            return null;
        });

    }

    /**
     * Creates a new tika metadata object used by the parser. This will contain the mime-type of the content being parsed, if this
     * is available to the underlying context. If not, Tika's autodetection mechanism is used to try and get the mime-type.
     * 
     * @param binary a <code>org.modeshape.jcr.api.Binary</code> instance of the content being parsed
     * @param context the extraction context; may not be null
     * @return a <code>Metadata</code> instance.
     * @throws java.io.IOException if auto-detecting the mime-type via Tika fails
     * @throws RepositoryException if error obtaining MIME-type of the binary parameter
     */
    protected final Metadata prepareMetadata( final Binary binary,
                                              final Context context ) throws IOException, RepositoryException {
        Metadata metadata = new Metadata();

        String mimeType = binary.getMimeType();
        if (StringUtil.isBlank(mimeType)) {
            // Call the detector (we don't know the name) ...
            mimeType = context.mimeTypeOf(null, binary);
        }
        if (!StringUtil.isBlank(mimeType)) {
            metadata.set(Metadata.CONTENT_TYPE, mimeType);
        }
        return metadata;
    }
    
    /**
     * This class lazily initializes the {@link DefaultParser} instance.
     *
     * @return the default parser; same as {@link #parser}
     */
    protected DefaultParser initialize() {
        parser.compareAndSet(null, newDefaultParser());
        return parser.get();
    }
    
    private DefaultParser newDefaultParser() {
        ServiceLoader serviceLoader = new ServiceLoader(this.getClass().getClassLoader(),
                                                        (classname, throwable) -> LOGGER.debug(throwable, "error while loading parser for {0}", classname));
        DefaultParser defaultParser = new DefaultParser(MediaTypeRegistry.getDefaultRegistry(), serviceLoader);
        LOGGER.debug("Initializing Tika Text Extractor");
        Map<MediaType, Parser> parsers = defaultParser.getParsers();
        LOGGER.debug("Tika parsers found: {0}",parsers.size());
        for (MediaType mediaType : parsers.keySet()) {
            parserSupportedMediaTypes.add(mediaType);
            LOGGER.debug("Tika Text Extractor will support the {0} media-type",mediaType);
        }
        convertStringMimeTypesToMediaTypes(getExcludedMimeTypes(), excludedMediaTypes);
        convertStringMimeTypesToMediaTypes(getIncludedMimeTypes(), includedMediaTypes);
        LOGGER.debug("Initialized {0}", this);
        return defaultParser;
    }
    
    private void convertStringMimeTypesToMediaTypes(Set<String> mimeTypes, Set<MediaType> mediaTypes) {
        for (String mimeTypeEntry : mimeTypes) {
            //allow each mime type entry to be an array in itself
            String[] multipleMimeTypes = mimeTypeEntry.split("[,\\s]");
            for (String mimeType : multipleMimeTypes) {
                if (StringUtil.isBlank(mimeType)) {
                    continue;
                }
                MediaType mediaType = MediaType.parse(mimeType.trim());
                if (mediaType == null) {
                    logger().debug("Invalid media type: {0}", mimeType);
                    continue;
                }
                mediaTypes.add(mediaType);
            }
        }
    }

    /**
     * Sets the write limit for the Tika parser, representing the maximum number of characters that should be extracted by the
     * TIKA parser.
     *
     * @param writeLimit an {@link Integer} which represents the write limit; may be null
     * @see BodyContentHandler#BodyContentHandler(int)
     */
    protected void setWriteLimit( Integer writeLimit ) {
        this.writeLimit = writeLimit;
    }

    protected Set<MediaType> getExcludedMediaTypes() {
        return excludedMediaTypes;
    }

    protected Set<MediaType> getIncludedMediaTypes() {
        return includedMediaTypes;
    }

    protected Set<MediaType> getParserSupportedMediaTypes() {
        return parserSupportedMediaTypes;
    }

    @Override
    public String toString() {
        final StringBuilder sb = new StringBuilder("TikaTextExtractor{");
        sb.append("excludedMediaTypes=").append(excludedMediaTypes);
        sb.append(", includedMediaTypes=").append(includedMediaTypes);
        sb.append(", parserSupportedMediaTypes=").append(parserSupportedMediaTypes);
        sb.append(", writeLimit=").append(writeLimit != null ? writeLimit : "unlimited");
        sb.append('}');
        return sb.toString();
    }
}