PDF2TextConverter.java example

Explorer

nuxeo-core-master
- nuxeo-core
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        CoreService.java
        CoreServiceOrphanVersionRemovalFilterDescriptor.java
        CoreServicePolicyDescriptor.java
        NXCore.java
        api
        AbstractSession.java
        DocumentModelFactory.java
        TransactionalCoreSessionWrapper.java
        local
        LocalException.java
        LocalSession.java
        SessionInfo.java
        lifecycle
        LifeCycle.java
        LifeCycleConstants.java
        LifeCycleException.java
        LifeCycleService.java
        LifeCycleState.java
        LifeCycleTransition.java
        event
        BulkLifeCycleChangeListener.java
        extensions
        LifeCycleDescriptor.java
        LifeCycleStateConfiguration.java
        LifeCycleTransitionConfiguration.java
        LifeCycleTypesDescriptor.java
        impl
        LifeCycleImpl.java
        LifeCycleRegistry.java
        LifeCycleServiceImpl.java
        LifeCycleStateImpl.java
        LifeCycleTransitionImpl.java
        LifeCycleTypeRegistry.java
        model
        Document.java
        DocumentExistsException.java
        DocumentIterator.java
        DuplicatedNameFixer.java
        EmptyDocumentIterator.java
        EmptyNameFixer.java
        MockDocument.java
        NoSuchDocumentException.java
        NoSuchPropertyException.java
        NoSuchRepositoryException.java
        PathComparator.java
        PropertyExistsException.java
        PropertyTypeException.java
        Repository.java
        Session.java
        repository
        RepositoryFactory.java
        RepositoryInitializationHandler.java
        RepositoryService.java
        security
        AbstractSecurityPolicy.java
        CheckInSecurityPolicy.java
        DefaultPermissionProvider.java
        LockSecurityPolicy.java
        MergedPermissionDescriptor.java
        PermissionDescriptor.java
        PermissionProviderLocal.java
        PermissionUIItemComparator.java
        PermissionUIItemDescriptor.java
        PermissionVisibilityDescriptor.java
        SecurityException.java
        SecurityPolicy.java
        SecurityPolicyDescriptor.java
        SecurityPolicyService.java
        SecurityPolicyServiceImpl.java
        SecurityService.java
        trash
        TrashInfo.java
        TrashService.java
        TrashServiceImpl.java
        versioning
        CompatVersioningService.java
        DefaultVersionRemovalPolicy.java
        DefaultVersioningRuleDescriptor.java
        ExtendableVersioningService.java
        InitialStateDescriptor.java
        NullVersionRemovalPolicy.java
        OptionDescriptor.java
        OrphanVersionRemovalFilter.java
        OrphanVersionRemoverListener.java
        SaveOptionsDescriptor.java
        StandardVersioningService.java
        VersionRemovalPolicy.java
        VersioningComponent.java
        VersioningDocumentAdapter.java
        VersioningDocumentAdapterFactory.java
        VersioningRuleDescriptor.java
        VersioningService.java
        VersioningServiceDescriptor.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        CoreUTConstants.java
        event
        TestCoreEvent.java
        TestEventContext.java
        lifecycle
        TestLifeCycleService.java
        model
        TestSidGenerator.java
        repository
        TestRepositoryInitializationHandler.java
        security
        MockCreatorSecurityPolicy.java
        TestSecurityPolicyService.java
        TestSecurityService.java
- nuxeo-core-api
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        api
        Blob.java
        ClientException.java
        ClientRuntimeException.java
        ConcurrentUpdateDocumentException.java
        ConcurrentUpdateException.java
        ConnectionException.java
        CoreInstance.java
        CoreSession.java
        DataModel.java
        DataModelMap.java
        DetachedAdapter.java
        DocumentException.java
        DocumentLocation.java
        DocumentModel.java
        DocumentModelComparator.java
        DocumentModelIterator.java
        DocumentModelList.java
        DocumentRef.java
        DocumentRefList.java
        DocumentSecurityException.java
        DocumentTreeIterator.java
        Filter.java
        IdRef.java
        IterableQueryResult.java
        LifeCycleConstants.java
        ListDiff.java
        Lock.java
        NoRollbackOnException.java
        NotConnectedException.java
        NuxeoException.java
        NuxeoGroup.java
        NuxeoPrincipal.java
        PathRef.java
        RecoverableClientException.java
        SerializableInputStream.java
        ServerException.java
        SimplePrincipal.java
        SortInfo.java
        Sorter.java
        SystemPrincipal.java
        UnrestrictedSessionRunner.java
        VersionModel.java
        VersioningChangeNotifier.java
        VersioningOption.java
        WrappedException.java
        adapter
        DocumentAdapterDescriptor.java
        DocumentAdapterFactory.java
        DocumentAdapterService.java
        blobholder
        AbstractBlobHolder.java
        BlobHolder.java
        BlobHolderAdapterComponent.java
        BlobHolderAdapterFactory.java
        BlobHolderAdapterService.java
        BlobHolderFactory.java
        BlobHolderFactoryDescriptor.java
        DocumentBlobHolder.java
        DocumentStringBlobHolder.java
        SimpleBlobHolder.java
        SimpleBlobHolderWithProperties.java
        event
        CoreEvent.java
        CoreEventConstants.java
        DocumentEventCategories.java
        DocumentEventTypes.java
        impl
        CoreEventImpl.java
        externalblob
        AbstractExternalBlobAdapter.java
        ExternalBlobAdapter.java
        ExternalBlobAdapterDescriptor.java
        FileSystemExternalBlobAdapter.java
        facet
        VersioningDocument.java
        impl
        CompoundFilter.java
        DataModelImpl.java
        DataModelMapImpl.java
        DocumentLocationImpl.java
        DocumentModelChildrenIterator.java
        DocumentModelImpl.java
        DocumentModelListImpl.java
        DocumentRefListImpl.java
        FacetFilter.java
        LifeCycleFilter.java
        NuxeoGroupImpl.java
        PermissionFilter.java
        SimpleDocumentModel.java
        UserPrincipal.java
        VersionModelImpl.java
        blob
        AbstractBlob.java
        BlobWrapper.java
        ByteArrayBlob.java
        DefaultBlob.java
        DefaultStreamBlob.java
        FileBlob.java
        InputStreamBlob.java
        StreamBlob.java
        StreamingBlob.java
        StringBlob.java
        URLBlob.java
        local
        ClientLoginModule.java
        LoginStack.java
        localconfiguration
        AbstractLocalConfiguration.java
        LocalConfiguration.java
        LocalConfigurationService.java
        LocalConfigurationServiceImpl.java
        model
        Delta.java
        DeltaLong.java
        DocumentPart.java
        InvalidPropertyValueException.java
        Property.java
        PropertyAccessException.java
        PropertyConversionException.java
        PropertyDiff.java
        PropertyException.java
        PropertyNotFoundException.java
        PropertyRuntimeException.java
        PropertyVisitor.java
        ReadOnlyPropertyException.java
        ValueExporter.java
        impl
        AbstractProperty.java
        ArrayProperty.java
        ComplexProperty.java
        DirtyPropertyIterator.java
        DocumentPartImpl.java
        ListProperty.java
        MapProperty.java
        PropertyFactory.java
        ScalarProperty.java
        primitives
        BinaryProperty.java
        BlobProperty.java
        BooleanProperty.java
        DateProperty.java
        DoubleProperty.java
        ExternalBlobProperty.java
        LongProperty.java
        StringProperty.java
        pathsegment
        PathSegmentComponent.java
        PathSegmentService.java
        PathSegmentServiceCompat.java
        PathSegmentServiceDefault.java
        PathSegmentServiceDescriptor.java
        propertiesmapping
        PropertiesMappingContributionRegistry.java
        PropertiesMappingDescriptor.java
        PropertiesMappingService.java
        impl
        PropertiesMappingComponent.java
        quota
        QuotaStats.java
        QuotaStatsNonFolderishCount.java
        QuotaStatsSize.java
        repository
        Repository.java
        RepositoryManager.java
        RepositoryManagerImpl.java
        security
        ACE.java
        ACL.java
        ACP.java
        Access.java
        PermissionProvider.java
        SecurityConstants.java
        UserEntry.java
        UserVisiblePermission.java
        impl
        ACLImpl.java
        ACPImpl.java
        UserEntryImpl.java
        thumbnail
        Thumbnail.java
        ThumbnailAdapter.java
        ThumbnailAdapterFactory.java
        ThumbnailFactory.java
        ThumbnailFactoryDescriptor.java
        ThumbnailService.java
        ThumbnailServiceImpl.java
        tree
        DefaultDocumentTreeFilter.java
        DefaultDocumentTreeSorter.java
        DocumentTreeFilter.java
        DocumentTreeSorter.java
        utils
        BlobsExtractor.java
        DocumentModelUtils.java
        SIDGenerator.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        api
        SerializableInputStreamTest.java
        TestDocumentModel.java
        TestDocumentRef.java
        TestFacetFilter.java
        TestListDiff.java
        TestNuxeoGroupImpl.java
        TestNuxeoPrincipal.java
        TestPropertyModel.java
        adapter
        TestAdapter.java
        blobholder
        TestBlobHolder.java
        event
        TestCoreEvent.java
        externalblob
        TestExternalBlob.java
        impl
        blob
        TestBlob.java
        TestBlob2.java
        TestMediaType.java
        model
        TestDeltaLong.java
        pathsegment
        PathSegmentServiceTest.java
        security
        TestACE.java
        TestACL.java
        TestACP.java
        utils
        TestBlobExtractor.java
        TestBlobsExtractor.java
- nuxeo-core-cache
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        cache
        AbstractCache.java
        Cache.java
        CacheAttributesChecker.java
        CacheDescriptor.java
        CacheRegistry.java
        CacheService.java
        CacheServiceImpl.java
        InMemoryCacheImpl.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        cache
        CacheComplianceFixture.java
        CacheFeature.java
        InMemoryCacheFeature.java
        TestCacheInMemory.java
        TestInMemoryCacheService.java
- nuxeo-core-convert
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        convert
        cache
        CachableBlobHolder.java
        CacheKeyGenerator.java
        ConversionCacheEntry.java
        ConversionCacheGCManager.java
        ConversionCacheHolder.java
        GCTask.java
        SimpleCachableBlobHolder.java
        extension
        ChainedConverter.java
        ConversionServiceManager.java
        Converter.java
        ConverterDescriptor.java
        ExternalConverter.java
        GlobalConfigDescriptor.java
        service
        ConversionServiceImpl.java
        ConvertOption.java
        MimeTypeTranslationHelper.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        convert
        tests
        ConvertFeature.java
        DummyConverter.java
        IdentityConverter.java
        NotAvailableConverter.java
        TestBlobHolderPersistence.java
        TestCGCache.java
        TestCache.java
        TestService.java
- nuxeo-core-convert-api
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        convert
        api
        ConversionException.java
        ConversionService.java
        ConverterCheckResult.java
        ConverterNotAvailable.java
        ConverterNotRegistered.java
- nuxeo-core-convert-plugins
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        convert
        plugins
        text
        extractors
        BaseOfficeXMLTextConverter.java
        DOCX2TextConverter.java
        FullTextConverter.java
        Html2TextConverter.java
        MD2TextConverter.java
        MSOffice2TextConverter.java
        OOo2TextConverter.java
        OOoXmlContentHandler.java
        OpenXmlContentHandler.java
        PDF2TextConverter.java
        PPT2TextConverter.java
        PPTX2TextConverter.java
        RFC822ToTextConverter.java
        RTF2TextConverter.java
        UnclosableZipInputStream.java
        Word2TextConverter.java
        XL2TextConverter.java
        XLX2TextConverter.java
        XML2TextConverter.java
        Xml2TextHandler.java
        XmlZip2TextConverter.java
        presentation
        PresentationSlide.java
- nuxeo-core-convert-plugins-test
  - src
    - test
      - java
        org
        nuxeo
        ecm
        core
        convert
        plugins
        tests
        AbstractConverterTest.java
        PDFEncodingWarn.java
        SimpleConverterTest.java
        TestConverters.java
        TestMSOfficeConverter.java
        TestMailConverter.java
        advanced
        AdvancedMSOfficeConverterTest.java
        AdvancedXMLZipConverterTest.java
        TestAdvancedMSOfficeConversion.java
        TestAdvancedXMLZipConversion.java
- nuxeo-core-event
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        event
        DeletedDocumentModel.java
        Event.java
        EventBundle.java
        EventContext.java
        EventListener.java
        EventProducer.java
        EventService.java
        EventServiceAdmin.java
        EventServiceComponent.java
        EventStats.java
        PostCommitEventListener.java
        PostCommitFilteringEventListener.java
        ReconnectedEventBundle.java
        impl
        AbstractEventContext.java
        AbstractLongRunningListener.java
        AssocMap.java
        AsyncEventExecutor.java
        AsyncWaitHook.java
        DocumentEventContext.java
        EventBundleImpl.java
        EventContextImpl.java
        EventImpl.java
        EventListenerDescriptor.java
        EventListenerDescriptorComparator.java
        EventListenerList.java
        EventServiceImpl.java
        InlineEventContext.java
        PostCommitEventExecutor.java
        ReconnectedEventBundleImpl.java
        ShallowDocumentModel.java
        ShallowEvent.java
        UnboundEventContext.java
        jms
        AsyncProcessorConfig.java
        ReconnectedJMSEventBundle.java
        SerializableEventBundle.java
        script
        FakeCompiledScript.java
        FileScript.java
        JARFileScript.java
        JARUrlScript.java
        Script.java
        ScriptingEventListener.java
        ScriptingPostCommitEventListener.java
        URLScript.java
        scheduler
        EventJob.java
        Schedule.java
        ScheduleExtensionRegistry.java
        ScheduleImpl.java
        SchedulerService.java
        SchedulerServiceImpl.java
        work
        AbstractWork.java
        MemoryBlockingQueue.java
        MemoryWorkQueuing.java
        NuxeoBlockingQueue.java
        SleepWork.java
        WorkHolder.java
        WorkManagerCleanupListener.java
        WorkManagerImpl.java
        WorkQueueDescriptorRegistry.java
        WorkQueuing.java
        api
        Work.java
        WorkManager.java
        WorkQueueDescriptor.java
        WorkQueuingImplDescriptor.java
        WorkSchedulePath.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        event
        test
        DummyInlineListener.java
        DummyPostCommitEventListener.java
        EventListenerTest.java
        FakeEventBundle.java
        TestEventListenerContrib.java
        TestEventServiceComponent.java
        scheduler
        DummyEventListener.java
        TestSchedulerService.java
        WorkErrorsAreTracableTest.java
        work
        WorkManagerTXTest.java
        WorkManagerTest.java
- nuxeo-core-event-jms
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        event
        jms
        JMSBusNotActiveException.java
        JmsEventForwarder.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        event
        test
        TestJMSEventBundle.java
- nuxeo-core-io
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        io
        DocumentPipe.java
        DocumentReader.java
        DocumentReaderFactory.java
        DocumentTransformer.java
        DocumentTranslationMap.java
        DocumentWriter.java
        DocumentWriterFactory.java
        DocumentXMLExporter.java
        DocumentsExporter.java
        DocumentsImporter.java
        ExportConstants.java
        ExportedDocument.java
        IODocumentManager.java
        exceptions
        ExportDocumentException.java
        ImportDocumentException.java
        impl
        AbstractDocumentModelWriter.java
        AbstractDocumentReader.java
        AbstractDocumentWriter.java
        DWord.java
        DocumentPipeImpl.java
        DocumentTranslationMapImpl.java
        DocumentXMLExporterImpl.java
        ExportedDocumentImpl.java
        IODocumentManagerImpl.java
        TransactionBatchingDocumentPipeImpl.java
        TypedExportedDocumentImpl.java
        plugins
        DocumentChildrenReader.java
        DocumentModelInjector.java
        DocumentModelReader.java
        DocumentModelUpdater.java
        DocumentModelWriter.java
        DocumentTreeReader.java
        DocumentTreeReaderFactory.java
        DocumentsListReader.java
        NuxeoArchiveReader.java
        NuxeoArchiveWriter.java
        SingleDocumentReader.java
        TypedSingleDocumentReader.java
        XMLDirectoryReader.java
        XMLDirectoryWriter.java
        XMLDocumentTreeWriter.java
        XMLDocumentWriter.java
        XMLZipReader.java
        ZipReader.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        io
        impl
        ComplexDocRepositoryInit.java
        TestExportImportBlob.java
        TestExportImportZipArchive.java
        TestExportedDocument.java
        TestImportExportWithComplexXSD.java
        TestImportModifiedZipArchive.java
        TestTypedExportedDocument.java
        TypedExportedDocumentRepositoryInit.java
- nuxeo-core-management
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        management
        CoreManagementComponent.java
        CoreManagementService.java
        StatusesManagementFactory.java
        api
        AdministrativeStatus.java
        AdministrativeStatusManager.java
        GlobalAdministrativeStatusManager.java
        Probe.java
        ProbeInfo.java
        ProbeMBean.java
        ProbeManager.java
        ProbeRunnerMBean.java
        ProbeStatus.java
        StorageError.java
        events
        CallStat.java
        EventCounterListener.java
        EventMonitoring.java
        EventMonitoringFactory.java
        EventMonitoringMBean.java
        EventStatsHolder.java
        EventStatsImpl.java
        probes
        AdministrativeStatusProbe.java
        ProbeDescriptor.java
        ProbeInfoImpl.java
        ProbeManagerImpl.java
        statuses
        AdministrableServiceDescriptor.java
        AdministrativeStatusManagerImpl.java
        CoreEventNotifier.java
        GlobalAdministrativeStatusManagerImpl.java
        Notifier.java
        NuxeoInstanceIdentifierHelper.java
        RuntimeEventNotifier.java
        StatusServlet.java
        storage
        AdministrativeStatusPersister.java
        DocumentModelStatusPersister.java
        DocumentStoreConfigurationDescriptor.java
        DocumentStoreHandler.java
        DocumentStoreHandlerDescriptor.java
        DocumentStoreManager.java
        DocumentStoreSessionRunner.java
        works
        WorksMonitoring.java
        WorksMonitoringFactory.java
        WorksMonitoringMBean.java
        WorksQueueMonitoring.java
        WorksQueueMonitoringMBean.java
- nuxeo-core-management-jtajca
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        management
        jtajca
        ConnectionPoolMonitor.java
        CoreSessionMonitor.java
        Defaults.java
        Monitor.java
        TransactionMonitor.java
        TransactionStatistics.java
        internal
        DefaultConnectionPoolMonitor.java
        DefaultCoreSessionMonitor.java
        DefaultMonitorComponent.java
        DefaultTransactionMonitor.java
        DefaultTransactionStatistics.java
        Log4jWebFilter.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        management
        jtajca
        CanMonitorConnectionPoolTest.java
        CanMonitorCoreSessionTest.java
        CanMonitorTransactionsTest.java
        IndexerDoesNotLeakTest.java
        JtajcaManagementFeature.java
- nuxeo-core-management-test
  - src
    - test
      - java
        org
        nuxeo
        ecm
        core
        management
        test
        FakeDocumentStoreHandler.java
        probes
        TestProbes.java
        statuses
        AdministrativeStatusChangeListener.java
        RuntimeListener.java
        TestAdministrativeStatusService.java
        storage
        TestStorage.java
- nuxeo-core-persistence
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        persistence
        EntityManagerFactoryProvider.java
        HibernateConfiguration.java
        HibernateConfigurator.java
        NuxeoConnectionProvider.java
        PersistenceComponent.java
        PersistenceError.java
        PersistenceProvider.java
        PersistenceProviderFactory.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        persistence
        DummyEntity.java
        TestPersistenceProvider.java
        TestPersistenceProviderSingleDataSource.java
- nuxeo-core-query
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        query
        QueryException.java
        QueryFilter.java
        QueryParseException.java
        sql
        NXQL.java
        SQLQueryParser.java
        model
        ASTNode.java
        BooleanLiteral.java
        Clause.java
        DateLiteral.java
        DefaultQueryVisitor.java
        DoubleLiteral.java
        Expression.java
        FromClause.java
        FromList.java
        Function.java
        GroupByClause.java
        HavingClause.java
        IVisitor.java
        IntegerLiteral.java
        Literal.java
        LiteralList.java
        MultiExpression.java
        Operand.java
        OperandList.java
        Operator.java
        OrderByClause.java
        OrderByExpr.java
        OrderByList.java
        PathReference.java
        Predicate.java
        Reference.java
        ReferenceList.java
        SQLQuery.java
        SelectClause.java
        SelectList.java
        StringLiteral.java
        WhereClause.java
        parser
        Scanner.java
        parser.java
        sym.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        query
        sql
        TestNXQLEscaping.java
        TestQueryParser.java
        TestQueryParser2.java
        model
        TestLiterals.java
        TestQueryVisitor.java
        TestSerialization.java
- nuxeo-core-redis
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        redis
        RedisAdmin.java
        RedisCallable.java
        RedisComponent.java
        RedisExecutor.java
        RedisFailoverExecutor.java
        RedisHostDescriptor.java
        RedisPoolDescriptor.java
        RedisPoolExecutor.java
        RedisSentinelDescriptor.java
        RedisServerDescriptor.java
        SingletonContributionRegistry.java
        contribs
        RedisBlockingQueue.java
        RedisCache.java
        RedisLockManager.java
        RedisWorkQueuing.java
        retry
        ExponentialBackofDelay.java
        Retry.java
        SimpleDelay.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        redis
        RedisFailoverFeature.java
        RedisFeature.java
        TestRedisCacheService.java
        TestRedisFailover.java
        TestRedisLockManager.java
        TestRedisWorkManager.java
        embedded
        RedisEmbeddedConnection.java
        RedisEmbeddedFactory.java
        RedisEmbeddedGuessConnectionError.java
        RedisEmbeddedGuessError.java
        RedisEmbeddedLuaEngine.java
        RedisEmbeddedLuaLibrary.java
        RedisEmbeddedPool.java
        RedisEmbeddedSynchronizedExecutor.java
        RedisEmbeddedTraceExecutor.java
- nuxeo-core-schema
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        schema
        DocumentType.java
        DocumentTypeDescriptor.java
        DocumentTypeImpl.java
        FacetDescriptor.java
        FacetNames.java
        FlushPendingsRegistrationOnReloadListener.java
        NXSchema.java
        Namespace.java
        Prefetch.java
        PrefetchInfo.java
        ProxiesDescriptor.java
        SchemaBindingDescriptor.java
        SchemaDescriptor.java
        SchemaManager.java
        SchemaManagerImpl.java
        SchemaNames.java
        TypeConfiguration.java
        TypeConstants.java
        TypeProvider.java
        TypeService.java
        XSDLoader.java
        XSDTypes.java
        types
        AbstractType.java
        AnyType.java
        ComplexType.java
        ComplexTypeImpl.java
        CompositeType.java
        CompositeTypeImpl.java
        Constraint.java
        Field.java
        FieldImpl.java
        JavaTypes.java
        ListType.java
        ListTypeImpl.java
        PrimitiveType.java
        QName.java
        Schema.java
        SchemaImpl.java
        SimpleType.java
        SimpleTypeImpl.java
        Type.java
        TypeBindingException.java
        TypeException.java
        constraints
        EnumConstraint.java
        StringLengthConstraint.java
        primitives
        BinaryType.java
        BooleanType.java
        DateType.java
        DoubleType.java
        IntegerType.java
        LongType.java
        StringType.java
        utils
        DateParser.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        schema
        TestDocumentType.java
        TestNamespace.java
        TestSchemaLoader.java
        TestSchemaManager.java
        types
        TestQName.java
        TestSimpleType.java
        TestTypes.java
        utils
        DateParserTest.java
- nuxeo-core-storage
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        storage
        DefaultFulltextParser.java
        ExpressionEvaluator.java
        FulltextConfiguration.java
        FulltextExtractorWork.java
        FulltextParser.java
        FulltextQueryAnalyzer.java
        FulltextUpdaterWork.java
        QueryOptimizer.java
        RepositoryReloader.java
        State.java
        StateHelper.java
        StorageBlob.java
        binary
        AESBinaryManager.java
        AbstractBinaryManager.java
        Binary.java
        BinaryGarbageCollector.java
        BinaryManager.java
        BinaryManagerDescriptor.java
        BinaryManagerRootDescriptor.java
        BinaryManagerService.java
        BinaryManagerStatus.java
        BinaryManagerStreamSupport.java
        BinaryScrambler.java
        CachingBinaryManager.java
        DefaultBinaryManager.java
        FileStorage.java
        LazyBinary.java
        LocalBinaryManager.java
        XORBinaryManager.java
        lock
        AbstractLockManager.java
        LockException.java
        LockManager.java
        LockManagerDescriptor.java
        LockManagerService.java
        sql
        coremodel
        SQLBlob.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        storage
        TestDefaultFulltextParser.java
        TestFulltextQueryAnalyzer.java
        TestStateHelper.java
        binary
        TestAESBinaryManager.java
        TestDefaultBinaryManager.java
        TestXORBinaryManager.java
- nuxeo-core-storage-dbs
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        storage
        dbs
        DBSDocument.java
        DBSDocumentState.java
        DBSExpressionEvaluator.java
        DBSFulltextExtractorWork.java
        DBSRepository.java
        DBSRepositoryBase.java
        DBSSession.java
        DBSTransactionState.java
- nuxeo-core-storage-mem
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        storage
        mem
        MemRepository.java
        MemRepositoryFactory.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        storage
        mem
        MemRepositoryTestCase.java
        TestMemRepository.java
        TestMemRepositoryApplyDiff.java
        TestMemRepositoryProperties.java
        TestMemRepositoryQuery.java
        TestMemRepositorySecurity.java
- nuxeo-core-storage-mongodb
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        storage
        mongodb
        MongoDBQueryBuilder.java
        MongoDBRepository.java
        MongoDBRepositoryDescriptor.java
        MongoDBRepositoryFactory.java
        MongoDBRepositoryService.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        storage
        mongodb
        MongoDBRepositoryTXTestCase.java
        MongoDBRepositoryTestCase.java
        TestMongoDBFulltextQuerySyntax.java
        TestMongoDBRepository.java
        TestMongoDBRepositoryFulltextQuery.java
        TestMongoDBRepositoryJTAJCA.java
        TestMongoDBRepositoryProperties.java
        TestMongoDBRepositoryQuery.java
        TestMongoDBRepositorySecurity.java
- nuxeo-core-storage-sql
  - nuxeo-core-storage-sql
    - src
      - main
        java
        org
        nuxeo
        ecm
        core
        storage
        ConcurrentUpdateStorageException.java
        ConnectionResetException.java
        Credentials.java
        EventConstants.java
        PartialList.java
        StorageException.java
        sql
        ACLRow.java
        Activator.java
        BaseProperty.java
        CachingMapper.java
        CollectionFragment.java
        CollectionProperty.java
        ColumnSpec.java
        ColumnType.java
        Fragment.java
        Invalidations.java
        InvalidationsPropagator.java
        InvalidationsQueue.java
        Mapper.java
        Model.java
        ModelProperty.java
        ModelSetup.java
        Node.java
        NuxeoEhcacheTransactionManagerLookup.java
        PersistenceContext.java
        PropertyType.java
        Repository.java
        RepositoryBackend.java
        RepositoryDescriptor.java
        RepositoryImpl.java
        RepositoryManagement.java
        RepositoryResolver.java
        Row.java
        RowId.java
        RowMapper.java
        Selection.java
        SelectionContext.java
        SelectionType.java
        Session.java
        SessionImpl.java
        SimpleFragment.java
        SimpleProperty.java
        SoftDeleteCleanupListener.java
        SoftRefCachingMapper.java
        SoftRefCachingRowMapper.java
        UnifiedCachingMapper.java
        UnifiedCachingRowMapper.java
        VCSLockManager.java
        coremodel
        SQLDocument.java
        SQLDocumentLive.java
        SQLDocumentProxy.java
        SQLDocumentVersion.java
        SQLFulltextExtractorWork.java
        SQLRepository.java
        SQLRepositoryCompatService.java
        SQLRepositoryFactory.java
        SQLRepositoryService.java
        SQLSession.java
        jdbc
        ACLCollectionIO.java
        ClusterNodeHandler.java
        CollectionIO.java
        JDBCBackend.java
        JDBCConnection.java
        JDBCConnectionPropagator.java
        JDBCLogger.java
        JDBCMapper.java
        JDBCMapperConnector.java
        JDBCMapperTxSuspender.java
        JDBCRowMapper.java
        NXQLQueryMaker.java
        QueryMaker.java
        QueryMakerDescriptor.java
        QueryMakerService.java
        QueryMakerServiceImpl.java
        ResultSetQueryResult.java
        SQLInfo.java
        ScalarCollectionIO.java
        TableUpgrader.java
        XAResourceConnectionAdapter.java
        db
        Column.java
        Database.java
        Delete.java
        Insert.java
        Join.java
        Select.java
        Table.java
        TableAlias.java
        TableImpl.java
        Update.java
        dialect
        Dialect.java
        DialectDB2.java
        DialectDerby.java
        DialectH2.java
        DialectHSQLDB.java
        DialectMySQL.java
        DialectOracle.java
        DialectPostgreSQL.java
        DialectSQLServer.java
        SQLStatement.java
      - test
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        TestNXQLQueryMaker.java
        TestQueryMakerService.java
        TestRepositoryDescriptor.java
        jdbc
        dialect
        TestDialectQuerySyntax.java
        TestDialectSubclassing.java
  - nuxeo-core-storage-sql-extensions
    - src
      - main
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        db
        DerbyFunctions.java
        EmbeddedFunctions.java
        H2Fulltext.java
        H2Functions.java
      - test
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        db
        TestEmbeddedFunctions.java
  - nuxeo-core-storage-sql-management
    - src
      - main
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        management
        ActiveSessionsProbe.java
        MonitoredBackend.java
        MonitoredJDBCBackend.java
        RemoteSessionsProbe.java
        SQLRepositoryStatus.java
        SQLRepositoryStatusFactory.java
        SQLRepositoryStatusMBean.java
  - nuxeo-core-storage-sql-ra
    - src
      - main
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        ra
        ConnectionFactoryImpl.java
        ConnectionImpl.java
        ConnectionManagerImpl.java
        ManagedConnectionFactoryImpl.java
        ManagedConnectionImpl.java
        PoolingRepositoryFactory.java
        ResourceAdapterImpl.java
      - test
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        ra
        TestParseProperties.java
  - nuxeo-core-storage-sql-test
    - src
      - main
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        CapturingQueryMaker.java
        DatabaseDB2.java
        DatabaseDerby.java
        DatabaseH2.java
        DatabaseHelper.java
        DatabaseMySQL.java
        DatabaseOracle.java
        DatabasePostgreSQL.java
        DatabaseSQLServer.java
        H2OnlyFeature.java
        IgnoreNonPooledCondition.java
        IgnoreNonPostgresql.java
        LockStepJob.java
        listeners
        DummyAsyncRetryListener.java
        DummyBeforeModificationListener.java
        DummyTestListener.java
        security
        NoFile2SecurityPolicy.java
        NoFileSecurityPolicy.java
      - test
        java
        org
        nuxeo
        ecm
        core
        storage
        sql
        SQLBackendTestCase.java
        TestSQLBackend.java
        TestSQLBackendArrayColumns.java
        TestSQLBackendNoProxies.java
        TestSQLBackendScrambling.java
        TestSQLBackendSequenceId.java
        TestSQLBackendSoftDelete.java
        TestSQLBackendUpgrade.java
        coremodel
        TestRemotableBlob.java
        TestSQLSecurityManager.java
- nuxeo-core-test
  - src
    - main
      - java
        org
        nuxeo
        ecm
        core
        storage
        sql
        SQLRepositoryTestCase.java
        TXSQLRepositoryTestCase.java
        test
        CoreFeature.java
        CoreScope.java
        DefaultRepositoryInit.java
        DetectThreadDeadlocksFeature.java
        FakeSmtpMailServerFeature.java
        JettyTransactionalFeature.java
        MultiNuxeoCoreRunner.java
        MultiRepositoriesCoreFeature.java
        NoopRepositoryInit.java
        RepositorySettings.java
        TransactionalFeature.java
        annotations
        BackendType.java
        DatabaseHelperFactory.java
        Granularity.java
        RepositoryConfig.java
        RepositoryConfigs.java
        RepositoryInit.java
        TransactionalConfig.java
    - test
      - java
        org
        nuxeo
        ecm
        core
        TestJCAPoolBehavior.java
        TestSQLBinariesIndexing.java
        TestSQLBinariesIndexingOverride.java
        TestSQLRepositoryAPI.java
        TestSQLRepositoryDirectBlob.java
        TestSQLRepositoryFulltextConfig.java
        TestSQLRepositoryFulltextQuery.java
        TestSQLRepositoryFulltextWork.java
        TestSQLRepositoryJTAJCA.java
        TestSQLRepositoryLocking.java
        TestSQLRepositoryLockingNoTX.java
        TestSQLRepositoryProperties.java
        TestSQLRepositoryQuery.java
        TestSQLRepositoryQueryNoPathOptim.java
        TestSQLRepositoryReadAcls.java
        TestSQLRepositorySecurity.java
        TestSQLRepositorySecurityNegativeAcl.java
        TestSQLRepositoryVersioning.java
        TestSingleDataSource.java
        api
        Attachment.java
        Constants.java
        NameFilter.java
        TestDocumentModel.java
        TestLockSecurityPolicy.java
        TestPermissionFilter.java
        TestSecurityPolicyService.java
        TestUnrestrictedSessionRunner.java
        adapter
        AnnotatedDocument.java
        AnnotatedDocumentAdapter.java
        AnnotatedDocumentFactory.java
        blobholder
        BlobHolderDummyFactory.java
        BlobHolderDummyImpl.java
        TestBlobHolderAdapterService.java
        TestDocumentAdapter.java
        propertiesmapping
        TestMappingPropertiesService.java
        event
        test
        PostCommitEventListenerTest.java
        ShallowFilterPostCommitEventListener.java
        TransitionTest.java
        WorkTest.java
        virusscan
        TestDummyVirusScanner.java
        VirusScanConsts.java
        listeners
        VirusScanEventContext.java
        VirusScanSyncListener.java
        VirusScannerProcessor.java
        service
        DummyVirusScanner.java
        ScanComponent.java
        ScanResult.java
        ScanService.java
        security
        AccessLevelSecurityPolicy.java
        test
        CanDetectThreadDeadlocksTest.java
        CanRenameDuplicateTest.java
        CleanUpWithInitializerTest.java
        CleanupLevelClassTest.java
        CleanupLevelTest.java
        CoreSessionInjectionTest.java
        DefaultRepoFactoryTest.java
        DocumentPropertyTest.java
        NuxeoSimpleSuite.java
        QueryResultsAreAutomaticallyClosedTest.java
        SimpleSession.java
        ThreadDeadlocksRunner.java
        trash
        test
        TestTrashService.java
        version
        test
        OrphanVersionRemovalOnlyFileFilter.java
        TestVersioningDocumentAdapter.java
        TestVersioningRemovalPolicy.java
        TestVersioningSaveOptions.java
        TestVersioningService.java

/*
 * (C) Copyright 2002-2010 Nuxeo SA (http://nuxeo.com/) and contributors.
 *
 * All rights reserved. This program and the accompanying materials
 * are made available under the terms of the GNU Lesser General Public License
 * (LGPL) version 2.1 which accompanies this distribution, and is available at
 * http://www.gnu.org/licenses/lgpl.html
 *
 * This library is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
 * Lesser General Public License for more details.
 *
 * Contributors:
 *     Julien Anguenot
 *     Florent Guillaume
 */
package org.nuxeo.ecm.core.convert.plugins.text.extractors;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.Serializable;
import java.lang.reflect.Field;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.pdfbox.cos.COSBase;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.encryption.AccessPermission;
import org.apache.pdfbox.util.PDFOperator;
import org.apache.pdfbox.util.PDFStreamEngine;
import org.apache.pdfbox.util.PDFTextStripper;
import org.apache.pdfbox.util.operator.OperatorProcessor;
import org.nuxeo.ecm.core.api.blobholder.BlobHolder;
import org.nuxeo.ecm.core.api.impl.blob.FileBlob;
import org.nuxeo.ecm.core.api.impl.blob.StringBlob;
import org.nuxeo.ecm.core.convert.api.ConversionException;
import org.nuxeo.ecm.core.convert.cache.SimpleCachableBlobHolder;
import org.nuxeo.ecm.core.convert.extension.Converter;
import org.nuxeo.ecm.core.convert.extension.ConverterDescriptor;

public class PDF2TextConverter implements Converter {

    public static class PatchedPDFTextStripper extends PDFTextStripper {

        public PatchedPDFTextStripper() throws IOException {
            super();
            // platform independent line and paragraph separators
            setLineSeparator("\n");
            setParagraphEnd("\n\n");
            setArticleEnd("\n\n");
        }

        protected Object unrestrictedAccess(String name) {
            try {
                Field f = PDFStreamEngine.class.getDeclaredField(name);
                f.setAccessible(true);
                return f.get(this);
            } catch (Exception e) {
                throw new RuntimeException(
                        "Cannot get access to PDFStreamEngine fields", e);
            }
        }

        @SuppressWarnings("unchecked")
        protected Set<String> unsupportedOperators() {
            return (Set<String>) unrestrictedAccess("unsupportedOperators");
        }

        @SuppressWarnings("unchecked")
        protected Map<String, OperatorProcessor> operators() {
            return (Map<String, OperatorProcessor>) unrestrictedAccess("operators");
        }

        final static Set<StackTraceElement> loggedStacks = new HashSet<StackTraceElement>();

        @Override
        protected void processOperator(PDFOperator operator,
                List<COSBase> arguments) throws IOException {
            try {

                String operation = operator.getOperation();
                OperatorProcessor processor = operators().get(operation);
                if (processor != null) {
                    processor.setContext(this);
                    processor.process(operator, arguments);
                } else {
                    if (!unsupportedOperators().contains(operation)) {
                        log.info("unsupported/disabled operation: " + operation);
                        unsupportedOperators().add(operation);
                    }
                }
            } catch (Exception e) {
                StackTraceElement root = e.getStackTrace()[0];
                synchronized (loggedStacks) {
                    if (loggedStacks.contains(root)) {
                        return;
                    }
                    loggedStacks.add(root);
                }
                log.warn(
                        "Caught error in pdfbox during extraction (stack logged only once)",
                        e);
            }
        }

    }

    private static final Log log = LogFactory.getLog(PDF2TextConverter.class);

    @Override
    public BlobHolder convert(BlobHolder blobHolder,
            Map<String, Serializable> parameters) throws ConversionException {

        PDDocument document = null;
        File f = null;
        OutputStream fas = null;
        try {
            document = PDDocument.load(blobHolder.getBlob().getStream());
            // NXP-1556: if document is protected an IOException will be raised
            // Instead of catching the exception based on its message string
            // lets avoid sending messages that will generate this error
            // code taken from PDFTextStripper.writeText source.
            // only care about standard encryption and if it was decrypted with
            // the user password
            AccessPermission permission = document.getCurrentAccessPermission();
            if (permission.canExtractContent()) {
                PatchedPDFTextStripper textStripper = new PatchedPDFTextStripper();

                // use the position information to heuristically organize the
                // extracted paragraphs. This is also important for
                // right-to-left languages.
                textStripper.setSortByPosition(true);

                String text = textStripper.getText(document);
                // replace non breaking space by regular spaces (why?)
                // text = text.replace("\u00a0", " ");
                f = File.createTempFile("pdfboplugin", ".txt");
                fas = new FileOutputStream(f);
                fas.write(text.getBytes("UTF-8"));
                return new SimpleCachableBlobHolder(new FileBlob(
                        new FileInputStream(f), "text/plain", "UTF-8"));
            } else {
                return new SimpleCachableBlobHolder(new StringBlob(""));
            }
        } catch (Exception e) {
            throw new ConversionException(
                    "Error during text extraction with PDFBox", e);
        } finally {
            if (document != null) {
                try {
                    document.close();
                } catch (Exception e) {
                    log.error("Error while closing PDFBox document", e);
                }
            }
            if (fas != null) {
                try {
                    fas.close();
                } catch (IOException e) {
                    log.error(e);
                }
            }
            if (f != null) {
                f.delete();
            }
        }
    }

    @Override
    public void init(ConverterDescriptor descriptor) {
    }

}