OpenNLPMaximumEntropyExtractorGraphPropertyWorker.java example

Explorer

lumify-master
- core
  - core
    - src
      - main
        java
        io
        lumify
        core
        EntityHighlighter.java
        FrameworkUtils.java
        bootstrap
        BootstrapBindingProvider.java
        InjectHelper.java
        LumifyBootstrap.java
        lib
        HdfsLibCacheLoader.java
        LibDirectoryLoader.java
        LibLoader.java
        cmdline
        CommandLineBase.java
        OwlExport.java
        OwlImport.java
        OwlToJava.java
        config
        Configurable.java
        Configuration.java
        ConfigurationHelper.java
        ConfigurationLoader.java
        DatabaseConfigurationLoader.java
        DatabaseConfigurationLoaderConfig.java
        FileConfigurationLoader.java
        HashMapConfigurationLoader.java
        LumifyResourceBundle.java
        LumifyResourceBundleManager.java
        PostConfigurationValidator.java
        PropertyUtils.java
        exception
        LumifyAccessDeniedException.java
        LumifyException.java
        LumifyJsonParseException.java
        LumifyResourceNotFoundException.java
        formula
        FormulaEvaluator.java
        RequireJsSupport.java
        ingest
        ArtifactDetectedObject.java
        FileImport.java
        FileImportSupportingFileHandler.java
        MetadataFileImportSupportingFileHandler.java
        MetadataGraphPropertyWorker.java
        WorkerSpout.java
        WorkerTuple.java
        graphProperty
        GraphPropertyRunner.java
        GraphPropertyThreadedWrapper.java
        GraphPropertyWorkData.java
        GraphPropertyWorker.java
        GraphPropertyWorkerPrepareData.java
        GraphPropertyWorkerTuple.java
        MimeTypeGraphPropertyWorker.java
        PostMimeTypeWorker.java
        RegexGraphPropertyWorker.java
        TermMentionFilter.java
        TermMentionFilterPrepareData.java
        video
        VideoFrameInfo.java
        VideoPropertyHelper.java
        VideoTranscript.java
        mapreduce
        LumifyElementMapperBase.java
        LumifyMRBase.java
        metrics
        JmxMetricsManager.java
        MetricsManager.java
        PausableTimerContext.java
        PausableTimerContextAware.java
        model
        PropertyJustificationMetadata.java
        SaveFileResults.java
        SourceInfo.java
        artifactThumbnails
        ArtifactThumbnail.java
        ArtifactThumbnailRepository.java
        BigTableArtifactThumbnail.java
        BigTableArtifactThumbnailMetadata.java
        BigTableArtifactThumbnailRepository.java
        BigTableArtifactThumbnailRowKey.java
        ImageUtils.java
        NoOpArtifactThumbnailRepository.java
        audit
        Audit.java
        AuditAction.java
        AuditBuilder.java
        AuditCommon.java
        AuditData.java
        AuditEntity.java
        AuditProperty.java
        AuditRelationship.java
        AuditRepository.java
        AuditRowKey.java
        InMemoryAuditRepository.java
        NoOpAuditRepository.java
        lock
        LocalLockRepository.java
        Lock.java
        LockRepository.java
        longRunningProcess
        FindPathLongRunningProcessQueueItem.java
        FindPathLongRunningProcessWorker.java
        LongRunningProcessRepository.java
        LongRunningProcessRunner.java
        LongRunningProcessWorker.java
        LongRunningWorkerPrepareData.java
        notification
        ExpirationAge.java
        ExpirationAgeUnit.java
        Notification.java
        NotificationRepository.java
        SystemNotification.java
        SystemNotificationRepository.java
        SystemNotificationSeverity.java
        UserNotification.java
        UserNotificationRepository.java
        ontology
        Concept.java
        InMemoryConcept.java
        InMemoryOntologyProperty.java
        InMemoryOntologyRepository.java
        InMemoryRelationship.java
        LabelName.java
        OntologyProperty.java
        OntologyRepository.java
        OntologyRepositoryBase.java
        Relationship.java
        properties
        LumifyProperties.java
        MediaLumifyProperties.java
        types
        BooleanLumifyProperty.java
        ByteArrayLumifyProperty.java
        ClientApiLumifyProperty.java
        DateLumifyProperty.java
        DetectedObjectProperty.java
        DoubleLumifyProperty.java
        GeoPointLumifyProperty.java
        IdentityLumifyProperty.java
        IntegerLumifyProperty.java
        JsonArrayLumifyProperty.java
        JsonLumifyProperty.java
        LongLumifyProperty.java
        LumifyProperty.java
        PropertyJustificationMetadataLumifyProperty.java
        StreamingLumifyProperty.java
        StringLumifyProperty.java
        VideoTranscriptProperty.java
        VisibilityJsonLumifyProperty.java
        termMention
        TermMentionBuilder.java
        TermMentionFor.java
        TermMentionForProperty.java
        TermMentionRepository.java
        textHighlighting
        OffsetItem.java
        VertexOffsetItem.java
        user
        AccumuloAuthorizationRepository.java
        AuthorizationRepository.java
        InMemoryAuthorizationRepository.java
        InMemoryUser.java
        InMemoryUserRepository.java
        NoOpAuthorizationRepository.java
        UserListener.java
        UserListenerUtil.java
        UserLumifyProperties.java
        UserPasswordUtil.java
        UserRepository.java
        UserSessionCounterRepository.java
        workQueue
        NoOpWorkQueueRepository.java
        WorkQueueRepository.java
        workspace
        Workspace.java
        WorkspaceEntity.java
        WorkspaceLumifyProperties.java
        WorkspaceRepository.java
        WorkspaceUser.java
        diff
        WorkspaceDiffHelper.java
        security
        DirectVisibilityTranslator.java
        LumifyVisibility.java
        VisibilityTranslator.java
        user
        ProxyUser.java
        SystemUser.java
        User.java
        util
        AutoDependencyTreeRunner.java
        ClassUtil.java
        ClientApiConverter.java
        ConfidencePropertyComparator.java
        ExecutorServiceUtil.java
        FixedSizeCircularLinkedList.java
        GraphUtil.java
        HdfsLimitOutputStream.java
        IsClosedInputStream.java
        JSONUtil.java
        JsonSerializer.java
        LumifyLogger.java
        LumifyLoggerFactory.java
        MetricReportingExecutorService.java
        MockProcessRunner.java
        ModelUtil.java
        Pipe.java
        ProcessRunner.java
        ProcessUtil.java
        RowKeyHelper.java
        ServiceLoaderUtil.java
        StreamHelper.java
        TeeInputStream.java
        ThreadedInputStreamProcess.java
        ThreadedTeeInputStreamWorker.java
        TimingCallable.java
        WorkerPool.java
        version
        BuildInfo.java
        ProjectInfo.java
        ProjectInfoScanner.java
        VersionService.java
        VersionServiceMXBean.java
      - test
        java
        io
        lumify
        core
        EntityHighlighterTest.java
        config
        ConfigurationTest.java
        formula
        FormulaEvaluatorTest.java
        model
        ValueTest.java
        ontology
        PropertyTest.java
        util
        AutoDependencyTreeRunnerTest.java
        FixedSizeCircularLinkedListTest.java
        HdfsLimitOutputStreamTest.java
        IsClosedInputStreamTest.java
        TeeInputStreamTest.java
        ThreadedInputStreamProcessTest.java
        version
        VersionServiceTest.java
  - plugins
    - model-bigtable
      - src
        main
        java
        io
        lumify
        bigtable
        model
        notification
        BigTableSystemNotification.java
        BigTableSystemNotificationRepository.java
        BigTableUserNotification.java
        BigTableUserNotificationRepository.java
        model
        SystemNotificationRepository.java
        SystemNotificationRowKey.java
        UserNotificationRepository.java
        UserNotificationRowKey.java
    - model-rabbitmq
      - src
        main
        java
        io
        lumify
        model
        rabbitmq
        RabbitMQUtils.java
        RabbitMQWorkQueueRepository.java
        RabbitMQWorkQueueSpout.java
    - model-securegraph
      - src
        main
        java
        io
        lumify
        securegraph
        model
        audit
        SecureGraphAuditRepository.java
        longRunningProcess
        SecureGraphLongRunningProcessRepository.java
        ontology
        SecureGraphConcept.java
        SecureGraphOntologyProperty.java
        SecureGraphOntologyRepository.java
        SecureGraphRelationship.java
        user
        SecureGraphUser.java
        SecureGraphUserRepository.java
        workspace
        SecureGraphWorkspace.java
        SecureGraphWorkspaceRepository.java
        test
        java
        io
        lumify
        securegraph
        model
        user
        SecureGraphUserRepositoryTest.java
        workspace
        SecureGraphWorkspaceRepositoryTest.java
    - model-sql
      - src
        main
        java
        io
        lumify
        sql
        SqlBootstrapBindingProvider.java
        model
        HibernateSessionManager.java
        SqlModelSession.java
        longRunningProcess
        SqlLongRunningProcess.java
        SqlLongRunningProcessRepository.java
        notification
        SqlSystemNotification.java
        SqlSystemNotificationRepository.java
        SqlUserNotification.java
        SqlUserNotificationRepository.java
        user
        SqlUser.java
        SqlUserRepository.java
        workspace
        SqlWorkspace.java
        SqlWorkspaceRepository.java
        SqlWorkspaceUser.java
        SqlWorkspaceUserId.java
        SqlWorkspaceVertex.java
        web
        HibernateSessionManagementFilter.java
        SqlModelWebAppPlugin.java
        test
        java
        io
        lumify
        sql
        model
        notification
        SqlUserNotificationRepositoryTest.java
        SqlUserNotificationTest.java
        user
        SqlUserRepositoryTest.java
        SqlUserTest.java
        workspace
        SqlWorkspaceRepositoryTest.java
    - newuser-workspace-copy
      - src
        main
        java
        io
        lumify
        newUserWorkspaceCopy
        NewUserWorkspaceCopyUserListener.java
    - newuser-workspace-sharer
      - src
        main
        java
        io
        lumify
        newUserWorkspaceSharer
        NewUserWorkspaceSharerUserListener.java
  - test
    - src
      - main
        java
        io
        lumify
        core
        config
        LumifyTestClusterConfigurationLoader.java
        test
        GraphPropertyWorkerTestBase.java
        InMemoryWorkQueueRepository.java
        LumifyTestCluster.java
        LumifyTestClusterBootstrapBindingProvider.java
        TestAccumulo.java
        TestElasticSearch.java
        TestJettyServer.java
  - yarn-base
    - src
      - main
        java
        io
        lumify
        yarn
        ApplicationMasterBase.java
        ClientBase.java
        TaskBase.java
- datasets
  - dbpedia
    - src
      - main
        java
        io
        lumify
        dbpedia
        mapreduce
        DbpediaImportCounters.java
        DbpediaOntology.java
        ImportMR.java
        ImportMRMapper.java
        model
        LineData.java
        LinkValue.java
        OtherValue.java
        StringValue.java
        Value.java
  - flight-aware
    - src
      - main
        java
        io
        lumify
        flightTrack
        FlightAware.java
        FlightAwareClient.java
        FlightRepository.java
        FlightTrackOntology.java
        Replay.java
  - friendster
    - src
      - main
        java
        io
        lumify
        friendster
        FriendsterImportCounters.java
        FriendsterOntology.java
        ImportMR.java
        ImportMRMapper.java
        ImportMRReducer.java
  - gdelt
    - lumify-gdelt-mr
      - src
        main
        java
        io
        lumify
        gdelt
        GDELTConstants.java
        GDELTImportCounters.java
        GDELTMapper.java
        GDELTProperties.java
        GDELTRunner.java
    - lumify-gdelt-parser
      - src
        main
        java
        io
        lumify
        gdelt
        CAMEOCode.java
        GDELTActor.java
        GDELTEvent.java
        GDELTField.java
        GDELTParser.java
        test
        java
        io
        lumify
        gdelt
        CAMEOCodeTest.java
        GDELTParserTest.java
  - palantir
    - core
      - src
        main
        java
        io
        lumify
        palantir
        model
        AWState.java
        LongLongWritable.java
        PtGraph.java
        PtGraphObject.java
        PtImageInfo.java
        PtLinkRelation.java
        PtLinkType.java
        PtMediaAndValue.java
        PtModelBase.java
        PtNodeDisplayType.java
        PtNoteAndNoteValue.java
        PtObject.java
        PtObjectObject.java
        PtObjectType.java
        PtOntologyResource.java
        PtOntologyType.java
        PtPropertyAndValue.java
        PtPropertyType.java
        PtTypeGroup.java
        PtUser.java
        util
        JGeometryWrapper.java
        OwlNamespaceContext.java
        TryInflaterInputStream.java
        XmlUtil.java
    - data-to-sequence-file
      - src
        main
        java
        io
        lumify
        palantir
        DataToSequenceFile.java
        ontologyToOwl
        DataTypeProperty.java
        ObjectProperty.java
        OntologyToOwl.java
        OwlClass.java
        OwlElement.java
        TitleFormulaMaker.java
        service
        Exporter.java
        ExporterBase.java
        OntologyTypeExporterBase.java
        PtGraphExporter.java
        PtGraphObjectExporter.java
        PtImageInfoExporter.java
        PtLinkRelationExporter.java
        PtLinkTypeExporter.java
        PtMediaAndValueExporter.java
        PtNodeDisplayTypeExporter.java
        PtNoteAndNoteValueExporter.java
        PtObjectExporter.java
        PtObjectObjectExporter.java
        PtObjectTypeExporter.java
        PtOntologyResourceExporter.java
        PtPropertyAndValueExporter.java
        PtPropertyTypeExporter.java
        PtTypeGroupExporter.java
        PtUserExporter.java
        sqlrunner
        SqlRunner.java
        SqlRunnerQueryIterable.java
    - import-mr
      - src
        main
        java
        io
        lumify
        palantir
        mr
        ImportMR.java
        mappers
        PalantirMapperBase.java
        PtGraphMapper.java
        PtGraphObjectMapper.java
        PtMediaAndValueMapper.java
        PtNoteAndNoteValueMapper.java
        PtObjectMapper.java
        PtObjectObjectMapper.java
        PtPropertyAndValueMapper.java
        PtUserMapper.java
  - the-movie-db
    - lumify-the-movie-db-download
      - src
        main
        java
        io
        lumify
        themoviedb
        download
        ImageDownloadWorkItem.java
        MovieDownloadWorkItem.java
        PersonDownloadWorkItem.java
        ProductionCompanyDownloadWorkItem.java
        TheMovieDb.java
        TheMovieDbDownload.java
        WorkItem.java
    - the-movie-db-mr
      - src
        main
        java
        io
        lumify
        themoviedb
        ImportImgMR.java
        ImportImgMRMapper.java
        ImportJsonMR.java
        ImportJsonMRMapper.java
        RecordType.java
        SequenceFileKey.java
        TheMovieDbCombine.java
        TheMovieDbImportCounters.java
        TheMovieDbOntology.java
  - twitter
    - twitter-common
      - src
        main
        java
        io
        lumify
        twitter
        TweetStreamReader.java
        TwitterOntology.java
    - twitter-graph-property-worker
      - src
        main
        java
        io
        lumify
        twitter
        TwitterProfileImageDownloadGraphPropertyWorker.java
    - twitter-ingestion
      - src
        main
        java
        io
        lumify
        twitter
        OAuthConfiguration.java
        TweetExtractor.java
        TweetTransformer.java
        TwitterDataIngestRunner.java
        loaders
        LoaderConstants.java
        TweetVertexLoader.java
        UserVertexDetails.java
        UserVertexLoader.java
        package-info.java
        package-info.java
        twitter4j
        RetweetStatusFactory.java
        package-info.java
  - wikipedia
    - core
      - src
        main
        java
        io
        lumify
        wikipedia
        InternalLinkWithOffsets.java
        LinkWithOffsets.java
        RandomAccessFileInputStream.java
        RedirectWithOffsets.java
        TextConverter.java
        WikipediaConstants.java
    - mr
      - src
        main
        java
        io
        lumify
        wikipedia
        mapreduce
        ImportMR.java
        ImportMRMapper.java
        WikipediaFileToMRFile.java
        WikipediaImportCounters.java
  - world-factbook
    - src
      - main
        java
        io
        lumify
        worldFactbook
        ImportXml.java
        WorldFactbookOntology.java
        XmlToOwl.java
- dev
  - graph-property-worker-local
    - src
      - main
        java
        io
        lumify
        gpw
        local
        GraphPropertyWorkerRunnerLocal.java
- examples
  - food-truck
    - src
      - main
        java
        io
        lumify
        foodTruck
        FoodTruckHasTwitterAccountOnCreateGraphPropertyWorker.java
        FoodTruckLocationUpdateGraphPropertyWorker.java
        FoodTruckOntology.java
        FoodTruckRemoveOldGeoLocationsGraphPropertyWorker.java
        FoodTruckTweetAnalyzerGraphPropertyWorker.java
- graph-property-worker
  - graph-property-worker-base
    - src
      - main
        java
        io
        lumify
        gpw
        util
        FFprobeDateUtil.java
        FFprobeDimensionsUtil.java
        FFprobeDurationUtil.java
        FFprobeExecutor.java
        FFprobeGeoLocationUtil.java
        FFprobeMakeAndModelUtil.java
        FFprobeRotationUtil.java
        FileSizeUtil.java
  - graph-property-worker-yarn
    - src
      - main
        java
        io
        lumify
        gpw
        yarn
        GraphPropertyWorkerYarnApplicationMaster.java
        GraphPropertyWorkerYarnClient.java
        GraphPropertyWorkerYarnTask.java
  - plugins
    - audio-mp4-encoder
      - src
        main
        java
        io
        lumify
        gpw
        audio
        AudioMp4EncodingWorker.java
    - audio-ogg-encoder
      - src
        main
        java
        io
        lumify
        gpw
        audio
        AudioOggEncodingWorker.java
    - ccextractor
      - src
        main
        java
        io
        lumify
        ccextractor
        CCExtractorGraphPropertyWorker.java
    - clavin
      - src
        main
        java
        io
        lumify
        clavin
        ClavinTermMentionFilter.java
    - csv
      - src
        main
        java
        io
        lumify
        csv
        CsvGraphPropertyWorker.java
        CsvOntology.java
        CsvPostMimeTypeWorker.java
        LumifyCsvException.java
        State.java
        model
        Mapping.java
        MappingProperty.java
    - drewnoakes-image-metadata-extractor
      - src
        main
        java
        io
        lumify
        imageMetadataExtractor
        ImageMetadataGraphPropertyWorker.java
        ImageOrientationPostMimeTypeWorker.java
        ImageTransform.java
        imageMetadataHelper
        DateExtractor.java
        DimensionsExtractor.java
        GeoPointExtractor.java
        HeadingExtractor.java
        ImageTransformExtractor.java
        LeftoverMetadataExtractor.java
        MakeExtractor.java
        ModelExtractor.java
    - email-extractor
      - src
        main
        java
        io
        lumify
        email
        EmailGraphPropertyWorker.java
    - java-code
      - src
        main
        java
        io
        lumify
        javaCodeIngest
        ClassFileGraphPropertyWorker.java
        JarFileGraphPropertyWorker.java
        JavaCodeIngestIdGenerator.java
        Ontology.java
    - known-entity-extractor
      - src
        main
        java
        io
        lumify
        knownEntity
        KnownEntityExtractorGraphPropertyWorker.java
        org
        arabidopsis
        ahocorasick
        AhoCorasick.java
        Benchmark.java
        DenseEdgeList.java
        EdgeList.java
        Queue.java
        SearchResult.java
        Searcher.java
        SparseEdgeList.java
        State.java
        test
        java
        io
        lumify
        knownEntity
        KnownEntityExtractorGraphPropertyWorkerTest.java
    - mime-type-ontology-mapper
      - src
        main
        java
        io
        lumify
        mimeTypeOntologyMapper
        MimeTypeOntologyMapperGraphPropertyWorker.java
    - opencv-object-detector
      - src
        main
        java
        io
        lumify
        opencvObjectDetector
        OpenCVObjectDetectorPropertyWorker.java
        OpenCVUtils.java
        test
        java
        io
        lumify
        opencvObjectDetector
        OpenCVObjectDetectorPropertyWorkerTest.java
        OpenCVUtilsTest.java
    - opennlp-dictionary-extractor
      - src
        main
        java
        io
        lumify
        opennlpDictionary
        DictionaryImporter.java
        OpenNLPDictionaryExtractorGraphPropertyWorker.java
        model
        DictionaryEntry.java
        DictionaryEntryMetadata.java
        DictionaryEntryRepository.java
        DictionaryEntryRowKey.java
        test
        java
        io
        lumify
        opennlpDictionary
        OpenNLPDictionaryExtractorGraphPropertyWorkerTest.java
    - opennlp-me-extractor
      - src
        main
        java
        io
        lumify
        opennlpme
        OpenNLPMaximumEntropyExtractorGraphPropertyWorker.java
        test
        java
        io
        lumify
        opennlpme
        OpenNLPMaximumEntropyExtractorGraphPropertyWorkerTest.java
    - phone-number-extractor
      - src
        main
        java
        io
        lumify
        phoneNumber
        PhoneNumberGraphPropertyWorker.java
        test
        java
        io
        lumify
        phoneNumber
        PhoneNumberGraphPropertyWorkerTest.java
    - rdf
      - src
        main
        java
        io
        lumify
        rdf
        RdfGraphPropertyWorker.java
        RdfOntology.java
        RdfPostMimeTypeWorker.java
    - reindex
      - src
        main
        java
        io
        lumify
        reindex
        ReIndexGraphPropertyWorker.java
    - sphinx
      - src
        main
        java
        io
        lumify
        sphinx
        SphinxGraphPropertyWorker.java
        SphinxOutputParser.java
        WavFileUtil.java
    - subrip-parser
      - src
        main
        java
        io
        lumify
        gpw
        video
        SubRip.java
    - subrip-transcript
      - src
        main
        java
        io
        lumify
        subrip
        SubRipTranscriptFileImportSupportingFileHandler.java
        SubRipTranscriptGraphPropertyWorker.java
    - tesseract
      - src
        main
        java
        io
        lumify
        tesseract
        TesseractGraphPropertyWorker.java
        test
        java
        io
        lumify
        tesseract
        TesseractGraphPropertyWorkerTest.java
    - tika-mime-type
      - src
        main
        java
        io
        lumify
        tikaMimeType
        LumifyMimeTypeDetector.java
        TikaMimeTypeGraphPropertyWorker.java
        TikaMimeTypeMapper.java
        test
        java
        io
        lumify
        tikaMimeType
        TikaMimeTypeMapperTest.java
    - tika-text-extractor
      - src
        main
        java
        io
        lumify
        tikaTextExtractor
        GenericDateExtractor.java
        TikaMetadataUtils.java
        TikaTextExtractorGraphPropertyWorker.java
        org
        apache
        tika
        parser
        pdf
        LumifyParserConfig.java
        test
        java
        io
        lumify
        tikaTextExtractor
        TikaTextExtractorGraphPropertyWorkerTest.java
    - translate
      - src
        main
        java
        com
        cybozu
        labs
        langdetect
        Detector.java
        DetectorFactory.java
        GenProfile.java
        LangDetectException.java
        Language.java
        util
        LangProfile.java
        Messages.java
        NGram.java
        TagExtractor.java
        io
        lumify
        translate
        NopTranslator.java
        TranslateBootstrapBindingProvider.java
        TranslateGraphPropertyWorker.java
        Translator.java
    - translator-bing
      - src
        main
        java
        io
        lumify
        translator
        bing
        BingTranslator.java
    - video-audio-extract
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoAudioExtractWorker.java
    - video-frame-extract
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoFrameExtractGraphPropertyWorker.java
    - video-metadata
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoPostMimeTypeWorker.java
    - video-mp4-encoder
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoMp4EncodingWorker.java
    - video-poster-frame
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoPosterFrameWorker.java
    - video-webm-encoder
      - src
        main
        java
        io
        lumify
        gpw
        video
        VideoWebMEncodingWorker.java
    - youtube-transcript
      - src
        main
        java
        io
        lumify
        youtube
        YoutubeTranscriptFileImportSupportingFileHandler.java
        YoutubeTranscriptGraphPropertyWorker.java
        YoutubeccReader.java
        test
        java
        io
        lumify
        youtube
        YoutubeccReaderTest.java
    - zipcode-extractor
      - src
        main
        java
        io
        lumify
        zipcode
        ZipCodeGraphPropertyWorker.java
    - zipcode-resolver
      - src
        main
        java
        io
        lumify
        zipCodeResolver
        ZipCodeResolverTermMentionFilter.java
- integration-test
  - src
    - test
      - java
        io
        lumify
        it
        BenchmarkCategory.java
        PublicItemChangeIntegrationTest.java
        ResolveTermIntegrationTest.java
        TestBase.java
        TestClassAndMethod.java
        TestOntology.java
        TimedExecution.java
        UploadCsvIntegrationTest.java
        UploadFileIntegrationTest.java
        UploadImageFileIntegrationTest.java
        UploadRdfIntegrationTest.java
        UploadVideoFileIntegrationTest.java
        UserIntegrationTest.java
        VertexBenchmarkTest.java
        VertexIntegrationTest.java
        VertextTestBase.java
        WorkspaceSandboxingIntegrationTest.java
        WorkspaceUndoIntegrationTest.java
- migrations
  - src
    - main
      - java
        io
        lumify
        migrations
        ElementMigrationMapperBase.java
        M001NormalizeUserIris.java
        M002NormalizeWorkspaceIris.java
        MigrationBase.java
        MigrationCounters.java
        OntologyMigrationBase.java
- tools
  - assign-image-mr
    - src
      - main
        java
        io
        lumify
        assignimagemr
        AssignImageConfiguration.java
        AssignImageCounters.java
        AssignImageMR.java
        AssignImageMRMapper.java
  - backup-restore
    - src
      - main
        java
        io
        lumify
        backupRestore
        Action.java
        Backup.java
        BackupOptions.java
        BackupRestore.java
        BackupRestoreBase.java
        BackupRestoreOptionsBase.java
        Restore.java
        RestoreOptions.java
  - cli
    - src
      - main
        java
        io
        lumify
        tools
        Cli.java
  - format
    - src
      - main
        java
        io
        lumify
        tools
        format
        FormatLumify.java
  - import
    - src
      - main
        java
        io
        lumify
        tools
        Import.java
  - long-running-process-yarn
    - src
      - main
        java
        io
        lumify
        lrp
        yarn
        LongRunningProcessYarnApplicationMaster.java
        LongRunningProcessYarnClient.java
        LongRunningProcessYarnTask.java
  - rdf-import
    - src
      - main
        java
        io
        lumify
        tools
        RdfImport.java
  - reindex-mr
    - src
      - main
        java
        io
        lumify
        reindexmr
        ReindexCounters.java
        ReindexMR.java
        ReindexMRMapper.java
  - requeue
    - src
      - main
        java
        io
        lumify
        tools
        Requeue.java
  - user-admin
    - src
      - main
        java
        io
        lumify
        tools
        UserAdmin.java
  - version-inspector
    - src
      - main
        java
        io
        lumify
        tools
        version
        VersionInspector.java
- web
  - client-api
    - src
      - main
        java
        io
        lumify
        web
        clientapi
        AdminApiExt.java
        ApiInvoker.java
        EdgeApiExt.java
        JsonUtil.java
        LongRunningProcessApiExt.java
        LumifyApi.java
        LumifyClientApiException.java
        OntologyApiExt.java
        UserApiExt.java
        UserNameOnlyLumifyApi.java
        VertexApiExt.java
        WorkspaceApiExt.java
        codegen
        AdminApi.java
        ApiException.java
        EdgeApi.java
        LongrunningprocessApi.java
        OntologyApi.java
        UserApi.java
        VertexApi.java
        WorkspaceApi.java
        model
        ClientApiArtifactImportResponse.java
        ClientApiDetectedObject.java
        ClientApiDetectedObjects.java
        ClientApiEdge.java
        ClientApiEdgeMultipleResponse.java
        ClientApiEdgeWithVertexData.java
        ClientApiEdgesExistsResponse.java
        ClientApiElement.java
        ClientApiLongRunningProcess.java
        ClientApiLongRunningProcessSubmitResponse.java
        ClientApiObject.java
        ClientApiOntology.java
        ClientApiProperty.java
        ClientApiPropertyPublishItem.java
        ClientApiPropertyUndoItem.java
        ClientApiPublishItem.java
        ClientApiRelationshipPublishItem.java
        ClientApiRelationshipUndoItem.java
        ClientApiTermMentionsResponse.java
        ClientApiUndoItem.java
        ClientApiUser.java
        ClientApiUsers.java
        ClientApiVertex.java
        ClientApiVertexEdges.java
        ClientApiVertexFindPathResponse.java
        ClientApiVertexFindRelatedResponse.java
        ClientApiVertexMultipleResponse.java
        ClientApiVertexPublishItem.java
        ClientApiVertexSearchResponse.java
        ClientApiVertexUndoItem.java
        ClientApiVerticesExistsResponse.java
        ClientApiWorkspace.java
        ClientApiWorkspaceDiff.java
        ClientApiWorkspaceEdges.java
        ClientApiWorkspacePublishResponse.java
        ClientApiWorkspaceUndoResponse.java
        ClientApiWorkspaceUpdateData.java
        ClientApiWorkspaceVertices.java
        ClientApiWorkspaces.java
        GraphPosition.java
        Privilege.java
        PropertyType.java
        SandboxStatus.java
        UserStatus.java
        UserType.java
        VisibilityJson.java
        WorkspaceAccess.java
        util
        ClientApiConverter.java
        ObjectMapperFactory.java
  - client-api-codegen
    - src
      - main
        java
        io
        lumify
        web
        clientapi
        codegen
        JavaCodeGenerator.java
  - plugins
    - analysts-notebook-export
      - src
        main
        java
        io
        lumify
        analystsNotebook
        AnalystsNotebookExportConfiguration.java
        AnalystsNotebookExportWebPlugin.java
        AnalystsNotebookExporter.java
        AnalystsNotebookFeature.java
        AnalystsNotebookImageUtil.java
        AnalystsNotebookVersion.java
        aggregateClassification
        AggregateClassificationClient.java
        AggregateClassificationConfiguration.java
        model
        Attribute.java
        AttributeClass.java
        Chart.java
        ChartItem.java
        CustomImage.java
        CustomProperty.java
        End.java
        Entity.java
        EntityType.java
        Footer.java
        Header.java
        Icon.java
        IconPicture.java
        IconStyle.java
        Label.java
        Link.java
        LinkStyle.java
        LinkType.java
        PrintSettings.java
        Summary.java
        routes
        AnalystsNotebookExport.java
    - auth-social
      - src
        main
        java
        io
        lumify
        http
        HttpConnection.java
        HttpGetMethod.java
        HttpMethod.java
        HttpPostMethod.java
        HttpRequestParameterBuilder.java
        NameValuePair.java
        URLBuilder.java
        web
        auth
        oauth
        OAuthConfiguration.java
        OAuthWebAppPlugin.java
        routes
        Google.java
        Twitter.java
    - auth-username-only
      - src
        main
        java
        io
        lumify
        web
        auth
        usernameonly
        UsernameOnlyWebAppPlugin.java
        routes
        Login.java
    - auth-username-password
      - src
        main
        java
        io
        lumify
        web
        auth
        usernamepassword
        ForgotPasswordConfiguration.java
        UsernamePasswordWebAppPlugin.java
        routes
        ChangePassword.java
        Login.java
        LookupToken.java
        RequestToken.java
    - auth-x509
      - src
        main
        java
        io
        lumify
        web
        auth
        X509IdentityAuthenticationHandler.java
        X509IdentityWebAppPlugin.java
    - auth-x509ldap
      - src
        main
        java
        io
        lumify
        ldap
        LdapSearchConfiguration.java
        LdapSearchService.java
        LdapSearchServiceImpl.java
        LdapServerConfiguration.java
        web
        auth
        LdapX509AuthenticationConfiguration.java
        LdapX509AuthenticationHandler.java
        LdapX509AuthenticationProviderBootstrapBindingProvider.java
        LdapX509WebAppPlugin.java
        test
        java
        io
        lumify
        ldap
        LdapSearchServiceTest.java
        web
        auth
        LdapX509AuthenticationHandlerTest.java
    - change-email
      - src
        main
        java
        io
        lumify
        web
        changeEmail
        ChangeEmail.java
        ChangeEmailWebPlugin.java
    - change-password
      - src
        main
        java
        io
        lumify
        web
        changePassword
        ChangePassword.java
        ChangePasswordWebPlugin.java
    - dev-tools
      - src
        main
        java
        io
        lumify
        web
        devTools
        DeleteVertex.java
        DevToolsWebAppPlugin.java
        QueueEdges.java
        QueueVertices.java
        ontology
        SaveOntologyConcept.java
        user
        UserAddAuthorization.java
        UserDelete.java
        UserRemoveAuthorization.java
        UserUpdatePrivileges.java
        WorkspaceShareWithMe.java
    - geocoder-bing
      - src
        main
        java
        io
        lumify
        geocoder
        bing
        BingGeocoder.java
        BingGeocoderWebAppPlugin.java
    - google-analytics
      - src
        main
        java
        io
        lumify
        googleAnalytics
        GoogleAnalyticsWebAppPlugin.java
    - import-export-workspaces
      - src
        main
        java
        io
        lumify
        web
        importExportWorkspaces
        Export.java
        Import.java
        ImportExportWorkspaceWebAppPlugin.java
    - opennlp-dictionary-extractor
      - src
        main
        java
        io
        lumify
        opennlpDictionary
        web
        AdminDictionary.java
        AdminDictionaryByConcept.java
        AdminDictionaryEntryAdd.java
        AdminDictionaryEntryDelete.java
        AdminDictionaryWebAppPlugin.java
    - terms-of-use
      - src
        main
        java
        io
        lumify
        termsOfUse
        TermsOfUse.java
        TermsOfUseWebAppPlugin.java
  - server
    - jetty-server
      - src
        main
        java
        io
        lumify
        web
        JettyWebServer.java
    - server-base
      - src
        main
        java
        io
        lumify
        web
        WebServer.java
    - tomcat-server
      - src
        main
        java
        io
        lumify
        web
        TomcatWebServer.java
  - web-base
    - src
      - main
        java
        io
        lumify
        web
        ApplicationBootstrap.java
        AuthenticationHandler.java
        BaseRequestHandler.java
        CacheServletFilter.java
        ConnectionClosedException.java
        CurrentUser.java
        ErrorCodeHandler.java
        LumifyCsrfHandler.java
        Messaging.java
        MessagingFilter.java
        MinimalRequestHandler.java
        No404AppendableStaticResourceHandler.java
        RequestDebugFilter.java
        ResponseTypes.java
        Router.java
        SessionUser.java
        UserAgentFilter.java
        WebApp.java
        WebAppPlugin.java
        X509AuthenticationHandler.java
        privilegeFilters
        AdminPrivilegeFilter.java
        CommentPrivilegeFilter.java
        EditPrivilegeFilter.java
        PrivilegeFilter.java
        PublishPrivilegeFilter.java
        ReadPrivilegeFilter.java
        routes
        Index.java
        admin
        AdminList.java
        AdminUploadOntology.java
        PluginList.java
        config
        Configuration.java
        Plugin.java
        edge
        DeleteEdgeProperty.java
        EdgeAudit.java
        EdgeCreate.java
        EdgeDelete.java
        EdgeExists.java
        EdgeMultiple.java
        EdgeProperties.java
        EdgePropertySourceInfo.java
        EdgeSetVisibility.java
        EdgeSourceInfo.java
        SetEdgeProperty.java
        longRunningProcess
        LongRunningProcessById.java
        LongRunningProcessCancel.java
        LongRunningProcessDelete.java
        notification
        Notifications.java
        SystemNotificationDelete.java
        SystemNotificationSave.java
        UserNotificationMarkRead.java
        ontology
        Ontology.java
        resource
        MapMarkerImage.java
        ResourceGet.java
        user
        Logout.java
        MeGet.java
        UserGet.java
        UserList.java
        UserSetUiPreferences.java
        vertex
        ResolveDetectedObject.java
        ResolveTermEntity.java
        UnresolveDetectedObject.java
        UnresolveTermEntity.java
        VertexAudit.java
        VertexDeleteProperty.java
        VertexEdges.java
        VertexExists.java
        VertexFindPath.java
        VertexFindRelated.java
        VertexGeoSearch.java
        VertexGetDetectedObjects.java
        VertexGetPropertyValue.java
        VertexGetTermMentions.java
        VertexHighlightedText.java
        VertexImport.java
        VertexMultiple.java
        VertexNew.java
        VertexPosterFrame.java
        VertexProperties.java
        VertexPropertySourceInfo.java
        VertexRaw.java
        VertexRemove.java
        VertexSearch.java
        VertexSetProperty.java
        VertexSetVisibility.java
        VertexSourceInfo.java
        VertexThumbnail.java
        VertexUploadImage.java
        VertexVideoPreviewImage.java
        workspace
        WorkspaceById.java
        WorkspaceCreate.java
        WorkspaceDelete.java
        WorkspaceDiff.java
        WorkspaceEdges.java
        WorkspaceHelper.java
        WorkspaceList.java
        WorkspacePublish.java
        WorkspaceUndo.java
        WorkspaceUpdate.java
        WorkspaceVertices.java
        session
        LumifyBigTableJettySessionManager.java
      - test
        java
        io
        lumify
        web
        BaseRequestHandlerTest.java
        X509AuthenticationHandlerTest.java
        config
        PropertyUtilsTest.java
        routes
        RouteTestBase.java

package io.lumify.opennlpme;

import io.lumify.core.ingest.graphProperty.GraphPropertyWorkData;
import io.lumify.core.ingest.graphProperty.GraphPropertyWorker;
import io.lumify.core.ingest.graphProperty.GraphPropertyWorkerPrepareData;
import io.lumify.core.model.properties.LumifyProperties;
import io.lumify.core.model.termMention.TermMentionBuilder;
import io.lumify.core.util.LumifyLogger;
import io.lumify.core.util.LumifyLoggerFactory;
import io.lumify.web.clientapi.model.VisibilityJson;
import opennlp.tools.namefind.NameFinderME;
import opennlp.tools.namefind.TokenNameFinder;
import opennlp.tools.namefind.TokenNameFinderModel;
import opennlp.tools.tokenize.Tokenizer;
import opennlp.tools.tokenize.TokenizerME;
import opennlp.tools.tokenize.TokenizerModel;
import opennlp.tools.util.ObjectStream;
import opennlp.tools.util.PlainTextByLineStream;
import opennlp.tools.util.Span;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.securegraph.Element;
import org.securegraph.Property;
import org.securegraph.Vertex;

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;

public class OpenNLPMaximumEntropyExtractorGraphPropertyWorker extends GraphPropertyWorker {
    private static final LumifyLogger LOGGER = LumifyLoggerFactory.getLogger(OpenNLPMaximumEntropyExtractorGraphPropertyWorker.class);
    public static final String PATH_PREFIX_CONFIG = "termextraction.opennlp.pathPrefix";
    private static final String DEFAULT_PATH_PREFIX = "hdfs://";
    private static final int NEW_LINE_CHARACTER_LENGTH = 1;

    private List<TokenNameFinder> finders;
    private Tokenizer tokenizer;
    private String locationIri;
    private String organizationIri;
    private String personIri;

    @Override
    public void prepare(GraphPropertyWorkerPrepareData workerPrepareData) throws Exception {
        super.prepare(workerPrepareData);

        this.locationIri = getOntologyRepository().getRequiredConceptIRIByIntent("location");
        this.organizationIri = getOntologyRepository().getRequiredConceptIRIByIntent("organization");
        this.personIri = getOntologyRepository().getRequiredConceptIRIByIntent("person");

        String pathPrefix = (String) workerPrepareData.getConfiguration().get(PATH_PREFIX_CONFIG);
        if (pathPrefix == null) {
            pathPrefix = DEFAULT_PATH_PREFIX;
        }
        this.tokenizer = loadTokenizer(pathPrefix, workerPrepareData.getHdfsFileSystem());
        this.finders = loadFinders(pathPrefix, workerPrepareData.getHdfsFileSystem());
    }

    @Override
    public void execute(InputStream in, GraphPropertyWorkData data) throws Exception {
        ObjectStream<String> untokenizedLineStream = new PlainTextByLineStream(in, "UTF-8");
        String line;
        int charOffset = 0;

        LOGGER.debug("Processing artifact content stream");
        Vertex sourceVertex = (Vertex) data.getElement();
        List<Vertex> termMentions = new ArrayList<>();
        while ((line = untokenizedLineStream.read()) != null) {
            termMentions.addAll(processLine(sourceVertex, data.getProperty().getKey(), line, charOffset, LumifyProperties.VISIBILITY_JSON.getPropertyValue(sourceVertex)));
            getGraph().flush();
            charOffset += line.length() + NEW_LINE_CHARACTER_LENGTH;
        }
        applyTermMentionFilters(sourceVertex, termMentions);
        pushTextUpdated(data);

        untokenizedLineStream.close();
        LOGGER.debug("Stream processing completed");
    }

    private List<Vertex> processLine(Vertex sourceVertex, String propertyKey, String line, int charOffset, VisibilityJson visibilityJson) {
        List<Vertex> termMentions = new ArrayList<>();
        String tokenList[] = tokenizer.tokenize(line);
        Span[] tokenListPositions = tokenizer.tokenizePos(line);
        for (TokenNameFinder finder : finders) {
            Span[] foundSpans = finder.find(tokenList);
            for (Span span : foundSpans) {
                termMentions.add(createTermMention(sourceVertex, propertyKey, charOffset, span, tokenList, tokenListPositions, visibilityJson));
            }
            finder.clearAdaptiveData();
        }
        return termMentions;
    }

    private Vertex createTermMention(Vertex sourceVertex, String propertyKey, int charOffset, Span foundName, String[] tokens, Span[] tokenListPositions, VisibilityJson visibilityJson) {
        String name = Span.spansToStrings(new Span[]{foundName}, tokens)[0];
        int start = charOffset + tokenListPositions[foundName.getStart()].getStart();
        int end = charOffset + tokenListPositions[foundName.getEnd() - 1].getEnd();
        String type = foundName.getType();
        String ontologyClassUri = mapToOntologyIri(type);

        return new TermMentionBuilder()
                .sourceVertex(sourceVertex)
                .propertyKey(propertyKey)
                .start(start)
                .end(end)
                .title(name)
                .conceptIri(ontologyClassUri)
                .visibilityJson(visibilityJson)
                .process(getClass().getName())
                .save(getGraph(), getVisibilityTranslator(), getAuthorizations());
    }

    protected String mapToOntologyIri(String type) {
        String ontologyClassUri;
        if ("location".equals(type)) {
            ontologyClassUri = this.locationIri;
        } else if ("organization".equals(type)) {
            ontologyClassUri = this.organizationIri;
        } else if ("person".equals(type)) {
            ontologyClassUri = this.personIri;
        } else {
            ontologyClassUri = LumifyProperties.CONCEPT_TYPE_THING;
        }
        return ontologyClassUri;
    }

    @Override
    public boolean isHandled(Element element, Property property) {
        if (property == null) {
            return false;
        }

        if (property.getName().equals(LumifyProperties.RAW.getPropertyName())) {
            return false;
        }

        String mimeType = LumifyProperties.MIME_TYPE.getMetadataValue(property.getMetadata(), null);
        return !(mimeType == null || !mimeType.startsWith("text"));
    }

    protected List<TokenNameFinder> loadFinders(String pathPrefix, FileSystem fs)
            throws IOException {
        Path finderHdfsPaths[] = {
                new Path(pathPrefix + "/en-ner-location.bin"),
                new Path(pathPrefix + "/en-ner-organization.bin"),
                new Path(pathPrefix + "/en-ner-person.bin")};
        List<TokenNameFinder> finders = new ArrayList<>();
        for (Path finderHdfsPath : finderHdfsPaths) {
            TokenNameFinderModel model;
            try (InputStream finderModelInputStream = fs.open(finderHdfsPath)) {
                model = new TokenNameFinderModel(finderModelInputStream);
            }
            NameFinderME finder = new NameFinderME(model);
            finders.add(finder);
        }

        return finders;
    }

    protected Tokenizer loadTokenizer(String pathPrefix, FileSystem fs) throws IOException {
        Path tokenizerHdfsPath = new Path(pathPrefix + "/en-token.bin");

        TokenizerModel tokenizerModel;
        try (InputStream tokenizerModelInputStream = fs.open(tokenizerHdfsPath)) {
            tokenizerModel = new TokenizerModel(tokenizerModelInputStream);
        }

        return new TokenizerME(tokenizerModel);
    }
}