HTMLInputFormat.java example

Explorer

Web-Karma-master
- karma-commands
  - commands-alignment
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        alignment
        AddLinkCommand.java
        AddLinkCommandFactory.java
        AddLinkConsolidator.java
        AddLiteralNodeCommand.java
        AddLiteralNodeCommandFactory.java
        AddLiteralNodeConsolidator.java
        AddNodeCommand.java
        AddNodeCommandFactory.java
        AddUserLinkToAlignmentCommand.java
        AddUserLinkToAlignmentCommandFactory.java
        ApplyModelFromTripleStoreCommand.java
        ApplyModelFromTripleStoreCommandFactory.java
        AugmentDataCommand.java
        AugmentDataCommandFactory.java
        AugmentDataDispachCommand.java
        AugmentDataDispachCommandFactory.java
        ChangeInternalNodeLinksCommand.java
        ChangeInternalNodeLinksCommandFactory.java
        CheckModelExistenceCommand.java
        CheckModelExistenceCommandFactory.java
        CreateNewModelCommand.java
        CreateNewModelCommandFactory.java
        DeleteLinkCommand.java
        DeleteLinkCommandFactory.java
        DeleteLinkConsolidator.java
        DeleteNodeCommand.java
        DeleteNodeCommandFactory.java
        DeleteNodeConsolidator.java
        FetchExistingModelsForWorksheetCommand.java
        FetchExistingModelsForWorksheetCommandFactory.java
        FetchHNodeIdFromAlignmentCommand.java
        FetchHNodeIdFromAlignmentCommandFactory.java
        FetchR2RMLModelsCommand.java
        FetchR2RMLModelsCommandFactory.java
        FetchR2RMLModelsListCommand.java
        FetchR2RMLModelsListCommandFactory.java
        GetAlternativeLinksCommand.java
        GetAlternativeLinksCommandFactory.java
        GetClassesCommand.java
        GetClassesCommandFactory.java
        GetCurrentLinksOfInternalNodeCommand.java
        GetCurrentLinksOfInternalNodeCommandFactory.java
        GetLinkSuggestionsCommand.java
        GetLinkSuggestionsCommandFactory.java
        GetLiteralNodeCommand.java
        GetLiteralNodeCommandFactory.java
        GetPropertiesCommand.java
        GetPropertiesCommandFactory.java
        GetSemanticSuggestionsCommand.java
        GetSemanticSuggestionsCommandFactory.java
        OrganizeColumnsConsolidator.java
        SemanticTypesConsolidator.java
        SetMetaPropertyCommand.java
        SetMetaPropertyCommandFactory.java
        SetSemanticTypeCommand.java
        SetSemanticTypeCommandFactory.java
        SuggestAutoModelCommand.java
        SuggestAutoModelCommandFactory.java
        SuggestModelCommand.java
        SuggestModelCommandFactory.java
        UnassignSemanticTypeCommand.java
        UnassignSemanticTypeCommandFactory.java
        UnassignSemanticTypesConsolidator.java
  - commands-alignment-openrdf
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        GetR2RMLModelURLsCommand.java
        GetR2RMLModelURLsCommandFactory.java
        worksheet
        ApplyHistoryFromR2RMLModelCommand.java
        ApplyHistoryFromR2RMLModelCommandFactory.java
        ApplyModelFromURLCommand.java
        ApplyModelFromURLCommandFactory.java
        kr2rml
        KR2RMLMappingWriter.java
        util
        SavedModelURLs.java
  - commands-bloom
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        alignment
        SearchForDataToAugmentCommand.java
        SearchForDataToAugmentCommandFactory.java
        SearchForDataToAugmentIncomingCommand.java
        SearchForDataToAugmentIncomingCommandFactory.java
        er
        helper
        BloomFilterTripleStoreUtil.java
        kr2rml
        writer
        BloomFilterKR2RMLRDFWriter.java
        KR2RMLBloomFilter.java
        KR2RMLBloomFilterManager.java
  - commands-common
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        WorksheetCommand.java
        WorksheetSelectionCommand.java
        importdata
        ImportServiceCommandPreferencesKeys.java
        history
        CommandHistoryUtil.java
        HistoryJSONEditor.java
        WorksheetCommandHistoryReader.java
        update
        AlignmentSVGVisualizationUpdate.java
        AllWorksheetHeadersUpdate.java
        RegenerateWorksheetUpdate.java
        TagsUpdate.java
        WorksheetCleaningUpdate.java
        WorksheetDataUpdate.java
        WorksheetDeleteUpdate.java
        WorksheetHeadersUpdate.java
        WorksheetSuperSelectionListUpdate.java
        WorksheetUpdateFactory.java
  - commands-import
    - import-avro
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportAvroFileCommand.java
        ImportAvroFileCommandFactory.java
    - import-common
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportCommand.java
        ImportFileCommand.java
        update
        ImportPropertiesUpdate.java
    - import-csv
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportCSVFileCommand.java
        ImportCSVFileCommandFactory.java
        update
        CSVImportPreviewUpdate.java
    - import-database
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportDatabaseTableCommand.java
        ImportDatabaseTableCommandFactory.java
        ImportSQLCommand.java
        ImportSQLCommandFactory.java
        update
        NewDatabaseCommandUpdate.java
        SQLCommandUpdate.java
        imp
        database
        DatabaseTableImport.java
        SQLImport.java
        mdb
        MDBFileExport.java
    - import-excel
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportExcelFileCommand.java
        ImportExcelFileCommandFactory.java
    - import-json
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportJSONFileCommand.java
        ImportJSONFileCommandFactory.java
        ImportJSONLinesFileCommand.java
        ImportJSONLinesFileCommandFactory.java
    - import-ontology
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportOntologyCommand.java
        ImportOntologyCommandFactory.java
    - import-service
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportServiceCommand.java
        ImportServiceCommandFactory.java
        update
        ImportServiceCommandPreferencesUpdate.java
    - import-spatial
      - src
        main
        java
        edu
        isi
        karma
        geospatial
        FeatureTable.java
        LineString.java
        Point.java
        SpatialReferenceSystemTransformationUtil.java
        WorksheetGeospatialContent.java
        WorksheetToFeatureCollection.java
        webserver
        SpatialReferenceSystemServiceHandler.java
    - import-xml
      - src
        main
        java
        edu
        isi
        karma
        controller
        command
        importdata
        ImportXMLFileCommand.java
        ImportXMLFileCommandFactory.java
        imp
        json
        XMLImport.java
  - commands-publish
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        publish
        PublishGithubCommand.java
        PublishGithubCommandFactory.java
        PublishJSONCommand.java
        PublishJSONCommandFactory.java
        PublishReportCommand.java
        PublishReportCommandFactory.java
        service
        PublishModelCommand.java
        PublishModelCommandFactory.java
        model
        serialization
        DataSourceLoader.java
        DataSourcePublisher.java
        WebServicePublisher.java
  - commands-publish-alignment-openrdf
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        alignment
        ClearTripleStoreCommand.java
        ClearTripleStoreCommandFactory.java
        DeleteModelFromTripleStoreCommand.java
        DeleteModelFromTripleStoreCommandFactory.java
        ExportOrDeleteHistoryCommand.java
        ExportOrDeleteHistoryCommandFactory.java
        GenerateR2RMLModelCommand.java
        GenerateR2RMLModelCommandFactory.java
        InvokeDataMiningServiceCommand.java
        InvokeDataMiningServiceCommandFactory.java
        R2RMLAlignmentFileSaver.java
        RefreshHistoryCommand.java
        RefreshHistoryCommandFactory.java
        RefreshModelFromTripleStoreCommand.java
        RefreshModelFromTripleStoreCommandFactory.java
        SaveR2RMLModelCommand.java
        SaveR2RMLModelCommandFactory.java
        publish
        PublishRDFCellCommand.java
        PublishRDFCellCommandFactory.java
        PublishRDFCommand.java
        PublishRDFCommandFactory.java
        avro
        ExportAvroCommand.java
        ExportAvroCommandFactory.java
        json
        ExportJSONCommand.java
        ExportJSONCommandFactory.java
        worksheet
        ExportCSVCommand.java
        ExportCSVCommandFactory.java
        FetchColumnCommand.java
        FetchColumnCommandFactory.java
        er
        helper
        ExportCSVUtil.java
  - commands-python
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        transformation
        AggregationPythonCommand.java
        AggregationPythonCommandFactory.java
        MutatingPythonTransformationCommand.java
        PreviewPythonTransformationResultsCommand.java
        PreviewPythonTransformationResultsCommandFactory.java
        PyTransformConsolidator.java
        PythonTransformationCommand.java
        RepeatPythonTransformationCommand.java
        RepeatPythonTransformationCommandFactory.java
        SubmitEditPythonTransformationCommand.java
        SubmitEditPythonTransformationCommandFactory.java
        SubmitPythonTransformationCommand.java
        SubmitPythonTransformationCommandFactory.java
        kr2rml
        KR2RMLWorksheetHistoryCompatibilityVerifier.java
        mapping
        KR2RMLMappingGenerator.java
        template
        PythonTransformationToTemplateTermSetBuilder.java
        metadata
        PythonTransformationMetadata.java
        transformation
        tokenizer
        PythonTransformationAsURITokenizer.java
        PythonTransformationAsURIValidator.java
        PythonTransformationColumnToken.java
        PythonTransformationInvalidToken.java
        PythonTransformationStringToken.java
        PythonTransformationToken.java
        PythonTransformationTokenVistor.java
      - test
        java
        edu
        isi
        karma
        transformation
        tokenizer
        PythonTransformationAsURIValidatorTest.java
  - commands-update
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        FetchPreferencesCommand.java
        FetchPreferencesCommandFactory.java
        ResetKarmaCommand.java
        ResetKarmaCommandFactory.java
        SetKarmaHomeCommand.java
        SetKarmaHomeCommandFactory.java
        UpdateModelConfigurationCommand.java
        UpdateModelConfigurationCommandFactory.java
        UpdateUIConfigurationCommand.java
        UpdateUIConfigurationCommandFactory.java
        service
        InvokeServiceCommand.java
        InvokeServiceCommandFactory.java
        PopulateCommand.java
        PopulateCommandFactory.java
        update
        AddColumnUpdate.java
        AdditionalRowsUpdate.java
        CleaningResultUpdate.java
        EmptyUpdate.java
        FetchPreferencesUpdate.java
        FetchR2RMLUpdate.java
        FetchResultUpdate.java
        InfoUpdate.java
        InvokeDataMiningServiceUpdate.java
        NodeChangedUpdate.java
        PythonPreviewResultsUpdate.java
        ReplaceWorksheetUpdate.java
  - commands-update-jdbc
    - src
      - main
        java
        edu
        isi
        karma
        controller
        update
        DatabaseTablePreviewUpdate.java
        DatabaseTablesListUpdate.java
  - commands-worksheet
    - src
      - main
        java
        edu
        isi
        karma
        controller
        command
        CloseWorkspaceCommand.java
        CloseWorkspaceCommandFactory.java
        FetchGraphsFromTripleStoreCommand.java
        FetchGraphsFromTripleStoreCommandFactory.java
        GetUniqueGraphUrlCommand.java
        GetUniqueGraphUrlCommandFactory.java
        TestSPARQLEndPointCommand.java
        TestSPARQLEndPointCommandFactory.java
        UndoRedoCommand.java
        UndoRedoCommandFactory.java
        worksheet
        AddColumnCommand.java
        AddColumnCommandFactory.java
        AddRowCommand.java
        AddRowCommandFactory.java
        AddValuesCommand.java
        AddValuesCommandFactory.java
        DeleteWorksheetCommand.java
        DeleteWorksheetCommandFactory.java
        EditCellCommand.java
        EditCellCommandFactory.java
        ExtractEntitiesCommand.java
        ExtractEntitiesCommandFactory.java
        FetchExistingWorksheetPropertiesCommand.java
        FetchExistingWorksheetPropertiesCommandFactory.java
        FoldCommand.java
        FoldCommandFactory.java
        GenerateClusterValuesCommand.java
        GenerateClusterValuesCommandFactory.java
        GetAllWorksheetHeadersCommand.java
        GetAllWorksheetHeadersCommandFactory.java
        GetHeadersCommand.java
        GetHeadersCommandFactory.java
        GlueCommand.java
        GlueCommandFactory.java
        GroupByCommand.java
        GroupByCommandFactory.java
        LoadAdditionalWorksheetRowsCommand.java
        LoadAdditionalWorksheetRowsCommandFactory.java
        MergeClusterValuesCommand.java
        MergeValuesCommandFactory.java
        MultipleValueEditColumnCommand.java
        MultipleValueEditColumnCommandFactory.java
        OrganizeColumnsCommand.java
        OrganizeColumnsCommandFactory.java
        RefreshSVGAligmentCommandFactory.java
        RefreshSVGAlignmentCommand.java
        RefreshWorksheetCommand.java
        RefreshWorksheetCommandFactory.java
        RenameColumnCommand.java
        RenameColumnCommandFactory.java
        SetWorksheetPropertiesCommand.java
        SetWorksheetPropertiesCommandFactory.java
        SplitByCommaCommand.java
        SplitByCommaCommandFactory.java
        SplitColumnByDelimiter.java
        SplitValuesCommand.java
        SplitValuesCommandFactory.java
        UnfoldCommand.java
        UnfoldCommandFactory.java
        selection
        ClearSelectionCommand.java
        ClearSelectionCommandFactory.java
        OperateSelectionCommand.java
        OperateSelectionCommandFactory.java
        RefreshSelectionCommand.java
        RefreshSelectionCommandFactory.java
        RefreshSuperSelectionCommand.java
        RefreshSuperSelectionCommandFactory.java
- karma-common
  - src
    - main
      - java
        edu
        isi
        karma
        common
        JenaWritable.java
        OSUtils.java
        config
        ModelingConfiguration.java
        ModelingConfigurationRegistry.java
        UIConfiguration.java
        UIConfigurationRegistry.java
        controller
        command
        Command.java
        CommandException.java
        CommandFactory.java
        CommandPreferences.java
        ICommand.java
        IPreviewable.java
        JSONInputCommandFactory.java
        selection
        LargeSelection.java
        MiniSelection.java
        Selection.java
        SelectionManager.java
        SuperSelection.java
        SuperSelectionManager.java
        service
        ServiceTableUtil.java
        history
        CommandConsolidator.java
        CommandHistory.java
        HistoryJsonUtil.java
        IHistorySaver.java
        RedoCommandObject.java
        WorksheetCommandHistory.java
        WorksheetCommandHistoryExecutor.java
        update
        AbstractUpdate.java
        ErrorUpdate.java
        HistoryUpdate.java
        SemanticTypesUpdate.java
        TrivialErrorUpdate.java
        UpdateContainer.java
        WorksheetListUpdate.java
        er
        helper
        CloneTableUtils.java
        PythonRepository.java
        PythonRepositoryRegistry.java
        PythonTransformationHelper.java
        SPARQLGeneratorUtil.java
        TripleStoreUtil.java
        imp
        Import.java
        avro
        AvroImport.java
        csv
        CSVFileExport.java
        CSVFileImport.java
        CSVImport.java
        json
        JsonExport.java
        JsonImport.java
        JsonImportValues.java
        kr2rml
        ContextGenerator.java
        ContextIdentifier.java
        KR2RMLConfiguration.java
        KR2RMLVersion.java
        KR2RMLWorksheetRDFGenerator.java
        NamedGraph.java
        ObjectMap.java
        Predicate.java
        PredicateObjectMap.java
        Prefix.java
        RefObjectMap.java
        ShortHandURI.java
        ShortHandURIGenerator.java
        SubjectMap.java
        TermMap.java
        URIFormatter.java
        affinity
        ColumnAffinity.java
        CommonParentRowColumnAffinity.java
        NoColumnAffinity.java
        ParentRowColumnAffinity.java
        RowColumnAffinity.java
        exception
        HNodeNotFoundKarmaException.java
        NoValueFoundInNodeException.java
        ValueNotFoundKarmaException.java
        formatter
        KR2RMLColumnNameFormatter.java
        KR2RMLColumnNameFormatterFactory.java
        KR2RMLIdentityColumnNameFormatter.java
        mapping
        KR2RMLMapping.java
        KR2RMLMappingAuxillaryInformation.java
        KR2RMLMappingColumnNameHNodeTranslator.java
        R2RMLMapping.java
        R2RMLMappingIdentifier.java
        WorksheetR2RMLJenaModelParser.java
        planning
        ColumnPredicateObjectMappingPlan.java
        ConstantPredicateObjectMappingPlan.java
        DFSTriplesMapGraphDAGifier.java
        InternalPredicateObjectMappingPlan.java
        MapPlan.java
        PredicateObjectMappingPlan.java
        RootStrategy.java
        SteinerTreeRootStrategy.java
        SubjectMapPlan.java
        TriplesMap.java
        TriplesMapGraph.java
        TriplesMapGraphDAGifier.java
        TriplesMapGraphMerger.java
        TriplesMapLink.java
        TriplesMapPlan.java
        TriplesMapPlanExecutor.java
        TriplesMapPlanGenerator.java
        TriplesMapWorker.java
        TriplesMapWorkerPlan.java
        UserSpecifiedRootStrategy.java
        WorksheetDepthRootStrategy.java
        template
        ColumnTemplateTerm.java
        ConstantTemplateTermSetPopulatorPlan.java
        DoublyAnchoredTemplateTermSetPopulator.java
        DynamicTemplateTermSetPopulatorStrategy.java
        MemoizedTemplateTermSetPopulatorStrategy.java
        PartiallyPopulatedTermSet.java
        PopulatedTemplateTermSet.java
        SinglyAnchoredTemplateTermSetPopulatorPlan.java
        StringTemplateTerm.java
        TemplateTerm.java
        TemplateTermSet.java
        TemplateTermSetBuilder.java
        TemplateTermSetPopulator.java
        TemplateTermSetPopulatorPlan.java
        TemplateTermSetPopulatorStrategy.java
        TemplateTermSetPopulatorWorker.java
        writer
        AvroKR2RMLRDFWriter.java
        JSONKR2RMLRDFWriter.java
        KR2RMLRDFWriter.java
        N3KR2RMLRDFWriter.java
        SFKR2RMLRDFWriter.java
        metadata
        AvroMetadata.java
        CSVMetadata.java
        GraphVizMetadata.java
        JSONMetadata.java
        JSONModelsMetadata.java
        KMLPublishedMetadata.java
        KarmaMetadata.java
        KarmaMetadataManager.java
        KarmaMetadataType.java
        KarmaPublishedMetadata.java
        KarmaUserMetadata.java
        ModelLearnerMetadata.java
        NumericSemanticTypeModelMetadata.java
        OntologyMetadata.java
        R2RMLMetadata.java
        R2RMLPublishedMetadata.java
        RDFMetadata.java
        ReportMetadata.java
        SemanticTypeModelMetadata.java
        StandardPublishMetadataTypes.java
        StandardUserMetadataTypes.java
        TextualSemanticTypeModelMetadata.java
        UserConfigMetadata.java
        UserPreferencesMetadata.java
        UserUploadedMetadata.java
        model
        serialization
        Repository.java
        SourceLoader.java
        SourcePublisher.java
        WebServiceLoader.java
        modeling
        Namespaces.java
        Prefixes.java
        Uris.java
        alignment
        Alignment.java
        AlignmentManager.java
        AlignmentScore.java
        GraphBuilder.java
        GraphBuilderTopK.java
        GraphPath.java
        GraphPreProcess.java
        GraphUtil.java
        GraphVizLabelType.java
        GraphVizUtil.java
        IAlignmentSaver.java
        LinkIdFactory.java
        ModelEvaluation.java
        NodeIdFactory.java
        SemanticModel.java
        SteinerTree.java
        TreePostProcess.java
        learner
        CandidateSteinerSets.java
        Coherence.java
        CoherenceItem.java
        Confidence.java
        LinkCoherence.java
        ModelLearner.java
        ModelLearner_Old.java
        ModelLearningGraph.java
        ModelLearningGraphCompact.java
        ModelLearningGraphCompact_Old.java
        ModelLearningGraphLoaderThread.java
        ModelLearningGraphSparse.java
        ModelLearningGraphType.java
        ModelReader.java
        NodeCoherence.java
        PatternWeightSystem.java
        SemanticTypeMapping.java
        SortableSemanticModel.java
        SortableSemanticModel_Old.java
        SteinerNodes.java
        SteinerNodesCoherenceComparator.java
        SteinerNodesConfidenceComparator.java
        SteinerNodesSizeComparator.java
        ontology
        AutoOntology.java
        OntologyCache.java
        OntologyHandler.java
        OntologyManager.java
        OntologyTreeNode.java
        OntologyUpdateListener.java
        SubclassSuperclassPair.java
        semantictypes
        SemanticTypeColumnModel.java
        SemanticTypeUtil.java
        steiner
        topk
        ApprSteinerTree.java
        BANKSIteratorComparator.java
        BANKSfromMM_Old.java
        CustomizedBANKS.java
        DirectedFact.java
        Edge.java
        Entity.java
        Fact.java
        Graph.java
        LabeledEdge.java
        LoosePath.java
        ModelCoherence.java
        ModelFrequencyPair.java
        QuickSelect.java
        Relation.java
        ResultGraph.java
        SteinerEdge.java
        SteinerNode.java
        SteinerNodeComparator.java
        SteinerScoringFunction.java
        SteinerSubTree.java
        TopKSteinertrees.java
        WeightedLabeledEdge.java
        rdf
        RdfGenerator.java
        rep
        CellValue.java
        ColumnMetadata.java
        Entity.java
        HNode.java
        HNodePath.java
        HTable.java
        HashValueManager.java
        IEntity.java
        Neighbor.java
        Node.java
        RepEntity.java
        RepFactory.java
        Row.java
        StringCellValue.java
        Table.java
        TablePager.java
        Worksheet.java
        Workspace.java
        WorkspaceManager.java
        alignment
        ClassInstanceLink.java
        ColumnNode.java
        ColumnSemanticTypeStatus.java
        ColumnSubClassLink.java
        CompactLink.java
        CompactObjectPropertyLink.java
        CompactSubClassLink.java
        DataPropertyLink.java
        DataPropertyOfColumnLink.java
        DefaultLink.java
        DisplayModel.java
        InternalNode.java
        Label.java
        LabeledLink.java
        LinkKeyInfo.java
        LinkPriorityComparator.java
        LinkStatus.java
        LinkType.java
        LiteralNode.java
        Node.java
        NodeSupportingModelsComparator.java
        NodeType.java
        ObjectPropertyLink.java
        ObjectPropertySpecializationLink.java
        ObjectPropertyType.java
        SemanticType.java
        SemanticTypes.java
        SubClassLink.java
        SynonymSemanticTypes.java
        metadata
        MetadataContainer.java
        SourceInformation.java
        Tag.java
        TagsContainer.java
        WorksheetProperties.java
        model
        Argument.java
        ArgumentType.java
        Atom.java
        ClassAtom.java
        DatavaluedPropertyAtom.java
        IndividualPropertyAtom.java
        Model.java
        sources
        Attribute.java
        AttributeRequirement.java
        DataSource.java
        IOType.java
        Invocation.java
        InvocationManager.java
        Request.java
        Response.java
        Source.java
        Table.java
        URLManager.java
        WebService.java
        service
        json
        ArrayValue.java
        Element.java
        JsonManager.java
        util
        CommandInputJSONUtil.java
        EncodingDetector.java
        FileUtil.java
        HTTPUtil.java
        JSONLDReducerComparator.java
        JSONLDReducerComparatorSimple.java
        JSONLDUtilSimple.java
        JSONUtil.java
        Jsonizable.java
        Preferences.java
        Util.java
        view
        VHNode.java
        VWorksheet.java
        VWorkspace.java
        VWorkspaceRegistry.java
        ViewEntity.java
        ViewFactory.java
        ViewPreferences.java
        webserver
        ExecutionController.java
        KarmaException.java
        WorkspaceRegistry.java
    - test
      - java
        edu
        isi
        karma
        util
        TestJSONLDUtilSimple.java
- karma-jdbc
  - src
    - main
      - java
        edu
        isi
        karma
        rdf
        DatabaseTableRDFGenerator.java
        util
        AbstractJDBCUtil.java
        JDBCUtilFactory.java
        MySQLUtil.java
        OracleUtil.java
        PostGISUtil.java
        SQLServerUtil.java
        SybaseUtil.java
- karma-jsonld
  - src
    - main
      - java
        com
        github
        jsonldjava
        core
        Context.java
        DocumentLoader.java
        JsonLdApi.java
        JsonLdConsts.java
        JsonLdError.java
        JsonLdOptions.java
        JsonLdProcessor.java
        JsonLdTripleCallback.java
        JsonLdUtils.java
        NormalizeUtils.java
        RDFDataset.java
        RDFDatasetUtils.java
        RDFParser.java
        Regex.java
        RemoteDocument.java
        UniqueNamer.java
        impl
        NQuadRDFParser.java
        NQuadTripleCallback.java
        TurtleRDFParser.java
        TurtleTripleCallback.java
        utils
        JarCacheResource.java
        JarCacheStorage.java
        JsonLdUrl.java
        JsonUtils.java
        Obj.java
        edu
        isi
        karma
        jsonld
        helper
        JSONLDConverter.java
        spark
        ConvertJSONLD.java
- karma-mr
  - src
    - main
      - java
        edu
        isi
        karma
        mapreduce
        driver
        BaseRDFMapper.java
        ElasticSearchMapper.java
        IdentityJSONMapper.java
        IdentityN3Mapper.java
        InputFileDirectoryLoader.java
        JSONAvroProcessor.java
        JSONCSVProcessor.java
        JSONCompactMapper.java
        JSONIdentityReducerProcessor.java
        JSONLDMapper.java
        JSONMapper.java
        JSONProcessor.java
        JSONReducer.java
        JSONTypeFilterMapper.java
        KarmaProcessor.java
        N3Mapper.java
        N3Processor.java
        N3Reducer.java
        N3ToJSONReducer.java
        TextToStringIterator.java
        ValueOnlyJSONReducer.java
        XMLElementExtractorMapper.java
        XMLElementExtractorProcessor.java
        ZipFileProcessor.java
        function
        CollectJSONObject.java
        CreateJSONFromSequenceFile.java
        CreateSequenceFile.java
        CreateSequenceFilesByType.java
        MergeArrayOfJSON.java
        MergeJSON.java
        SplitAndCleanJSONArray.java
        UpdateIdAndType.java
        inputformat
        AvroBatchRecordReader.java
        AvroKeyBatchInputFormat.java
        CSVBatchRecordReader.java
        CSVBatchTextInputFormat.java
        HTMLInputFormat.java
        SequenceFileAsJSONInputBatchFormat.java
        SequenceFileAsJSONRecordBatchReader.java
        SequenceFileAsLineInputFormat.java
        XMLInputFormat.java
        ZIPInputFormat.java
        ZIPRecordReader.java
        tripleparser
        Neo4jCSVGenerator.java
        NodeMapper.java
        NodeProcessor.java
        NodeReducer.java
        RelationshipProcessor.java
        RelationshipReducer.java
        TripleMapper.java
        TripleProcessor.java
        TripleReducer.java
    - test
      - java
        edu
        isi
        karma
        mapreduce
        driver
        CreateSequenceFileFromKeyValuePairs.java
        JSONIdentityMapReduceLocal.java
        TestAvroGenerationLocal.java
        TestCollectJSONObject.java
        TestIdentityN3ToJSONReducer.java
        TestJSONCollector.java
        TestJSONCompactMapper.java
        TestJSONIdentityMapReduce.java
        TestJSONIdentityMapReduceLocal.java
        TestJSONMapReduce.java
        TestJSONMapReduceMultiRoots.java
        TestMergeJSON.java
        TestN3Generation.java
        TestN3GenerationLocal.java
        TestN3MapReduce.java
        TestRDFMapReduce.java
        TestTypeFilterToJSONReducer.java
- karma-offline
  - src
    - main
      - java
        edu
        isi
        karma
        rdf
        BaseKarma.java
        BaseRDFImpl.java
        CommandLineArgumentParser.java
        GenerateContextFromModel.java
        GenericRDFGenerator.java
        InputProperties.java
        JSONImpl.java
        JSONRDFGenerator.java
        LoadRDFToTripleStore.java
        N3Impl.java
        OfflineRdfGenerator.java
        RDFGeneratorRequest.java
        bloom
        AddSameAsToBloomFilters.java
        BloomFilterWorker.java
        CombineBloomFiltersFromRDF.java
    - test
      - java
        edu
        isi
        karma
        rdf
        TestAvroRDFGenerator.java
        TestBasicJSONRDFGenerator.java
        TestCSVFileRdfGenerator.java
        TestCSVRDFGenerator.java
        TestFileRdfGenerator.java
        TestJSONDagRDFGenerator.java
        TestJSONRDFGenerator.java
        TestJSONRDFGeneratorWithContext.java
        TestJSONRDFGeneratorWithFold.java
        TestJSONRDFGeneratorWithGlue.java
        TestJSONRDFGeneratorWithGroupBy.java
        TestJSONRDFGeneratorWithOrganizeColumns.java
        TestJSONRDFGeneratorWithSelection.java
        TestJSONRDFGeneratorWithUnfold.java
        TestLiteralNodeCSVRDFGenerator.java
        TestRdfGenerator.java
        TestSelection.java
        bloom
        TestJSONRDFGeneratorWithBloomFilters.java
- karma-research
  - src
    - main
      - java
        edu
        isi
        karma
        research
        misc
        TestMongoDB.java
        VirtuosoSample.java
        modeling
        GraphBuilder_LOD_Pattern.java
        GraphBuilder_Popularity.java
        LOD_SemanticModelComparator.java
        ModelLearner_KnownModels.java
        ModelLearner_KnownModels2.java
        ModelLearner_LOD.java
        ModelLearner_LOD_Greedy.java
        ModelOverlap.java
        OfflineTraining.java
        Pattern.java
        PatternComparator.java
        PatternGenerator.java
        PatternLabelComparator.java
        PatternReader.java
        VirtuosoConnector.java
        VirtuosoManager.java
        reserach
        alignment
        Approach1.java
        Approach2.java
        PatternContainment.java
        SemanticLabel.java
        SemanticLabelType.java
        WeightTuning.java
- karma-spark
  - src
    - main
      - java
        edu
        isi
        karma
        spark
        JSONContextDriver.java
        JSONReducerDriver.java
        KarmaDriver.java
        UtilitiesDriver.java
    - test
      - java
        edu
        isi
        karma
        spark
        TestJSONGeneratorWithProvenance.java
- karma-storm
  - src
    - main
      - java
        edu
        isi
        karma
        storm
        bolt
        KarmaBolt.java
        KarmaJoinBolt.java
        KarmaReducerBolt.java
        function
        JSONToMerge.java
        strategy
        AbstractFileDistributionStrategy.java
        FileDistributionStrategy.java
        JoinStrategy.java
        KarmaHomeStrategy.java
        LoadStrategy.java
        LocalFileDistributionStrategy.java
        URLFileDistributionStrategy.java
    - test
      - java
        edu
        isi
        karma
        storm
        BasicJSONTestSpout.java
        TestBasicKarmaTopology.java
- karma-typer
  - src
    - main
      - java
        edu
        isi
        karma
        semantictypes
        evaluation
        EvaluateMRR.java
        EvaluatedJSONLabels.java
        MRRItem.java
        ReadEvaluatedFile.java
        numeric
        KSTest.java
        tfIdf
        Indexer.java
        Searcher.java
        typinghandler
        HybridSTModelHandler.java
        LuceneBasedSTModelHandler.java
- karma-util
  - src
    - main
      - java
        edu
        isi
        karma
        common
        HttpMethods.java
        ResourceUtils.java
        controller
        command
        CommandType.java
        importdata
        ImportFileInteractionType.java
        publish
        PublishRDFCommandJsonKeys.java
        PublishRDFCommandPreferencesKeys.java
        worksheet
        AddColumnCommandJsonKeys.java
        imp
        excel
        ToCSV.java
        kr2rml
        ErrorReport.java
        HNodeNotFoundKarmaException.java
        KR2RMLWorksheetRDFGenerator.java
        ReportMessage.java
        ValueNotFoundKarmaException.java
        linkedapi
        server
        ResourceType.java
        model
        serialization
        MimeType.java
        SerializationLang.java
        modeling
        ModelingParams.java
        alignment
        LinkFrequency.java
        research
        Params.java
        semantictypes
        ISemanticTypeModelHandler.java
        SemanticTypeLabel.java
        SemanticTypeLabelComparator.java
        service
        json
        SingleValue.java
        Value.java
        ValueType.java
        util
        DBType.java
        KarmaStats.java
        LogStackTrace.java
        RandomGUID.java
        webserver
        ContextParametersRegistry.java
        ServletContextParameterMap.java
        WorkspaceKarmaHomeRegistry.java
- karma-web
  - src
    - main
      - java
        edu
        isi
        karma
        linkedapi
        server
        GetRequestManager.java
        HTTPClientTest.java
        LinkedApiRequestManager.java
        PostRequestManager.java
        webserver
        KMLFileTransferHandler.java
        KarmaServlet.java
        LinkedApiServiceHandler.java
        R2RMLMappingServlet.java
        R2RMLMappingTripleStoreServlet.java
        RequestController.java
        SampleDataFactory.java
        ServerStart.java
    - test
      - java
        edu
        isi
        karma
        webserver
        KarmaServletTest.java
- karma-web-services
  - web-services-publish-es
    - src
      - main
        java
        edu
        isi
        karma
        web
        services
        publish
        es
        ElasticSearchConfig.java
        ElasticSearchPublishServlet.java
        FormParameters.java
        R2RMLConfig.java
      - test
        java
        edu
        isi
        karma
        web
        services
        publish
        es
        TestElasticSearchPublishServlet.java
  - web-services-rdf
    - src
      - main
        java
        edu
        isi
        karma
        web
        services
        rdf
        FormParameters.java
        RDFGeneratorServlet.java
      - test
        java
        edu
        isi
        karma
        web
        services
        rdf
        TestRDFGeneratorServlet.java

package edu.isi.karma.mapreduce.inputformat;

import java.io.IOException;

import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.DataOutputBuffer;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapred.FileSplit;
import org.apache.hadoop.mapred.InputSplit;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.RecordReader;
import org.apache.hadoop.mapred.Reporter;
import org.apache.hadoop.mapred.TextInputFormat;

public class HTMLInputFormat extends TextInputFormat {
public static final String START_TAG = "<html";
public static final String END_TAG = "</html>";

@Override
public RecordReader<LongWritable,Text> getRecordReader(InputSplit inputSplit,
                                                       JobConf jobConf,
                                                       Reporter reporter) throws IOException {
  return new HTMLRecordReader((FileSplit) inputSplit, jobConf);
}

/**
 * XMLRecordReader class to read through a given xml document to output xml
 * blocks as records as specified by the start tag and end tag
 * 
 */
public static class HTMLRecordReader implements
    RecordReader<LongWritable,Text> {
  private final byte[] startTag;
  private final byte[] startTagUpper;
  private final byte[] endTag;
  private final byte[] endTagUpper;
  private final long start;
  private final long end;
  private final FSDataInputStream fsin;
  private final DataOutputBuffer buffer = new DataOutputBuffer();
  private String filename;
  
  public HTMLRecordReader(FileSplit split, JobConf jobConf) throws IOException {
    startTag = START_TAG.getBytes("utf-8");
    startTagUpper = START_TAG.toUpperCase().getBytes("utf-8");
    endTag = END_TAG.getBytes("utf-8");
    endTagUpper = END_TAG.toUpperCase().getBytes("utf-8");
    
    // open the file and seek to the start of the split
    start = split.getStart();
    end = start + split.getLength();
    Path file = split.getPath();
    FileSystem fs = file.getFileSystem(jobConf);
    fsin = fs.open(split.getPath());
    filename = split.getPath().getName();
    fsin.seek(start);
  }
  
  @Override
  public boolean next(LongWritable key, Text value) throws IOException {
    if (fsin.getPos() < end) {
      if (readUntilMatch(startTag, startTagUpper, false)) {
        try {
          buffer.write(startTag);
          if (readUntilMatch(endTag, endTagUpper, true)) {
            key.set(fsin.getPos());
        	//  key.set(filename);
            buffer.write(("<location>" + filename + "</location>").getBytes("utf-8"));
            value.set(buffer.getData(), 0, buffer.getLength());
            return true;
          }
        } finally {
          buffer.reset();
        }
      }
    }
    return false;
  }
  
  @Override
  public LongWritable createKey() {
    return new LongWritable();
  }
  
  @Override
  public Text createValue() {
    return new Text();
  }
  
  @Override
  public long getPos() throws IOException {
    return fsin.getPos();
  }
  
  @Override
  public void close() throws IOException {
    fsin.close();
  }
  
  @Override
  public float getProgress() throws IOException {
    return (fsin.getPos() - start) / (float) (end - start);
  }
  
  private boolean readUntilMatch(byte[] match, byte[] uppermatch, boolean withinBlock) throws IOException {
    int i = 0;
    while (true) {
      int b = fsin.read();
      // end of file:
      if (b == -1) return false;
      // save to buffer:
      if (withinBlock && b!= 13 && b != 10) buffer.write(b);
      
      // check if we're matching:
      if (b == match[i] || b == uppermatch[i]) {
        i++;
        if (i >= match.length) return true;
      } else i = 0;
      // see if we've passed the stop point:
      if (!withinBlock && i == 0 && fsin.getPos() >= end) return false;
    }
  }
}
}