XmlExtractor.java example

Explorer

plato-master
- idp
  - src
    - main
      - java
        eu
        scape_project
        pw
        idp
        UserAttributeManager.java
        UserManager.java
        application
        Resources.java
        bean
        ActivateUserView.java
        CreateAccountView.java
        ForgotPasswordView.java
        ResetPasswordView.java
        excpetions
        CannotSendMailException.java
        CreateUserException.java
        UserNotFoundException.java
        model
        IdpRole.java
        IdpUser.java
        IdpUserState.java
        PasswordHashingEntityListener.java
        utils
        ConfigurationLoader.java
        FacesMessages.java
        validator
        ConfirmPasswordValidator.java
        EmailExistsValidator.java
        ReCaptchaValidator.java
        UsernameExistsValidator.java
    - test
      - java
        eu
        scape_project
        pw
        idp
        UserManagerTest.java
        model
        IdpRoleTest.java
        IdpUserTest.java
        validator
        ConfirmPasswordValidatorTest.java
        EmailExistsValidatorTest.java
        UsernameExistsValidatorTest.java
- jboss-util
  - src
    - main
      - java
        eu
        scape_project
        planning
        jboss
        util
        UTF8EncodingValve.java
- kbrowser
  - src
    - main
      - java
        eu
        scape_project
        planning
        application
        BugReportView.java
        FeedbackView.java
        criteria
        bean
        AlternativeResultRange.java
        CriteriaHierarchyHelperBean.java
        CriteriaSetsFullView.java
        CriteriaSetsSummaryView.java
        DominatedSets.java
        ImportanceAnalysis.java
        ImportanceAnalysisProperty.java
        KBrowser.java
        KBrowserCalculator.java
        KBrowserTransformerTable.java
        ManageCriteriaSets.java
        PlanInfo.java
        PlanSelection.java
        PlanSelector.java
        RankChangingDominatedSets.java
        WinningDominatedSets.java
        data
        DiagramData.java
        PotentialToRangeData.java
        PotentialToRangeMaxData.java
        converters
        JsonConverter.java
        xml
        CriteriaHierarchyExporter.java
    - test
      - java
        eu
        scape_project
        planning
        criteria
        bean
        RankChangingDominatedSetsTest.java
        pw
        planning
        criteria
        xml
        CriteriaHierarchyExporterTest.java
- minimee
  - minimee-tools
    - migration-tools
      - oo
        PDFCM_src
        pdfcm
        Main.java
        PDFConvert.java
      - taverna
        t2-server-java-cli
        src
        main
        java
        uk
        org
        taverna
        server
        client
        cli
        AppDispatcher.java
        ConsoleApp.java
        DeleteRuns.java
        RunWorkflow.java
        ServerInfo.java
  - src
    - main
      - java
        at
        tuwien
        minimee
        ActionService.java
        MiniMeeException.java
        emulation
        EmulationService.java
        migration
        CommandLineMigrator.java
        MigrationService.java
        MiniMeeMigrationService.java
        engines
        ChainedEvaluationEngine.java
        IMigrationEngine.java
        MiniMeeDefaultMigrationEngine.java
        MonitorEngineDefaultJava.java
        MonitorEngineHPROF.java
        MonitorEngineJIP.java
        MonitorEngineTOPDefault.java
        MonitorEngineTOPJava.java
        MonitorEngineTOPOpenOffice.java
        MonitorEngineTime.java
        MonitorEngineTimeJava.java
        MonitorEngineWinPslist.java
        MultipleMonitoringMigrationEngine.java
        evaluators
        IMinimeeEvaluator.java
        ImageCompareEvaluator.java
        parser
        HPROF_Parser.java
        Jip_Parser.java
        TIME_Parser.java
        runners
        DefaultRunner.java
        IRunner.java
        RunInfo.java
        SingletonRunner.java
        tools
        oo
        OpenOfficeMigrationLinux.java
        model
        ExperienceBase.java
        Machine.java
        Tool.java
        ToolConfig.java
        registry
        MiniMeeRegistry.java
        MiniMeeServiceRegistry.java
        MiniReefServiceRegistry.java
        PreservationActionService.java
        ToolRegistry.java
        xml
        EngineFactory.java
        EvaluatorFactory.java
        PreservationActionServiceFactory.java
        util
        CommandExecutor.java
        ExecutionFootprint.java
        ExecutionFootprintList.java
        FileUtils.java
        ILogDevice.java
        LinuxCommandExecutor.java
        LinuxCommandMonitor.java
        OS.java
        ProcessExecutionFootprint.java
        PslistWinParser.java
        StrictErrorHandler.java
        SystemExecutionFootprint.java
        TopParser.java
        WinExecutionFootprintList.java
        WinProcessExecutionFootprint.java
        minireef
        MiniREEF.java
        MiniREEFResolver.java
        ResultSet.java
    - test
      - java
        at
        tuwien
        minimee
        registry
        MiniReefServiceRegistryTest.java
- minimee-view
  - src
    - main
      - java
        at
        tuwien
        minimee
        DummyUserFactory.java
        Resources.java
        controller
        MiniMeeAdminAction.java
        view
        MiniMeeAdmin.java
        eu
        scape_project
        planning
        services
        action
        minimee
        MiniMeeEmulationService.java
        MiniMeeMigrationService.java
- planning-core
  - src
    - main
      - java
        eu
        scape_project
        planning
        annotation
        IntegrationTest.java
        ManualTest.java
        SeleniumTest.java
        api
        RepositoryConnectorApi.java
        application
        BugReport.java
        DefaultExceptionHandler.java
        DefaultExceptionHandlerFactory.java
        ErrorMessage.java
        Feedback.java
        IAuthenticatedUserProvider.java
        InitApplication.java
        MailException.java
        Messages.java
        NewsMessage.java
        Resources.java
        SessionScopeProducer.java
        bean
        CriterionSelector.java
        PrepareChangesForPersist.java
        efficiency
        CriteriaImpactAnalysis.java
        LUndef.java
        PlanStatistics.java
        PlanStatisticsGenerator.java
        StateChangeLog.java
        StateChangeLogGenerator.java
        StatisticsGenerator.java
        evaluation
        EvaluatorException.java
        IActionEvaluator.java
        IEvaluator.java
        IObjectEvaluator.java
        IStatusListener.java
        evaluators
        ExperimentEvaluator.java
        FITSEvaluator.java
        ObjectEvaluator.java
        PCDLEvaluator.java
        XmlExtractor.java
        manager
        ByteStreamManager.java
        CriteriaManager.java
        DigitalObjectManager.java
        FileStorage.java
        IByteStreamManager.java
        IByteStreamStorage.java
        PlanManager.java
        StorageException.java
        services
        IServiceInfo.java
        PlanningServiceException.java
        UTF8EncodingFilter.java
        action
        ActionInfo.java
        ActionInfoFactory.java
        IPreservationActionRegistry.java
        characterisation
        fits
        FitsIntegration.java
        FitsNamespaceContext.java
        myexperiment
        MyExperimentRESTClient.java
        domain
        AcceptedMimetypes.java
        ComponentConstants.java
        Installation.java
        LicenseType.java
        MigrationPath.java
        Port.java
        Rating.java
        ResourceDescription.java
        SearchResult.java
        Tag.java
        Type.java
        Uploader.java
        WorkflowDescription.java
        WorkflowInfo.java
        taverna
        PortType.java
        TavernaPort.java
        executor
        SSHInMemoryTempFile.java
        SSHTavernaExecutor.java
        SSHTempFile.java
        TavernaExecutor.java
        TavernaExecutorException.java
        generator
        T2FlowExecutablePlanGenerator.java
        model
        Dataflow.java
        Datalink.java
        InputPort.java
        LinkableElement.java
        OutputPort.java
        Workflow.java
        processor
        Component.java
        NestedWorkflow.java
        Processor.java
        TextConstant.java
        parser
        T2FlowParser.java
        TavernaParserException.java
        sla
        QLDGenerator.java
        TriggerGenerator.java
        utils
        CommandExecutor.java
        ConfigurationLoader.java
        Downloader.java
        FacesMessages.java
        FileUtils.java
        GravatarHelper.java
        Helper.java
        ILogDevice.java
        JGet.java
        LoggerFactory.java
        MemoryTest.java
        OS.java
        ParserException.java
        RepositoryConnectorException.java
        XmlXPathEvaluator.java
        validation
        INodeValidator.java
        ITreeValidator.java
        PlanValidator.java
        TargetValueValidator.java
        TreeValidator.java
        xml
        C3POProfileParser.java
        LocalURIResolver.java
        PlanMigrator.java
        PlanParser.java
        PlanXMLConstants.java
        PreservationActionPlanGenerator.java
        ProjectExportAction.java
        ProjectExporter.java
        ProjectImporter.java
        SchemaResolver.java
        StrictDefaultHandler.java
        StrictErrorHandler.java
        TreeLoader.java
        ValidatingParserFactory.java
        XMLStreamContentWriter.java
        freemind
        MindMap.java
        Node.java
        PolicyNode.java
        plan
        BinaryDataWrapper.java
        ChangeLogFactory.java
        EnumConverter.java
        ExperimentWrapper.java
        GoDecisionFactory.java
        NodeContentWrapper.java
        NumericTransformerThresholdFactory.java
        OrdinalTransformerMappingFactory.java
        PlanStateFactory.java
        RecommendationWrapper.java
        SampleAggregationModeFactory.java
        StringCapsule.java
        TimestampFormatter.java
        TransformationModeFactory.java
        TriggerFactory.java
        XMLDataWrapper.java
    - test
      - java
        eu
        scape_project
        planning
        application
        Mock.java
        MockAuthenticatedUserProvider.java
        MockConversation.java
        MockConversationContext.java
        efficiency
        LUndefTest.java
        PlanStatisticTest.java
        manager
        ByteStreamManagerIT.java
        CriteriaManagerTest.java
        DigitalObjectManagerTest.java
        services
        myexperiment
        MyExperimentRESTClientTest.java
        taverna
        generator
        T2FlowExecutablePlanGeneratorTest.java
        parser
        T2FlowParserTest.java
        sla
        QLDGeneratorTest.java
        QualityLevelDefinitionTest.java
        utils
        FileUtilsTest.java
        JGetTest.java
        SchematronValidator.java
        XmlXPathEvaluatorTest.java
        xml
        C3POProfileParserTest.java
        PlanMigratorTest.java
        PlanParserProjectExporterTest.java
        PlanParserTest.java
        ProjectExporterTest.java
        SchemaValidationTest.java
- plato
  - src
    - main
      - java
        eu
        scape_project
        planning
        ConversationScopeProducer.java
        LoadedPlan.java
        application
        AdminActions.java
        AdminActionsView.java
        BugReportView.java
        FeedbackView.java
        SessionTimeoutListener.java
        converters
        NumberConverter.java
        StringTrimConverter.java
        evaluation
        MiniRED.java
        evaluators
        ImageComparisonEvaluator.java
        MiniREEFEvaluator.java
        MiniREEFResolver.java
        plans
        PlanListerView.java
        PlanSettingsView.java
        plato
        ExperimentRunner.java
        bean
        ExperimentStatus.java
        IServiceLoader.java
        MyExperimentServices.java
        ServiceInfoDataModel.java
        TreeHelperBean.java
        wf
        AbstractWorkflowStep.java
        AnalyseResults.java
        CreateExecutablePlan.java
        DefineAlternatives.java
        DefineBasis.java
        DefinePreservationPlan.java
        DefineSampleObjects.java
        DevelopExperiments.java
        EvaluateExperiments.java
        IdentifyRequirements.java
        PlanningWorkflowException.java
        RunExperiments.java
        SetImportanceFactors.java
        TakeGoDecision.java
        TransformMeasuredValues.java
        ValidatePlan.java
        wfview
        AbstractView.java
        ViewWorkflow.java
        ViewWorkflowFactory.java
        ViewWorkflowManager.java
        ViewWorkflowMenu.java
        beans
        ReportLeaf.java
        ServiceParametersView.java
        full
        AnalyseResultsView.java
        CreateExecutablePlanView.java
        CreatePlanView.java
        DefineAlternativesView.java
        DefineBasisView.java
        DefinePreservationPlanView.java
        DefineSampleRecordsView.java
        DevelopExperimentsView.java
        EvaluateExperimentsView.java
        IdentifyRequirementsView.java
        RunExperimentsView.java
        SetImportanceFactorsView.java
        TakeGoDecisionView.java
        TransformMeasuredValuesView.java
        ValidatePlanView.java
        policies
        OrganisationalPolicies.java
        OrganisationalPoliciesView.java
        repository
        RODAConnector.java
        SCAPEDataConnectorClient.java
        SCAPEPlanManagementClient.java
        services
        RestSecurityInterceptor.java
        evaluation
        taverna
        SSHTavernaEvaluationService.java
        myexperiment
        MyExperimentAsyncBuilder.java
        MyExperimentAsyncLoader.java
        MyExperimentExecutablePlanGenerator.java
        MyExperimentSearch.java
        RecommendedComponent.java
        notification
        NotificationResource.java
        WatchNotification.java
        pa
        PreservationActionRegistryDefinition.java
        PreservationActionRegistryFactory.java
        PreservationActionServiceFactory.java
        taverna
        MyExperimentActionInfo.java
        SSHGeneratedTavernaMigrationService.java
        SSHTavernaMigrationActionService.java
        user
        AlreadyGroupMemberException.java
        GroupInvitationView.java
        GroupNotFoundException.java
        Groups.java
        GroupsView.java
        InvitationMailException.java
        NotificationView.java
        TokenNotFoundException.java
        utils
        CharacterisationReportGenerator.java
        validators
        TargetValueValidator.java
    - test
      - java
        eu
        scape_project
        planning
        application
        PlatoDeploymentBuilder.java
        converters
        NumberConverterTest.java
        plans
        PlanSettingsTest.java
        plato
        wf
        AbstractWorkflowStepTest.java
        DefineAlternativesIT.java
        DefineBasisIT.java
        FullPlanningworkflowIT.java
        wfview
        ViewWorkflowTest.java
        WorkflowStepFactoryTest.java
        full
        DefineAlternativesViewTest.java
        repository
        SCAPEDataConnectorIT.java
        SCAPEPlanManagementClientIT.java
        selenium
        WebDriverIT.java
        services
        myexperiment
        domain
        WorkflowDescriptionTest.java
        notification
        NotificationResourceIT.java
        utils
        CharacterisationReportGeneratorTest.java
- plato-model
  - src
    - main
      - java
        eu
        scape_project
        planning
        exception
        PlanningException.java
        model
        Alternative.java
        AlternativesDefinition.java
        ByteStream.java
        ChangeLog.java
        CollectionProfile.java
        Decision.java
        DetailedExperimentInfo.java
        DigitalObject.java
        Evaluation.java
        EvaluationStatus.java
        ExecutablePlanDefinition.java
        Experiment.java
        FormatInfo.java
        GroupInvitation.java
        IChangesHandler.java
        ITouchable.java
        ImportanceWeighting.java
        Notification.java
        ObjectProperty.java
        Parameter.java
        Plan.java
        PlanDefinition.java
        PlanProperties.java
        PlanState.java
        PlatoException.java
        Policy.java
        PolicyNode.java
        PreservationActionDefinition.java
        ProjectBasis.java
        RDFPolicy.java
        RealByteStream.java
        Recommendation.java
        Repository.java
        RequirementsDefinition.java
        ResourceDescription.java
        Role.java
        SampleAggregationMode.java
        SampleObject.java
        SampleRecordsDefinition.java
        TargetValueObject.java
        Transformation.java
        Trigger.java
        TriggerDefinition.java
        TriggerType.java
        User.java
        UserGroup.java
        Values.java
        XcdlDescription.java
        aggregators
        Aggregator.java
        IAggregator.java
        Multiplication.java
        Sum.java
        WeightedMultiplication.java
        WeightedSum.java
        beans
        MigrationResult.java
        ResultNode.java
        interfaces
        actions
        IEmulationAction.java
        IMigrationAction.java
        IPreservationAction.java
        kbrowser
        CriteriaHierarchy.java
        CriteriaLeaf.java
        CriteriaNode.java
        CriteriaTreeNode.java
        VPlanLeaf.java
        measurement
        Attribute.java
        CriterionCategory.java
        EvaluationScope.java
        Measure.java
        MeasureConstants.java
        Measurement.java
        MeasurementStatistics.java
        Measurements.java
        ToolExperience.java
        policy
        ControlPolicy.java
        PreservationCase.java
        scales
        BooleanScale.java
        FloatRangeScale.java
        FloatScale.java
        FreeStringScale.java
        IntRangeScale.java
        IntegerScale.java
        OrdinalScale.java
        PositiveFloatScale.java
        PositiveIntegerScale.java
        RestrictedScale.java
        Scale.java
        ScaleType.java
        YanScale.java
        sensitivity
        BestAlternativeTest.java
        EqualWeightModifier.java
        ExtremeWeightModifier.java
        GaussianRandomModifier.java
        ISensitivityAnalysisResult.java
        ISensitivityTest.java
        IWeightModifier.java
        OrderChangeCountTest.java
        OrderChangeTest.java
        RandomSameOrderModifier.java
        RangCorrelationTest.java
        SimpleIterativeWeightModifier.java
        VarianceSensitivityTest.java
        transform
        ITransformer.java
        NumericTransformer.java
        OrdinalTransformer.java
        TransformationMode.java
        Transformer.java
        tree
        ITreeNode.java
        ITreeWalker.java
        Leaf.java
        LibraryRequirement.java
        LibraryTree.java
        Node.java
        ObjectiveTree.java
        PolicyTree.java
        TemplateTree.java
        TreeNode.java
        util
        FloatFormatter.java
        values
        BooleanValue.java
        FloatRangeValue.java
        FloatValue.java
        FreeStringValue.java
        INumericValue.java
        IOrdinalValue.java
        IntRangeValue.java
        IntegerValue.java
        OrdinalValue.java
        PositiveFloatValue.java
        PositiveIntegerValue.java
        TargetValue.java
        TargetValues.java
        Value.java
        YanValue.java
        validation
        ValidationError.java
    - test
      - java
        eu
        scape_project
        planning
        model
        AlternativeTest.java
        AlternativesDefinitionTest.java
        PersistenceTest.java
        PlanTest.java
        SampleObjectsPersistenceIT.java
        SampleRecordsDefinitionIT.java
        measurement
        MeasurementsTest.java
        scales
        FloatRangeScaleTest.java
        transform
        NumericTransformerTest.java
        OrdinalTransformerTest.java
        TransformerTester.java
        tree
        LeafPersistenceIT.java
        LeafTest.java
        NodeTest.java
        ObjectiveTreeTest.java
        VPlanLeafTest.java
        values
        FloatValueTest.java
        TargetValuesTest.java
        util
        FloatFormatterTest.java
        validation
        PlanValidatorTest.java

/*******************************************************************************
 * Copyright 2006 - 2012 Vienna University of Technology,
 * Department of Software Technology and Interactive Systems, IFS
 * 
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 * 
 *   http://www.apache.org/licenses/LICENSE-2.0
 * 
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 ******************************************************************************/
package eu.scape_project.planning.evaluation.evaluators;

import java.io.IOException;
import java.io.Serializable;
import java.util.HashMap;

import javax.xml.namespace.NamespaceContext;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpression;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;

import org.apache.commons.lang.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import eu.scape_project.planning.model.scales.Scale;
import eu.scape_project.planning.model.values.Value;

/**
 * This is a generic helper class that takes an XPath expression and uses it to
 * search a specified XML and extract a @link {@link Value}
 * 
 * @author cb
 * 
 */
public class XmlExtractor implements Serializable {
    private static final long serialVersionUID = -8844757294292266759L;

    private static Logger log = LoggerFactory.getLogger(XmlExtractor.class);

    private NamespaceContext namespaceContext;

    public NamespaceContext getNamespaceContext() {
        return namespaceContext;
    }

    public void setNamespaceContext(NamespaceContext context) {
        this.namespaceContext = context;
    }

    public Value extractValue(Document xml, Scale scale, String xpath, String commentXPath) {
        try {
            Document pcdlDoc = xml;
            String text = extractTextInternal(pcdlDoc, xpath);
            Value v = null;
            // if the query provides no result, we cannot extract a value
            if (!StringUtils.isEmpty(text)) {
                v = scale.createValue();
                v.parse(text);
                if (commentXPath != null) {
                    String comment = extractTextInternal(pcdlDoc, commentXPath);
                    v.setComment(comment);
                }
            }
            return v;

        } catch (Exception e) {
            log.error("Could not parse XML " + " searching for path " + xpath + ": " + e.getMessage(), e);
            return null;
        }
    }

    public String extractText(Document xml, String xpath) {
        try {
            Document pcdlDoc = xml;
            String text = extractTextInternal(pcdlDoc, xpath);
            return text;
        } catch (Exception e) {
            log.error("Could not parse XML " + " searching for path " + xpath + ": " + e.getMessage(), e);
            return null;
        }
    }

    public Document getDocument(InputSource xml) throws ParserConfigurationException, SAXException, IOException {
        // extract value via XPath
        DocumentBuilderFactory domFactory = DocumentBuilderFactory.newInstance();
        domFactory.setNamespaceAware(true); // never forget this!
        DocumentBuilder builder = domFactory.newDocumentBuilder();
        Document pcdlDoc = builder.parse(xml);
        return pcdlDoc;
    }

    public Value extractAttributeValue() {
        return null;
    }

    /**
     * very useful: {@link http
     * ://www.ibm.com/developerworks/library/x-javaxpathapi.html}
     * 
     * @param doc
     * @param path
     * @param scale
     * @return
     * @throws ParserConfigurationException
     * @throws SAXException
     * @throws IOException
     * @throws XPathExpressionException
     */
    private String extractTextInternal(Document doc, String path) throws ParserConfigurationException, SAXException,
        IOException, XPathExpressionException {

        XPathFactory factory = XPathFactory.newInstance();

        XPath xpath = factory.newXPath();
        xpath.setNamespaceContext(namespaceContext);
        XPathExpression expr = xpath.compile(path);
        try {
            String result = (String) expr.evaluate(doc, XPathConstants.STRING);
            return result;
        } catch (Exception e) {
            log.error("XML extraction for path " + path + " failed: " + e.getMessage(), e);
            return "XML extraction for path " + path + " failed: " + e.getMessage();
        }
    }

    public HashMap<String, String> extractValues(Document xml, String path) {
        try {
            HashMap<String, String> resultMap = new HashMap<String, String>();

            XPathFactory factory = XPathFactory.newInstance();

            XPath xpath = factory.newXPath();
            xpath.setNamespaceContext(namespaceContext);
            XPathExpression expr = xpath.compile(path);

            NodeList list = (NodeList) expr.evaluate(xml, XPathConstants.NODESET);
            if (list != null) {
                for (int i = 0; i < list.getLength(); i++) {
                    Node n = list.item(i);
                    String content = n.getTextContent();
                    if (content != null) {
                        resultMap.put(n.getLocalName(), content);
                    }
                }
            }
            return resultMap;
        } catch (Exception e) {
            log.error("Could not parse XML " + " searching for path " + path + ": " + e.getMessage(), e);
            return null;
        }
    }

}