KeyAttributeDiscovery.java example

Explorer

xcurator-master
- eval
  - edu
    - toronto
      - cs
        xml2rdf
        mapping
        generator
        MappingGeneratorEval.java
- lib
  - new_libs
    - apache-jena-3.1.0
      - src-examples
        arq
        examples
        AlgebraEx.java
        AlgebraExec.java
        ExProg1.java
        ExProg2.java
        ExQuerySelect1.java
        ExQuerySelect2.java
        ExampleDBpedia1.java
        ExampleDBpedia2.java
        ExampleDBpedia3.java
        aggregates
        CustomAggregate.java
        bgpmatching
        OpExecutorAlt.java
        StageAltMain.java
        StageGeneratorAlt.java
        constructquads
        ExampleConstructQuads.java
        engine
        MyQueryEngine.java
        filter
        classify.java
        propertyfunction
        labelSearch.java
        localname.java
        uppercase.java
        riot
        ExRIOT_1.java
        ExRIOT_2.java
        ExRIOT_3.java
        ExRIOT_4.java
        ExRIOT_5.java
        ExRIOT_6.java
        ExRIOT_7.java
        ExRIOT_out1.java
        ExRIOT_out2.java
        ExRIOT_out3.java
        update
        UpdateExecuteOperations.java
        UpdateProgrammatic.java
        UpdateReadFromFile.java
        jena
        examples
        ontology
        classHierarchy
        ClassHierarchy.java
        Main.java
        describeClass
        DescribeClass.java
        Main.java
        rdf
        Tutorial01.java
        Tutorial02.java
        Tutorial03.java
        Tutorial04.java
        Tutorial05.java
        Tutorial06.java
        Tutorial07.java
        Tutorial08.java
        Tutorial09.java
        Tutorial10.java
        Tutorial11.java
        jena-examples
        src
        main
        java
        org
        apache
        jena
        example
        Base.java
        CheeseBase.java
        helloworld
        HelloWorld.java
        pizza
        PizzaSparqlNoInf.java
        test
        java
        org
        apache
        jena_examples
        AppTest.java
        tdb
        examples
        ExQuadFilter.java
        ExTDB1.java
        ExTDB2.java
        ExTDB3.java
        ExTDB4.java
        ExTDB5.java
        ExTDB6.java
        ExTDB_Txn1.java
        ExTDB_Txn2.java
        ExTDB_Txn3.java
- src
  - edu
    - toronto
      - cs
        xcurator
        cli
        CLIRunner.java
        RdfFactory.java
        Util.java
        config
        RunConfig.java
        mapping
        MappingFactory.java
        XbrlEntityFiltering.java
        common
        DataDocument.java
        ElementIdGenerator.java
        NsContext.java
        RdfUriBuilder.java
        RdfUriConfig.java
        XMLUtils.java
        XPathFinder.java
        XmlDocumentBuilder.java
        XmlParser.java
        XmlUriBuilder.java
        discoverer
        BasicEntityDiscovery.java
        HashBasedEntityInterlinking.java
        KeyAttributeDiscovery.java
        MappingDiscoverer.java
        MappingDiscoveryStep.java
        OntologyLinkAddition.java
        RemoveGroupingNodes.java
        SerializeMapping.java
        eval
        Accuracy.java
        EvalUtil.java
        GoldStandardGenerator.java
        mapping
        Attribute.java
        Mapping.java
        MappingModel.java
        Reference.java
        Relation.java
        Schema.java
        SearchPath.java
        ValueAttribute.java
        XmlBasedMapping.java
        model
        Attribute.java
        AttributeInstance.java
        OntologyLink.java
        OntologyLinkInstance.java
        Relation.java
        RelationInstance.java
        Schema.java
        SchemaInstance.java
        parser
        Parser.java
        PatentParser.java
        rdf
        RdfGeneration.java
        RdfGenerationStep.java
        RdfGenerator.java
        XmlBasedMappingDeserialization.java
        utils
        BasicSimilarityMetric.java
        DependencyDAG.java
        DisjointSet.java
        IOUtils.java
        LogUtils.java
        SchemaSimilarityMetric.java
        StrUtils.java
        XMLUtil.java
        xml2rdf
        analysis
        SchemaGraph.java
        SchemaNodeLinkTree.java
        Statistics.java
        freebase
        FreeBaseLinker.java
        FreeBaseLinkerOld.java
        FreebaseUtil.java
        interlink
        Interlinker.java
        jena
        JenaUtils.java
        SKOS.java
        mapping
        Entity.java
        ForeignLookupKey.java
        LookupKey.java
        Mapping.java
        Property.java
        Relation.java
        generator
        DemoMappingGenerator.java
        DummyMappingGenerator.java
        DummySimilarityMetric.java
        MappingGenerator.java
        RelationFlatteningMetric.java
        Schema.java
        SchemaException.java
        SchemaSimilarityMetic.java
        opencyc
        OpenCycOntology.java
        string
        NoWSCaseInsensitiveStringMetric.java
        StringMetric.java
        StringUtils.java
        utils
        DependencyDAG.java
        DisjointSet.java
        LogUtils.java
        xml
        XMLUtils.java
- test
  - edu
    - toronto
      - cs
        xcurator
        TestConfigs.java
        cli
        CLIRunnerTest.java
        CliSuite.java
        RdfFactoryTest.java
        UtilTest.java
        config
        ConfigSuite.java
        RunConfigTest.java
        mapping
        MappingFactoryTest.java
        MappingSuite.java
        XbrlEntityFilteringTest.java
        discoverer
        BasicEntityDiscoveryTest.java
        MappingDiscoveryTests.java
        OntologyLinkAdditionTest.java
        json2xml
        TestJSON2XML.java
        rdf
        RdfGeneratorTest.java
        RdfGeneratorTest2.java
        XmlBasedMappingDeserializationTests.java
        xml
        ElementIdGeneratorTest.java
        NsContextTest.java
        XMLUtilsTest.java
        XPathFinderTest.java
        XmlParserTest.java
        xml2rdf
        jena
        JenaSimpleTest.java
        mapping
        DataTest.java
        MappingTest.java
        MappingTestNew.java
        generator
        MappingGeneratorStepTestCT.java
        MappingGeneratorStepTestDBLP.java
        MappingGeneratorStepTestDrugBank.java
        MappingGeneratorStepTestFDA.java
        MappingGeneratorStepTestXBRL.java
        MappingGeneratorTest.java

/*
 *    Copyright (c) 2013, University of Toronto.
 * 
 *    Licensed under the Apache License, Version 2.0 (the "License"); you may
 *    not use this file except in compliance with the License. You may obtain
 *    a copy of the License at
 *
 *         http://www.apache.org/licenses/LICENSE-2.0
 *
 *    Unless required by applicable law or agreed to in writing, software
 *    distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
 *    WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
 *    License for the specific language governing permissions and limitations
 *    under the License.
 */
package edu.toronto.cs.xcurator.discoverer;

import edu.toronto.cs.xcurator.common.DataDocument;
import edu.toronto.cs.xcurator.mapping.Attribute;
import edu.toronto.cs.xcurator.mapping.Schema;
import edu.toronto.cs.xcurator.mapping.Mapping;
import java.util.Iterator;
import java.util.List;

/**
 *
 * @author ekzhu
 */
public class KeyAttributeDiscovery implements MappingDiscoveryStep {

    @Override
    public void process(List<DataDocument> dataDocuments, Mapping mapping) {
        System.out.println("process KeyAttributeDiscovery...");
        Iterator<Schema> it = mapping.getEntityIterator();
        while (it.hasNext()) {
            // For each entity, find attribute whose instances are unique
            // That is, the cardinality of the attribute instances should equal
            // to the cardinality of the entity instances

            // The value attribute should not be used as key.
            // Its instance count should be zero
            Schema entity = it.next();
            int instanceCount = entity.getXmlInstanceCount();
            Iterator<Attribute> attrIt = entity.getAttributeIterator();
            while (attrIt.hasNext()) {
                Attribute attr = attrIt.next();
                // This is a hack, the key identification algorithm needs to be 
                // improved.
                System.out.println(attr);
                System.out.println(attr.getInstances().size() + " <> " + instanceCount);
                if (attr.getInstances().size() == instanceCount
//                        &&
//                        attr.getId().endsWith(".id")
                        ) {
                    attr.asKey();
                }
            }
        }
    }
}