DictionaryHandler.java example

Explorer

bard-master
- src
  - gov
    - nih
      - ncgc
        bard
        capextract
        CAPAnnotation.java
        CAPConstants.java
        CAPDictionary.java
        CAPDictionaryElement.java
        CAPExtractor.java
        CAPUtil.java
        CapResourceHandlerRegistry.java
        ClientHelper.java
        ICapResourceHandler.java
        LooseSSLSocketFactory.java
        ResultExploder.java
        ResultHistogram.java
        ResultStatistics.java
        ScoreHandler.java
        SslHttpClient.java
        handler
        AssayHandler.java
        AssaysHandler.java
        BardexportHandler.java
        CapResourceHandler.java
        DictionaryHandler.java
        ExperimentHandler.java
        ExperimentResultHandler.java
        ExperimentResultsHandler.java
        ExperimentsHandler.java
        ExternalReferenceHandler.java
        ExternalSystemHandler.java
        ProjectDocHandler.java
        ProjectHandler.java
        ProjectsHandler.java
        ResultHandler.java
        ResultsHandler.java
        Target.java
        jaxb
        AbstractContextItemType.java
        AbstractContextType.java
        Assay.java
        AssayContexType.java
        AssayContextItemType.java
        AssayContextItems.java
        AssayDocument.java
        Assays.java
        Bardexport.java
        ContextItemType.java
        ContextType.java
        Contexts.java
        DescriptorType.java
        Dictionary.java
        DocumentType.java
        Element.java
        Experiment.java
        ExperimentContexType.java
        ExperimentContextItemType.java
        ExperimentContextItems.java
        ExperimentMeasure.java
        Experiments.java
        ExternalReference.java
        ExternalReferences.java
        ExternalSystem.java
        ExternalSystems.java
        Link.java
        ObjectFactory.java
        Project.java
        ProjectExperiment.java
        ProjectStep.java
        ProjectSteps.java
        Projects.java
        Result.java
        ResultContextItems.java
        ResultType.java
        Results.java
        Stage.java
        resultextract
        BardConcResponseSeries.java
        BardExptDataResponse.java
        BardResultFactory.java
        BardResultType.java
        CAPExperimentResult.java
        CAPMeasureContextItem.java
        CAPResultMeasure.java
        ResultTuple.java
        entity
        Assay.java
        AssayConcentration.java
        AssayPub.java
        BardEntity.java
        BardLinkedEntity.java
        BaseEntity.java
        Biology.java
        Compound.java
        DummyEntity.java
        ETag.java
        Experiment.java
        ExperimentData.java
        ExperimentResult.java
        ExperimentResultType.java
        FitModel.java
        PantherClassification.java
        Probe.java
        Project.java
        ProjectStep.java
        ProteinTarget.java
        Publication.java
        Source.java
        SourceSubstance.java
        Substance.java
        TargetClassification.java
        pcparser
        Assay.java
        AssayData.java
        AssayDataDoseResponse.java
        AssayDataDoseResponseHill4p.java
        AssayDataFloat.java
        AssayResults.java
        Constants.java
        PubChemAssayParser.java
        ResultType.java
        XmlTwig.java
        plugin
        IPlugin.java
        PluginManifest.java
        resourcemgr
        BardDBManager.java
        BardDBUpdateLogger.java
        BardDBUtil.java
        BardExtResourceLoader.java
        BardExternalResource.java
        BardResourceLoaderFactory.java
        BardResourceManager.java
        BardResourceService.java
        IBardExtResourceLoader.java
        extresource
        go
        BardGOEntityLoader.java
        BardGoAssociationLoader.java
        kegg
        BardKeggLoader.java
        ontology
        IOntologyWorker.java
        OntologyNode.java
        go
        GONode.java
        GOQueryWorker.java
        panther
        PantherTargetClassLoader.java
        pubchem
        BardCompoundPubchemExtrasLoader.java
        CIDSIDMappingLoader.java
        PubchemCompoundLoader.java
        PubchemSubstanceLoader.java
        uniprot
        BardUniprotProteinTargetLoader.java
        precomp
        BardCompoundTestStatsWorker.java
        CompoundSimilarityWorker.java
        util
        BardDBUpdateLogger.java
        BardResourceFetch.java
        BardResourceLoaderException.java
        BardServiceParser.java
        rest
        BARDAssayResource.java
        BARDBiologyResource.java
        BARDCapResource.java
        BARDCompoundResource.java
        BARDConstants.java
        BARDDocumentResource.java
        BARDEtagResource.java
        BARDExperimentDataResource.java
        BARDExperimentResource.java
        BARDLandingResource.java
        BARDMonitorResource.java
        BARDProbeResource.java
        BARDProjectResource.java
        BARDResource.java
        BARDScaffoldResource.java
        BARDSearchResource.java
        BARDSubstanceResource.java
        BARDTargetResource.java
        BadRequestException.java
        IBARDResource.java
        RequestTooLargeException.java
        filter
        CORSFilter.java
        CountFilter.java
        rowdef
        AssayDefinitionObject.java
        DataResultObject.java
        DoseResponseResultObject.java
        search
        AssaySearch.java
        CompoundSearch.java
        ExperimentSearch.java
        Facet.java
        ISolrSearch.java
        ProjectSearch.java
        SearchMeta.java
        SearchResult.java
        SearchUtil.java
        SolrField.java
        SolrSearch.java
        service
        CachingService.java
        CachingServiceFactory.java
        tools
        AnnotationUtils.java
        BARDJsonRequired.java
        BardHazelcastCluster.java
        BardServletContextListener.java
        CacheFlushManager.java
        CidSearchResultHandler.java
        DBUtils.java
        IJsonConverter.java
        JDBCResourceCloser.java
        JettyRunner.java
        JsonUtil.java
        LogConfig.java
        OrderedSearchResultHandler.java
        PluginValidator.java
        PopulateTargets.java
        ProjectListJsonConverter.java
        ResourceLister.java
        SearchDoS.java
        SearchResultHandler.java
        Util.java
        XmlParseSchema.java
        util
        MolFpFactory.java
- test
  - gov
    - nih
      - ncgc
        bard
        capextract
        DictionaryHandlerTest.java
        rest
        BARDAssayResourceTest.java
        BARDCompoundResourceTest.java
        BARDDocumentResourceTest.java
        BARDExperimentDataResourceTest.java
        BARDExperimentResourceTest.java
        BARDProjectResourceTest.java
        BARDSubstanceResourceTest.java
        BARDTargetResourceTest.java
        EntityResourceTest.java
        HeartBeatTest.java
        tools
        DBTest.java
        DBUtilsTest.java
        HazelTestClient.java
        QueryTest.java
        SearchTest.java
        UtilsTest.java

package gov.nih.ncgc.bard.capextract.handler;

import gov.nih.ncgc.bard.capextract.CAPConstants;
import gov.nih.ncgc.bard.capextract.CAPDictionary;
import gov.nih.ncgc.bard.capextract.CAPDictionaryElement;
import gov.nih.ncgc.bard.capextract.CAPUtil;
import gov.nih.ncgc.bard.capextract.ICapResourceHandler;
import gov.nih.ncgc.bard.capextract.jaxb.Dictionary;
import gov.nih.ncgc.bard.capextract.jaxb.Element;

import java.io.IOException;
import java.math.BigInteger;
import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.SQLException;
import java.util.List;
import java.util.Vector;

/**
 * A one line summary.
 *
 * @author Rajarshi Guha
 */
public class DictionaryHandler extends CapResourceHandler implements ICapResourceHandler {

    public DictionaryHandler() {
        super();
    }

    /**
     * Process a CAP entity that is located at some URL.
     *
     * @param url      The URL from which to retrieve the entity fron
     * @param resource The CAP resource that is meant to be processed. An implementing class
     *                 can choose to proceed or not based on this parameter.
     */
    public int process(String url, CAPConstants.CapResource resource) throws IOException {
        if (resource != CAPConstants.CapResource.DICTIONARY) return CAPConstants.CAP_EXTRACT_LOAD_STATUS_FAILED;
        log.info("Processing " + resource + " from " + url);
        Dictionary d = getResponse(url, resource);
        log.info("\tUnmarshalled dictionary");

        CAPDictionary dict = process(d);
        
        // serialize this to the db
        Connection conn = null;
        PreparedStatement pst;
        java.util.Date today = null;
        try {
            conn = CAPUtil.connectToBARD(CAPConstants.getBardDBJDBCUrl());

            pst = conn.prepareStatement("delete from cap_dict_obj");
            pst.executeUpdate();
            pst.close();
            pst = conn.prepareStatement("delete from cap_dict_elem");
            pst.executeUpdate();
            pst.close();

            pst = conn.prepareStatement("INSERT INTO cap_dict_obj(ins_date, dict) VALUES (?, ?)");
            today = new java.util.Date();
            pst.setDate(1, new java.sql.Date(today.getTime()));
            pst.setObject(2, dict);
            pst.executeUpdate();
            pst.close();
            conn.commit();
            log.info("\tSerialized dictionary object to database");

            // now we dump in the dict elements (a partial representation) that will be useful
            // for SQL queries. We're assuming for now that a dict elem is associated with
            // a single ontology
            pst = conn.prepareStatement("insert into cap_dict_elem (ins_date, dictid, label, description, abbreviation, ext_url, onto_name, onto_abbrv, onto_url, onto_id, element_status) values (?,?,?,?,?,?,  ?,?,?,?, ?)");
            for (CAPDictionaryElement elem : dict.getNodes()) {
                pst.setDate(1, new java.sql.Date(today.getTime()));
                pst.setInt(2, elem.getElementId().intValue());
                pst.setString(3, elem.getLabel());
                pst.setString(4, elem.getDescription());
                pst.setString(5, elem.getAbbreviation());
                pst.setString(6, elem.getExternalUrl());

                pst.setString(7, elem.getOnto_name());
                pst.setString(8, elem.getOnto_abbrv());
                pst.setString(9, elem.getOnto_url());
                pst.setString(10, elem.getOnto_id());

                pst.setString(11, elem.getElementStatus());

                pst.addBatch();
            }
            pst.executeBatch();
            conn.commit();
            log.info("\tStored (partial) dictionary elements to database");
            conn.close();
        } catch (com.mysql.jdbc.exceptions.jdbc4.MySQLIntegrityConstraintViolationException e) {
            if (e.getMessage().indexOf("Duplicate entry") >= 0) {
                log.warn("Already have a serialized dictionary for " + today + ", so not inserting");
            }
        } catch (SQLException e) {
            e.printStackTrace();  //To change body of catch statement use File | Settings | File Templates.
        }

        return CAPConstants.CAP_EXTRACT_LOAD_STATUS_COMPLETE;
        // TODO should handle resultType, units and descriptors
    }

    private CAPDictionary process(Dictionary d) throws IOException {
        CAPDictionary dict = new CAPDictionary();
        List<Element> elems = d.getElements().getElement();
        for (Element elem : elems) {
            dict.addNode(new CAPDictionaryElement(elem));
        }
        log.info("\tAdded " + dict.size() + " <element> entries");

        int nrel = 0;
        int nnoparent = 0;
        List<Dictionary.ElementHierarchies.ElementHierarchy> hierarchies = d.getElementHierarchies().getElementHierarchy();
        for (Dictionary.ElementHierarchies.ElementHierarchy h : hierarchies) {
            String relType = h.getRelationshipType();
            BigInteger childId = getElementId(h.getChildElement().getLink().getHref());
            h.getChildElement().getLink().getHref();
            
            //don't reset the extraction status so it perists at CAP.
            //set the extraction status to complete.
            //setExtractionStatus("Complete", h.getChildElement().getLink().getHref(), CAPConstants.CapResource.ELEMENT);
            
            CAPDictionaryElement childElem = dict.getNode(childId);

            // there may be an element with no parent
            if (h.getParentElement() != null) {
                BigInteger parentId = getElementId(h.getParentElement().getLink().getHref());
                CAPDictionaryElement parentElem = dict.getNode(parentId);
                dict.addOutgoingEdge(parentElem, childElem, null);
                dict.addIncomingEdge(childElem, parentElem, relType);
            } else nnoparent++;

            nrel++;
        }
        log.info("\tAdded " + nrel + " parent/child relationships with " + nnoparent + " elements having no parent");

        // ok'we got everything we need. Lets make it available globally
        CAPConstants.setDictionary(dict);
        
        return dict;
    }
    	
    public Vector<Object> poll(String url, CAPConstants.CapResource resource, boolean skipPartial) throws IOException {
	Vector<Object> vec = new Vector<Object>();
	Dictionary d = getResponse(url, resource);
	process(d);
	vec.add(d);
	return vec;
    }
    
    private BigInteger getElementId(String url) {
        String[] comps = url.split("/");
        return new BigInteger(comps[comps.length - 1]);
    }
}