DocumentData.java example

Explorer

mimir-master
- etc
  - generated-header.java
- mimir-client
  - src
    - gate
      - mimir
        index
        MimirConnector.java
        MimirIndexingPR.java
        search
        RemoteQueryRunner.java
        tool
        WebUtils.java
- mimir-cloud
  - archive-unpacker
    - src
      - gate
        mimir
        util
        MultiFileInputStream.java
        UnpackWizard.java
  - src
    - java
      - gate
        mimir
        util
        IndexArchiveState.java
        MultiFileOutputStream.java
- mimir-core
  - src
    - gate
      - mimir
        AbstractSemanticAnnotationHelper.java
        Constraint.java
        ConstraintType.java
        DocumentMetadataHelper.java
        DocumentRenderer.java
        IndexConfig.java
        MimirIndex.java
        SemanticAnnotationHelper.java
        index
        AtomicAnnotationIndex.java
        AtomicIndex.java
        AtomicTokenIndex.java
        DocumentCollection.java
        DocumentData.java
        GATEDocument.java
        GATEDocumentFactory.java
        IndexException.java
        Mention.java
        OriginalMarkupMetadataHelper.java
        package-info.java
        search
        FederatedQueryRunner.java
        IndexReaderPool.java
        QueryEngine.java
        QueryRunner.java
        RankingQueryRunnerImpl.java
        query
        AbstractIntersectionQueryExecutor.java
        AbstractOverlapQuery.java
        AbstractQueryExecutor.java
        AndQuery.java
        AnnotationQuery.java
        Binding.java
        ConstQuery.java
        ContainsQuery.java
        ExecutorsList.java
        GapQuery.java
        MinusQuery.java
        OrQuery.java
        QueryExecutor.java
        QueryNode.java
        RepeatsQuery.java
        SequenceQuery.java
        TermQuery.java
        WithinQuery.java
        parser
        ParseException.java
        Query.java
        QueryParser.java
        QueryParserConstants.java
        QueryParserTokenManager.java
        SimpleCharStream.java
        Token.java
        TokenMgrError.java
        score
        BindingScorer.java
        DelegatingScoringQueryExecutor.java
        MimirScorer.java
        terms
        AbstractCompoundTermsQuery.java
        AbstractDocumentsBasedTermsQuery.java
        AbstractIndexTermsQuery.java
        AndTermsQuery.java
        AnnotationTermsQuery.java
        CompoundTermsQuery.java
        ConstTermsQuery.java
        DocumentTermsQuery.java
        DocumentsAndTermsQuery.java
        DocumentsBasedTermsQuery.java
        DocumentsOrTermsQuery.java
        LimitTermsQuery.java
        OrTermsQuery.java
        SortedTermsQuery.java
        TermTypeTermsQuery.java
        TermsQuery.java
        TermsResultSet.java
        util
        DefaultMentionDescriber.java
        DelegatingSemanticAnnotationHelper.java
        DocumentFeaturesMetadataHelper.java
        IgnoreEmptiesTermProcessor.java
        IndexUpgrader.java
        MG4JTools.java
        NormalizingTermProcessor.java
        OntologyMentionDescriber.java
        TruncateIndex.java
- mimir-test
  - src
    - gate
      - mimir
        test
        QueryTests.java
        RenderZipCollection.java
        Scratch.java
        ScratchConsole.java
        TestQueryParser.java
        TestUtils.java
- mimir-web
  - src
    - gwt
      - gate
        mimir
        web
        client
        UI.java
    - java
      - gate
        mimir
        util
        LogAnalyser.java
        web
        client
        DocumentData.java
        GwtRpcService.java
        GwtRpcServiceAsync.java
        MimirSearchException.java
        ResultsData.java
- plugins
  - db-h2
    - src
      - gate
        mimir
        db
        AnnotationTemplateCache.java
        DBSemanticAnnotationHelper.java
  - measurements
    - src
      - gate
        mimir
        measurements
        MeasurementAnnotationHelper.java
        MeasurementPluginResource.java
  - sparql
    - src
      - gate
        mimir
        sparql
        RequestMethod.java
        SPARQLResultSet.java
        SPARQLSemanticAnnotationHelper.java

/*
 *  DocumentData.java
 *
 *  Copyright (c) 2007-2011, The University of Sheffield.
 *
 *  This file is part of GATE Mímir (see http://gate.ac.uk/family/mimir.html), 
 *  and is free software, licenced under the GNU Lesser General Public License,
 *  Version 3, June 2007 (also included with this distribution as file
 *  LICENCE-LGPL3.html).
 *
 *  Valentin Tablan, 15 Apr 2009
 *
 *  $Id$
 */
package gate.mimir.index;

import java.io.Serializable;
import java.util.HashMap;

/**
 * A container for the document data that gets stored in the zip collection.
 */
public class DocumentData implements Serializable {
  
  /**
   * Constructs a new DocumentData object.
   * @param documentURI the URI of the document.
   * @param documentTitle the title of the document.
   * @param tokens the document tokens.
   * @param nonTokens the document non-tokens (i.e. spaces).
   */
  public DocumentData(String documentURI, String documentTitle,
          String[] tokens, String[] nonTokens) {
    this.documentURI = documentURI;
    this.documentTitle = documentTitle;
    this.tokens = tokens;
    this.nonTokens = nonTokens;
  }

  /**
   * Adds a new arbitrary metadata field.
   * @param fieldName the name for the new field.
   * @param fieldValue the value for the new field. The value provided here must
   * be {@link Serializable}. The map of metadata fields is stored separately 
   * for each individual document; care should be taken to limit the size of
   * the object graph that is serialised! 
   */
  public void putMetadataField(String fieldName, Serializable fieldValue){
    if(metadata == null){
      metadata = new HashMap<String, Serializable>();
    }
    metadata.put(fieldName, fieldValue);
  }
  
  /**
   * Gets the value of a metadata field.
   * @param fieldName the name of field to be returned. 
   * @return the value previously stored in the metadata map for this field.
   */
  public Serializable getMetadataField(String fieldName){
    return metadata == null ? null : metadata.get(fieldName);
  }
  
  /**
   * @return the tokens
   */
  public String[] getTokens() {
    return tokens;
  }

  /**
   * @return the nonTokens
   */
  public String[] getNonTokens() {
    return nonTokens;
  }

  public String[][] getText(int termPosition, int length) {
    if(length < 0) {
      length = tokens.length - termPosition;
      if(length < 0) {
        // still less than 0 means termPosition was beyond the end of the doc,
        // so return no tokens.
        length = 0;
      }
    }
    String[][] result = new String[2][];
    result[0] = new String[length];
    result[1] = new String[length];
    for(int i = 0; i < length; i++) {
      int docIdx = i + termPosition;
      result[0][i] = docIdx < 0 ? null : 
          (docIdx < tokens.length ? tokens[docIdx] : null);
      result[1][i] = docIdx < 0 ? null : 
          (docIdx < nonTokens.length ? nonTokens[docIdx] : null);
    }
    return result;
  }
  
  /**
   * @return the documentURI
   */
  public String getDocumentURI() {
    return documentURI;
  }

  /**
   * @return the documentTitle
   */
  public String getDocumentTitle() {
    return documentTitle;
  }


  /**
   * Serialisation UID
   */
  private static final long serialVersionUID = 7079350474333976576L;
  
  /**
   * The tokens of the document.
   */
  protected String[] tokens;
  
  /**
   * The non-tokens (i.e. spaces) of the document.
   */
  protected String[] nonTokens;
  
  /**
   * The Document URI
   */
  protected String documentURI;
  
  /**
   * The Document title.
   */
  protected String documentTitle;
  
  /**
   * A {@link HashMap} of arbitrary metadata (all fields must be 
   * {@link Serializable}).
   */
  protected HashMap<String, Serializable> metadata;
  
  
}