JsonRecordSetIterator.java example

Explorer

gedcomx-java-master
- extensions
  - familysearch
    - familysearch-api-client
      - src
        main
        java
        org
        familysearch
        api
        client
        ArtifactsCollection.java
        ChangeHistoryState.java
        Client.java
        DiscussionState.java
        DiscussionsState.java
        FamilySearchCollectionState.java
        FamilySearchHistoricalRecordsArchive.java
        FamilySearchMemories.java
        FamilySearchNames.java
        FamilySearchOrdinancesState.java
        FamilySearchPersonState.java
        FamilySearchPlaceDescriptionState.java
        FamilySearchPlaceState.java
        FamilySearchPlaces.java
        FamilySearchReferenceEnvironment.java
        FamilySearchReservationsState.java
        FamilySearchSourceDescriptionState.java
        FamilySearchStateFactory.java
        NameSearchResultsState.java
        OrdinanceReservationsState.java
        OrdinanceStatusState.java
        PersonMatchResolutionsState.java
        PersonMatchResultsState.java
        PersonNonMatchesState.java
        PersonOrdinancesState.java
        PlaceGroupState.java
        PlaceSearchResultsState.java
        Rel.java
        TempleCardPrintSetState.java
        UserHistoryState.java
        UserState.java
        ft
        ChildAndParentsRelationshipState.java
        DiscoveryState.java
        FamilySearchFamilyTree.java
        FamilyTreePersonChildrenState.java
        FamilyTreePersonFamiliesState.java
        FamilyTreePersonMatchResultsState.java
        FamilyTreePersonMergeState.java
        FamilyTreePersonParentsState.java
        FamilyTreePersonState.java
        FamilyTreePersonsState.java
        FamilyTreeRelationshipState.java
        FamilyTreeRelationshipsState.java
        FamilyTreeStateFactory.java
        PreferredRelationshipState.java
        gens
        FamilySearchGenealogies.java
        GenealogiesPersonState.java
        GenealogiesStateFactory.java
        GenealogiesTreeState.java
        rt
        FamilySearchPlatformJsonProvider.java
        FamilySearchPlatformXmlProvider.java
        util
        ChangeEntry.java
        ChangeHistoryPage.java
        ExperimentsFilter.java
        FamilySearchOptions.java
        MergeAnalysisFilter.java
        NameSearchQueryBuilder.java
        PlaceSearchQueryBuilder.java
        RequestUtil.java
        test
        java
        org
        familysearch
        api
        client
        Examples.java
        Main.java
    - familysearch-api-model
      - src
        main
        java
        org
        familysearch
        platform
        Error.java
        FamilySearchPlatform.java
        Feature.java
        Tag.java
        artifacts
        ArtifactMetadata.java
        ArtifactScreeningState.java
        ArtifactType.java
        package-info.java
        ct
        ChangeInfo.java
        ChangeObjectModifier.java
        ChangeObjectType.java
        ChangeOperation.java
        ChangeType.java
        ChildAndParentsRelationship.java
        DiscussionReference.java
        FamilySearchFactType.java
        FamilySearchIdentifierType.java
        FamilyTreeFactQualifierType.java
        MatchCollection.java
        MatchInfo.java
        MatchStatus.java
        Merge.java
        MergeAnalysis.java
        MergeConflict.java
        NameFormInfo.java
        NameFormOrder.java
        PersonMergeConstraint.java
        RelationshipRole.java
        SearchInfo.java
        SourceReferenceTagType.java
        package-info.java
        discussions
        Comment.java
        Discussion.java
        package-info.java
        ordinances
        Ordinance.java
        OrdinanceAssignee.java
        OrdinanceRoleType.java
        OrdinanceStatus.java
        OrdinanceType.java
        package-info.java
        package-info.java
        places
        FamilySearchPlaceType.java
        FeedbackInfo.java
        PlaceAttribute.java
        package-info.java
        reservations
        Reservation.java
        package-info.java
        rt
        FamilySearchPlatformLocalReferenceResolver.java
        FamilySearchPlatformModelVisitor.java
        FamilySearchPlatformModelVisitorBase.java
        users
        AgentName.java
        User.java
        package-info.java
        test
        java
        org
        familysearch
        platform
        FamilySearchPlatformTest.java
        ct
        ChangeInfoTest.java
        ChangeTypeTest.java
        ChildAndParentsRelationshipTest.java
        FamilySearchFactTypeTest.java
        PersonMergeConstraintTest.java
        PersonMergeTest.java
        SourceReferenceTagTypeTest.java
        discussions
        DiscussionsModelTest.java
        ordinances
        OrdinanceAssigneeTest.java
        rt
        FamilySearchPlatformModelVisitorBaseTest.java
        users
        AgentNameTest.java
        UserTest.java
- gedcomx-atom
  - src
    - main
      - java
        org
        gedcomx
        atom
        AtomModel.java
        Category.java
        CommonAttributes.java
        Content.java
        Entry.java
        ExtensibleElement.java
        Feed.java
        Generator.java
        Person.java
        package-info.java
        rt
        AtomModelVisitor.java
        AtomModelVisitorBase.java
        search
        ResultConfidence.java
        package-info.java
    - test
      - java
        org
        gedcomx
        atom
        CustomEntity.java
        FeedTest.java
        JunkEntity.java
        rt
        BaseAtomModelVisitorTest.java
- gedcomx-date
  - src
    - main
      - java
        org
        gedcomx
        date
        GedcomxDate.java
        GedcomxDateApproximate.java
        GedcomxDateDuration.java
        GedcomxDateException.java
        GedcomxDateRange.java
        GedcomxDateRecurring.java
        GedcomxDateSimple.java
        GedcomxDateType.java
        GedcomxDateUtil.java
    - test
      - java
        org
        gedcomx
        date
        ApproximateTest.java
        DurationTest.java
        RangeTest.java
        RecurringTest.java
        SimpleTest.java
        UtilTest.java
- gedcomx-fileformat
  - src
    - main
      - java
        org
        gedcomx
        fileformat
        GedcomxEntryDeserializer.java
        GedcomxEntrySerializer.java
        GedcomxFile.java
        GedcomxFileEntry.java
        GedcomxOutputStream.java
        GedcomxTimeStampUtil.java
        JacksonJsonSerialization.java
        JaxbXmlSerialization.java
    - test
      - java
        org
        gedcomx
        fileformat
        ExampleGedcomxFileData.java
        Examples.java
        GedcomxFileWriteReadTest.java
        GedcomxTimeStampUtilTest.java
- gedcomx-model
  - src
    - main
      - java
        org
        gedcomx
        Gedcomx.java
        agent
        Address.java
        Agent.java
        OnlineAccount.java
        package-info.java
        common
        Attributable.java
        Attribution.java
        EvidenceReference.java
        ExtensibleData.java
        HasNotes.java
        HasText.java
        HasTransientProperties.java
        Note.java
        Qualifier.java
        ResourceReference.java
        TextValue.java
        URI.java
        URIAdapter.java
        package-info.java
        conclusion
        Conclusion.java
        Date.java
        DisplayProperties.java
        Document.java
        Event.java
        EventRole.java
        Fact.java
        FamilyView.java
        Gender.java
        HasDateAndPlace.java
        HasFacts.java
        Identifier.java
        Name.java
        NameForm.java
        NamePart.java
        Person.java
        PlaceDescription.java
        PlaceDisplayProperties.java
        PlaceReference.java
        Relationship.java
        Subject.java
        package-info.java
        links
        HypermediaEnabledData.java
        Link.java
        SupportsLinks.java
        package-info.java
        package-info.java
        records
        Collection.java
        CollectionContent.java
        Field.java
        FieldDescriptor.java
        FieldValue.java
        FieldValueDescriptor.java
        HasFields.java
        RecordDescriptor.java
        RecordSet.java
        package-info.java
        rt
        ControlledVocabulary.java
        EnumURIMap.java
        GedcomxLocalReferenceResolver.java
        GedcomxModelVisitor.java
        GedcomxModelVisitorBase.java
        source
        CitationField.java
        Coverage.java
        ReferencesSources.java
        SourceCitation.java
        SourceDescription.java
        SourceReference.java
        package-info.java
        types
        ConfidenceLevel.java
        DocumentType.java
        EventRoleType.java
        EventType.java
        FacetType.java
        FactQualifierType.java
        FactType.java
        FieldType.java
        FieldValueStatusType.java
        FieldValueType.java
        GenderType.java
        IdentifierType.java
        NamePartQualifierType.java
        NamePartType.java
        NameType.java
        RecordType.java
        RelationshipType.java
        ResourceStatusType.java
        ResourceType.java
        SourceReferenceQualifierType.java
        package-info.java
        util
        CleanXMLStreamWriter.java
        DocCheck.java
        DocMap.java
        FieldMap.java
        HasIdentifiersMixin.java
        HasLinksMixin.java
        JsonRecordSetIterator.java
        JsonRecordSetWriter.java
        LocaleUtil.java
        RecordSetIterator.java
        RecordSetWriter.java
        XmlRecordSetIterator.java
        vocab
        VocabElement.java
        VocabElementList.java
    - test
      - java
        org
        gedcomx
        agent
        AgentTest.java
        common
        AttributionTest.java
        CustomEntity.java
        CustomKeyedItem.java
        GedcomxTest.java
        JsonCustomizationTest.java
        NoteTest.java
        QualifierTest.java
        TextValueTest.java
        UniqueCustomKeyedItem.java
        conclusion
        DateRecipesTest.java
        DocumentTest.java
        EventTest.java
        EvidenceRecipesTest.java
        FactTest.java
        FamilyTest.java
        IdentifierTest.java
        PersonRecipesTest.java
        PersonTest.java
        PlaceTest.java
        RelationshipRecipesTest.java
        RelationshipTest.java
        examples
        EmmaBocockExampleTest.java
        GeorgeMarthaWashingtonExampleTest.java
        MiscellaneousFactsExampleTest.java
        NamesExampleTest.java
        SamuelHamExampleTest.java
        WongAloiauExampleTest.java
        links
        CustomData.java
        HypermediaConrollableDataTest.java
        LinkTest.java
        records
        TestCollection.java
        TestFieldValue.java
        rt
        GedcomxModelVisitorBaseTest.java
        source
        SourceDescriptionTest.java
        SourceOfASourceRecipesTest.java
        SourceReferenceTest.java
        types
        TypesTest.java
        util
        JsonRecordSetIteratorTest.java
        JsonRecordSetWriterTest.java
        MarshalUtil.java
        TestCleanXmlStreamWriter.java
        TestDocCheck.java
        TestDocMap.java
        TestFieldMap.java
        TestLocaleUtil.java
        TestRecordSetIterator.java
        TestRecordSetWriter.java
- gedcomx-rs-client
  - src
    - main
      - java
        org
        gedcomx
        rs
        client
        AgentState.java
        AncestryResultsState.java
        CollectionState.java
        CollectionsState.java
        DescendancyResultsState.java
        GedcomxApplicationException.java
        GedcomxApplicationState.java
        PersonChildrenState.java
        PersonParentsState.java
        PersonSearchResultsState.java
        PersonSpousesState.java
        PersonState.java
        PersonsState.java
        PlaceDescriptionState.java
        PlaceDescriptionsState.java
        RecordState.java
        RecordsState.java
        RelationshipState.java
        RelationshipsState.java
        SourceDescriptionState.java
        SourceDescriptionsState.java
        StateFactory.java
        StateTransitionOption.java
        VocabElementListState.java
        VocabElementState.java
        options
        CacheDirectives.java
        ConnegSetter.java
        HeaderParameter.java
        Preconditions.java
        QueryParameter.java
        util
        AncestryTree.java
        BaseSearchQueryBuilder.java
        DescendancyTree.java
        EmbeddedLinkLoader.java
        HttpWarning.java
        PagedFeedIterator.java
        PersonSearchQueryBuilder.java
        VocabConstants.java
    - test
      - java
        org
        gedcomx
        rs
        client
        Examples.java
        GedcomxApplicationStateTest.java
        util
        PagedFeedIteratorTest.java
- gedcomx-rs-rt-support
  - src
    - main
      - java
        org
        gedcomx
        rs
        Rel.java
        rt
        json
        GedcomJsonProvider.java
        GedcomxAtomJsonProvider.java
        xml
        GedcomxXmlProvider.java
- gedcomx-rt-support
  - src
    - main
      - java
        org
        gedcomx
        rt
        DataURIUtil.java
        DefaultNamespace.java
        DocIgnoreXmlRootElement.java
        GedcomNamespaceManager.java
        GedcomxConstants.java
        MediaTypeDefinition.java
        Model.java
        RDFDomain.java
        RDFRange.java
        RDFSubClassOf.java
        RDFSubPropertyOf.java
        SerializationProcessListener.java
        SerializationUtil.java
        SupportsExtensionAttributes.java
        SupportsExtensionElements.java
        json
        ExtensibleObjectDeserializer.java
        ExtensibleObjectSerializer.java
        GedcomBeanDeserializerModifier.java
        GedcomBeanSerializerModifier.java
        GedcomJacksonModule.java
        HasJsonKey.java
        JsonElementWrapper.java
        JsonSimpleValue.java
        KeyedListDeserializer.java
        KeyedListSerializer.java
    - test
      - java
        org
        gedcomx
        rt
        DataURIUtilTest.java
- gedcomx-test-support
  - src
    - main
      - java
        org
        gedcomx
        test
        Recipe.java
        RecipeTest.java
        Snippet.java
    - test
      - java
        org
        gedcomx
        test
        CustomElement.java
        RecipeTestTest.java

/**
 * Copyright Intellectual Reserve, Inc.
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *   http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */
package org.gedcomx.util;

import com.fasterxml.jackson.databind.ObjectMapper;
import org.gedcomx.Gedcomx;
import org.gedcomx.rt.json.GedcomJacksonModule;

import java.io.BufferedInputStream;
import java.io.ByteArrayOutputStream;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.zip.GZIPInputStream;

/**
 * Class for iterating through the 'record' elements (GedcomX documents) in a RecordSet one at a time
 *   from a stream (e.g., a gzipped byte array) without having to inflate all the records at once.
 *   This reads JSON-formatted Records.
 *
 * User: Brent Hale
 * Date: 6/3/2015
 */
public class JsonRecordSetIterator implements RecordSetIterator {
  private InputStream inputStream;
  private Gedcomx nextRecord;
  private Gedcomx metadata;
  private ObjectMapper objectMapper;
  private String id;
  private boolean noMoreRecords = false;

  /**
   * Constructor for a record iterator that takes a filename of a RecordSet file and iterates through its record elements.
   * @param filename - Filename to read a GedcomX RecordSet file from.
   * @throws IOException If there's an I/O problem.
   */
  public JsonRecordSetIterator(String filename) throws IOException {
    this(new FileInputStream(filename), filename.toLowerCase().endsWith(".gz"));
  }

  public JsonRecordSetIterator(InputStream inputStream, boolean isGzipped) throws IOException {
    this(isGzipped ? new GZIPInputStream(inputStream) : inputStream);
  }

  /**
   * Constructor for a record iterator that takes an InputStream of a RecordSet file and
   * iterates through its record elements.  This creates a BufferedInputStream on the
   * InputStream.
   *
   * @param inputStream - InputStream to read a GedcomX RecordSet file from.
   * @throws IOException If there's an I/O problem.
   */
  public JsonRecordSetIterator(InputStream inputStream) throws IOException {
    this.inputStream = new BufferedInputStream(inputStream);

    objectMapper = GedcomJacksonModule.createObjectMapper();

    // Read the beginning object brace { plus label: {"metadata":
    int character = inputStream.read();
    assert character == '{';

    // Read until you get to the "records": [ section of the stream
    noMoreRecords = false;
    readUntil(inputStream, "records");

    // Read the opening array bracket [
    readUntilChar(inputStream, '[');

    prepareNext();
  }

  private void readUntil(InputStream inputStream, String untilLabel) throws IOException {
    // Read until we see the first label (meaning opening quote
    String name;

    while (! (name = getName(inputStream)).equals(untilLabel)) {
      if (name.equals(untilLabel)) {
        break;
      }

      // Otherwise look for some other objects.
      if (name.equals("metadata")) {
        readMetadata(inputStream);
      }

      else if (name.equals("id")) {
        id = getName(inputStream, false);
      }
    }
  }

  private void readMetadata(InputStream inputStream) throws IOException {
    // I have to do it this way since if I pass the inputStream to objectMapper.readValue() it leaves
    // the inputStream past the end of the actual metadata object.  Then the next getName() is lost.
    byte[] object = getObjectAsBytes(inputStream);
    metadata = objectMapper.readValue(object, Gedcomx.class);
  }

  /**
   * Read in the current Json object from the stream.  It will read the opening brace til the end brace
   * and return that in a string.  If the first character is a comma then it will ignore it.
   */
  private byte[] getObjectAsBytes(InputStream inputStream) throws IOException {
    int character;
    ByteArrayOutputStream bos = new ByteArrayOutputStream();
    int openingBraces = 0;
    int closingBraces = 0;
    boolean firstTime = true;

    while ((character = inputStream.read()) >= 0) {
      if (character == ',') {
        if (firstTime) {
          firstTime = false;
          continue;   // Ignore comma if it is the first read character.
        }
      }
      firstTime = false;

      bos.write(character);

      if (character == '{') {
        openingBraces++;
      }
      else if (character == '}') {
        closingBraces++;
      }

      if ((openingBraces > 0) && (openingBraces == closingBraces)) {
        break;
      }
    }

    return bos.toByteArray();
  }

  /**
   * Read from the stream until it finds an opening quote.  Then read the characters until the next quote mark
   * as the name.
   * This will also consume the trailing colon character (:).
   */
  private String getName(InputStream inputStream) throws IOException {
    return getName(inputStream, true);
  }

  private String getName(InputStream inputStream, boolean consumeColon) throws IOException {
    StringBuilder name = new StringBuilder();
    readUntilChar(inputStream, '"');
    int character;
    while ((character = inputStream.read()) != '"') {
      name.append((char)character);
    }
    if (consumeColon) {
      readUntilChar(inputStream, ':');
    }

    return name.toString();
  }

  private void readUntilChar(InputStream inputStream, char c) throws IOException {
    int character;
    while ((character = inputStream.read()) != c) {
      if (character < 0) {
        close();
        break;    // End of file.
      }
    }
  }

  /**
   * Tell whether the RecordIterator has another GedcomX record to return.
   * @return true if there is another record to read; false otherwise.
   */
  @Override
  synchronized public boolean hasNext() {
    return nextRecord != null;
  }

  /**
   * Prepare the next record to be retrieved.  Sets 'nextRecord' to the parsed record, if any, or null
   *   if there are no more.  Consumes bytes from the xmlStreamReader.
   * This does not close the inputStream once there are no more records to read.  The metadata
   * may be after the Records.
   */
  synchronized private void prepareNext() throws IOException {
    // I have to do it this way since if I pass the inputStream to objectMapper.readValue() it leaves
    // the inputStream past the end of the actual record object.  Then the next get is lost.
    if (noMoreRecords) {
      nextRecord = null;
      return;
    }

    byte[] object = getObjectAsBytes(inputStream);
    nextRecord = objectMapper.readValue(object, Gedcomx.class);

    // Need to read past the next comma separating records.
    // We also might see the end of the array bracket ].
    int character;
    while ((character = inputStream.read()) != ',') {
      if (character == ']') {
        noMoreRecords = true;
        break;
      }
    }
  }

  @Override
  synchronized public Gedcomx next() {
    try {
      if (nextRecord == null) {
        return null;
      }
      Gedcomx record = nextRecord;
      prepareNext();
      return record;
    }
    catch (Exception e) {
      throw new RuntimeException(e);
    }
  }

  /**
   * This should be read last as you cannot be sure of when the metadata will appear in the data stream.
   *
   * @return The Metadata document.
   */
  synchronized public Gedcomx getMetadata() {
    if (metadata == null) {
      try {
        readUntil(inputStream, JsonRecordSetWriter.METADATA_STR);
        readMetadata(inputStream);
      } catch (IOException e) {
        // Do nothing.
      }
    }
    return metadata;
  }

  @Override
  public void remove() {
    throw new UnsupportedOperationException();
  }

  /**
   * Close the input stream and accompanying reader if they are still open.
   * If you want to get the metadata and id of the RecordSet, then get them before you close().
   */
  public void close() {
    if (inputStream != null) {
      try {
        inputStream.close();
      } catch (IOException e) {
        inputStream = null;
      } finally {
        inputStream = null;
      }
    }
  }

  public String getId() throws IOException {
    if (id == null) {
      readUntil(inputStream, JsonRecordSetWriter.ID_STR);
      id = getName(inputStream, false);
    }
    return id;
  }
}