TermTabularDataFileReaderTest.java example

Explorer

dwca-io-master
- src
  - main
    - java
      - org
        gbif
        digester
        CallParamNoNSRule.java
        ThesaurusHandlingRule.java
        dwc
        extensions
        Extension.java
        ExtensionFactory.java
        ExtensionProperty.java
        VocabulariesManager.java
        Vocabulary.java
        VocabularyConcept.java
        VocabularyFactory.java
        VocabularyTerm.java
        package-info.java
        dwca
        io
        Archive.java
        ArchiveFactory.java
        ArchiveField.java
        ArchiveFile.java
        DwcaStreamWriter.java
        DwcaWriter.java
        MetaDescriptorWriter.java
        MetaXMLSaxHandler.java
        MetadataException.java
        SimpleSaxHandler.java
        UnsupportedArchiveException.java
        record
        CleanUtils.java
        DarwinCoreRecord.java
        DarwinCoreTaxon.java
        Record.java
        RecordImpl.java
        RecordIterator.java
        StarRecord.java
        StarRecordImpl.java
        tools
        ArchiveScanner.java
        IdGenerator.java
        IntSequenceGenerator.java
        MetaValidator.java
        io
        TabWriter.java
        tabular
        DwcTabularDataFileReader.java
        TermTabularDataFileReader.java
        TermTabularDataLine.java
        TermTabularFiles.java
        util
        CSVReaderHelper.java
        DownloadUtil.java
        xml
        SAXUtils.java
  - test
    - java
      - org
        gbif
        dwc
        extensions
        ExtensionFactoryTest.java
        ExtensionTest.java
        VocabularyConceptTest.java
        dwca
        io
        ArchiveFactoryTest.java
        ArchiveFileTest.java
        ArchivePlaziTest.java
        ArchiveTest.java
        DwcaStreamWriterTest.java
        DwcaWriterTest.java
        MetaDescriptorTest.java
        ScanArchiveForScientificName.java
        StarIteratorTest.java
        UsageExample.java
        record
        CleanUtilsTest.java
        DarwinCoreRecordTest.java
        DarwinCoreTaxonTest.java
        RecordImplTest.java
        tools
        IntSequenceGeneratorTest.java
        io
        DownloadUtilTest.java
        StrTokenizerPerformance.java
        StrTokenizerTest.java
        tabular
        TermTabularDataFileReaderTest.java

package org.gbif.tabular;

import org.gbif.dwc.terms.DwcTerm;
import org.gbif.dwc.terms.Term;
import org.gbif.utils.file.FileUtils;

import java.io.File;
import java.io.FileInputStream;

import org.junit.Test;

import static junit.framework.TestCase.assertEquals;
import static org.junit.Assert.assertNull;
import static org.junit.Assert.assertTrue;

/**
 * Unit tests for {@link TermTabularDataFileReader}
 */
public class TermTabularDataFileReaderTest {

  //simply used to avoid infinite loop
  private static int LOOP_SAFEGUARD = 1000;

  @Test
  public void testMappedTabularDataFileReaderAlwaysQuotes() throws Exception {
    File csv = FileUtils.getClasspathFile("csv_optional_quotes_excel2008CSV.csv");

    Term[] columnsMapping = new Term[]{DwcTerm.occurrenceID,
            DwcTerm.scientificName, DwcTerm.locality};

    TermTabularDataFileReader mappedReader =
            TermTabularFiles.newTermMappedTabularFileReader(new FileInputStream(csv), ',', true, columnsMapping);

    TermTabularDataLine mappedLine = mappedReader.read();
    assertEquals(1, mappedLine.getLineNumber());
    assertEquals("1", mappedLine.getMappedData().get(DwcTerm.occurrenceID));
    assertEquals("This has a, comma", mappedLine.getMappedData().get(DwcTerm.locality));


    mappedLine = mappedReader.read();
    assertEquals("I say this is only a \"quote\"", mappedLine.getMappedData().get(DwcTerm.locality));

    int recordCount = 0;
    while (mappedReader.read() != null && recordCount < LOOP_SAFEGUARD) {
      recordCount++;
    }
    assertTrue("Reader loop terminate before LOOP_SAFEGUARD", recordCount < LOOP_SAFEGUARD);

    mappedReader.close();
  }

  @Test
  public void testMappedTabularDataFileReaderException() throws Exception {
    File csv = FileUtils.getClasspathFile("csv_optional_quotes_excel2008CSV.csv");

    //only declare 2 mapping (the file includes 3 columns)
    Term[] columnsMapping = new Term[]{DwcTerm.occurrenceID, DwcTerm.scientificName};

    TermTabularDataFileReader mappedReader =
            TermTabularFiles.newTermMappedTabularFileReader(new FileInputStream(csv), ',', true, columnsMapping);

    TermTabularDataLine mappedLine = mappedReader.read();
    assertEquals(1, mappedLine.getLineNumber());
    assertEquals("1", mappedLine.getMappedData().get(DwcTerm.occurrenceID));
    assertEquals("Got 2 mapped", 2, mappedLine.getMappedData().size());
    assertEquals("Got 1 unmapped ", 1, mappedLine.getUnmappedData().size());
    assertEquals("Returned number of column matches the content of the file", 3, mappedLine.getNumberOfColumn());

    mappedReader.close();

    //declare 1 field more
    columnsMapping = new Term[]{DwcTerm.occurrenceID, DwcTerm.scientificName, DwcTerm.locality, DwcTerm.country};
    mappedReader =
            TermTabularFiles.newTermMappedTabularFileReader(new FileInputStream(csv), ',', true, columnsMapping);

    mappedLine = mappedReader.read();
    assertEquals(1, mappedLine.getLineNumber());
    assertEquals("1", mappedLine.getMappedData().get(DwcTerm.occurrenceID));
    assertEquals("Got 3 mapped", 3, mappedLine.getMappedData().size());
    assertNull("Got no unmapped ", mappedLine.getUnmappedData());
    assertEquals("Returned number of column matches the content of the file", 3, mappedLine.getNumberOfColumn());
    mappedReader.close();
  }
}