ProteinFeatureTranslation.java example

Explorer

ensj-healthcheck-master
- src
  - org
    - ensembl
      - PackageScan.java
      - healthcheck
        AssemblyNameInfo.java
        BuildTestLibrary.java
        CallbackTarget.java
        ConfigurableTestRunner.java
        ConfigurationBasedTestRegistry.java
        DatabaseRegistry.java
        DatabaseRegistryEntry.java
        DatabaseServer.java
        DatabaseType.java
        Debug.java
        DiscoveryBasedTestRegistry.java
        EnsTestCaseGroup.java
        GroupOfTests.java
        GroupOfTestsComparator.java
        NotImplementedException.java
        ParallelConfigurableTestRunner.java
        ReportLine.java
        ReportManager.java
        Reporter.java
        ReporterFactory.java
        Species.java
        StandaloneReporter.java
        StandaloneTestRunner.java
        SystemCommand.java
        SystemPropertySetter.java
        Team.java
        TestCaseInfo.java
        TestInstantiator.java
        TestRegistry.java
        TestRegistryCreationException.java
        TestRegistryFactory.java
        TestRunner.java
        TestsInGroups.java
        UnknownTestTypeException.java
        autogroups
        Generator.java
        configuration
        ConfigurationUserParameters.java
        ConfigureCompareSchema.java
        ConfigureConfiguration.java
        ConfigureDatabases.java
        ConfigureHealthcheckDatabase.java
        ConfigureHost.java
        ConfigureMiscProperties.java
        ConfigureTestGroups.java
        ConfigureTestRunner.java
        configurationmanager
        AbstractAliasAwareConfigurationBacking.java
        AbstractAliasAwareWithStanardInvocationHanderConfigurationBacking.java
        AbstractConfigurationBacking.java
        ConfigurationByCascading.java
        ConfigurationByProperties.java
        ConfigurationBySystemEnvironment.java
        ConfigurationDumper.java
        ConfigurationException.java
        ConfigurationFactory.java
        ConfigurationProcessor.java
        eg_gui
        AdminTab.java
        AdminTabActionListener.java
        Constants.java
        CopyAndPastePopupBuilder.java
        DatabaseTabbedPane.java
        DatabaseTabbedPaneWithSearchBox.java
        GroupNode.java
        GuiLogHandler.java
        GuiReportPanelData.java
        GuiReporterTab.java
        GuiStarter.java
        GuiTestResultWindowTab.java
        GuiTestRunner.java
        GuiTestRunnerFrame.java
        GuiTestRunnerFrameActionListener.java
        GuiTestRunnerFrameActionPerformer.java
        GuiTestRunnerFrameBuilder.java
        GuiTestRunnerFrameComponentBuilder.java
        GuiTestRunnerFrameUtils.java
        JPopupTextArea.java
        JPopupTextField.java
        MySqlConnectionWidget.java
        SetupTab.java
        SetupTabBuildDirector.java
        SetupTabBuilder.java
        TestCaseCellRenderer.java
        TestCaseColoredCellRenderer.java
        TestClassList.java
        TestClassListItem.java
        TestClassListModel.java
        TestInstantiatorDynamic.java
        TestNode.java
        TestProgressDialog.java
        TreeModelFromListOfGroupsBuilder.java
        dragAndDrop
        ListOfTestsToBeRunDropListener.java
        TestsTransferHandler.java
        TreeOfTestGroupsGestureListener.java
        TreeToListDragSourceListener.java
        reporter
        DatabaseReporter.java
        TextReporter.java
        testcase
        AbstractControlledTable.java
        AbstractIntegerTestCase.java
        AbstractPerlBasedTestCase.java
        AbstractPerlModuleBasedTestCase.java
        AbstractRowCountTestCase.java
        AbstractShellBasedTestCase.java
        AbstractTemplatedTestCase.java
        EnsTestCase.java
        MultiDatabaseTestCase.java
        MysqlCmd.java
        OrderedDatabaseTestCase.java
        PerlScriptConfig.java
        Priority.java
        Repair.java
        SingleDatabaseTestCase.java
        compara
        AbstractComparaTestCase.java
        AbstractMLSSIdToData.java
        AbstractMLSSTagStats.java
        AbstractRepairableComparaTestCase.java
        AbstractRepairableMLSSTag.java
        CheckCAFETable.java
        CheckComparaStableIDs.java
        CheckConservationScore.java
        CheckConservationScoreSanity.java
        CheckConstrainedElementTable.java
        CheckFlatProteinTrees.java
        CheckGeneGainLossData.java
        CheckGenomeDB.java
        CheckGenomicAlignGenomeDBs.java
        CheckGenomicAlignMTs.java
        CheckGenomicAlignTreeTable.java
        CheckHomology.java
        CheckMLSSIDConsistencyInGenomicAlign.java
        CheckMSANames.java
        CheckMethodLinkSpeciesSetTable.java
        CheckOrthologQCThresholds.java
        CheckPairAlignerUniqueMethod.java
        CheckSequenceTable.java
        CheckSpeciesSetSizeByMethod.java
        CheckSpeciesSetTable.java
        CheckSpeciesTreeNodeAttr.java
        CheckSynteny.java
        CheckSyntenySanity.java
        CheckTableSizes.java
        CheckTaxon.java
        CheckTopLevelDnaFrag.java
        CompareMSANames.java
        ForeignKeyCAFETables.java
        ForeignKeyConservationTables.java
        ForeignKeyFamilyTables.java
        ForeignKeyGeneAlignTables.java
        ForeignKeyGeneTreeTables.java
        ForeignKeyGenomicAlignmentTables.java
        ForeignKeyHomologyTables.java
        ForeignKeyMLSSIdGenomic.java
        ForeignKeyMLSSIdHomology.java
        ForeignKeyMasterTables.java
        ForeignKeyMemberTables.java
        ForeignKeySpeciesTreeTables.java
        ForeignKeySyntenyTables.java
        MLSSTagGERPMSA.java
        MLSSTagHighCoverageMSA.java
        MLSSTagMaxAlign.java
        MLSSTagSpeciesNames.java
        MLSSTagStatsHomology.java
        MLSSTagStatsMultipleAlignment.java
        MLSSTagStatsPairwiseAlignment.java
        MLSSTagStatsSynteny.java
        MLSSTagThresholdDs.java
        MemberProductionCounts.java
        Meta.java
        MetaSpeciesID.java
        MultipleGenomicAlignBlockIds.java
        SingleDBCollations.java
        eg_compara
        AbstractControlledRows.java
        AbstractEGForeignKeyMemberId.java
        CheckEmptyLeavesTrees.java
        ControlledTableDnafrag.java
        ControlledTableGenomeDb.java
        ControlledTableMappingSession.java
        ControlledTableMethodLink.java
        ControlledTableMethodLinkSpeciesSet.java
        ControlledTableMethodLinkSpeciesSetTag.java
        ControlledTableNcbiTaxaName.java
        ControlledTableNcbiTaxaNode.java
        ControlledTableSpeciesSet.java
        ControlledTableSpeciesSetTag.java
        EGCheckEmptyLocators.java
        EGCheckNoTreeStableIds.java
        EGCheckSynteny.java
        EGForeignKeyFamilyMemberId.java
        EGForeignKeyGeneTreeMemberId.java
        EGForeignKeyMethodLinkSpeciesSetId.java
        EGGeneTreeForeignKeyMethodLinkSpeciesSetId.java
        EGMethodLinkSpeciesSetIdStats.java
        EGMethodLinkSpeciesSetIdSyntenyStats.java
        MemberXrefAssociation.java
        eg_core
        AbstractEgCoreTestCase.java
        AbstractEgMeta.java
        AliasAndNaming.java
        AssemblyAccession.java
        AssemblyDefault.java
        CircularAwareFeatureCoords.java
        DbDisplayNameUniProt.java
        DeprecatedEgMeta.java
        DisplayXrefId.java
        DuplicateMetaKeys.java
        DuplicateObjectXref.java
        DuplicateProteinFeature.java
        DuplicateProteinId.java
        DuplicateRepeatFeature.java
        DuplicateTaxonomyIds.java
        DuplicateTopLevel.java
        DuplicateXref.java
        EGAbstractCompareSchema.java
        EGCompareCoreSchema.java
        EGCompareVariationSchema.java
        ENASeqRegionSynonyms.java
        EgProteinFeatureTranslation.java
        EnaAnalysisTypes.java
        EnaProvider.java
        EnaSeqRegionName.java
        EponineFeatures.java
        EvidenceFreeGO.java
        ExonBoundary.java
        ExternalDbSeqRegion.java
        GOslimXrefs.java
        GeneBuildStartDate.java
        GeneDescription.java
        GeneDescriptionNewline.java
        GeneDescriptionSource.java
        GeneDescriptionUniProtSource.java
        GeneGC.java
        GeneSource.java
        GeneStableIdDisplayXref.java
        GenesDisplayable.java
        GenomeStatistics.java
        GoTermCount.java
        IdentityXref.java
        IgiXref.java
        InappropriateTranslation.java
        IncorrectExonRank.java
        InterproFeature.java
        InterproHitCount.java
        MetaForCompara.java
        MultiDbAssembly.java
        MultiDbCompareNames.java
        MultiDbContigNames.java
        MultiDbSpeciesNames.java
        MultiDbStableId.java
        MultipleENASeqRegionSynonyms.java
        NoRepeatFeatures.java
        OntologyLevel.java
        PepstatsTranslationAttribs.java
        PeptideTranslationAttribs.java
        PermittedEgMeta.java
        PositiveCoordinates.java
        ProteinCodingGene.java
        ProteinFeatureAnalysisDb.java
        ProteinTranslation.java
        RepeatAnalysesInMeta.java
        RequiredEgMeta.java
        SampleSetting.java
        SchemaPatchesApplied.java
        SeqRegionAttribForPolyploidGenome.java
        SeqRegionAttribForPolyploidGenomeToplevelOnly.java
        SeqRegionCoordSystem.java
        SeqRegionDna.java
        SeqRegionLength.java
        SeqRegionName.java
        SeqRegionNaming.java
        SeqRegionsConsistentWithComparaMaster.java
        SharedDisplayXref.java
        SimpleFeatureAnalysisTypes.java
        SimpleFeatureEnds.java
        SpeciesProductionName.java
        StableId.java
        TranscriptDisplayXrefSuffix.java
        TranscriptSource.java
        TranscriptStableIdDisplayXref.java
        TranslationAttribType.java
        UniParc_Coverage.java
        UniProtExternalDbTypes.java
        UniProtKB_Coverage.java
        UniProtKB_DisplayXrefIds.java
        UniprotGeneNameObjectXref.java
        VBStableIdFormat.java
        ValidSeqEnd.java
        VersionedExons.java
        VersionedGenes.java
        VersionedTranscripts.java
        VersionedTranslations.java
        XrefDescriptionSpecialChars.java
        ZombieSpecies.java
        eg_funcgen
        EGArrayXrefs.java
        EGCompareFuncgenSchema.java
        eg_variation
        EGVariationFeature.java
        funcgen
        AbstractCoreDatabaseUsingTestCase.java
        AbstractExternalFileUsingTestcase.java
        ArrayXrefs.java
        ArraysHaveProbes.java
        BrokenFeatureSetToFeatureTypeLinks.java
        CheckResultSetDBFileLink.java
        CompareFuncgenSchema.java
        ComparePreviousVersionArrayXrefs.java
        ComparePreviousVersionGenomicProbeFeaturesByArray.java
        ComparePreviousVersionGenomicProbeFeaturesByArrayWithProbeSets.java
        ComparePreviousVersionProbeFeatures.java
        ComparePreviousVersionProbeFeaturesByArray.java
        ComparePreviousVersionProbeFeaturesFromProbeSetsByArrayBase.java
        ComparePreviousVersionProbes.java
        ComparePreviousVersionRegulatoryFeatures.java
        ComparePreviousVersionRegulatoryFeaturesPerType.java
        ComparePreviousVersionTranscriptProbeFeaturesByArray.java
        ComparePreviousVersionTranscriptProbeFeaturesByArrayWithProbeSets.java
        CoordSystemUpToDate.java
        CurrentRegulatoryBuildHasEpigenomes.java
        CurrentSchemaBuildUnique.java
        DBFileRegistryHasFile.java
        DuplicateProbeFeatures.java
        EpigenomeHasSegmentationFile.java
        EpigenomeLinkedToEFO.java
        ExperimentHasFeatureSet.java
        ExternalFeatureFilesExist.java
        FeaturePosition.java
        FeaturesMappedToCurrentSeqRegion.java
        FuncgenAnalysisDescription.java
        FuncgenForeignKeys.java
        FuncgenStableID.java
        InconsistentExperimentIds.java
        InputSubsetHasResultSet.java
        MetaCoord.java
        NonCurrentSeqRegions.java
        PostMartTables.java
        PreMartTables.java
        RedundantAnnotatedFeatureSets.java
        RegulatoryFeatureIsActive.java
        RegulatoryFeatureTypes.java
        RegulatoryMotifFeatures.java
        RegulatorySets.java
        ResultSetHasBamFile.java
        ResultSetHasBigWigFile.java
        SampleRegulatoryFeatureExists.java
        SegmentationFileHasBigBed.java
        StableIDsUnique.java
        generic
        AbstractCompareSchema.java
        Accession.java
        AlignFeatureExternalDB.java
        AltAllele.java
        AltAlleleGroup.java
        AnalyseTables.java
        AnalysisDescription.java
        AnalysisLogicName.java
        AnalysisTypes.java
        AnalysisXrefs.java
        AncestralSequencesExtraChecks.java
        Archive.java
        AssemblyExceptions.java
        AssemblyMapping.java
        AssemblyMultipleOverlap.java
        AssemblyNameLength.java
        AssemblySeqregion.java
        AssemblyTablesAcrossSpecies.java
        AttribTypeAcrossSpecies.java
        AttribValues.java
        AutoIncrement.java
        BigGeneExon.java
        BiotypeGroups.java
        BlankCoordSystemVersions.java
        BlankEnums.java
        BlankInfoType.java
        BlanksInsteadOfNulls.java
        CanonicalTranscriptCoding.java
        CheckDeclarations.java
        ComparePreviousDatabases.java
        ComparePreviousVersionAnalysisDescriptions.java
        ComparePreviousVersionAssociatedXrefGroups.java
        ComparePreviousVersionAssociatedXrefs.java
        ComparePreviousVersionBase.java
        ComparePreviousVersionBiotypes.java
        ComparePreviousVersionCCDS.java
        ComparePreviousVersionDensityFeatures.java
        ComparePreviousVersionExonCoords.java
        ComparePreviousVersionGOXrefs.java
        ComparePreviousVersionGeneNames.java
        ComparePreviousVersionProjectedGeneNames.java
        ComparePreviousVersionProjectedSynonyms.java
        ComparePreviousVersionRegionSynonyms.java
        ComparePreviousVersionRepeatTypes.java
        ComparePreviousVersionSynonyms.java
        ComparePreviousVersionTableRows.java
        ComparePreviousVersionXrefs.java
        CompareSchema.java
        CoordSystemAcrossSpecies.java
        CoreForeignKeys.java
        DNAEmpty.java
        DataFiles.java
        DensityFeatures.java
        DescriptionNewlines.java
        DescriptionXrefs.java
        DisplayLabels.java
        DisplayLabelsMIM.java
        DisplayXref.java
        Ditag.java
        DuplicateAssembly.java
        DuplicateAttributes.java
        DuplicateExons.java
        DuplicateGenes.java
        ESTStableID.java
        EmptyTables.java
        EntrezGeneNumeric.java
        ExonRank.java
        ExonStrandOrder.java
        ExonSupportingFeatures.java
        ExonTranscriptStartEnd.java
        ExternalDBDescribe.java
        ExternalDBDisplayName.java
        ExternalSynonymArray.java
        FeatureAnalysis.java
        FeatureCoords.java
        FrameshiftAttributes.java
        GOXrefs.java
        GeneCoordSystem.java
        GeneCount.java
        GeneDescriptions.java
        GeneStatus.java
        GeneTranscriptBiotypeMismatch.java
        GeneTranscriptStartEnd.java
        HGNCMultipleGenes.java
        HGNCNumeric.java
        HGNCTypes.java
        HitNameFormat.java
        IdentityXrefCigarLines.java
        InterproDescriptions.java
        InterproFeatures.java
        IsCurrent.java
        Karyotype.java
        LRG.java
        MTCodonTable.java
        MappingSession.java
        MarkerFeatures.java
        Meta.java
        MetaCoord.java
        MetaCrossSpecies.java
        MetaValues.java
        MultipleComponentAssemblyMapping.java
        MySQLStorageEngine.java
        NonGTACNSequence.java
        NullStrings.java
        NullTranscripts.java
        PartitionedTables.java
        PredictedXrefs.java
        PredictionTranscriptHasExons.java
        ProductionAnalysisLogicName.java
        ProductionBiotypes.java
        ProductionMasterTables.java
        ProductionMeta.java
        ProductionSpeciesAlias.java
        ProjectedXrefGenes.java
        ProjectedXrefs.java
        ProteinFeatureTranslation.java
        ProteinFeatures.java
        Pseudogene.java
        RepeatConsensus.java
        RepeatFeature.java
        Retrotransposed.java
        SchemaType.java
        SeqRegionAcrossSpecies.java
        SeqRegionAttribAcrossSpecies.java
        SeqRegionAttribsPresent.java
        SeqRegionCoordSystem.java
        SeqRegionName.java
        SeqRegionsTopLevel.java
        SeqRegionsTopLevelRank.java
        SeqRegionsTopLevelRefSeq.java
        SequenceLevel.java
        SingleDBCollations.java
        SourceTypes.java
        SpeciesID.java
        StableID.java
        StableIDMapping.java
        Strand.java
        TranscriptNames.java
        TranscriptSupportingFeatures.java
        TranscriptsSameName.java
        TranscriptsTranslate.java
        TranslationCheckSeqStart.java
        TranslationCheckZeroLength.java
        TranslationStartEnd.java
        TranslationStartEndExon.java
        UTR.java
        UnreviewedXrefs.java
        VariationDensity.java
        XrefCategories.java
        XrefHTML.java
        XrefIdentifiers.java
        XrefLevels.java
        XrefPrefixes.java
        XrefTypes.java
        XrefVersions.java
        variation
        AlleleFrequencies.java
        CheckChar.java
        ComparePreviousVersionAlleles.java
        ComparePreviousVersionConsequenceType.java
        ComparePreviousVersionGenotypes.java
        ComparePreviousVersionPhenotypeFeatures.java
        ComparePreviousVersionReadCoverage.java
        ComparePreviousVersionSampleDisplay.java
        ComparePreviousVersionSources.java
        ComparePreviousVersionStructuralVariations.java
        ComparePreviousVersionValidationStatus.java
        ComparePreviousVersionVariationFeatures.java
        ComparePreviousVersionVariationSets.java
        ComparePreviousVersionVariationSynonyms.java
        ComparePreviousVersionVariations.java
        CompareVariationSchema.java
        CompressedGenotypeRegion.java
        Denormalized.java
        EmptyVariationTables.java
        FlankingUpDownSeq.java
        ForeignKeyCoreId.java
        IndividualType.java
        Meta.java
        Meta_coord.java
        Phenotype.java
        PhenotypeFeatureAttrib.java
        Population.java
        PopulationGenotype.java
        Publication.java
        StructuralVariation.java
        TranscriptVariation.java
        VFCoordinates.java
        Variation.java
        VariationClasses.java
        VariationFeature.java
        VariationFeatureAlleles.java
        VariationForeignKeys.java
        VariationSet.java
        VariationSynonym.java
        testgroup
        AdditionalAnnotation.java
        Assembly.java
        ComparaAll.java
        ComparaAncestral.java
        ComparaGenomic.java
        ComparaGenomicOnly.java
        ComparaHomology.java
        ComparaHomologyOnly.java
        ComparaMaster.java
        ComparaMasterOnly.java
        ComparaReleaseOnly.java
        ComparaSanity.java
        ComparaShared.java
        ControlledComparaTables.java
        CoreCompare.java
        CoreHandover.java
        CoreXrefs.java
        EBCore.java
        EGCommon.java
        EGCompara.java
        EGComparaGeneTree.java
        EGCore.java
        EGCoreAnnotation.java
        EGCoreAnnotationCritical.java
        EGCoreAnnotationMajor.java
        EGCoreCompare.java
        EGCoreGeneModel.java
        EGCoreGeneModelCritical.java
        EGCoreGeneModelMajor.java
        EGCoreHandover.java
        EGCoreIntegrity.java
        EGCoreMeta.java
        EGCoreMetaCritical.java
        EGCoreMetaMajor.java
        EGCoreMulti.java
        EGCoreVB.java
        EGFuncgen.java
        EGIntegrity.java
        EGOtherFeaturesHandover.java
        EGVariation.java
        EGVariationHandover.java
        EnsemblGenomes.java
        Funcgen.java
        FuncgenIntegrity.java
        FuncgenPostERSA.java
        FuncgenPostProbemapping.java
        FuncgenPostRegulatoryBuild.java
        FuncgenRelease.java
        GenebuildHandover.java
        Geneset.java
        IdMapping.java
        PostGenebuild.java
        PostMerge.java
        PostProjection.java
        PostRegulatorybuild.java
        PreSite.java
        Production.java
        Projection.java
        Schema.java
        VariationLong.java
        VariationRelease.java
        util
        AbstractLongMapRowMapper.java
        AbstractMapRowMapper.java
        AbstractStringMapRowMapper.java
        ActionAppendable.java
        CallbackHandler.java
        ChecksumDatabase.java
        ClassFileFilenameFilter.java
        ClassFileFilter.java
        Clazz.java
        CollectionUtils.java
        ConnectionBasedSqlTemplateImpl.java
        ConnectionPool.java
        CreateHealthCheckDB.java
        DBUtils.java
        DefaultMapRowMapper.java
        DefaultObjectRowMapper.java
        InputOutputUtils.java
        IntegerComparator.java
        Jar.java
        LogFormatter.java
        LogMapperPerl2Java.java
        MapRowMapper.java
        MyStreamHandler.java
        ObjectArrayRowMapper.java
        Pair.java
        PoorLruMap.java
        ProcessExec.java
        Quadruple.java
        RowMapper.java
        SQLParser.java
        ScriptRunner.java
        SqlTemplate.java
        SqlUncheckedException.java
        StringListMapRowMapper.java
        StringMapRowMapper.java
        StringPairRowMapper.java
        TemplateBuilder.java
        TestCaseUtils.java
        TestComparator.java
        Triple.java
        TupleRowMappers.java
        Unit.java
        UtilUncheckedException.java
        Utils.java
- test
  - src
    - org
      - ensembl
        healthcheck
        test
        ClassFileFilenameFilterTest.java
        DBUtilsTest.java
        DatabaseRegistryEntryTest.java
        LogFormatterTest.java
        MyStreamHandlerTest.java
        SQLParserTest.java
        SpeciesTest.java
        TestReadingClasspath.java
        UtilsTest.java
        util
        SqlTemplateTest.java
        UnitTest.java

/*
 * Copyright [1999-2015] Wellcome Trust Sanger Institute and the EMBL-European Bioinformatics Institute
 * Copyright [2016-2017] EMBL-European Bioinformatics Institute
 * 
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 * 
 *      http://www.apache.org/licenses/LICENSE-2.0
 * 
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */


package org.ensembl.healthcheck.testcase.generic;

import java.sql.Connection;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;

import org.ensembl.healthcheck.DatabaseRegistryEntry;
import org.ensembl.healthcheck.DatabaseType;
import org.ensembl.healthcheck.ReportManager;
import org.ensembl.healthcheck.Team;
import org.ensembl.healthcheck.testcase.Repair;
import org.ensembl.healthcheck.testcase.SingleDatabaseTestCase;
import org.ensembl.healthcheck.util.DBUtils;

/**
 * An EnsEMBL Healthcheck test case which checks that the protein_feature table agrees with the translation table.
 */

public class ProteinFeatureTranslation extends SingleDatabaseTestCase implements Repair {

	// hash of lists of protein features to delete
	// key - database name
	private Map featuresToDelete;

	private static int THRESHOLD = 1000; // don't report a problem if there are less results than this

	private static int OUTPUT_LIMIT = 20; // only complain about this many missing translations or long translations

	/**
	 * Create an ProteinFeatureTranslationTestCase that applies to a specific set of databases.
	 */
	public ProteinFeatureTranslation() {

		featuresToDelete = new HashMap();
		setFailureText("Large numbers of features longer than the translation indicate something is wrong. A few is probably OK");
		setHintLongRunning(true);
		setTeamResponsible(Team.GENEBUILD);
	}

	/**
	 * This test only applies to core and Vega databases.
	 */
	public void types() {

		removeAppliesToType(DatabaseType.OTHERFEATURES);
		removeAppliesToType(DatabaseType.ESTGENE);
		removeAppliesToType(DatabaseType.CDNA);
		removeAppliesToType(DatabaseType.RNASEQ);

	}

	/**
	 * Builds a cache of the translation lengths, then compares them with the values in the protein_features table.
	 * 
	 * @param dbre
	 *          The database to use.
	 * @return Result.
	 */

	public boolean run(DatabaseRegistryEntry dbre) {

		boolean result = true;

		int problems = 0;

		// get list of transcripts
		String sql = "SELECT t.transcript_id, e.exon_id, tl.start_exon_id, " + "       tl.translation_id, tl.end_exon_id, tl.seq_start, " + "       tl.seq_end, e.seq_region_start, e.seq_region_end "
				+ "FROM   transcript t, exon_transcript et, exon e, translation tl " + "WHERE  t.transcript_id = et.transcript_id " + "AND    et.exon_id = e.exon_id "
				+ "AND    t.transcript_id = tl.transcript_id " + "ORDER  BY t.transcript_id, et.rank";

		try {

			Connection con = dbre.getConnection();

			// check that the protein feature table actually has some rows - if
			// not there's
			// no point working out the translation lengths
			if (!tableHasRows(con, "protein_feature")) {
				ReportManager.problem(this, con, "protein_feature table is empty");
				return false; // shoud we return true or false in this case?
			}

			// NOTE: By default the MM MySQL JDBC driver reads and stores *all*
			// rows in the
			// ResultSet.
			// Since this TestCase is likely to produce lots of output, we must
			// use the
			// "streaming"
			// mode where only one row of the ResultSet is stored at a time.
			// To do this, the following two lines are both necessary.
			// See the README file for the mm MySQL driver.

			Statement stmt = con.createStatement(java.sql.ResultSet.TYPE_FORWARD_ONLY, java.sql.ResultSet.CONCUR_READ_ONLY);
			stmt.setFetchSize(1000);

			Map translationLengths = new HashMap();

			// now calculate and store the translation lengths
			ResultSet rs = stmt.executeQuery(sql);
			rs.setFetchDirection(ResultSet.FETCH_FORWARD);

			boolean inCodingRegion = false;

			while (rs.next()) {

				int currentTranslationID = rs.getInt("translation_id");
				Integer id = new Integer(currentTranslationID);
				// initialise if necessary
				if (translationLengths.get(id) == null) {
					translationLengths.put(id, new Integer(0));
				}

				if (!inCodingRegion) {
					if (rs.getInt("start_exon_id") == rs.getInt("exon_id")) {
						// single-exon-translations
						if (rs.getInt("start_exon_id") == rs.getInt("end_exon_id")) {
							int length = (rs.getInt("seq_end") - rs.getInt("seq_start")) + 1;
							translationLengths.put(id, new Integer(length));
							continue;
						}
						inCodingRegion = true;
						// subtract seq_start
						int currentLength = ((Integer) translationLengths.get(id)).intValue();
						currentLength -= (rs.getInt("seq_start") - 1);
						translationLengths.put(id, new Integer(currentLength));
					}
				} // if !inCoding

				if (inCodingRegion) {
					if (rs.getInt("exon_id") == rs.getInt("end_exon_id")) {
						// add seq_end
						int currentLength = ((Integer) translationLengths.get(id)).intValue();
						currentLength += rs.getInt("seq_end");
						translationLengths.put(id, new Integer(currentLength));
						inCodingRegion = false;
					} else {
						int currentLength = ((Integer) translationLengths.get(id)).intValue();
						currentLength += (rs.getInt("seq_region_end") - rs.getInt("seq_region_start")) + 1;
						translationLengths.put(id, new Integer(currentLength));
						// inCodingRegion = false;

					}
				} // if inCoding

			} // while rs

			rs.close();
			stmt.close();
			stmt = null;

			// Re-open the statement to make sure it's GC'd
			stmt = con.createStatement(java.sql.ResultSet.TYPE_FORWARD_ONLY, java.sql.ResultSet.CONCUR_READ_ONLY);
			// stmt.setFetchSize(1000);
			stmt.setFetchSize(Integer.MIN_VALUE);

			logger.fine("Built translation length cache, about to look at protein features");
			// dumpTranslationLengths(con, translationLengths, 100);

			// find protein features where seq_end is > than the length of the
			// translation
			List thisDBFeatures = new ArrayList();
			rs = stmt.executeQuery("SELECT protein_feature_id, translation_id, seq_end FROM protein_feature");

			while (rs.next()) {

				Integer translationID = new Integer(rs.getInt("translation_id"));
				Integer proteinFeatureID = new Integer(rs.getInt("protein_feature_id"));

				if (translationLengths.get(translationID) != null) {
					// some codons can only be 2 bp
					int minTranslationLength = (((Integer) translationLengths.get(translationID)).intValue() + 2) / 3;
					// int minTranslationLength = ((Integer)
					// translationLengths.get(translationID)).intValue();
					if (rs.getInt("seq_end") > minTranslationLength) {
						thisDBFeatures.add(proteinFeatureID);
						// System.out.println("proteinFeatureID: " + proteinFeatureID);
					}
				} else {
					if (problems++ < OUTPUT_LIMIT) {
						ReportManager.problem(this, con, "Protein feature " + proteinFeatureID + " refers to non-existent translation " + translationID);
					}
				}
			}

			featuresToDelete.put(DBUtils.getShortDatabaseName(con), thisDBFeatures);
			if (thisDBFeatures.size() > THRESHOLD) {
				ReportManager.problem(this, con, "protein_feature table has " + thisDBFeatures.size() + " features that are longer than the translation");
				result = false;
			} else if (thisDBFeatures.size() == 0) {
				ReportManager.correct(this, con, "protein_feature table has no features that are longer than the translation");
			} else {
				ReportManager.correct(this, con, "protein_feature table has " + thisDBFeatures.size() + " features that are longer than the translation; this is less than the threshold of " + THRESHOLD);
			}

			rs.close();
			stmt.close();

			if (problems >= OUTPUT_LIMIT) {
				ReportManager.problem(this, con, "Note that only " + OUTPUT_LIMIT + " missing translation IDs were notified, there may be more");
			}

		} catch (Exception e) {
			e.printStackTrace();
		}

		return result;

	}

	// ------------------------------------------
	// Implementation of Repair interface.

	/**
	 * Delete any protein features that run past the end of the translation. <strong>CAUTION! </strong>Actually deletes the features
	 * from the protein_feature table.
	 * 
	 * @param dbre
	 *          The database to use.
	 */
	public void repair(DatabaseRegistryEntry dbre) {

		Connection con = dbre.getConnection();
		String sql = setupRepairSQL(con);
		if (sql.length() == 0) {
			System.out.println("No invalid protein features were found in " + DBUtils.getShortDatabaseName(con));
		} else {
			try {
				Statement stmt = con.createStatement();
				System.out.println(DBUtils.getShortDatabaseName(con));
				System.out.println(sql);
				// stmt.execute(sql);
				stmt.close();
			} catch (SQLException se) {
				se.printStackTrace();
			}
		}

	}

	/**
	 * Show which protein features would be deleted by the repair method.
	 * 
	 * @param dbre
	 *          The database to use.
	 */
	public void show(DatabaseRegistryEntry dbre) {

		System.out.println("Candidate for repair:");

		Connection con = dbre.getConnection();
		String sql = setupRepairSQL(con);
		if (sql.length() == 0) {
			System.out.println("No invalid protein features were found in " + DBUtils.getShortDatabaseName(con));
		} else {
			System.out.println(DBUtils.getShortDatabaseName(con) + ": " + sql);
		}

	}

	/**
	 * Set up the SQL to delete the offending protein features.
	 * 
	 * @param con
	 *          The database connection to use.
	 * @return The SQL to delete the incorrect protein features, or "" if there are no problems.
	 */
	private String setupRepairSQL(Connection con) {

		StringBuffer sql = new StringBuffer("DELETE FROM protein_feature WHERE protein_feature_id IN (");

		List thisDBFeatures = (List) featuresToDelete.get(DBUtils.getShortDatabaseName(con));

		if (thisDBFeatures == null || thisDBFeatures.size() == 0) {
			return "";
		}

		Iterator featureIterator = thisDBFeatures.iterator();
		while (featureIterator.hasNext()) {
			sql.append(((Integer) featureIterator.next()).intValue());
			if (featureIterator.hasNext()) {
				sql.append(",");
			}
		}
		sql.append(")");

		return sql.toString();

	}

	// -------------------------------------------------------------------------

	// private void dumpTranslationLengths(Connection con, Map lengths, int maxID) {
	//
	// System.out.println("Translation lengths for " + DBUtils.getShortDatabaseName(con));
	//
	// Set keySet = lengths.keySet();
	// List keyList = new ArrayList(keySet);
	// Collections.sort(keyList, new IntegerComparator());
	//
	// Iterator it = keyList.iterator();
	// while (it.hasNext()) {
	//
	// Integer iid = (Integer) it.next();
	// int id = iid.intValue();
	// if (id > maxID) {
	// break;
	// }
	// Integer iLength = (Integer) lengths.get(iid);
	// int length = iLength.intValue();
	// System.out.println("ID: " + id + "\tLength: " + length);
	// }
	//
	// }

	// -------------------------------------------------------------------------

} // ProteinFeatureTranslationTestCase