AbstractSequenceClassifier.java example

Explorer

stan-cn-com-master
- src
  - main
    - java
      - com
        guokr
        protocol
        Protocols.java
        xcf
        Handler.java
        XcfConnection.java
        XcfFileConnection.java
        XcfJarConnection.java
        util
        MultipleGZIPOutputStream.java
        Settings.java
      - edu
        stanford
        nlp
        classify
        AbstractLinearClassifierFactory.java
        AdaptedGaussianPriorObjectiveFunction.java
        BiasedLogConditionalObjectiveFunction.java
        BiasedLogisticObjectiveFunction.java
        Classifier.java
        ClassifierCreator.java
        ClassifierFactory.java
        CrossValidator.java
        Dataset.java
        GeneralDataset.java
        GeneralizedExpectationObjectiveFunction.java
        LinearClassifier.java
        LinearClassifierFactory.java
        LogConditionalObjectiveFunction.java
        LogPrior.java
        LogisticClassifier.java
        LogisticClassifierFactory.java
        LogisticObjectiveFunction.java
        NBLinearClassifierFactory.java
        PRCurve.java
        ProbabilisticClassifier.java
        ProbabilisticClassifierCreator.java
        RVFClassifier.java
        RVFDataset.java
        SVMLightClassifier.java
        SVMLightClassifierFactory.java
        SemiSupervisedLogConditionalObjectiveFunction.java
        WeightedDataset.java
        dcoref
        ACEMentionExtractor.java
        CoNLL2011DocumentReader.java
        CoNLLMentionExtractor.java
        Constants.java
        CorefChain.java
        CorefCluster.java
        CorefCoreAnnotations.java
        CorefMentionFinder.java
        CorefScorer.java
        Dictionaries.java
        Document.java
        MUCMentionExtractor.java
        Mention.java
        MentionExtractor.java
        MentionMatcher.java
        RuleBasedCorefMentionFinder.java
        Rules.java
        ScorerBCubed.java
        ScorerMUC.java
        ScorerPairwise.java
        Semantics.java
        SieveCoreferenceSystem.java
        SieveOptions.java
        SpeakerInfo.java
        sievepasses
        AliasMatch.java
        CorefDictionaryMatch.java
        DeterministicCorefSieve.java
        DiscourseMatch.java
        ExactStringMatch.java
        LexicalChainMatch.java
        MarkRole.java
        NameMatch.java
        NameMatchPrecise.java
        PreciseConstructs.java
        PronounMatch.java
        RelaxedExactStringMatch.java
        RelaxedHeadMatch.java
        StrictHeadMatch1.java
        StrictHeadMatch2.java
        StrictHeadMatch3.java
        StrictHeadMatch4.java
        fsm
        AutomatonMinimizer.java
        Block.java
        DFSA.java
        DFSAState.java
        DFSATransition.java
        FastExactAutomatonMinimizer.java
        QuasiDeterminizer.java
        TransducerGraph.java
        graph
        ConnectedComponents.java
        DijkstraShortestPath.java
        DirectedMultiGraph.java
        Graph.java
        ie
        AbstractSequenceClassifier.java
        AcquisitionsPrior.java
        ClassifierCombiner.java
        EmpiricalNERPrior.java
        EmpiricalNERPriorBIO.java
        EntityCachingAbstractSequencePrior.java
        EntityCachingAbstractSequencePriorBIO.java
        NERClassifierCombiner.java
        NERFeatureFactory.java
        NumberNormalizer.java
        QuantifiableEntityNormalizer.java
        SeminarsPrior.java
        UniformPrior.java
        crf
        CRFBiasedClassifier.java
        CRFClassifier.java
        CRFClassifierEvaluator.java
        CRFClassifierFloat.java
        CRFClassifierNoisyLabel.java
        CRFClassifierNonlinear.java
        CRFClassifierWithDropout.java
        CRFClassifierWithLOP.java
        CRFCliqueTree.java
        CRFDatum.java
        CRFFeatureExporter.java
        CRFLabel.java
        CRFLogConditionalObjectiveFloatFunction.java
        CRFLogConditionalObjectiveFunction.java
        CRFLogConditionalObjectiveFunctionForLOP.java
        CRFLogConditionalObjectiveFunctionNoisyLabel.java
        CRFLogConditionalObjectiveFunctionWithDropout.java
        CRFNonLinearLogConditionalObjectiveFunction.java
        CRFNonLinearSecondOrderLogConditionalObjectiveFunction.java
        CliquePotentialFunction.java
        FactorTable.java
        FloatFactorTable.java
        HasCliquePotentialFunction.java
        LabelDictionary.java
        LinearCliquePotentialFunction.java
        NoisyLabelLinearCliquePotentialFunction.java
        NonLinearCliquePotentialFunction.java
        NonLinearSecondOrderCliquePotentialFunction.java
        TestSequenceModel.java
        machinereading
        BasicEntityExtractor.java
        BasicRelationExtractor.java
        Extractor.java
        ExtractorMerger.java
        GenericDataSetReader.java
        LabelValidator.java
        MachineReading.java
        MachineReadingProperties.java
        RelationFeatureFactory.java
        ResultsPrinter.java
        common
        DomReader.java
        NoPunctuationHeadFinder.java
        SimpleTokenize.java
        StringDictionary.java
        domains
        ace
        AceReader.java
        reader
        AceCharSeq.java
        AceDocument.java
        AceDomReader.java
        AceElement.java
        AceEntity.java
        AceEntityMention.java
        AceEvent.java
        AceEventMention.java
        AceEventMentionArgument.java
        AceMention.java
        AceMentionArgument.java
        AceRelation.java
        AceRelationMention.java
        AceRelationMentionArgument.java
        AceSentenceSegmenter.java
        AceToken.java
        MatchException.java
        RobustTokenizer.java
        roth
        RothCONLL04Reader.java
        RothEntityExtractor.java
        structure
        AnnotationUtils.java
        EntityMention.java
        EntityMentionFactory.java
        EventMention.java
        ExtractionObject.java
        MachineReadingAnnotations.java
        RelationMention.java
        RelationMentionFactory.java
        Span.java
        ner
        CMMClassifier.java
        pascal
        AcronymModel.java
        Alignment.java
        AlignmentFactory.java
        CliqueTemplates.java
        DateTemplate.java
        DefaultTeXHyphenData.java
        ISODateInstance.java
        InfoTemplate.java
        PascalTemplate.java
        Prior.java
        RelationalModel.java
        TeXHyphenator.java
        regexp
        NumberSequenceClassifier.java
        RegexNERSequenceClassifier.java
        international
        Languages.java
        arabic
        ArabicMorphoFeatureSpecification.java
        Buckwalter.java
        pipeline
        DefaultLexicalMapper.java
        process
        ArabicDocumentReaderAndWriter.java
        ArabicLexer.java
        ArabicSegmenter.java
        ArabicSegmenterFeatureFactory.java
        ArabicTokenizer.java
        IOBUtils.java
        french
        FrenchMorphoFeatureSpecification.java
        FrenchUnknownWordSignatures.java
        process
        FrenchLexer.java
        FrenchTokenizer.java
        morph
        MorphoFeatureSpecification.java
        MorphoFeatures.java
        io
        BZip2PipedOutputStream.java
        EncodingFileReader.java
        EncodingPrintWriter.java
        ExtensionFileFilter.java
        FileSequentialCollection.java
        IOUtils.java
        Lexer.java
        NumberRangeFileFilter.java
        NumberRangesFileFilter.java
        PrintFile.java
        ReaderInputStream.java
        RegExFileFilter.java
        RuntimeIOException.java
        StringOutputStream.java
        TeeStream.java
        ling
        AnnotationLookup.java
        BasicDatum.java
        BasicDocument.java
        CategoryWordTag.java
        CategoryWordTagFactory.java
        ChineseCoreAnnotations.java
        CoreAnnotation.java
        CoreAnnotations.java
        CoreLabel.java
        Datum.java
        Document.java
        DocumentReader.java
        Featurizable.java
        HasCategory.java
        HasContext.java
        HasIndex.java
        HasLemma.java
        HasOffset.java
        HasTag.java
        HasWord.java
        IndexedWord.java
        Label.java
        LabelFactory.java
        Labeled.java
        LabeledWord.java
        MultiTokenTag.java
        RVFDatum.java
        Sentence.java
        StringLabel.java
        StringLabelFactory.java
        Tag.java
        TaggedWord.java
        TaggedWordFactory.java
        ValueLabel.java
        Word.java
        WordFactory.java
        WordLemmaTag.java
        WordLemmaTagFactory.java
        WordTag.java
        WordTagFactory.java
        tokensregex
        BasicSequenceMatchResult.java
        CoreMapExpressionExtractor.java
        CoreMapExpressionNodePattern.java
        CoreMapNodePattern.java
        CoreMapNodePatternTrigger.java
        CoreMapSequenceMatchAction.java
        CoreMapSequenceMatcher.java
        Env.java
        EnvLookup.java
        MatchedExpression.java
        MultiCoreMapNodePattern.java
        MultiNodePattern.java
        MultiPatternMatcher.java
        MultiWordStringMatcher.java
        NodePattern.java
        PhraseTable.java
        SequenceMatchAction.java
        SequenceMatchResult.java
        SequenceMatchRules.java
        SequenceMatcher.java
        SequencePattern.java
        TokenSequenceMatcher.java
        TokenSequencePattern.java
        matcher
        ApproxMatch.java
        BoundedCostOrderedMap.java
        ExactMatchCost.java
        Match.java
        MatchCostFunction.java
        MultiMatch.java
        TrieMap.java
        TrieMapMatcher.java
        parser
        ParseException.java
        SimpleCharStream.java
        Token.java
        TokenMgrError.java
        TokenSequenceParser.java
        TokenSequenceParserConstants.java
        TokenSequenceParserTokenManager.java
        types
        AssignableExpression.java
        Expression.java
        Expressions.java
        Tags.java
        Value.java
        ValueFunction.java
        ValueFunctions.java
        math
        ADMath.java
        ArrayMath.java
        DoubleAD.java
        NumberMatchingRegex.java
        SloppyMath.java
        maxent
        CGRunner.java
        DataGeneric.java
        Experiments.java
        Feature.java
        Features.java
        Problem.java
        iis
        LambdaSolve.java
        net
        ClasspathURLStreamHandler.java
        neural
        Embedding.java
        NeuralUtils.java
        SimpleTensor.java
        rnn
        RNNCoreAnnotations.java
        TopNGramRecord.java
        objectbank
        DelimitRegExIterator.java
        IdentityFunction.java
        IteratorFromReaderFactory.java
        LineIterator.java
        ObjectBank.java
        ReaderIteratorFactory.java
        ResettableReaderIteratorFactory.java
        XMLBeginEndIterator.java
        optimization
        AbstractCachingDiffFloatFunction.java
        AbstractCachingDiffFunction.java
        AbstractStochasticCachingDiffFunction.java
        AbstractStochasticCachingDiffUpdateFunction.java
        CGMinimizer.java
        CmdEvaluator.java
        DiffFloatFunction.java
        DiffFunction.java
        Evaluator.java
        FloatFunction.java
        Function.java
        GoldenSectionLineSearch.java
        HasEvaluators.java
        HasFeatureGrouping.java
        HasFloatInitial.java
        HasInitial.java
        HasRegularizerParamRange.java
        HybridMinimizer.java
        InefficientSGDMinimizer.java
        LineSearcher.java
        MemoryEvaluator.java
        Minimizer.java
        QNMinimizer.java
        ResultStoringFloatMonitor.java
        ResultStoringMonitor.java
        SGDMinimizer.java
        SGDToQNMinimizer.java
        SGDWithAdaGradAndFOBOS.java
        SMDMinimizer.java
        SQNMinimizer.java
        ScaledSGDMinimizer.java
        StochasticCalculateMethods.java
        StochasticDiffFunctionTester.java
        StochasticMinimizer.java
        parser
        KBestViterbiParser.java
        Parser.java
        ViterbiParser.java
        ViterbiParserWithOptions.java
        charniak
        CharniakParser.java
        CharniakScoredParsesReaderWriter.java
        common
        ArgUtils.java
        NoSuchParseException.java
        ParserAnnotations.java
        ParserConstraint.java
        ParserGrammar.java
        ParserQuery.java
        ParserUtils.java
        ParsingThreadsafeProcessor.java
        dvparser
        CacheParseHypotheses.java
        DVModel.java
        DVModelReranker.java
        DVParser.java
        DVParserCostAndGradient.java
        FilterConfusingRules.java
        UnknownWordPrinter.java
        lexparser
        AbstractDependencyGrammar.java
        AbstractTreeExtractor.java
        AbstractTreebankParserParams.java
        AbstractUnknownWordModelTrainer.java
        ArabicTreebankParserParams.java
        ArabicUnknownWordModel.java
        ArabicUnknownWordModelTrainer.java
        ArabicUnknownWordSignatures.java
        BaseLexicon.java
        BaseUnknownWordModel.java
        BaseUnknownWordModelTrainer.java
        BasicCategoryTagProjection.java
        BiLexPCFGParser.java
        BinaryGrammar.java
        BinaryGrammarExtractor.java
        BinaryHeadFinder.java
        BinaryRule.java
        BoundaryRemover.java
        CNFTransformers.java
        ChineseCharacterBasedLexicon.java
        ChineseLexicon.java
        ChineseLexiconAndWordSegmenter.java
        ChineseSimWordAvgDepGrammar.java
        ChineseTreebankParserParams.java
        ChineseUnknownWordModel.java
        ChineseUnknownWordModelTrainer.java
        CollinsPuncTransformer.java
        Debinarizer.java
        DependencyGrammar.java
        Edge.java
        EnglishTreebankParserParams.java
        EnglishUnknownWordModel.java
        EnglishUnknownWordModelTrainer.java
        EvalbFormatWriter.java
        EvaluateTreebank.java
        ExactGrammarCompactor.java
        ExhaustiveDependencyParser.java
        ExhaustivePCFGParser.java
        Extractor.java
        FactoredLexicon.java
        FactoredLexiconEvent.java
        FactoredParser.java
        FastFactoredParser.java
        FrenchTreebankParserParams.java
        FrenchUnknownWordModel.java
        FrenchUnknownWordModelTrainer.java
        GermanUnknownWordModel.java
        GermanUnknownWordModelTrainer.java
        GrammarCompactor.java
        GrammarProjection.java
        HTKLatticeReader.java
        HebrewTreebankParserParams.java
        Hook.java
        HookChart.java
        IntDependency.java
        IntTaggedWord.java
        Interner.java
        Item.java
        IterativeCKYPCFGParser.java
        Lattice.java
        LatticeEdge.java
        LatticeScorer.java
        LexicalizedParser.java
        LexicalizedParserQuery.java
        Lexicon.java
        LinearGrammarSmoother.java
        MLEDependencyGrammar.java
        MLEDependencyGrammarExtractor.java
        NegraPennCollinizer.java
        NegraPennTreebankParserParams.java
        NodePruner.java
        NullGrammarProjection.java
        Options.java
        OutsideRuleFilter.java
        ParentAnnotationStats.java
        ParseFiles.java
        ParserUtils.java
        PostSplitter.java
        ProjectionScorer.java
        RandomWalk.java
        Reranker.java
        RerankerQuery.java
        RerankingParserQuery.java
        Rule.java
        Scorer.java
        SisterAnnotationStats.java
        SplittingGrammarExtractor.java
        TagProjection.java
        TestOptions.java
        TestTagProjection.java
        TrainOptions.java
        TreeAnnotator.java
        TreeAnnotatorAndBinarizer.java
        TreeBinarizer.java
        TreeCollinizer.java
        TreebankAnnotator.java
        TreebankLangParserParams.java
        TwinScorer.java
        UnaryGrammar.java
        UnaryRule.java
        UnknownGTTrainer.java
        UnknownWordModel.java
        UnknownWordModelTrainer.java
        metrics
        AbstractEval.java
        BestOfTopKEval.java
        Eval.java
        Evalb.java
        EvalbByCat.java
        FilteredEval.java
        LeafAncestorEval.java
        ParserQueryEval.java
        TaggingEval.java
        TopMatchEval.java
        TreeSpanScoring.java
        UnlabeledAttachmentEval.java
        shiftreduce
        BasicFeatureFactory.java
        BinaryTransition.java
        CombinationFeatureFactory.java
        CompoundUnaryTransition.java
        CreateTransitionSequence.java
        DistsimFeatureFactory.java
        FeatureFactory.java
        FinalizeTransition.java
        IdleTransition.java
        Oracle.java
        OracleTransition.java
        ShiftReduceOptions.java
        ShiftReduceParser.java
        ShiftReduceParserQuery.java
        ShiftReduceTestOptions.java
        ShiftReduceTrainOptions.java
        ShiftReduceUtils.java
        ShiftTransition.java
        State.java
        Transition.java
        TreeRecorder.java
        UnaryTransition.java
        Weight.java
        tools
        PunctEquivalenceClasser.java
        patterns
        surface
        AnnotatedTextReader.java
        ApplyPatternsMulti.java
        ConstantsAndVariables.java
        CreatePatterns.java
        Data.java
        EditDistanceDamerauLevenshteinLike.java
        GetPatternsFromDataMultiClass.java
        InvertedIndexByTokens.java
        LearnImportantFeatures.java
        PatternToken.java
        PatternsAnnotations.java
        PhraseScorer.java
        ScorePatterns.java
        ScorePatternsF1.java
        ScorePatternsFreqBased.java
        ScorePatternsRatioModifiedFreq.java
        ScorePhrases.java
        ScorePhrasesAverageFeatures.java
        SurfacePattern.java
        pipeline
        Annotation.java
        AnnotationPipeline.java
        AnnotationSerializer.java
        Annotator.java
        AnnotatorFactory.java
        AnnotatorPool.java
        CharniakParserAnnotator.java
        ChineseSegmenterAnnotator.java
        ChunkAnnotationUtils.java
        CleanXmlAnnotator.java
        CoreMapAggregator.java
        CoreMapAttributeAggregator.java
        CustomAnnotationSerializer.java
        DefaultPaths.java
        DeterministicCorefAnnotator.java
        GenderAnnotator.java
        LabeledChunkIdentifier.java
        MorphaAnnotator.java
        NERCombinerAnnotator.java
        POSTaggerAnnotator.java
        PTBTokenizerAnnotator.java
        ParserAnnotator.java
        ParserAnnotatorUtils.java
        RegexNERAnnotator.java
        RelationExtractorAnnotator.java
        Requirement.java
        SentimentAnnotator.java
        StanfordCoreNLP.java
        TextOutputter.java
        TokenizerAnnotator.java
        TokensRegexAnnotator.java
        TokensRegexNERAnnotator.java
        TrueCaseAnnotator.java
        WhitespaceTokenizerAnnotator.java
        WordsToSentencesAnnotator.java
        XMLOutputter.java
        process
        AbstractListProcessor.java
        AbstractTokenizer.java
        Americanize.java
        AmericanizeFunction.java
        ChineseDocumentToSentenceProcessor.java
        CoreLabelTokenFactory.java
        CoreTokenFactory.java
        DistSimClassifier.java
        DocumentPreprocessor.java
        DocumentProcessor.java
        JFlexDummyLexer.java
        LexedTokenFactory.java
        LexerTokenizer.java
        ListProcessor.java
        LowercaseAndAmericanizeFunction.java
        LowercaseFunction.java
        Morpha.java
        Morphology.java
        PTB2TextLexer.java
        PTBEscapingProcessor.java
        PTBLexer.java
        PTBTokenizer.java
        SerializableFunction.java
        StripTagsProcessor.java
        Tokenizer.java
        TokenizerAdapter.java
        TokenizerFactory.java
        TransformXML.java
        WhitespaceLexer.java
        WhitespaceTokenizer.java
        WordSegmenter.java
        WordSegmentingTokenizer.java
        WordShapeClassifier.java
        WordToSentenceProcessor.java
        WordTokenFactory.java
        semgraph
        SemanticGraph.java
        SemanticGraphCoreAnnotations.java
        SemanticGraphEdge.java
        SemanticGraphFactory.java
        SemanticGraphFormatter.java
        sentiment
        BuildBinarizedDataset.java
        CollapseUnaryTransformer.java
        Evaluate.java
        RNNOptions.java
        RNNTestOptions.java
        RNNTrainOptions.java
        ReadSentimentDataset.java
        SentimentCoreAnnotations.java
        SentimentCostAndGradient.java
        SentimentModel.java
        SentimentPipeline.java
        SentimentTraining.java
        SentimentUtils.java
        sequences
        BeamBestSequenceFinder.java
        BestSequenceFinder.java
        Clique.java
        CoNLLDocumentReaderAndWriter.java
        ColumnDocumentReaderAndWriter.java
        CoolingSchedule.java
        DocumentReaderAndWriter.java
        ExactBestSequenceFinder.java
        FactoredSequenceListener.java
        FactoredSequenceModel.java
        FeatureFactory.java
        KBestSequenceFinder.java
        LatticeWriter.java
        ObjectBankWrapper.java
        PlainTextDocumentReaderAndWriter.java
        SeqClassifierFlags.java
        SequenceGibbsSampler.java
        SequenceListener.java
        SequenceModel.java
        SequenceSampler.java
        TrueCasingForNISTDocumentReaderAndWriter.java
        ViterbiSearchGraphBuilder.java
        stats
        AbstractCounter.java
        AccuracyStats.java
        ClassicCounter.java
        Counter.java
        Counters.java
        Distribution.java
        EquivalenceClasser.java
        GeneralizedCounter.java
        IntCounter.java
        MultiClassAccuracyStats.java
        MultiClassChunkEvalStats.java
        MultiClassPrecisionRecallExtendedStats.java
        MultiClassPrecisionRecallStats.java
        PrecisionRecallStats.java
        ProbabilityDistribution.java
        Sampler.java
        Scorer.java
        SimpleGoodTuring.java
        TwoDimensionalCounter.java
        TwoDimensionalCounterInterface.java
        TwoDimensionalIntCounter.java
        tagger
        common
        Tagger.java
        io
        TSVTaggedFileReader.java
        TaggedFileReader.java
        TaggedFileRecord.java
        TextTaggedFileReader.java
        TreeTaggedFileReader.java
        maxent
        ASBCunkDict.java
        AmbiguityClass.java
        AmbiguityClasses.java
        CTBunkDict.java
        CountWrapper.java
        CtbDict.java
        DataWordTag.java
        Dictionary.java
        DictionaryExtractor.java
        Distsim.java
        Extractor.java
        ExtractorDistsim.java
        ExtractorDistsimConjunction.java
        ExtractorFrames.java
        ExtractorFramesRare.java
        ExtractorVerbalVBNZero.java
        Extractors.java
        FeatureKey.java
        History.java
        HistoryTable.java
        LambdaSolveTagger.java
        MaxentTagger.java
        PairsHolder.java
        ReadDataTagged.java
        TTags.java
        TagCount.java
        TaggerConfig.java
        TaggerExperiments.java
        TaggerFeature.java
        TaggerFeatures.java
        TemplateHash.java
        TestClassifier.java
        TestSentence.java
        time
        GUTimeAnnotator.java
        GenericTimeExpressionPatterns.java
        HeidelTimeAnnotator.java
        JodaTimeUtils.java
        JollyDayHolidays.java
        Options.java
        SUTime.java
        SUTimeMain.java
        TimeAnnotations.java
        TimeAnnotator.java
        TimeExpression.java
        TimeExpressionExtractor.java
        TimeExpressionExtractorFactory.java
        TimeExpressionExtractorImpl.java
        TimeExpressionPatterns.java
        TimeFormatter.java
        Timex.java
        XMLUtils.java
        trees
        AbstractCollinsHeadFinder.java
        AbstractTreebankLanguagePack.java
        BasicCategoryTreeTransformer.java
        BobChrisTreeNormalizer.java
        CollinsHeadFinder.java
        CollocationFinder.java
        CompositeTreeTransformer.java
        CompositeTreebank.java
        Constituent.java
        ConstituentFactory.java
        CoordinationTransformer.java
        CopulaHeadFinder.java
        DateTreeTransformer.java
        DeepTree.java
        Dependencies.java
        Dependency.java
        DependencyFactory.java
        DependencyPrinter.java
        DependencyReader.java
        DependencyTreeTransformer.java
        DependencyTyper.java
        DiskTreebank.java
        EnglishGrammaticalRelations.java
        EnglishGrammaticalStructure.java
        EnglishGrammaticalStructureFactory.java
        EnglishPTBTreebankCorrector.java
        FilteringTreeReader.java
        FilteringTreebank.java
        GrammaticalRelation.java
        GrammaticalStructure.java
        GrammaticalStructureFactory.java
        GrammaticalStructureFromDependenciesFactory.java
        HasParent.java
        HeadFinder.java
        Labeled.java
        LabeledConstituent.java
        LabeledScoredConstituent.java
        LabeledScoredConstituentFactory.java
        LabeledScoredTreeFactory.java
        LabeledScoredTreeNode.java
        LabeledScoredTreeReaderFactory.java
        LeftHeadFinder.java
        LengthTreeFilter.java
        MemoryTreebank.java
        ModCollinsHeadFinder.java
        NPTmpRetainingTreeNormalizer.java
        NamedDependency.java
        PennTreeReader.java
        PennTreeReaderFactory.java
        PennTreebankLanguagePack.java
        PennTreebankTokenizer.java
        QPTreeTransformer.java
        RecursiveTreeTransformer.java
        SemanticHeadFinder.java
        SimpleConstituent.java
        SimpleConstituentFactory.java
        SimpleTree.java
        SimpleTreeFactory.java
        Span.java
        SynchronizedTreeTransformer.java
        TransformingTreebank.java
        Tree.java
        TreeCoreAnnotations.java
        TreeFactory.java
        TreeFilters.java
        TreeFunctions.java
        TreeGraph.java
        TreeGraphNode.java
        TreeGraphNodeFactory.java
        TreeLeafLabelTransformer.java
        TreeLemmatizer.java
        TreeLengthComparator.java
        TreeNormalizer.java
        TreePrint.java
        TreeReader.java
        TreeReaderFactory.java
        TreeTokenizerFactory.java
        TreeTransformer.java
        TreeVisitor.java
        Treebank.java
        TreebankFactory.java
        TreebankLanguagePack.java
        TreebankTransformer.java
        Treebanks.java
        Trees.java
        TypedDependency.java
        UnnamedConcreteDependency.java
        UnnamedDependency.java
        WordNetConnection.java
        WordStemmer.java
        international
        arabic
        ATBTreeUtils.java
        ArabicHeadFinder.java
        ArabicTreeNormalizer.java
        ArabicTreeReaderFactory.java
        ArabicTreebankLanguagePack.java
        ArabicTreebankTokenizer.java
        french
        DybroFrenchHeadFinder.java
        FrenchHeadFinder.java
        FrenchTreeNormalizer.java
        FrenchTreeReaderFactory.java
        FrenchTreebankLanguagePack.java
        FrenchXMLTreeReader.java
        FrenchXMLTreeReaderFactory.java
        hebrew
        HebrewTreeNormalizer.java
        HebrewTreeReaderFactory.java
        HebrewTreebankLanguagePack.java
        negra
        NegraHeadFinder.java
        NegraLabel.java
        NegraPennLanguagePack.java
        NegraPennLexer.java
        NegraPennTokenizer.java
        NegraPennTreeNormalizer.java
        NegraPennTreeReaderFactory.java
        pennchinese
        BikelChineseHeadFinder.java
        CEDict.java
        CHTBLexer.java
        CHTBTokenizer.java
        CTBErrorCorrectingTreeNormalizer.java
        CTBTreeReaderFactory.java
        ChineseCollinizer.java
        ChineseEnglishWordMap.java
        ChineseEscaper.java
        ChineseGrammaticalRelations.java
        ChineseGrammaticalStructure.java
        ChineseGrammaticalStructureFactory.java
        ChineseHeadFinder.java
        ChineseSemanticHeadFinder.java
        ChineseTreebankLanguagePack.java
        ChineseUtils.java
        FragDiscardingPennTreeReader.java
        RadicalMap.java
        SunJurafskyChineseHeadFinder.java
        treebank
        Mapper.java
        tregex
        CoordinationPattern.java
        DescriptionPattern.java
        Macros.java
        ParseException.java
        Relation.java
        SimpleCharStream.java
        Token.java
        TokenMgrError.java
        TregexMatcher.java
        TregexParseException.java
        TregexParser.java
        TregexParserConstants.java
        TregexParserTokenManager.java
        TregexPattern.java
        TregexPatternCompiler.java
        VariableStrings.java
        tsurgeon
        AdjoinNode.java
        AdjoinToFootNode.java
        AdjoinToHeadNode.java
        AuxiliaryTree.java
        CoindexNodes.java
        CoindexationGenerator.java
        CreateSubtreeNode.java
        DeleteNode.java
        ExciseNode.java
        FetchNode.java
        HoldTreeNode.java
        IfExistsNode.java
        InsertNode.java
        JJTTsurgeonParserState.java
        MoveNode.java
        Node.java
        ParseException.java
        PruneNode.java
        RelabelNode.java
        ReplaceNode.java
        SimpleCharStream.java
        SimpleNode.java
        Token.java
        TokenMgrError.java
        TreeLocation.java
        Tsurgeon.java
        TsurgeonParseException.java
        TsurgeonParser.java
        TsurgeonParserConstants.java
        TsurgeonParserTokenManager.java
        TsurgeonParserTreeConstants.java
        TsurgeonPattern.java
        TsurgeonPatternRoot.java
        TsurgeonRuntimeException.java
        util
        AbstractIterator.java
        ArrayCoreMap.java
        ArrayHeap.java
        ArrayMap.java
        ArraySet.java
        ArrayStringFilter.java
        ArrayUtils.java
        Beam.java
        BinaryHeapPriorityQueue.java
        ByteStreamGobbler.java
        CacheMap.java
        Characters.java
        CollectionFactory.java
        CollectionUtils.java
        CollectionValuedMap.java
        Comparators.java
        ConcatenationIterator.java
        ConfusionMatrix.java
        ConvertByteArray.java
        CoreMap.java
        DataFilePaths.java
        DeltaCollectionValuedMap.java
        DeltaIndex.java
        DeltaMap.java
        EditDistance.java
        ErasureUtils.java
        Execution.java
        Factory.java
        FilePathProcessor.java
        FileProcessor.java
        Filter.java
        FilteredIterator.java
        Filters.java
        FixedPrioritiesPriorityQueue.java
        Function.java
        FuzzyInterval.java
        Generics.java
        HasInterval.java
        HashIndex.java
        HashableCoreMap.java
        Heap.java
        IdentityHashSet.java
        Index.java
        IntPair.java
        IntQuadruple.java
        IntTriple.java
        IntTuple.java
        IntUni.java
        Interner.java
        Interval.java
        IntervalTree.java
        IterableIterator.java
        Iterables.java
        MapFactory.java
        Maps.java
        MemoryMonitor.java
        MetaClass.java
        MutableDouble.java
        MutableInteger.java
        MutableLong.java
        PaddedList.java
        Pair.java
        PriorityQueue.java
        PropertiesUtils.java
        Quadruple.java
        ReflectionLoading.java
        RuntimeInterruptedException.java
        Scored.java
        ScoredComparator.java
        ScoredObject.java
        Sets.java
        StreamGobbler.java
        StringParsingTask.java
        StringUtils.java
        SystemUtils.java
        ThreeDimensionalMap.java
        Timing.java
        TreeShapedStack.java
        Triple.java
        TwoDimensionalCollectionValuedMap.java
        TwoDimensionalMap.java
        TwoDimensionalSet.java
        TypesafeMap.java
        UTF8EquivalenceFunction.java
        ValuedInterval.java
        XMLUtils.java
        concurrent
        MulticoreWrapper.java
        SynchronizedInterner.java
        ThreadsafeProcessor.java
        logging
        Color.java
        JavaUtilLoggingAdaptor.java
        LogRecordHandler.java
        NewlineLogFormatter.java
        OutputHandler.java
        PrettyLoggable.java
        PrettyLogger.java
        RedirectOutputHandler.java
        Redwood.java
        RedwoodConfiguration.java
        RedwoodPrintStream.java
        RepeatedRecordHandler.java
        RerouteChannel.java
        StanfordRedwoodConfiguration.java
        Style.java
        VisibilityHandler.java
        wordseg
        ChineseDictionary.java
        ChineseSegmenterFeatureFactory.java
        ChineseStringUtils.java
        CorpusChar.java
        CorpusDictionary.java
        Gale2007ChineseSegmenterFeatureFactory.java
        NonDict2.java
        Sighan2005DocumentReaderAndWriter.java
        TagAffixDetector.java
        affDict.java

// AbstractSequenceClassifier -- a framework for probabilistic sequence models.
// Copyright (c) 2002-2008 The Board of Trustees of
// The Leland Stanford Junior University. All Rights Reserved.
//
// This program is free software; you can redistribute it and/or
// modify it under the terms of the GNU General Public License
// as published by the Free Software Foundation; either version 2
// of the License, or (at your option) any later version.
//
// This program is distributed in the hope that it will be useful,
// but WITHOUT ANY WARRANTY; without even the implied warranty of
// MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
// GNU General Public License for more details.
//
// You should have received a copy of the GNU General Public License
// along with this program; if not, write to the Free Software
// Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.
//
// For more information, bug reports, fixes, contact:
//    Christopher Manning
//    Dept of Computer Science, Gates 1A
//    Stanford CA 94305-9010
//    USA
//    Support/Questions: java-nlp-user@lists.stanford.edu
//    Licensing: java-nlp-support@lists.stanford.edu
//    http://nlp.stanford.edu/downloads/crf-classifier.shtml

package edu.stanford.nlp.ie;

import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileFilter;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.ObjectInputStream;
import java.io.OutputStream;
import java.io.PrintWriter;
import java.io.StringWriter;
import java.net.URL;
import java.text.DecimalFormat;
import java.text.NumberFormat;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Collections;
import java.util.List;
import java.util.Properties;
import java.util.Set;
import java.util.TreeSet;
import java.util.concurrent.ConcurrentHashMap;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.regex.Pattern;
import java.util.zip.GZIPInputStream;

import edu.stanford.nlp.fsm.DFSA;
import edu.stanford.nlp.io.IOUtils;
import edu.stanford.nlp.io.RegExFileFilter;
import edu.stanford.nlp.io.RuntimeIOException;
import edu.stanford.nlp.ling.CoreAnnotation;
import edu.stanford.nlp.ling.CoreAnnotations;
import edu.stanford.nlp.ling.CoreLabel;
import edu.stanford.nlp.ling.HasWord;
import edu.stanford.nlp.objectbank.ObjectBank;
import edu.stanford.nlp.objectbank.ResettableReaderIteratorFactory;
import edu.stanford.nlp.process.CoreLabelTokenFactory;
import edu.stanford.nlp.process.CoreTokenFactory;
import edu.stanford.nlp.sequences.DocumentReaderAndWriter;
import edu.stanford.nlp.sequences.FeatureFactory;
import edu.stanford.nlp.sequences.KBestSequenceFinder;
import edu.stanford.nlp.sequences.LatticeWriter;
import edu.stanford.nlp.sequences.ObjectBankWrapper;
import edu.stanford.nlp.sequences.PlainTextDocumentReaderAndWriter;
import edu.stanford.nlp.sequences.SeqClassifierFlags;
import edu.stanford.nlp.sequences.SequenceModel;
import edu.stanford.nlp.sequences.SequenceSampler;
import edu.stanford.nlp.sequences.ViterbiSearchGraphBuilder;
import edu.stanford.nlp.stats.ClassicCounter;
import edu.stanford.nlp.stats.Counter;
import edu.stanford.nlp.stats.Counters;
import edu.stanford.nlp.stats.Sampler;
import edu.stanford.nlp.util.CoreMap;
import edu.stanford.nlp.util.Function;
import edu.stanford.nlp.util.Generics;
import edu.stanford.nlp.util.Index;
import edu.stanford.nlp.util.MetaClass;
import edu.stanford.nlp.util.ReflectionLoading;
import edu.stanford.nlp.util.StringUtils;
import edu.stanford.nlp.util.Timing;
import edu.stanford.nlp.util.Triple;
import edu.stanford.nlp.util.concurrent.MulticoreWrapper;
import edu.stanford.nlp.util.concurrent.ThreadsafeProcessor;

/**
 * This class provides common functionality for (probabilistic) sequence models.
 * It is a superclass of our CMM and CRF sequence classifiers, and is even used
 * in the (deterministic) NumberSequenceClassifier. See implementing classes for
 * more information.
 * <p>
 * A full implementation should implement these 5 abstract methods: <br>
 * {@code List<CoreLabel> classify(List<CoreLabel> document); } <br>
 * {@code void train(Collection<List<CoreLabel>> docs); } <br>
 * {@code printProbsDocument(List<CoreLabel> document); } <br>
 * {@code void serializeClassifier(String serializePath); } <br>
 * {@code void loadClassifier(ObjectInputStream in, Properties props) throws IOException,
 * ClassCastException, ClassNotFoundException; } <br>
 * but a runtime (or rule-based) implementation can usefully implement just the
 * first.
 * 
 * @author Jenny Finkel
 * @author Dan Klein
 * @author Christopher Manning
 * @author Dan Cer
 * @author sonalg (made the class generic)
 */
public abstract class AbstractSequenceClassifier<IN extends CoreMap> implements
		Function<String, String> {

	public SeqClassifierFlags flags;
	public Index<String> classIndex; // = null;

	// Thang Sep13: multiple feature factories (NERFeatureFactory,
	// EmbeddingFeatureFactory)
	public List<FeatureFactory<IN>> featureFactories;

	protected IN pad;
	private CoreTokenFactory<IN> tokenFactory;
	public int windowSize;
	// different threads can add or query knownLCWords at the same time,
	// so we need a concurrent data structure. created in reinit()
	protected Set<String> knownLCWords = null;

	private DocumentReaderAndWriter<IN> defaultReaderAndWriter;

	public DocumentReaderAndWriter<IN> defaultReaderAndWriter() {
		return defaultReaderAndWriter;
	}

	private DocumentReaderAndWriter<IN> plainTextReaderAndWriter;

	public DocumentReaderAndWriter<IN> plainTextReaderAndWriter() {
		return plainTextReaderAndWriter;
	}

	/**
	 * Construct a SeqClassifierFlags object based on the passed in properties,
	 * and then call the other constructor.
	 * 
	 * @param props
	 *            See SeqClassifierFlags for known properties.
	 */
	public AbstractSequenceClassifier(Properties props) {
		this(new SeqClassifierFlags(props));
	}

	/**
	 * Initialize the featureFactory and other variables based on the passed in
	 * flags.
	 * 
	 * @param flags
	 *            A specification of the AbstractSequenceClassifier to
	 *            construct.
	 */
	public AbstractSequenceClassifier(SeqClassifierFlags flags) {
		this.flags = flags;

		// try {
		// Thang Sep13: allow for multiple feature factories.
		this.featureFactories = Generics.newArrayList();
		if (flags.featureFactory != null) {
			FeatureFactory factory = new MetaClass(flags.featureFactory)
					.createInstance(flags.featureFactoryArgs); // for
																// compatibility
			featureFactories.add(factory);
		}
		if (flags.featureFactories != null) {
			for (int i = 0; i < flags.featureFactories.length; i++) {
				FeatureFactory<IN> indFeatureFactory = new MetaClass(
						flags.featureFactories[i])
						.createInstance(flags.featureFactoriesArgs.get(i));
				this.featureFactories.add(indFeatureFactory);
			}
		}
		if (flags.tokenFactory == null) {
			tokenFactory = (CoreTokenFactory<IN>) new CoreLabelTokenFactory();
		} else {
			this.tokenFactory = new MetaClass(flags.tokenFactory)
					.createInstance(flags.tokenFactoryArgs);
			// this.tokenFactory = (CoreTokenFactory<IN>)
			// Class.forName(flags.tokenFactory).newInstance();
		}
		// } catch (Exception e) {
		// throw new RuntimeException(e);
		// }
		pad = tokenFactory.makeToken();
		windowSize = flags.maxLeft + 1;
		reinit();
	}

	/**
	 * This method should be called after there have been changes to the flags
	 * (SeqClassifierFlags) variable, such as after deserializing a classifier.
	 * It is called inside the loadClassifier methods. It assumes that the flags
	 * variable and the pad variable exist, but reinitializes things like the
	 * pad variable, featureFactory and readerAndWriter based on the flags.
	 * <p>
	 * <i>Implementation note:</i> At the moment this variable doesn't set
	 * windowSize or featureFactory, since they are being serialized separately
	 * in the file, but we should probably stop serializing them and just
	 * reinitialize them from the flags?
	 */
	protected final void reinit() {
		pad.set(CoreAnnotations.AnswerAnnotation.class, flags.backgroundSymbol);
		pad.set(CoreAnnotations.GoldAnswerAnnotation.class,
				flags.backgroundSymbol);

		for (FeatureFactory featureFactory : featureFactories) {
			featureFactory.init(flags);
		}

		defaultReaderAndWriter = makeReaderAndWriter();
		if (flags.readerAndWriter != null
				&& flags.readerAndWriter
						.equals(flags.plainTextDocumentReaderAndWriter)) {
			plainTextReaderAndWriter = defaultReaderAndWriter;
		} else {
			plainTextReaderAndWriter = makePlainTextReaderAndWriter();
		}

		if (!flags.useKnownLCWords) {
			knownLCWords = Collections.emptySet();
		} else if (knownLCWords == null || knownLCWords.size() == 0) {
			knownLCWords = Collections
					.newSetFromMap(new ConcurrentHashMap<String, Boolean>());
		}
	}

	/**
	 * Makes a DocumentReaderAndWriter based on the flags the CRFClassifier was
	 * constructed with. Will create an instance of the class specified in the
	 * property flags.readerAndWriter and initialize it with the CRFClassifier's
	 * flags.
	 * 
	 * @return The appropriate ReaderAndWriter for training/testing this
	 *         classifier
	 */
	public DocumentReaderAndWriter<IN> makeReaderAndWriter() {
		DocumentReaderAndWriter<IN> readerAndWriter;
		try {
			readerAndWriter = ReflectionLoading
					.loadByReflection(flags.readerAndWriter);
		} catch (Exception e) {
			throw new RuntimeException(String.format(
					"Error loading flags.readerAndWriter: '%s'",
					flags.readerAndWriter), e);
		}
		readerAndWriter.init(flags);
		return readerAndWriter;
	}

	/**
	 * Makes a DocumentReaderAndWriter based on flags.plainTextReaderAndWriter.
	 * Useful for reading in untokenized text documents or reading plain text
	 * from the command line. An example of a way to use this would be to return
	 * a edu.stanford.nlp.wordseg.Sighan2005DocumentReaderAndWriter for the
	 * Chinese Segmenter.
	 */
	public DocumentReaderAndWriter<IN> makePlainTextReaderAndWriter() {
		String readerClassName = flags.plainTextDocumentReaderAndWriter;
		// We set this default here if needed because there may be models
		// which don't have the reader flag set
		if (readerClassName == null) {
			readerClassName = SeqClassifierFlags.DEFAULT_PLAIN_TEXT_READER;
		}
		DocumentReaderAndWriter<IN> readerAndWriter;
		try {
			readerAndWriter = ReflectionLoading
					.loadByReflection(readerClassName);
		} catch (Exception e) {
			throw new RuntimeException(
					String.format(
							"Error loading flags.plainTextDocumentReaderAndWriter: '%s'",
							flags.plainTextDocumentReaderAndWriter), e);
		}
		readerAndWriter.init(flags);
		return readerAndWriter;
	}

	/**
	 * Returns the background class for the classifier.
	 * 
	 * @return The background class name
	 */
	public String backgroundSymbol() {
		return flags.backgroundSymbol;
	}

	public Set<String> labels() {
		return Generics.newHashSet(classIndex.objectsList());
	}

	/**
	 * Classify a List of IN. This method returns a new list of tokens, not the
	 * list of tokens passed in, and runs the new tokens through
	 * ObjectBankWrapper. (Both these behaviors are different from that of the
	 * classify(List) method.
	 * 
	 * @param sentence
	 *            The List of IN to be classified.
	 * @return The classified List of IN, where the classifier output for each
	 *         token is stored in its
	 *         {@link edu.stanford.nlp.ling.CoreAnnotations.AnswerAnnotation}
	 *         field.
	 */
	public List<IN> classifySentence(List<? extends HasWord> sentence) {
		List<IN> document = new ArrayList<IN>();
		int i = 0;
		for (HasWord word : sentence) {
			IN wi; // initialized below
			if (word instanceof CoreMap) {
				// copy all annotations! some are required later in
				// AbstractSequenceClassifier.classifyWithInlineXML
				// wi = (IN) new ArrayCoreMap((ArrayCoreMap) word);
				wi = tokenFactory.makeToken((IN) word);
			} else {
				wi = tokenFactory.makeToken();
				wi.set(CoreAnnotations.TextAnnotation.class, word.word());
				// wi.setWord(word.word());
			}
			wi.set(CoreAnnotations.PositionAnnotation.class,
					Integer.toString(i));
			wi.set(CoreAnnotations.AnswerAnnotation.class, backgroundSymbol());
			document.add(wi);
			i++;
		}

		// TODO get rid of objectbankwrapper
		ObjectBankWrapper<IN> wrapper = new ObjectBankWrapper<IN>(flags, null,
				knownLCWords);
		wrapper.processDocument(document);

		classify(document);

		return document;
	}

	/**
	 * Classify a List of IN using whatever additional information is passed in
	 * globalInfo. Used by SUTime (NumberSequenceClassifier), which requires the
	 * doc date to resolve relative dates
	 * 
	 * @param tokenSequence
	 *            The List of IN to be classified.
	 * @return The classified List of IN, where the classifier output for each
	 *         token is stored in its "answer" field.
	 */
	public List<IN> classifySentenceWithGlobalInformation(
			List<? extends HasWord> tokenSequence, final CoreMap doc,
			final CoreMap sentence) {
		List<IN> document = new ArrayList<IN>();
		int i = 0;
		for (HasWord word : tokenSequence) {
			IN wi; // initialized straight below
			if (word instanceof CoreMap) {
				// copy all annotations! some are required later in
				// AbstractSequenceClassifier.classifyWithInlineXML
				// wi = (IN) new ArrayCoreMap((ArrayCoreMap) word);
				wi = tokenFactory.makeToken((IN) word);
			} else {
				wi = tokenFactory.makeToken();
				wi.set(CoreAnnotations.TextAnnotation.class, word.word());
				// wi.setWord(word.word());
			}
			wi.set(CoreAnnotations.PositionAnnotation.class,
					Integer.toString(i));
			wi.set(CoreAnnotations.AnswerAnnotation.class, backgroundSymbol());
			document.add(wi);
			i++;
		}

		// TODO get rid of objectbankwrapper
		ObjectBankWrapper<IN> wrapper = new ObjectBankWrapper<IN>(flags, null,
				knownLCWords);
		wrapper.processDocument(document);

		classifyWithGlobalInformation(document, doc, sentence);

		return document;
	}

	public SequenceModel getSequenceModel(List<IN> doc) {
		throw new UnsupportedOperationException();
	}

	public Sampler<List<IN>> getSampler(final List<IN> input) {
		return new Sampler<List<IN>>() {
			SequenceModel model = getSequenceModel(input);
			SequenceSampler sampler = new SequenceSampler();

			@Override
			public List<IN> drawSample() {
				int[] sampleArray = sampler.bestSequence(model);
				List<IN> sample = new ArrayList<IN>();
				int i = 0;
				for (IN word : input) {

					IN newWord = tokenFactory.makeToken(word);
					newWord.set(CoreAnnotations.AnswerAnnotation.class,
							classIndex.get(sampleArray[i++]));
					sample.add(newWord);
				}
				return sample;
			}
		};
	}

	public Counter<List<IN>> classifyKBest(List<IN> doc,
			Class<? extends CoreAnnotation<String>> answerField, int k) {

		if (doc.isEmpty()) {
			return new ClassicCounter<List<IN>>();
		}

		// TODO get rid of ObjectBankWrapper
		// i'm sorry that this is so hideous - JRF
		ObjectBankWrapper<IN> obw = new ObjectBankWrapper<IN>(flags, null,
				knownLCWords);
		doc = obw.processDocument(doc);

		SequenceModel model = getSequenceModel(doc);

		KBestSequenceFinder tagInference = new KBestSequenceFinder();
		Counter<int[]> bestSequences = tagInference.kBestSequences(model, k);

		Counter<List<IN>> kBest = new ClassicCounter<List<IN>>();

		for (int[] seq : bestSequences.keySet()) {
			List<IN> kth = new ArrayList<IN>();
			int pos = model.leftWindow();
			for (IN fi : doc) {
				IN newFL = tokenFactory.makeToken(fi);
				String guess = classIndex.get(seq[pos]);
				fi.remove(CoreAnnotations.AnswerAnnotation.class); // because
																	// fake
																	// answers
																	// will get
				// added during testing
				newFL.set(answerField, guess);
				pos++;
				kth.add(newFL);
			}
			kBest.setCount(kth, bestSequences.getCount(seq));
		}

		return kBest;
	}

	public DFSA<String, Integer> getViterbiSearchGraph(List<IN> doc,
			Class<? extends CoreAnnotation<String>> answerField) {
		if (doc.isEmpty()) {
			return new DFSA<String, Integer>(null);
		}
		// TODO get rid of objectbankwrapper
		ObjectBankWrapper<IN> obw = new ObjectBankWrapper<IN>(flags, null,
				knownLCWords);
		doc = obw.processDocument(doc);
		SequenceModel model = getSequenceModel(doc);
		return ViterbiSearchGraphBuilder.getGraph(model, classIndex);
	}

	/**
	 * Classify the tokens in a String. Each sentence becomes a separate
	 * document.
	 * 
	 * @param str
	 *            A String with tokens in one or more sentences of text to be
	 *            classified.
	 * @return {@link List} of classified sentences (each a List of something
	 *         that extends {@link CoreMap}).
	 */
	public List<List<IN>> classify(String str) {
		ObjectBank<List<IN>> documents = makeObjectBankFromString(str,
				plainTextReaderAndWriter);
		List<List<IN>> result = new ArrayList<List<IN>>();

		for (List<IN> document : documents) {
			classify(document);

			List<IN> sentence = new ArrayList<IN>();
			for (IN wi : document) {
				// TaggedWord word = new TaggedWord(wi.word(), wi.answer());
				// sentence.add(word);
				sentence.add(wi);
			}
			result.add(sentence);
		}
		return result;
	}

	/**
	 * Classify the tokens in a String. Each sentence becomes a separate
	 * document. Doesn't override default readerAndWriter.
	 * 
	 * @param str
	 *            A String with tokens in one or more sentences of text to be
	 *            classified.
	 * @return {@link List} of classified sentences (each a List of something
	 *         that extends {@link CoreMap}).
	 */
	public List<List<IN>> classifyRaw(String str,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		ObjectBank<List<IN>> documents = makeObjectBankFromString(str,
				readerAndWriter);
		List<List<IN>> result = new ArrayList<List<IN>>();

		for (List<IN> document : documents) {
			classify(document);

			List<IN> sentence = new ArrayList<IN>();
			for (IN wi : document) {
				// TaggedWord word = new TaggedWord(wi.word(), wi.answer());
				// sentence.add(word);
				sentence.add(wi);
			}
			result.add(sentence);
		}
		return result;
	}

	/**
	 * Classify the contents of a file.
	 * 
	 * @param filename
	 *            Contains the sentence(s) to be classified.
	 * @return {@link List} of classified List of IN.
	 */
	public List<List<IN>> classifyFile(String filename) {
		ObjectBank<List<IN>> documents = makeObjectBankFromFile(filename,
				plainTextReaderAndWriter);
		List<List<IN>> result = new ArrayList<List<IN>>();

		for (List<IN> document : documents) {
			// System.err.println(document);
			classify(document);

			List<IN> sentence = new ArrayList<IN>();
			for (IN wi : document) {
				sentence.add(wi);
				// System.err.println(wi);
			}
			result.add(sentence);
		}
		return result;
	}

	/**
	 * Maps a String input to an XML-formatted rendition of applying NER to the
	 * String. Implements the Function interface. Calls
	 * classifyWithInlineXML(String) [q.v.].
	 */
	@Override
	public String apply(String in) {
		return classifyWithInlineXML(in);
	}

	/**
	 * Classify the contents of a {@link String} to one of several String
	 * representations that shows the classes. Plain text or XML input is
	 * expected and the {@link PlainTextDocumentReaderAndWriter} is used. The
	 * classifier will tokenize the text and treat each sentence as a separate
	 * document. The output can be specified to be in a choice of three formats:
	 * slashTags (e.g., Bill/PERSON Smith/PERSON died/O ./O), inlineXML (e.g.,
	 * <PERSON>Bill Smith</PERSON> went to
	 * <LOCATION>Paris</LOCATION> .), or xml, for stand-off XML
	 * (e.g., <wi num="0" entity="PERSON">Sue</wi> <wi num="1"
	 * entity="O">shouted</wi> ). There is also a binary choice as to
	 * whether the spacing between tokens of the original is preserved or
	 * whether the (tagged) tokens are printed with a single space (for
	 * inlineXML or slashTags) or a single newline (for xml) between each one.
	 * <p>
	 * <i>Fine points:</i> The slashTags and xml formats show tokens as
	 * transformed by any normalization processes inside the tokenizer, while
	 * inlineXML shows the tokens exactly as they appeared in the source text.
	 * When a period counts as both part of an abbreviation and as an end of
	 * sentence marker, it is included twice in the output String for slashTags
	 * or xml, but only once for inlineXML, where it is not counted as part of
	 * the abbreviation (or any named entity it is part of). For slashTags with
	 * preserveSpacing=true, there will be two successive periods such as "Jr.."
	 * The tokenized (preserveSpacing=false) output will have a space or a
	 * newline after the last token.
	 * 
	 * @param sentences
	 *            The String to be classified. It will be tokenized and divided
	 *            into documents according to (heuristically determined)
	 *            sentence boundaries.
	 * @param outputFormat
	 *            The format to put the output in: one of "slashTags", "xml", or
	 *            "inlineXML"
	 * @param preserveSpacing
	 *            Whether to preserve the input spacing between tokens, which
	 *            may sometimes be none (true) or whether to tokenize the text
	 *            and print it with one space between each token (false)
	 * @return A {@link String} with annotated with classification information.
	 */
	public String classifyToString(String sentences, String outputFormat,
			boolean preserveSpacing) {
		PlainTextDocumentReaderAndWriter.OutputStyle outFormat = PlainTextDocumentReaderAndWriter.OutputStyle
				.fromShortName(outputFormat);

		ObjectBank<List<IN>> documents = makeObjectBankFromString(sentences,
				plainTextReaderAndWriter);

		StringBuilder sb = new StringBuilder();
		for (List<IN> doc : documents) {
			List<IN> docOutput = classify(doc);
			if (plainTextReaderAndWriter instanceof PlainTextDocumentReaderAndWriter) {
				// TODO: implement this particular method and its options in
				// the other documentReaderAndWriters
				sb.append(((PlainTextDocumentReaderAndWriter<IN>) plainTextReaderAndWriter)
						.getAnswers(docOutput, outFormat, preserveSpacing));
			} else {
				StringWriter sw = new StringWriter();
				PrintWriter pw = new PrintWriter(sw);
				plainTextReaderAndWriter.printAnswers(docOutput, pw);
				pw.flush();
				sb.append(sw.toString());
				sb.append("\n");
			}
		}
		return sb.toString();
	}

	/**
	 * Classify the contents of a {@link String}. Plain text or XML is expected
	 * and the {@link PlainTextDocumentReaderAndWriter} is used by default. The
	 * classifier will treat each sentence as a separate document. The output
	 * can be specified to be in a choice of formats: Output is in inline XML
	 * format (e.g. <PERSON>Bill Smith</PERSON> went to
	 * <LOCATION>Paris</LOCATION> .)
	 * 
	 * @param sentences
	 *            The string to be classified
	 * @return A {@link String} with annotated with classification information.
	 */
	public String classifyWithInlineXML(String sentences) {
		return classifyToString(sentences, "inlineXML", true);
	}

	/**
	 * Classify the contents of a String to a tagged word/class String. Plain
	 * text or XML input is expected and the
	 * {@link PlainTextDocumentReaderAndWriter} is used by default. Output looks
	 * like: My/O name/O is/O Bill/PERSON Smith/PERSON ./O
	 * 
	 * @param sentences
	 *            The String to be classified
	 * @return A String annotated with classification information.
	 */
	public String classifyToString(String sentences) {
		return classifyToString(sentences, "slashTags", true);
	}

	/**
	 * Classify the contents of a {@link String} to classified character offset
	 * spans. Plain text or XML input text is expected and the
	 * {@link PlainTextDocumentReaderAndWriter} is used by default. Output is a
	 * (possibly empty, but not <code>null</code>) List of Triples. Each Triple
	 * is an entity name, followed by beginning and ending character offsets in
	 * the original String. Character offsets can be thought of as fenceposts
	 * between the characters, or, like certain methods in the Java String
	 * class, as character positions, numbered starting from 0, with the end
	 * index pointing to the position AFTER the entity ends. That is, end -
	 * start is the length of the entity in characters.
	 * <p>
	 * <i>Fine points:</i> Token offsets are true wrt the source text, even
	 * though the tokenizer may internally normalize certain tokens to String
	 * representations of different lengths (e.g., " becoming `` or ''). When a
	 * period counts as both part of an abbreviation and as an end of sentence
	 * marker, and that abbreviation is part of a named entity, the reported
	 * entity string excludes the period.
	 * 
	 * @param sentences
	 *            The string to be classified
	 * @return A {@link List} of {@link Triple}s, each of which gives an entity
	 *         type and the beginning and ending character offsets.
	 */
	public List<Triple<String, Integer, Integer>> classifyToCharacterOffsets(
			String sentences) {
		ObjectBank<List<IN>> documents = makeObjectBankFromString(sentences,
				plainTextReaderAndWriter);

		List<Triple<String, Integer, Integer>> entities = new ArrayList<Triple<String, Integer, Integer>>();
		for (List<IN> doc : documents) {
			String prevEntityType = flags.backgroundSymbol;
			Triple<String, Integer, Integer> prevEntity = null;

			classify(doc);

			for (IN fl : doc) {
				String guessedAnswer = fl
						.get(CoreAnnotations.AnswerAnnotation.class);
				if (guessedAnswer.equals(flags.backgroundSymbol)) {
					if (prevEntity != null) {
						entities.add(prevEntity);
						prevEntity = null;
					}
				} else {
					if (!guessedAnswer.equals(prevEntityType)) {
						if (prevEntity != null) {
							entities.add(prevEntity);
						}
						prevEntity = new Triple<String, Integer, Integer>(
								guessedAnswer,
								fl.get(CoreAnnotations.CharacterOffsetBeginAnnotation.class),
								fl.get(CoreAnnotations.CharacterOffsetEndAnnotation.class));
					} else {
						assert prevEntity != null; // if you read the code
													// carefully, this
													// should always be true!
						prevEntity
								.setThird(fl
										.get(CoreAnnotations.CharacterOffsetEndAnnotation.class));
					}
				}
				prevEntityType = guessedAnswer;
			}

			// include any entity at end of doc
			if (prevEntity != null) {
				entities.add(prevEntity);
			}

		}
		return entities;
	}

	/**
	 * ONLY USE IF LOADED A CHINESE WORD SEGMENTER!!!!!
	 * 
	 * @param sentence
	 *            The string to be classified
	 * @return List of words
	 */
	public List<String> segmentString(String sentence) {
		return segmentString(sentence, defaultReaderAndWriter);
	}

	public List<String> segmentString(String sentence,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		ObjectBank<List<IN>> docs = makeObjectBankFromString(sentence,
				readerAndWriter);

		StringWriter stringWriter = new StringWriter();
		PrintWriter stringPrintWriter = new PrintWriter(stringWriter);
		for (List<IN> doc : docs) {
			classify(doc);
			readerAndWriter.printAnswers(doc, stringPrintWriter);
			stringPrintWriter.println();
		}
		stringPrintWriter.close();
		String segmented = stringWriter.toString();

		return Arrays.asList(segmented.split("\\s"));
	}

	/**
	 * Classify the contents of {@link SeqClassifierFlags scf.testFile}. The
	 * file should be in the format expected based on {@link SeqClassifierFlags
	 * scf.documentReader}.
	 * 
	 * @return A {@link List} of {@link List}s of classified something that
	 *         extends {@link CoreMap} where each {@link List} refers to a
	 *         document/sentence.
	 */
	// public ObjectBank<List<IN>> test() {
	// return test(flags.testFile);
	// }

	/**
	 * Classify a {@link List} of something that extends{@link CoreMap}. The
	 * classifications are added in place to the items of the document, which is
	 * also returned by this method
	 * 
	 * @param document
	 *            A {@link List} of something that extends {@link CoreMap}.
	 * @return The same {@link List}, but with the elements annotated with their
	 *         answers (stored under the
	 *         {@link edu.stanford.nlp.ling.CoreAnnotations.AnswerAnnotation}
	 *         key).
	 */
	public abstract List<IN> classify(List<IN> document);

	/**
	 * Classify a {@link List} of something that extends {@link CoreMap} using
	 * as additional information whatever is stored in the document and
	 * sentence. This is needed for SUTime (NumberSequenceClassifier), which
	 * requires the document date to resolve relative dates.
	 * 
	 * @param tokenSequence
	 * @param document
	 * @param sentence
	 * @return Classified version of the input tokenSequence
	 */
	public abstract List<IN> classifyWithGlobalInformation(
			List<IN> tokenSequence, final CoreMap document,
			final CoreMap sentence);

	/**
	 * Classification is finished for the document. Do any cleanup (if
	 * information was stored as part of the document for global classification)
	 * 
	 * @param document
	 */
	public void finalizeClassification(final CoreMap document) {
	}

	/**
	 * Train the classifier based on values in flags. It will use the first of
	 * these variables that is defined: trainFiles (and baseTrainDir),
	 * trainFileList, trainFile.
	 */
	public void train() {
		if (flags.trainFiles != null) {
			train(flags.baseTrainDir, flags.trainFiles, defaultReaderAndWriter);
		} else if (flags.trainFileList != null) {
			String[] files = flags.trainFileList.split(",");
			train(files, defaultReaderAndWriter);
		} else {
			train(flags.trainFile, defaultReaderAndWriter);
		}
	}

	public void train(String filename) {
		train(filename, defaultReaderAndWriter);
	}

	public void train(String filename,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		// only for the OCR data does this matter
		flags.ocrTrain = true;
		train(makeObjectBankFromFile(filename, readerAndWriter),
				readerAndWriter);
	}

	public void train(String baseTrainDir, String trainFiles,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		// only for the OCR data does this matter
		flags.ocrTrain = true;
		train(makeObjectBankFromFiles(baseTrainDir, trainFiles, readerAndWriter),
				readerAndWriter);
	}

	public void train(String[] trainFileList,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		// only for the OCR data does this matter
		flags.ocrTrain = true;
		train(makeObjectBankFromFiles(trainFileList, readerAndWriter),
				readerAndWriter);
	}

	/**
	 * Trains a classifier from a Collection of sequences. Note that the
	 * Collection can be (and usually is) an ObjectBank.
	 * 
	 * @param docs
	 *            An Objectbank or a collection of sequences of IN
	 */
	public void train(Collection<List<IN>> docs) {
		train(docs, defaultReaderAndWriter);
	}

	/**
	 * Trains a classifier from a Collection of sequences. Note that the
	 * Collection can be (and usually is) an ObjectBank.
	 * 
	 * @param docs
	 *            An ObjectBank or a collection of sequences of IN
	 * @param readerAndWriter
	 *            A DocumentReaderAndWriter to use when loading test files
	 */
	public abstract void train(Collection<List<IN>> docs,
			DocumentReaderAndWriter<IN> readerAndWriter);

	/**
	 * Reads a String into an ObjectBank object. NOTE: that the current
	 * implementation of ReaderIteratorFactory will first try to interpret each
	 * string as a filename, so this method will yield unwanted results if it
	 * applies to a string that is at the same time a filename. It prints out a
	 * warning, at least.
	 * 
	 * @param string
	 *            The String which will be the content of the ObjectBank
	 * @return The ObjectBank
	 */
	public ObjectBank<List<IN>> makeObjectBankFromString(String string,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		if (flags.announceObjectBankEntries) {
			System.err
					.print("Reading data using " + readerAndWriter.getClass());

			if (flags.inputEncoding == null) {
				System.err.println("Getting data from " + string
						+ " (default encoding)");
			} else {
				System.err.println("Getting data from " + string + " ("
						+ flags.inputEncoding + " encoding)");
			}
		}
		// return new ObjectBank<List<IN>>(new
		// ResettableReaderIteratorFactory(string), readerAndWriter);
		// TODO
		return new ObjectBankWrapper<IN>(flags, new ObjectBank<List<IN>>(
				new ResettableReaderIteratorFactory(string), readerAndWriter),
				knownLCWords);
	}

	public ObjectBank<List<IN>> makeObjectBankFromFile(String filename) {
		return makeObjectBankFromFile(filename, defaultReaderAndWriter);
	}

	public ObjectBank<List<IN>> makeObjectBankFromFile(String filename,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		String[] fileAsArray = { filename };
		return makeObjectBankFromFiles(fileAsArray, readerAndWriter);
	}

	public ObjectBank<List<IN>> makeObjectBankFromFiles(String[] trainFileList,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		// try{
		Collection<File> files = new ArrayList<File>();
		for (String trainFile : trainFileList) {
			File f = new File(trainFile);
			files.add(f);
		}
		// System.err.printf("trainFileList contains %d file%s.\n",
		// files.size(),
		// files.size() == 1 ? "": "s");
		// TODO get rid of objectbankwrapper
		// return new ObjectBank<List<IN>>(new
		// ResettableReaderIteratorFactory(files), readerAndWriter);
		return new ObjectBankWrapper<IN>(flags,
				new ObjectBank<List<IN>>(new ResettableReaderIteratorFactory(
						files, flags.inputEncoding), readerAndWriter),
				knownLCWords);
		// } catch (IOException e) {
		// throw new RuntimeException(e);
		// }
	}

	public ObjectBank<List<IN>> makeObjectBankFromFiles(String baseDir,
			String filePattern, DocumentReaderAndWriter<IN> readerAndWriter) {

		File path = new File(baseDir);
		FileFilter filter = new RegExFileFilter(Pattern.compile(filePattern));
		File[] origFiles = path.listFiles(filter);
		Collection<File> files = new ArrayList<File>();
		for (File file : origFiles) {
			if (file.isFile()) {
				if (flags.announceObjectBankEntries) {
					System.err.println("Getting data from " + file + " ("
							+ flags.inputEncoding + " encoding)");
				}
				files.add(file);
			}
		}

		if (files.isEmpty()) {
			throw new RuntimeException("No matching files: " + baseDir + '\t'
					+ filePattern);
		}
		// return new ObjectBank<List<IN>>(new
		// ResettableReaderIteratorFactory(files, flags.inputEncoding),
		// readerAndWriter);
		// TODO get rid of objectbankwrapper
		return new ObjectBankWrapper<IN>(flags,
				new ObjectBank<List<IN>>(new ResettableReaderIteratorFactory(
						files, flags.inputEncoding), readerAndWriter),
				knownLCWords);
	}

	public ObjectBank<List<IN>> makeObjectBankFromFiles(Collection<File> files,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		if (files.isEmpty()) {
			throw new RuntimeException(
					"Attempt to make ObjectBank with empty file list");
		}
		// return new ObjectBank<List<IN>>(new
		// ResettableReaderIteratorFactory(files, flags.inputEncoding),
		// readerAndWriter);
		// TODO get rid of objectbankwrapper
		return new ObjectBankWrapper<IN>(flags,
				new ObjectBank<List<IN>>(new ResettableReaderIteratorFactory(
						files, flags.inputEncoding), readerAndWriter),
				knownLCWords);
	}

	/**
	 * Set up an ObjectBank that will allow one to iterate over a collection of
	 * documents obtained from the passed in Reader. Each document will be
	 * represented as a list of IN. If the ObjectBank iterator() is called until
	 * hasNext() returns false, then the Reader will be read till end of file,
	 * but no reading is done at the time of this call. Reading is done using
	 * the reading method specified in <code>flags.documentReader</code>, and
	 * for some reader choices, the column mapping given in
	 * <code>flags.map</code>.
	 * 
	 * @param in
	 *            Input data addNEWLCWords do we add new lowercase words from
	 *            this data to the word shape classifier
	 * @return The list of documents
	 */
	public ObjectBank<List<IN>> makeObjectBankFromReader(BufferedReader in,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		if (flags.announceObjectBankEntries) {
			System.err.println("Reading data using "
					+ readerAndWriter.getClass());
		}
		// TODO get rid of objectbankwrapper
		// return new ObjectBank<List<IN>>(new
		// ResettableReaderIteratorFactory(in),
		// readerAndWriter);
		return new ObjectBankWrapper<IN>(flags, new ObjectBank<List<IN>>(
				new ResettableReaderIteratorFactory(in), readerAndWriter),
				knownLCWords);
	}

	/**
	 * Takes the file, reads it in, and prints out the likelihood of each
	 * possible label at each point.
	 * 
	 * @param filename
	 *            The path to the specified file
	 */
	public void printProbs(String filename,
			DocumentReaderAndWriter<IN> readerAndWriter) {
		// only for the OCR data does this matter
		flags.ocrTrain = false;

		ObjectBank<List<IN>> docs = makeObjectBankFromFile(filename,
				readerAndWriter);
		printProbsDocuments(docs);
	}

	/**
	 * Takes a {@link List} of documents and prints the likelihood of each
	 * possible label at each point.
	 * 
	 * @param documents
	 *            A {@link List} of {@link List} of something that extends
	 *            {@link CoreMap}.
	 */
	public void printProbsDocuments(ObjectBank<List<IN>> documents) {
		for (List<IN> doc : documents) {
			printProbsDocument(doc);
			System.out.println();
		}
	}

	public void classifyStdin() throws IOException {
		classifyStdin(plainTextReaderAndWriter);
	}

	public void classifyStdin(DocumentReaderAndWriter<IN> readerWriter)
			throws IOException {
		BufferedReader is = IOUtils.readerFromStdin(flags.inputEncoding);
		for (String line; (line = is.readLine()) != null;) {
			Collection<List<IN>> documents = makeObjectBankFromString(line,
					readerWriter);
			if (flags.keepEmptySentences && documents.size() == 0) {
				documents = Collections.<List<IN>> singletonList(Collections
						.<IN> emptyList());
			}
			classifyAndWriteAnswers(documents, readerWriter);
		}
	}

	public abstract void printProbsDocument(List<IN> document);

	/**
	 * Load a test file, run the classifier on it, and then print the answers to
	 * stdout (with timing to stderr). This uses the value of
	 * flags.documentReader to determine testFile format.
	 * 
	 * @param testFile
	 *            The file to test on.
	 */
	public void classifyAndWriteAnswers(String testFile) throws IOException {
		classifyAndWriteAnswers(testFile, plainTextReaderAndWriter);
	}

	/**
	 * Load a test file, run the classifier on it, and then print the answers to
	 * stdout (with timing to stderr). This uses the value of
	 * flags.documentReader to determine testFile format.
	 * 
	 * @param testFile
	 *            The file to test on.
	 * @param readerWriter
	 *            A reader and writer to use for the output
	 */
	public void classifyAndWriteAnswers(String testFile,
			DocumentReaderAndWriter<IN> readerWriter) throws IOException {
		ObjectBank<List<IN>> documents = makeObjectBankFromFile(testFile,
				readerWriter);
		classifyAndWriteAnswers(documents, readerWriter);
	}

	/**
	 * If the flag <code>outputEncoding</code> is defined, the output is written
	 * in that character encoding, otherwise in the system default character
	 * encoding.
	 */
	public void classifyAndWriteAnswers(String testFile,
			OutputStream outStream, DocumentReaderAndWriter<IN> readerWriter)
			throws IOException {
		ObjectBank<List<IN>> documents = makeObjectBankFromFile(testFile,
				readerWriter);
		PrintWriter pw = IOUtils.encodedOutputStreamPrintWriter(outStream,
				flags.outputEncoding, true);
		classifyAndWriteAnswers(documents, pw, readerWriter);
	}

	public void classifyAndWriteAnswers(String baseDir, String filePattern,
			DocumentReaderAndWriter<IN> readerWriter) throws IOException {
		ObjectBank<List<IN>> documents = makeObjectBankFromFiles(baseDir,
				filePattern, readerWriter);
		classifyAndWriteAnswers(documents, readerWriter);
	}

	public void classifyFilesAndWriteAnswers(Collection<File> testFiles)
			throws IOException {
		classifyFilesAndWriteAnswers(testFiles, plainTextReaderAndWriter);
	}

	public void classifyFilesAndWriteAnswers(Collection<File> testFiles,
			DocumentReaderAndWriter<IN> readerWriter) throws IOException {
		ObjectBank<List<IN>> documents = makeObjectBankFromFiles(testFiles,
				readerWriter);
		classifyAndWriteAnswers(documents, readerWriter);
	}

	private void classifyAndWriteAnswers(Collection<List<IN>> documents,
			DocumentReaderAndWriter<IN> readerWriter) throws IOException {
		classifyAndWriteAnswers(documents,
				IOUtils.encodedOutputStreamPrintWriter(System.out,
						flags.outputEncoding, true), readerWriter);
	}

	public void classifyAndWriteAnswers(Collection<List<IN>> documents,
			PrintWriter printWriter, DocumentReaderAndWriter<IN> readerWriter)
			throws IOException {
		Timing timer = new Timing();

		Counter<String> entityTP = new ClassicCounter<String>();
		Counter<String> entityFP = new ClassicCounter<String>();
		Counter<String> entityFN = new ClassicCounter<String>();
		boolean resultsCounted = true;
		int numWords = 0;
		int numDocs = 0;

		final AtomicInteger threadCompletionCounter = new AtomicInteger(0);

		ThreadsafeProcessor<List<IN>, List<IN>> threadProcessor = new ThreadsafeProcessor<List<IN>, List<IN>>() {
			@Override
			public List<IN> process(List<IN> doc) {
				doc = classify(doc);

				int completedNo = threadCompletionCounter.incrementAndGet();
				if (flags.verboseMode)
					System.err.println(completedNo + " examples completed");
				return doc;
			}

			@Override
			public ThreadsafeProcessor<List<IN>, List<IN>> newInstance() {
				return this;
			}
		};

		MulticoreWrapper<List<IN>, List<IN>> wrapper = null;
		if (flags.multiThreadClassifier != 0) {
			wrapper = new MulticoreWrapper<List<IN>, List<IN>>(
					flags.multiThreadClassifier, threadProcessor);
		}

		for (List<IN> doc : documents) {
			numWords += doc.size();
			numDocs++;
			if (flags.multiThreadClassifier != 0) {
				wrapper.put(doc);
				while (wrapper.peek()) {
					List<IN> results = wrapper.poll();
					writeAnswers(results, printWriter, readerWriter);
					resultsCounted = resultsCounted
							&& countResults(results, entityTP, entityFP,
									entityFN);
				}
			} else {
				List<IN> results = threadProcessor.process(doc);
				writeAnswers(results, printWriter, readerWriter);
				resultsCounted = resultsCounted
						&& countResults(results, entityTP, entityFP, entityFN);
			}
		}
		if (flags.multiThreadClassifier != 0) {
			wrapper.join();
			while (wrapper.peek()) {
				List<IN> results = wrapper.poll();
				writeAnswers(results, printWriter, readerWriter);
				resultsCounted = resultsCounted
						&& countResults(results, entityTP, entityFP, entityFN);
			}
		}

		long millis = timer.stop();
		double wordspersec = numWords / (((double) millis) / 1000);
		NumberFormat nf = new DecimalFormat("0.00"); // easier way!
		System.err.println(StringUtils.getShortClassName(this) + " tagged "
				+ numWords + " words in " + numDocs + " documents at "
				+ nf.format(wordspersec) + " words per second.");
		if (resultsCounted) {
			printResults(entityTP, entityFP, entityFN);
		}
	}

	/**
	 * Load a test file, run the classifier on it, and then print the answers to
	 * stdout (with timing to stderr). This uses the value of
	 * flags.documentReader to determine testFile format.
	 * 
	 * @param testFile
	 *            The filename to test on.
	 */
	public void classifyAndWriteAnswersKBest(String testFile, int k,
			DocumentReaderAndWriter<IN> readerAndWriter) throws IOException {
		ObjectBank<List<IN>> documents = makeObjectBankFromFile(testFile,
				readerAndWriter);
		PrintWriter pw = IOUtils.encodedOutputStreamPrintWriter(System.out,
				flags.outputEncoding, true);
		classifyAndWriteAnswersKBest(documents, k, pw, readerAndWriter);
	}

	/**
	 * Run the classifier on the documents in an ObjectBank, and print the
	 * answers to a given PrintWriter (with timing to stderr). The value of
	 * flags.documentReader is used to determine testFile format.
	 * 
	 * @param documents
	 *            The ObjectBank to test on.
	 */
	public void classifyAndWriteAnswersKBest(ObjectBank<List<IN>> documents,
			int k, PrintWriter printWriter,
			DocumentReaderAndWriter<IN> readerAndWriter) throws IOException {
		Timing timer = new Timing();
		int numWords = 0;
		int numSentences = 0;

		for (List<IN> doc : documents) {
			Counter<List<IN>> kBest = classifyKBest(doc,
					CoreAnnotations.AnswerAnnotation.class, k);
			numWords += doc.size();
			List<List<IN>> sorted = Counters.toSortedList(kBest);
			int n = 1;
			for (List<IN> l : sorted) {
				System.out.println("<sentence id=" + numSentences + " k=" + n
						+ " logProb=" + kBest.getCount(l) + " prob="
						+ Math.exp(kBest.getCount(l)) + '>');
				writeAnswers(l, printWriter, readerAndWriter);
				System.out.println("</sentence>");
				n++;
			}
			numSentences++;
		}

		long millis = timer.stop();
		double wordspersec = numWords / (((double) millis) / 1000);
		NumberFormat nf = new DecimalFormat("0.00"); // easier way!
		System.err.println(this.getClass().getName() + " tagged " + numWords
				+ " words in " + numSentences + " documents at "
				+ nf.format(wordspersec) + " words per second.");
	}

	/**
	 * Load a test file, run the classifier on it, and then write a Viterbi
	 * search graph for each sequence.
	 * 
	 * @param testFile
	 *            The file to test on.
	 */
	public void classifyAndWriteViterbiSearchGraph(String testFile,
			String searchGraphPrefix,
			DocumentReaderAndWriter<IN> readerAndWriter) throws IOException {
		Timing timer = new Timing();
		ObjectBank<List<IN>> documents = makeObjectBankFromFile(testFile,
				readerAndWriter);
		int numWords = 0;
		int numSentences = 0;

		for (List<IN> doc : documents) {
			DFSA<String, Integer> tagLattice = getViterbiSearchGraph(doc,
					CoreAnnotations.AnswerAnnotation.class);
			numWords += doc.size();
			PrintWriter latticeWriter = new PrintWriter(new FileOutputStream(
					searchGraphPrefix + '.' + numSentences + ".wlattice"));
			PrintWriter vsgWriter = new PrintWriter(new FileOutputStream(
					searchGraphPrefix + '.' + numSentences + ".lattice"));
			if (readerAndWriter instanceof LatticeWriter)
				((LatticeWriter<IN, String, Integer>) readerAndWriter)
						.printLattice(tagLattice, doc, latticeWriter);
			tagLattice.printAttFsmFormat(vsgWriter);
			latticeWriter.close();
			vsgWriter.close();
			numSentences++;
		}

		long millis = timer.stop();
		double wordspersec = numWords / (((double) millis) / 1000);
		NumberFormat nf = new DecimalFormat("0.00"); // easier way!
		System.err.println(this.getClass().getName() + " tagged " + numWords
				+ " words in " + numSentences + " documents at "
				+ nf.format(wordspersec) + " words per second.");
	}

	/**
	 * Write the classifications of the Sequence classifier out to a writer in a
	 * format determined by the DocumentReaderAndWriter used.
	 * 
	 * @param doc
	 *            Documents to write out
	 * @param printWriter
	 *            Writer to use for output
	 * @throws IOException
	 *             If an IO problem
	 */
	public void writeAnswers(List<IN> doc, PrintWriter printWriter,
			DocumentReaderAndWriter<IN> readerAndWriter) throws IOException {
		if (flags.lowerNewgeneThreshold) {
			return;
		}
		if (flags.numRuns <= 1) {
			readerAndWriter.printAnswers(doc, printWriter);
			// out.println();
			printWriter.flush();
		}
	}

	/**
	 * Count results using a method appropriate for the tag scheme being used.
	 */
	public boolean countResults(List<IN> doc, Counter<String> entityTP,
			Counter<String> entityFP, Counter<String> entityFN) {
		String bg = (flags.evaluateBackground ? null : flags.backgroundSymbol);
		if (flags.entitySubclassification.equalsIgnoreCase("iob2")) {
			bg = flags.backgroundSymbol;
			return countResultsIOB2(doc, entityTP, entityFP, entityFN, bg);
		} else if (flags.iobTags) {
			bg = flags.backgroundSymbol;
			return countResultsIOB(doc, entityTP, entityFP, entityFN, bg);
		} else {
			return countResults(doc, entityTP, entityFP, entityFN, bg);
		}
	}

	public static boolean countResultsIOB2(List<? extends CoreMap> doc,
			Counter<String> entityTP, Counter<String> entityFP,
			Counter<String> entityFN, String background) {
		boolean entityCorrect = true;
		// the annotations
		String previousGold = background;
		String previousGuess = background;
		// the part after the I- or B- in the annotation
		String previousGoldEntity = "";
		String previousGuessEntity = "";

		for (CoreMap word : doc) {
			String gold = word.get(CoreAnnotations.GoldAnswerAnnotation.class);
			String guess = word.get(CoreAnnotations.AnswerAnnotation.class);
			String goldEntity = (!gold.equals(background)) ? gold.substring(2)
					: "";
			String guessEntity = (!guess.equals(background)) ? guess
					.substring(2) : "";

			// System.out.println(gold + " (" + goldEntity + ") ; " + guess +
			// " (" + guessEntity + ")");

			boolean newGold = (!gold.equals(background)
					&& (!goldEntity.equals(previousGoldEntity)) || gold
					.startsWith("B-"));
			boolean newGuess = (!guess.equals(background)
					&& (!guessEntity.equals(previousGuessEntity)) || guess
					.startsWith("B-"));
			boolean goldEnded = (!previousGold.equals(background) && (gold
					.startsWith("B-") || !goldEntity.equals(previousGoldEntity)));
			boolean guessEnded = (!previousGuess.equals(background) && (guess
					.startsWith("B-") || !guessEntity
					.equals(previousGuessEntity)));

			// System.out.println("  " + newGold + " " + newGuess + " " +
			// goldEnded + " " + guessEnded);

			if (goldEnded && !guessEnded) {
				entityFN.incrementCount(previousGoldEntity, 1.0);
				entityCorrect = gold.equals(background)
						&& guess.equals(background);
			}
			if (goldEnded && guessEnded) {
				if (entityCorrect) {
					entityTP.incrementCount(previousGoldEntity, 1.0);
				} else {
					entityFN.incrementCount(previousGoldEntity, 1.0);
					entityFP.incrementCount(previousGuessEntity, 1.0);
				}
				entityCorrect = gold.equals(guess);
			}
			if (!goldEnded && guessEnded) {
				entityCorrect = false;
				entityFP.incrementCount(previousGuessEntity, 1.0);
			}
			// nothing to do if neither gold nor guess have ended

			if (newGold && !newGuess) {
				entityCorrect = false;
			}
			if (newGold && newGuess) {
				entityCorrect = guessEntity.equals(goldEntity);
			}
			if (!newGold && newGuess) {
				entityCorrect = false;
			}

			previousGold = gold;
			previousGuess = guess;
			previousGoldEntity = goldEntity;
			previousGuessEntity = guessEntity;
		}

		// At the end, we need to check the last entity
		if (!previousGold.equals(background)) {
			if (entityCorrect) {
				entityTP.incrementCount(previousGoldEntity, 1.0);
			} else {
				entityFN.incrementCount(previousGoldEntity, 1.0);
			}
		}
		if (!previousGuess.equals(background)) {
			if (!entityCorrect) {
				entityFP.incrementCount(previousGuessEntity, 1.0);
			}
		}

		return true;
	}

	public static boolean countResultsIOB(List<? extends CoreMap> doc,
			Counter<String> entityTP, Counter<String> entityFP,
			Counter<String> entityFN, String background) {
		// first, check that all answers exist and are either O, B-, or I-
		for (CoreMap line : doc) {
			String gold = line.get(CoreAnnotations.GoldAnswerAnnotation.class);
			String guess = line.get(CoreAnnotations.AnswerAnnotation.class);

			if (gold == null) {
				System.err.println("Blank gold answer");
				return false;
			}
			if (guess == null) {
				System.err.println("Blank guess");
				return false;
			}
			if (!gold.equals(background) && !gold.startsWith("B-")
					&& !gold.startsWith("I-")) {
				System.err.println("Unexpected gold answer " + gold);
				return false;
			}
			if (!guess.equals(background) && !guess.startsWith("B-")
					&& !guess.startsWith("I-")) {
				System.err.println("Unexpected guess " + guess);
				return false;
			}
			// todo: verify that gold entities are in a good pattern
		}

		// We count entities in three categories. When we have an entity
		// in the gold, it is a true positive if the start of the entity
		// is correctly guessed, all of the I- tags are correctly guessed,
		// and the next guess tag after the last gold I- tag is not the
		// same I- tag. Otherwise, it is a false negative. We then apply
		// the same logic to the guesses, counting false positives for
		// anything that did not correctly match the gold.
		int index = 0;
		while (index < doc.size()) {
			index = tallyOneEntityIOB(doc, index,
					CoreAnnotations.GoldAnswerAnnotation.class,
					CoreAnnotations.AnswerAnnotation.class, entityTP, entityFN,
					background);
		}
		index = 0;
		while (index < doc.size()) {
			index = tallyOneEntityIOB(doc, index,
					CoreAnnotations.AnswerAnnotation.class,
					CoreAnnotations.GoldAnswerAnnotation.class, null, entityFP,
					background);
		}

		return true;
	}

	public static int tallyOneEntityIOB(List<? extends CoreMap> doc, int index,
			Class<? extends CoreAnnotation<String>> source,
			Class<? extends CoreAnnotation<String>> target,
			Counter<String> positive, Counter<String> negative,
			String background) {
		CoreMap line = doc.get(index);
		String gold = line.get(source);
		String guess = line.get(target);

		// uninteresting
		if (gold.equals(background)) {
			return index + 1;
		}
		String entity = gold.substring(2);
		boolean correct = gold.equals(guess);
		++index;
		while (index < doc.size()) {
			line = doc.get(index);
			gold = line.get(source);
			guess = line.get(target);

			if (!gold.equals("I-" + entity)) {
				if (guess.equals("I-" + entity)) {
					correct = false;
				}
				break;
			}
			if (!gold.equals(guess)) {
				correct = false;
			}
			++index;
		}
		if (correct) {
			if (positive != null) {
				positive.incrementCount(entity, 1.0);
			}
		} else {
			negative.incrementCount(entity, 1.0);
		}
		return index;
	}

	/**
	 * Count the successes and failures of the model on the given document.
	 * Fills numbers in to counters for true positives, false positives, and
	 * false negatives, and also keeps track of the entities seen. <br>
	 * Returns false if we ever encounter null for gold or guess.
	 */
	public static boolean countResults(List<? extends CoreMap> doc,
			Counter<String> entityTP, Counter<String> entityFP,
			Counter<String> entityFN, String background) {
		int index = 0;
		int goldIndex = 0, guessIndex = 0;
		String lastGold = background, lastGuess = background;

		// As we go through the document, there are two events we might be
		// interested in. One is when a gold entity ends, and the other
		// is when a guessed entity ends. If the gold and guessed
		// entities end at the same time, started at the same time, and
		// match entity type, we have a true positive. Otherwise we
		// either have a false positive or a false negative.
		for (CoreMap line : doc) {
			String gold = line.get(CoreAnnotations.GoldAnswerAnnotation.class);
			String guess = line.get(CoreAnnotations.AnswerAnnotation.class);

			if (gold == null || guess == null)
				return false;

			if (lastGold != null && !lastGold.equals(gold)
					&& !lastGold.equals(background)) {
				if (lastGuess.equals(lastGold) && !lastGuess.equals(guess)
						&& goldIndex == guessIndex) {
					entityTP.incrementCount(lastGold, 1.0);
				} else {
					entityFN.incrementCount(lastGold, 1.0);
				}
			}

			if (lastGuess != null && !lastGuess.equals(guess)
					&& !lastGuess.equals(background)) {
				if (lastGuess.equals(lastGold) && !lastGuess.equals(guess)
						&& goldIndex == guessIndex && !lastGold.equals(gold)) {
					// correct guesses already tallied
					// only need to tally false positives
				} else {
					entityFP.incrementCount(lastGuess, 1.0);
				}
			}

			if (lastGold == null || !lastGold.equals(gold)) {
				lastGold = gold;
				goldIndex = index;
			}

			if (lastGuess == null || !lastGuess.equals(guess)) {
				lastGuess = guess;
				guessIndex = index;
			}
			++index;
		}

		// We also have to account for entities at the very end of the
		// document, since the above logic only occurs when we see
		// something that tells us an entity has ended
		if (lastGold != null && !lastGold.equals(background)) {
			if (lastGold.equals(lastGuess) && goldIndex == guessIndex) {
				entityTP.incrementCount(lastGold, 1.0);
			} else {
				entityFN.incrementCount(lastGold, 1.0);
			}
		}
		if (lastGuess != null && !lastGuess.equals(background)) {
			if (lastGold.equals(lastGuess) && goldIndex == guessIndex) {
				// correct guesses already tallied
			} else {
				entityFP.incrementCount(lastGuess, 1.0);
			}
		}
		return true;
	}

	/**
	 * Given counters of true positives, false positives, and false negatives,
	 * prints out precision, recall, and f1 for each key.
	 */
	public static void printResults(Counter<String> entityTP,
			Counter<String> entityFP, Counter<String> entityFN) {
		Set<String> entities = new TreeSet<String>();
		entities.addAll(entityTP.keySet());
		entities.addAll(entityFP.keySet());
		entities.addAll(entityFN.keySet());
		boolean printedHeader = false;
		for (String entity : entities) {
			double tp = entityTP.getCount(entity);
			double fp = entityFP.getCount(entity);
			double fn = entityFN.getCount(entity);
			printedHeader = printPRLine(entity, tp, fp, fn, printedHeader);
		}
		double tp = entityTP.totalCount();
		double fp = entityFP.totalCount();
		double fn = entityFN.totalCount();
		printedHeader = printPRLine("Totals", tp, fp, fn, printedHeader);
	}

	/**
	 * Print a line of precision, recall, and f1 scores, titled by entity,
	 * possibly printing a header if it hasn't already been printed. Returns
	 * whether or not the header has ever been printed.
	 */
	private static boolean printPRLine(String entity, double tp, double fp,
			double fn, boolean printedHeader) {
		if (tp == 0.0 && (fp == 0.0 || fn == 0.0))
			return printedHeader;
		double precision = tp / (tp + fp);
		double recall = tp / (tp + fn);
		double f1 = ((precision == 0.0 || recall == 0.0) ? 0.0
				: 2.0 / (1.0 / precision + 1.0 / recall));
		if (!printedHeader) {
			System.err.println("         Entity\tP\tR\tF1\tTP\tFP\tFN");
			printedHeader = true;
		}
		System.err.format("%15s\t%.4f\t%.4f\t%.4f\t%.0f\t%.0f\t%.0f\n", entity,
				precision, recall, f1, tp, fp, fn);
		return printedHeader;
	}

	/**
	 * Serialize a sequence classifier to a file on the given path.
	 * 
	 * @param serializePath
	 *            The path/filename to write the classifier to.
	 */
	public abstract void serializeClassifier(String serializePath);

	/**
	 * Loads a classifier from the given input stream. Any exceptions are
	 * rethrown as unchecked exceptions. This method does not close the
	 * InputStream.
	 * 
	 * @param in
	 *            The InputStream to read from
	 */
	public void loadClassifierNoExceptions(InputStream in, Properties props) {
		// load the classifier
		try {
			loadClassifier(in, props);
		} catch (IOException e) {
			throw new RuntimeIOException(e);
		} catch (ClassNotFoundException cnfe) {
			throw new RuntimeException(cnfe);
		}
	}

	/**
	 * Load a classifier from the specified InputStream. No extra properties are
	 * supplied. This does not close the InputStream.
	 * 
	 * @param in
	 *            The InputStream to load the serialized classifier from
	 * @throws IOException
	 *             If there are problems accessing the input stream
	 * @throws ClassCastException
	 *             If there are problems interpreting the serialized data
	 * @throws ClassNotFoundException
	 *             If there are problems interpreting the serialized data
	 */
	public void loadClassifier(InputStream in) throws IOException,
			ClassCastException, ClassNotFoundException {
		loadClassifier(in, null);
	}

	/**
	 * Load a classifier from the specified InputStream. The classifier is
	 * reinitialized from the flags serialized in the classifier. This does not
	 * close the InputStream.
	 * 
	 * @param in
	 *            The InputStream to load the serialized classifier from
	 * @param props
	 *            This Properties object will be used to update the
	 *            SeqClassifierFlags which are read from the serialized
	 *            classifier
	 * @throws IOException
	 *             If there are problems accessing the input stream
	 * @throws ClassCastException
	 *             If there are problems interpreting the serialized data
	 * @throws ClassNotFoundException
	 *             If there are problems interpreting the serialized data
	 */
	public void loadClassifier(InputStream in, Properties props)
			throws IOException, ClassCastException, ClassNotFoundException {
		loadClassifier(new ObjectInputStream(in), props);
	}

	/**
	 * Load a classifier from the specified input stream. The classifier is
	 * reinitialized from the flags serialized in the classifier.
	 * 
	 * @param in
	 *            The InputStream to load the serialized classifier from
	 * @param props
	 *            This Properties object will be used to update the
	 *            SeqClassifierFlags which are read from the serialized
	 *            classifier
	 * @throws IOException
	 *             If there are problems accessing the input stream
	 * @throws ClassCastException
	 *             If there are problems interpreting the serialized data
	 * @throws ClassNotFoundException
	 *             If there are problems interpreting the serialized data
	 */
	public abstract void loadClassifier(ObjectInputStream in, Properties props)
			throws IOException, ClassCastException, ClassNotFoundException;

	private InputStream loadStreamFromClasspath(String path) {
		InputStream is = getClass().getClassLoader().getResourceAsStream(path);
		if (is == null)
			return null;
		try {
			if (path.endsWith(".gz"))
				is = new GZIPInputStream(new BufferedInputStream(is));
			else
				is = new BufferedInputStream(is);
		} catch (IOException e) {
			System.err.println("CLASSPATH resource " + path
					+ " is not a GZIP stream!");
		}
		return is;
	}

	/**
	 * Loads a classifier from the file specified by loadPath. If loadPath ends
	 * in .gz, uses a GZIPInputStream, else uses a regular FileInputStream.
	 */
	public void loadClassifier(String loadPath) throws ClassCastException,
			IOException, ClassNotFoundException {
		loadClassifier(loadPath, null);
	}

	/**
	 * 
	 * Loads a classifier from the file specified by loadPath. If loadPath ends
	 * 
	 * in .gz, uses a GZIPInputStream, else uses a regular FileInputStream.
	 */

	public void loadClassifier(String loadURL, Properties props)
			throws ClassCastException, IOException, ClassNotFoundException {
		// modified by guokr --Mingli
		// InputStream is;
		// // ms, 10-04-2010: check first is this path exists in our CLASSPATH.
		// This
		// // takes priority over the file system.
		// if ((is = loadStreamFromClasspath(loadPath)) != null) {
		// Timing.startDoing("Loading classifier from " + loadPath);
		// loadClassifier(is, props);
		// is.close();
		// Timing.endDoing();
		// } else {
		// loadClassifier(new File(loadPath), props);
		// }
		URL url = new URL(loadURL);
		if (url.getPath().endsWith(".gz")) {
			loadClassifier(new GZIPInputStream(url.openStream()), props);
		} else {
			loadClassifier(url.openStream(), props);
		}
	}

	public void loadClassifierNoExceptions(String loadPath) {
		loadClassifierNoExceptions(loadPath, null);
	}

	public void loadClassifierNoExceptions(String loadPath, Properties props) {
		InputStream is;
		// ms, 10-04-2010: check first is this path exists in our CLASSPATH.
		// This
		// takes priority over the file system.
		if ((is = loadStreamFromClasspath(loadPath)) != null) {
			Timing.startDoing("Loading classifier from " + loadPath);
			loadClassifierNoExceptions(is, props);
			try {
				is.close();
			} catch (IOException e) {
				throw new RuntimeException(e);
			}
			Timing.endDoing();
		} else {
			loadClassifierNoExceptions(new File(loadPath), props);
		}
	}

	public void loadClassifier(File file) throws ClassCastException,
			IOException, ClassNotFoundException {
		loadClassifier(file, null);
	}

	/**
	 * Loads a classifier from the file specified. If the file's name ends in
	 * .gz, uses a GZIPInputStream, else uses a regular FileInputStream. This
	 * method closes the File when done.
	 * 
	 * @param file
	 *            Loads a classifier from this file.
	 * @param props
	 *            Properties in this object will be used to overwrite those
	 *            specified in the serialized classifier
	 * 
	 * @throws IOException
	 *             If there are problems accessing the input stream
	 * @throws ClassCastException
	 *             If there are problems interpreting the serialized data
	 * @throws ClassNotFoundException
	 *             If there are problems interpreting the serialized data
	 */
	public void loadClassifier(File file, Properties props)
			throws ClassCastException, IOException, ClassNotFoundException {
		Timing.startDoing("Loading classifier from " + file.getAbsolutePath());
		BufferedInputStream bis;
		if (file.getName().endsWith(".gz")) {
			bis = new BufferedInputStream(new GZIPInputStream(
					new FileInputStream(file)));
		} else {
			bis = new BufferedInputStream(new FileInputStream(file));
		}
		loadClassifier(bis, props);
		bis.close();
		Timing.endDoing();
	}

	public void loadClassifierNoExceptions(File file) {
		loadClassifierNoExceptions(file, null);
	}

	public void loadClassifierNoExceptions(File file, Properties props) {
		try {
			loadClassifier(file, props);
		} catch (Exception e) {
			System.err.println("Error deserializing " + file.getAbsolutePath());
			throw new RuntimeException(e);
		}
	}

	/**
	 * This function will load a classifier that is stored inside a jar file (if
	 * it is so stored). The classifier should be specified as its full path in
	 * a jar. If the classifier is not stored in the jar file or this is not run
	 * from inside a jar file, then this function will throw a RuntimeException.
	 * 
	 * @param modelName
	 *            The name of the model file. Iff it ends in .gz, then it is
	 *            assumed to be gzip compressed.
	 * @param props
	 *            A Properties object which can override certain properties in
	 *            the serialized file, such as the DocumentReaderAndWriter. You
	 *            can pass in <code>null</code> to override nothing.
	 */
	public void loadJarClassifier(String modelName, Properties props) {
		Timing.startDoing("Loading JAR-internal classifier " + modelName);
		try {
			InputStream is = getClass().getResourceAsStream(modelName);
			if (modelName.endsWith(".gz")) {
				is = new GZIPInputStream(is);
			}
			is = new BufferedInputStream(is);
			loadClassifier(is, props);
			is.close();
			Timing.endDoing();
		} catch (Exception e) {
			String msg = "Error loading classifier from jar file (most likely you are not running this code from a jar file or the named classifier is not stored in the jar file)";
			throw new RuntimeException(msg, e);
		}
	}

	private transient PrintWriter cliqueWriter;
	private transient int writtenNum; // = 0;

	/** Print the String features generated from a IN */
	protected void printFeatures(IN wi, Collection<String> features) {
		if (flags.printFeatures == null
				|| writtenNum >= flags.printFeaturesUpto) {
			return;
		}
		if (cliqueWriter == null) {
			cliqueWriter = IOUtils.getPrintWriterOrDie("features-"
					+ flags.printFeatures + ".txt");
			writtenNum = 0;
		}
		if (wi instanceof CoreLabel) {
			cliqueWriter.print(wi.get(CoreAnnotations.TextAnnotation.class)
					+ ' '
					+ wi.get(CoreAnnotations.PartOfSpeechAnnotation.class)
					+ ' ' + wi.get(CoreAnnotations.GoldAnswerAnnotation.class)
					+ '\t');
		} else {
			cliqueWriter
					.print(wi.get(CoreAnnotations.TextAnnotation.class)
							+ wi.get(CoreAnnotations.GoldAnswerAnnotation.class)
							+ '\t');
		}
		boolean first = true;
		List<String> featsList = new ArrayList<String>(features);
		Collections.sort(featsList);
		for (String feat : featsList) {
			if (first) {
				first = false;
			} else {
				cliqueWriter.print(" ");
			}
			cliqueWriter.print(feat);
		}
		cliqueWriter.println();
		writtenNum++;
	}

	/** Print the String features generated from a token. */
	protected void printFeatureLists(IN wi, Collection<List<String>> features) {
		if (flags.printFeatures == null
				|| writtenNum >= flags.printFeaturesUpto) {
			return;
		}
		printFeatureListsHelper(wi, features);
	}

	// Separating this method out lets printFeatureLists be inlined, which is
	// good since it is usually a no-op.
	private void printFeatureListsHelper(IN wi,
			Collection<List<String>> features) {
		if (cliqueWriter == null) {
			cliqueWriter = IOUtils.getPrintWriterOrDie("features-"
					+ flags.printFeatures + ".txt");
			writtenNum = 0;
		}
		if (wi instanceof CoreLabel) {
			cliqueWriter.print(wi.get(CoreAnnotations.TextAnnotation.class)
					+ ' '
					+ wi.get(CoreAnnotations.PartOfSpeechAnnotation.class)
					+ ' ' + wi.get(CoreAnnotations.GoldAnswerAnnotation.class)
					+ '\t');
		} else {
			cliqueWriter
					.print(wi.get(CoreAnnotations.TextAnnotation.class)
							+ wi.get(CoreAnnotations.GoldAnswerAnnotation.class)
							+ '\t');
		}
		boolean first = true;
		for (List<String> featList : features) {
			List<String> sortedFeatList = new ArrayList<String>(featList);
			Collections.sort(sortedFeatList);
			for (String feat : sortedFeatList) {
				if (first) {
					first = false;
				} else {
					cliqueWriter.print(" ");
				}
				cliqueWriter.print(feat);
			}
			cliqueWriter.print("  ");
		}
		cliqueWriter.println();
		writtenNum++;
	}

	public int windowSize() {
		return windowSize;
	}

}