LatexWordCounter.java example

Explorer

texclipse-master
- source
  - net
    - sourceforge
      - texlipse
        DDEClient.java
        PathUtils.java
        SelectedResourceManager.java
        TexPerspectiveFactory.java
        TexlipsePlugin.java
        actions
        AbstractTexSelectionChange.java
        ForceRebuildAction.java
        GoToMatchingBracketAction.java
        InputQueryDialog.java
        OpenDeclarationAction.java
        PartialBuildAction.java
        PreviewAction.java
        RunBibTeXOnNextBuildAction.java
        SaveAsTemplateAction.java
        SetMainFileAction.java
        TexCollapseAction.java
        TexComment.java
        TexCorrectIndentationAction.java
        TexHardLineWrapAction.java
        TexInsertMathSymbolAction.java
        TexSelections.java
        TexUncollapseAction.java
        TexUncomment.java
        TexWordWrapAction.java
        WordCountAction.java
        auxparser
        AuxFileParser.java
        bibeditor
        AbbrevManager.java
        BibBraceRule.java
        BibCodeFolder.java
        BibCodeScanner.java
        BibColorProvider.java
        BibCommandRule.java
        BibCompletionProcessor.java
        BibContentProvider.java
        BibDocumentModel.java
        BibEditor.java
        BibEntryScanner.java
        BibLabelProvider.java
        BibOutlinePage.java
        BibPartitionScanner.java
        BibProjectionAnnotation.java
        BibSetupParticipant.java
        BibSourceViewerConfiguration.java
        BibStringCompleter.java
        BibStringRule.java
        bibparser
        AbbrevRetriever.java
        BibFileReferenceSearch.java
        BibLexer.java
        BibOutlineContainer.java
        BibParser.java
        EntryRetriever.java
        analysis
        Analysis.java
        AnalysisAdapter.java
        DepthFirstAdapter.java
        ReversedDepthFirstAdapter.java
        lexer
        Lexer.java
        LexerException.java
        node
        ABibeBibEntry.java
        ABibstreBibEntry.java
        ABibtaskBibEntry.java
        ABibtex.java
        AConcat.java
        AEntryDef.java
        AEntrybraceEntry.java
        AEntryparenEntry.java
        AIdValOrSid.java
        AKeyvalDecl.java
        ANumValOrSid.java
        AStrbraceStringEntry.java
        AStrparenStringEntry.java
        AValueBValOrSid.java
        AValueQValOrSid.java
        EOF.java
        Node.java
        PBibEntry.java
        PBibtex.java
        PConcat.java
        PEntry.java
        PEntryDef.java
        PKeyvalDecl.java
        PStringEntry.java
        PValOrSid.java
        Start.java
        Switch.java
        Switchable.java
        TBString.java
        TComma.java
        TComment.java
        TEntryName.java
        TEquals.java
        TEstring.java
        TIdentifier.java
        TLBrace.java
        TLParen.java
        TNumber.java
        TPreamble.java
        TQuotec.java
        TRBrace.java
        TRParen.java
        TScribeComment.java
        TSharp.java
        TStringLiteral.java
        TTaskcomment.java
        TWhitespace.java
        Token.java
        parser
        Parser.java
        ParserException.java
        State.java
        TokenIndex.java
        builder
        AbstractBuilder.java
        AbstractProgramRunner.java
        AdaptableBuilder.java
        BiberRunner.java
        BibtexRunner.java
        Builder.java
        BuilderChooser.java
        BuilderCoreException.java
        BuilderRegistry.java
        DviBuilder.java
        DvipdfRunner.java
        DvipsRunner.java
        ExternalProgram.java
        Kpath.java
        KpsewhichRunner.java
        LatexRunner.java
        LualatexRunner.java
        MakeindexNomenclRunner.java
        MakeindexRunner.java
        OutputFileManager.java
        OutputScanner.java
        PdflatexRunner.java
        ProgramRunner.java
        ProjectFileTracking.java
        Ps2pdfRunner.java
        PsBuilder.java
        PslatexRunner.java
        TexBuilder.java
        TexlipseBuilder.java
        TexlipseNature.java
        XelatexRunner.java
        editor
        BracketInserter.java
        ColorManager.java
        HardLineWrap.java
        TeXSpellingReconcileStrategy.java
        TexAnnotationHover.java
        TexAutoIndentStrategy.java
        TexCodeFolder.java
        TexCompletionProcessor.java
        TexCompletionProposal.java
        TexDocumentParseException.java
        TexDocumentProvider.java
        TexDocumentSetupParticipant.java
        TexEditor.java
        TexEditorActionContributor.java
        TexEditorTools.java
        TexMathCompletionProcessor.java
        TexPairMatcher.java
        TexProjectionAnnotation.java
        TexQuoteListener.java
        TexSourceViewerConfiguration.java
        TexlipseAnnotationUpdater.java
        hover
        TexHover.java
        TexHoverControlCreator.java
        TexInformationControl.java
        partitioner
        BufferedDocumentScanner.java
        FastLaTeXPartitionScanner.java
        scanner
        TexArgScanner.java
        TexCommentScanner.java
        TexEnvironmentRule.java
        TexMathScanner.java
        TexOptArgScanner.java
        TexScanner.java
        TexSpecialCharRule.java
        TexTikzScanner.java
        TexWord.java
        TextWords.java
        WhitespaceDetector.java
        extension
        BibOutlineActionProvider.java
        BibProvider.java
        filefinder
        ProjectFileFinder.java
        model
        AbstractEntry.java
        CommandEntry.java
        DocumentReference.java
        MarkerHandler.java
        OutlineNode.java
        ParseErrorMessage.java
        PartialRetriever.java
        ReferenceContainer.java
        ReferenceEntry.java
        ReferenceManager.java
        TexCommandContainer.java
        TexCommandEntry.java
        TexDocumentModel.java
        TexOutlineInput.java
        TexProjectParser.java
        TexStyleCompletionManager.java
        outline
        TexContentProvider.java
        TexLabelProvider.java
        TexOutlineActionCopy.java
        TexOutlineActionCut.java
        TexOutlineActionDelete.java
        TexOutlineActionPaste.java
        TexOutlineActionUpdate.java
        TexOutlineDNDAdapter.java
        TexOutlineFilter.java
        TexOutlineNodeComparer.java
        TexOutlinePage.java
        TexProjectOutline.java
        properties
        BibColoringPreferencePage.java
        BibDirectoriesPreferencePage.java
        BibtexPreferencePage.java
        BuilderConfigDialog.java
        BuilderEnvPreferencePage.java
        BuilderSettingsPreferencePage.java
        KeyValueListFieldEditor.java
        LatexTempExtsPreferencePage.java
        ProjectTemplatesPreferencePage.java
        StringListFieldEditor.java
        TexlipseHelpIds.java
        TexlipsePreferenceInitializer.java
        TexlipsePreferencePage.java
        TexlipseProjectPropertyPage.java
        TexlipseProperties.java
        ViewerEnvPreferencePage.java
        ViewerListFieldEditor.java
        ViewerSettingsPreferencePage.java
        editor
        CodeFoldingPreferencePage.java
        ColoringPreferencePage.java
        IndentationPreferencePage.java
        OutlinePreferencePage.java
        SmartKeyPreferencePage.java
        StyleCompletionPreferencePage.java
        StyleListFieldEditor.java
        TexEditorPreferencePage.java
        spelling
        AddToDictProposal.java
        IgnoreProposal.java
        SpellCheckAction.java
        SpellChecker.java
        SpellCheckerEnvPreferencePage.java
        SpellCheckerPreferencePage.java
        SpellUncheckAction.java
        SpellingCompletionProposal.java
        SpellingMarkerResolution.java
        SpellingResolutionGenerator.java
        TexSpellDictionary.java
        TexSpellingEngine.java
        TexlipseWordFinder.java
        tableview
        views
        ITexRowListViewer.java
        TexCellListener.java
        TexCellModifier.java
        TexRow.java
        TexRowList.java
        TexTableView.java
        templates
        BibTexContextType.java
        BibTexTemplateCompletion.java
        BibTexTemplatePreferencesPage.java
        CompletionProposalComparator.java
        ProjectTemplateManager.java
        ProposalsComparator.java
        TexContextType.java
        TexTemplateCompletion.java
        TexTemplatePreferencesPage.java
        texparser
        LatexLexer.java
        LatexParser.java
        LatexParserUtils.java
        LatexRefExtractingParser.java
        LatexWordCounter.java
        TexParser.java
        analysis
        Analysis.java
        AnalysisAdapter.java
        lexer
        Lexer.java
        LexerException.java
        node
        EOF.java
        Node.java
        Switch.java
        Switchable.java
        TArgument.java
        TBverbatim.java
        TCbegin.java
        TCbib.java
        TCbibstyle.java
        TCchapter.java
        TCcite.java
        TCend.java
        TCinclude.java
        TCinput.java
        TClabel.java
        TCnew.java
        TCommentline.java
        TCpackage.java
        TCparagraph.java
        TCpart.java
        TCpbib.java
        TCpindex.java
        TCref.java
        TCrenew.java
        TCsection.java
        TCspace.java
        TCssection.java
        TCsssection.java
        TCsymbol.java
        TCverb.java
        TCword.java
        TEverbatim.java
        TLBrace.java
        TLBracket.java
        TOptargument.java
        TRBrace.java
        TRBracket.java
        TSkippedArea.java
        TStar.java
        TTaskcomment.java
        TVtext.java
        TWhitespace.java
        TWord.java
        Token.java
        treeview
        views
        TexOutlineTreeView.java
        ui
        KpathseaProvider.java
        viewer
        TexLaunchConfigurationDelegate.java
        TexLaunchConfigurationTab.java
        TexLaunchConfigurationTabGroup.java
        ViewerAttributeRegistry.java
        ViewerConfigDialog.java
        ViewerManager.java
        ViewerOutputScanner.java
        util
        FileLocationClient.java
        FileLocationListener.java
        FileLocationServer.java
        ViewerErrorScanner.java
        wizards
        TexlipseNewTexFileWizard.java
        TexlipseNewTexFileWizardPage.java
        TexlipseProjectAttributes.java
        TexlipseProjectCreationOperation.java
        TexlipseProjectCreationWizard.java
        TexlipseProjectCreationWizardPage.java
        TexlipseProjectFilesWizardPage.java
        TexlipseWizardPage.java

/*
 *
 * Copyright (c) 2004-2011 by the TeXlapse Team.
 * All rights reserved. This program and the accompanying materials
 * are made available under the terms of the Eclipse Public License v1.0
 * which accompanies this distribution, and is available at
 * http://www.eclipse.org/legal/epl-v10.html
 */
package net.sourceforge.texlipse.texparser;

import java.io.IOException;
import java.io.PushbackReader;
import java.io.StringReader;

import net.sourceforge.texlipse.texparser.lexer.LexerException;
import net.sourceforge.texlipse.texparser.node.EOF;
import net.sourceforge.texlipse.texparser.node.TArgument;
import net.sourceforge.texlipse.texparser.node.TCchapter;
import net.sourceforge.texlipse.texparser.node.TCcite;
import net.sourceforge.texlipse.texparser.node.TCommentline;
import net.sourceforge.texlipse.texparser.node.TCparagraph;
import net.sourceforge.texlipse.texparser.node.TCpart;
import net.sourceforge.texlipse.texparser.node.TCsection;
import net.sourceforge.texlipse.texparser.node.TCssection;
import net.sourceforge.texlipse.texparser.node.TCsssection;
import net.sourceforge.texlipse.texparser.node.TOptargument;
import net.sourceforge.texlipse.texparser.node.TStar;
import net.sourceforge.texlipse.texparser.node.TWhitespace;
import net.sourceforge.texlipse.texparser.node.TWord;
import net.sourceforge.texlipse.texparser.node.Token;


/**
 * A LaTeX word counting parser. Counts the likely printed words from
 * the given string, ie. all normal words and the contents of sectioning 
 * commands are counted. Cite-references are counted as one word.
 * 
 * @author Oskar Ojala
 */
public class LatexWordCounter {

    private String selection;

    /**
     * Creates new word counter with a string with words to count.
     * 
     * @param selection The string to use for counting words
     */
    public LatexWordCounter(String selection) {
        this.selection = selection;
    }

    /**
     * Counts the number of (LaTeX) words in the string that this
     * object contains.
     * 
     * @return The number of words or -1 on an error
     */
    public int countWords() {
        try {
            LatexLexer lexer = new LatexLexer(new PushbackReader(new StringReader(selection), 4096));

            int words = 0;
            boolean expectArg = false;
            for (Token t = lexer.next(); !(t instanceof EOF); t = lexer.next()) {
                if (expectArg) {
                    if (t instanceof TArgument) {
                        words += t.getText().split("\\s+").length;
                        expectArg = false;
                    } else if (!(t instanceof TOptargument) && !(t instanceof TWhitespace)
                            && !(t instanceof TStar) && !(t instanceof TCommentline)) {
                        // this is an error state, but we'll skip it
                        expectArg = false;
                    }
                } else {
                    if (t instanceof TWord || t instanceof TCcite) {
                        if (!"&".equals(t.getText()))
                            words++;
                    } else if (t instanceof TWhitespace) { // make the common case fast
                        continue;
                    } else if (t instanceof TCpart || t instanceof TCchapter 
                            || t instanceof TCsection || t instanceof TCssection 
                            || t instanceof TCsssection || t instanceof TCparagraph)
                        expectArg = true;
                }
            }
            return words;
        } catch (IOException e) {
            return -1;
        } catch (LexerException e) {
            return -1;
        }
    }
}