WordTokenizer.java example

Explorer

jmeld-master
- src
  - main
    - java
      - com
        jgoodies
        looks
        plastic
        theme
        MySkyBluer.java
      - org
        apache
        commons
        jrcs
        diff
        AddDelta.java
        ChangeDelta.java
        Chunk.java
        DeleteDelta.java
        Delta.java
        Diff.java
        DiffAlgorithm.java
        DiffException.java
        DifferentiationFailedException.java
        PatchFailedException.java
        Revision.java
        RevisionVisitor.java
        myers
        DiffNode.java
        MyersDiff.java
        PathNode.java
        Snake.java
        tools
        JDiff.java
        util
        ToString.java
        jmeld
        tools
        ant
        BuildException.java
        DirectoryScanner.java
        taskdefs
        condition
        Condition.java
        Os.java
        types
        Resource.java
        ResourceFactory.java
        selectors
        FileSelector.java
        SelectorScanner.java
        SelectorUtils.java
        util
        FileUtils.java
        eclipse
        compare
        internal
        LCS.java
        rangedifferencer
        DifferencesIterator.java
        IRangeComparator.java
        RangeComparatorLCS.java
        RangeDifference.java
        RangeDifferencer.java
        jdesktop
        swingworker
        AccumulativeRunnable.java
        SwingPropertyChangeSupport.java
        SwingWorker.java
        jmeld
        JMeld.java
        JMeldException.java
        Version.java
        diff
        AbstractJMDiffAlgorithm.java
        EclipseDiff.java
        JMChunk.java
        JMDelta.java
        JMDiff.java
        JMDiffAlgorithmIF.java
        JMRevision.java
        MaxTimeExceededException.java
        MyersDiff.java
        TypeDiff.java
        model
        LevenshteinTableModel.java
        settings
        ColorSetting.java
        EditorSettings.java
        FilterSettings.java
        FolderSettings.java
        FontSetting.java
        JMeldSettings.java
        util
        Filter.java
        FilterRule.java
        ui
        AbstractBarDialog.java
        AbstractContentPanel.java
        BufferDiffPanel.java
        CollectDiffNodeLeaf.java
        DefaultContextMenu.java
        DirectoryComparison.java
        FileComparison.java
        FilePanel.java
        FilePanelBar.java
        FolderDiffForm.java
        FolderDiffMouseAdapter.java
        FolderDiffPanel.java
        FolderDiffTreeTableModel.java
        JMeldComponent.java
        JMeldContentPanelIF.java
        JMeldPanel.java
        ListScrollSynchronizer.java
        Option.java
        PanelDialog.java
        PanelDialogForm.java
        RevisionBar.java
        SavePanelDialog.java
        SaveSettingsPanel.java
        ScrollSynchronizer.java
        StatusBar.java
        UINode.java
        VersionControlComparison.java
        VersionControlFolderDiffPanel.java
        VersionControlPanel.java
        VersionControlTreeTableModel.java
        action
        ActionHandler.java
        Actions.java
        MeldAction.java
        bar
        LineNumberBarDialog.java
        diffbar
        DiffScrollComponent.java
        dnd
        DragAndDropPanel.java
        help
        HelpPanel.java
        search
        SearchBarDialog.java
        SearchCommand.java
        SearchHit.java
        SearchHits.java
        settings
        EditorSettingsForm.java
        EditorSettingsPanel.java
        FilterSettingsForm.java
        FilterSettingsPanel.java
        FolderSettingsForm.java
        FolderSettingsPanel.java
        SaveSettingsDialog.java
        SettingCellRenderer.java
        Settings.java
        SettingsPanel.java
        SettingsPanelForm.java
        swing
        BusyLabel.java
        ColumnGroup.java
        DetailHeader.java
        DiffLabel.java
        GradientLabel.java
        JMHighlightLinePainter.java
        JMHighlightNewLinePainter.java
        JMHighlightPainter.java
        JMHighlighter.java
        LeftScrollPaneLayout.java
        LineNumberBorder.java
        MultiLineHeaderRenderer.java
        table
        JMTable.java
        JMTableModel.java
        JMTreeTable.java
        JMTreeTableModel.java
        util
        JMComboBoxEditor.java
        JMComboBoxRenderer.java
        text
        AbstractBufferDocument.java
        BufferDocumentChangeListenerIF.java
        BufferDocumentIF.java
        FileDocument.java
        JMDocumentEvent.java
        VersionControlBaseDocument.java
        tree
        DiffTree.java
        DiffTreeCellRenderer.java
        JMChange.java
        JMChunkNode.java
        JMDeltaNode.java
        TreeColorIcon.java
        util
        BrightnessFilter.java
        ColorUtil.java
        Colors.java
        EmptyIcon.java
        FontUtil.java
        ImageUtil.java
        LookAndFeelManager.java
        RevisionUtil.java
        SwingUtil.java
        TabExitEvent.java
        TabExitListenerIF.java
        TabIcon.java
        ToolBarBuilder.java
        ToolBarSeparator.java
        TransparentFilter.java
        TypeTokenizerManager.java
        WidgetFactory.java
        util
        CharsetDetector.java
        DiffUtil.java
        Ignore.java
        JaxbPersister.java
        ObjectUtil.java
        Option.java
        PrintProperties.java
        RegexUtil.java
        ResourceLoader.java
        Result.java
        StopWatch.java
        StringUtil.java
        Tokenizer.java
        TokenizerFactory.java
        UIDefaultsPrint.java
        WeakHashSet.java
        WordTokenizer.java
        conf
        AbstractConfiguration.java
        AbstractConfigurationElement.java
        ConfigurationListenerIF.java
        ConfigurationManager.java
        ConfigurationPersister.java
        ConfigurationPreference.java
        file
        CompareUtil.java
        DirectoryDiff.java
        FileUtil.java
        FolderDiff.java
        VersionControlDiff.java
        cmd
        AbstractCmd.java
        CopyFileCmd.java
        RemoveFileCmd.java
        node
        BufferNode.java
        FileNode.java
        JMDiffNode.java
        JMDiffNodeFactory.java
        JMeldNode.java
        VersionControlBaseNode.java
        prefs
        AppPreferences.java
        ComboBoxPreference.java
        ComboBoxSelectionPreference.java
        DirectoryChooserPreference.java
        FileChooserPreference.java
        Preference.java
        TabbedPanePreference.java
        WindowPreference.java
        vc
        BaseFile.java
        BlameIF.java
        DiffIF.java
        StatusResult.java
        VersionControlIF.java
        VersionControlUtil.java
        bzr
        ActiveCmd.java
        BazaarVersionControl.java
        CatCmd.java
        InstalledCmd.java
        StatusCmd.java
        git
        ActiveCmd.java
        BranchCmd.java
        CatCmd.java
        GitVersionControl.java
        InstalledCmd.java
        LogCmd.java
        StatusCmd.java
        TagCmd.java
        hg
        ActiveCmd.java
        CatCmd.java
        InstalledCmd.java
        MercurialVersionControl.java
        StatusCmd.java
        svn
        ActiveCmd.java
        BlameCmd.java
        BlameData.java
        CatCmd.java
        DiffCmd.java
        DiffData.java
        InfoCmd.java
        InfoData.java
        InstalledCmd.java
        LogCmd.java
        LogData.java
        StatusCmd.java
        StatusData.java
        SubversionVersionControl.java
        SvnXmlCmd.java
        util
        VcCmd.java
  - test
    - java
      - org
        jmeld
        DirComparison.java
        FileComparison.java
        VcsComparison.java

/*
   JMeld is a visual diff and merge tool.
   Copyright (C) 2007  Kees Kuip
   This library is free software; you can redistribute it and/or
   modify it under the terms of the GNU Lesser General Public
   License as published by the Free Software Foundation; either
   version 2.1 of the License, or (at your option) any later version.
   This library is distributed in the hope that it will be useful,
   but WITHOUT ANY WARRANTY; without even the implied warranty of
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
   Lesser General Public License for more details.
   You should have received a copy of the GNU Lesser General Public
   License along with this library; if not, write to the Free Software
   Foundation, Inc., 51 Franklin Street, Fifth Floor,
   Boston, MA  02110-1301  USA
 */
package org.jmeld.util;

import java.util.*;
import java.util.regex.*;

public class WordTokenizer implements Tokenizer
{
  private Pattern p;

  public WordTokenizer(String pattern)
  {
    p = Pattern.compile(pattern);
  }

  /** Get the tokens of the text.
   *   All tokens and non-tokens are returned in the result.
   *   So that the length of the text is the same length as
   *   the length of all tokens.
   */
  @Override
  public List<String> getTokens(String text)
  {
    Matcher m;
    List<String> result;
    int index;
    String s;

    result = new ArrayList<String>();

    index = 0;
    m = p.matcher(text);
    while (m.find())
    {
      s = text.substring(index, m.start());
      // Here the text starts with a token!
      if (s.length() > 0)
      {
        result.add(s);
        index += s.length();
      }

      // Add the string that matches the token also to the result.
      s = text.substring(m.start(), m.end());
      if (s.length() > 0)
      {
        result.add(s);
        index += s.length();
      }
    }

    // Here the text does not end with the pattern!
    if (index < text.length())
    {
      s = text.substring(index, text.length());
      if (s.length() > 0)
      {
        result.add(s);
      }
    }

    return result;
  }
}