RubyTokenizer.java example

Explorer

rdt-master
- plugins
- tests
  - com.aptana.rdt.tests
    - src
      - com
        aptana
        rdt
        AptanaRDTTests.java
        TS_Aptana.java
        core
        rspec
        RSpecStructureCreatorTest.java
        internal
        core
        gems
        AbstractGemParserTestCase.java
        AllTests.java
        GemManagerTest.java
        GemOnePointTwoParserTest.java
        GemParserTest.java
        HybridGemParserTest.java
        ShortListingGemParserTest.java
        parser
        warnings
        AccidentalBooleanAssignmentVisitorTest.java
        ConstantNamingConventionTest.java
        ControlCoupleTest.java
        DynamicVariableAliasesLocalTest.java
        FeatureEnvyTest.java
        LocalsMaskingMethodsVisitorTest.java
        MockProblemRequestor.java
        TC_CodeComplexity.java
        TC_CodeComplexityMaxLocals.java
        TC_CodeComplexityTooManyArguments.java
        TC_CodeComplexityTooManyReturns.java
        TC_ComparableInclusionVisitor.java
        TC_EnumerableInclusionVisitor.java
        TC_SimilarVariableNameVisitor.java
        TC_UnecessaryElseVisitor.java
        TS_ParserWarnings.java
        UncommunicativeNameTest.java
        WarningVisitorTest.java
  - org.rubypeople.eclipse.shams
    - src
      - org
        rubypeople
        eclipse
        shams
        debug
        core
        ShamLaunchConfiguration.java
        ShamLaunchConfigurationType.java
        ShamLaunchConfigurationWorkingCopy.java
        ShamLaunchManager.java
        resources
        ShamContainer.java
        ShamFile.java
        ShamFolder.java
        ShamProject.java
        ShamResource.java
        ShamResourceProxy.java
        runtime
        ShamException.java
        ShamIPath.java
        ShamPreferences.java
  - org.rubypeople.eclipse.testutils
    - src
      - org
        rubypeople
        eclipse
        testutils
        ResourceTools.java
  - org.rubypeople.rdt.core.tests
    - src
      - org
        rubypeople
        rdt
        TS_RdtCore.java
        core
        formatter
        TC_EditableFormatHelper.java
        TestReWriteVisitor.java
        rewriter
        TestBooleanStateStack.java
        tests
        AbstractRubyModelTest.java
        ModifyingResourceTest.java
        model
        BufferTests.java
        util
        Util.java
        util
        TS_CoreUtil.java
        UtilTest.java
        internal
        TS_Internal.java
        codeassist
        CompletionContextTest.java
        CompletionEngineTest.java
        TS_InternalCodeAssist.java
        core
        ShamResourceChangeEvent.java
        ShamResourceDelta.java
        TC_LoadPathEntry.java
        TC_RubyCore.java
        TC_RubyProject.java
        TS_InternalCore.java
        builder
        TS_InternalCoreBuilder.java
        parser
        ShamNode.java
        TC_RubyParser.java
        TC_TaskParser.java
        TS_InternalCoreParser.java
        warnings
        AbstractRubyLintVisitorTestCase.java
        ConstantReassignmentVisitorTest.java
        CoreClassReOpeningTest.java
        EmptyStatementVisitorTest.java
        Ruby19HashCommaSyntaxTest.java
        Ruby19WhenStatementsTest.java
        TS_InternalCoreParserWarnings.java
        search
        AllTests.java
        MethodPatternParserTest.java
        util
        ASTUtilTest.java
        TS_Util.java
        formatter
        AbstractCodeFormatterTestCase.java
        TC_ASTBasedCodeFormatter.java
        TC_CodeFormatter.java
        TS_InternalFormatter.java
        ti
        CombinedTypeInferrerTest.java
        DataFlowTypeInferrerTest.java
        ReferenceMatchTest.java
        TS_TypeInference.java
        TypeInferrerTest.java
        TypeInferrerTestCase.java
  - org.rubypeople.rdt.debug.core.tests
    - src
      - org
        rubypeople
        rdt
        debug
        core
        tests
        FTC_AbstractDebuggerCommunicationTest.java
        FTC_ClassicDebuggerCommunicationTest.java
        FTC_DebuggerLaunch.java
        FTC_DebuggerProxyTest.java
        FTC_ReadStrategyTest.java
        FTC_RubyDebugCommunicationTest.java
        FTC_Single.java
        FTS_Debug.java
        NonBlockingSocketReader.java
        OutputRedirectorThread.java
        RdtDebugTestsPlugin.java
        TC_RubyDebugTarget.java
        TS_UnitTests.java
        TestRubyDebugTarget.java
        TestXmlStreamReader.java
        WasteReader.java
  - org.rubypeople.rdt.debug.ui.tests
    - src
      - org
        rubypeople
        rdt
        debug
        ui
        tests
        RdtDebugUiTestsPlugin.java
        TS_DebugUi.java
        internal
        debug
        ui
        TC_RubyConsoleTracker.java
        TC_RubySourceLocator.java
        TS_InternalDebugUi.java
        launcher
        ShamApplicationLaunchConfigurationDelegate.java
        TC_RubyApplicationShortcut.java
        TC_RubyArgumentsTab.java
        TC_RubyEntryPointTab.java
        TC_RubyEnvironmentTab.java
        TS_InternalDebugUiLauncher.java
  - org.rubypeople.rdt.launching.tests
    - src
      - org
        rubypeople
        rdt
        internal
        launching
        EvaluateRubyProcessOutput.java
        ShamProcess.java
        TC_RubyInterpreter.java
        TC_RubyRuntime.java
        TC_RunnerLaunching.java
        TS_InternalLaunching.java
        TestRubyDebugDebugger.java
        TestVM.java
        TestVMDebugger.java
        TestVMRunner.java
        TestVMType.java
        launching
        tests
        TS_Launching.java
  - org.rubypeople.rdt.refactoring.tests
    - src
      - org
        rubypeople
        rdt
        refactoring
        tests
        FilePropertyData.java
        FileTestCase.java
        FileTestData.java
        FileTestSuite.java
        MultiFileTestData.java
        RefactoringConditionTestCase.java
        RefactoringTestCase.java
        TS_All.java
        TestsPlugin.java
        TreeProviderTester.java
        TwoLayerTreeEditProviderTester.java
        classnodeprovider
        ClassNodeProviderTester.java
        TC_ClassNodeProvider.java
        TC_IncludedClassesProvider.java
        TS_ClassNodeProvider.java
        core
        MultipleDocumentsInOneProvider.java
        TC_ModuleNodeProvider.java
        TC_NodeProvider.java
        TC_RefactoringConditionChecker.java
        TC_SelectionNodeProvider.java
        TS_Core.java
        convertlocaltofield
        LocalToFieldTester.java
        TS_LocalToField.java
        conditionchecks
        LocalToFieldConditionTester.java
        TS_LocalToFieldChecks.java
        encapsulatefield
        EncapsulateFieldTester.java
        TS_EncapsulateField.java
        conditionchecks
        EncapsulateFieldConditionTester.java
        TS_EncapsulateFieldChecks.java
        extractconstant
        ExtractConstantTester.java
        TS_ExtractConstant.java
        conditionchecks
        ExtractConstantConditionTester.java
        TS_ExtractConstantChecks.java
        extractmethod
        ExtractMethodTester.java
        TS_ExtractMethod.java
        conditionchecks
        ExtractMethodConditionTester.java
        TS_ExtractMethodChecks.java
        generateaccessors
        AccessorSelection.java
        GenerateAccessorTester.java
        TC_AccessorsGeneratorTreeTest.java
        TS_GenerateAccessors.java
        generateconstructor
        ConstructorGeneratorTester.java
        TC_ConstructorGeneratorTreeTest.java
        TS_GenerateConstructor.java
        inlineclass
        ClassInlinerTester.java
        TS_InlineClass.java
        conditionchecks
        InlineClassConditionTester.java
        TS_InlineClassChecks.java
        inlinelocal
        LocalInlinerTester.java
        TS_InlineLocal.java
        conditionchecks
        InlineLocalConditionTester.java
        TS_InlineLocalConditionChecks.java
        inlinemethod
        FinderTestsBase.java
        InlineMethodTester.java
        TC_MethodBodyStatementReplacer.java
        TC_MethodFinder.java
        TC_ParameterReplacer.java
        TC_RenameDuplicatedVariables.java
        TC_ReturnStatementReplacer.java
        TC_SelectedCallFinder.java
        TC_TargetClassFinder.java
        TS_InlineMethod.java
        conditions
        InlineMethodConditionTester.java
        TS_InlineMethodChecks.java
        mergeclasspartsinfile
        ClassPartSelectorTester.java
        TS_MergeClassPartsInFile.java
        conditionchecks
        MergeInFileConditionTester.java
        TS_MergeClassPartsInFileChecks.java
        mergewithexternalclassparts
        MergeWithExternalClassPartsTester.java
        TS_MergeWithExternalClassParts.java
        conditionchecks
        MergeWithExternalConditionTester.java
        TS_MergetWitExternalChecks.java
        movefield
        MoveFieldTester.java
        TS_MoveField.java
        conditionchecks
        MoveFieldConditionTester.java
        TS_MoveFieldChecks.java
        movemethod
        MoveMethodTester.java
        TS_MoveMethod.java
        conditionchecks
        MoveMethodConditionTester.java
        TS_MoveMethodChecks.java
        nodewrapper
        TC_FieldNodeWrapper.java
        TC_MethodNodeWrapper.java
        TS_NodeWrapper.java
        overridemethod
        OverrideMethodTester.java
        TC_MethodOverriderTreeTest.java
        TC_OverridenMethodEditTest.java
        TS_OverrideMethod.java
        pushdown
        PushDownTester.java
        TC_MethodDownPusherTreeTest.java
        TS_PushDown.java
        rename
        RenameTester.java
        TS_Rename.java
        renameclass
        ClassRenameTester.java
        TC_ClassFinder.java
        TC_ClassInstanciationFinder.java
        TS_RenameClass.java
        conditionchecker
        RenameClassConditionTester.java
        TS_RenameClassChecks.java
        renamefield
        FieldRenamerTester.java
        TS_RenameField.java
        conditionchecks
        RenameFieldConditionTester.java
        TS_RenameFieldChecks.java
        renamelocal
        RenameLocalTester.java
        TS_RenameLocal.java
        conditionchecks
        RenameLocalConditionTester.java
        TS_RenameLocalCondition.java
        renamemethod
        MethodRenamerTester.java
        TS_RenameMethod.java
        conditioncheck
        RenameMethodConditionTester.java
        TS_RenameMethodChecks.java
        selection
        RenameMethodSelectionTester.java
        TS_RenameMethodSelection.java
        renamemodule
        ModuleRenameTester.java
        TC_ModuleInclusionFinder.java
        TS_RenameModule.java
        conditionchecker
        RenameModuleConditionTester.java
        TS_RenameModuleChecks.java
        splitlocal
        SplitLocalTester.java
        TC_LocalVarFinder.java
        TC_SplittedVariableRenamer.java
        TS_SplitLocal.java
        conditionchecks
        SplitLocalConditionTester.java
        TS_SplitLocalChecks.java
        util
        TC_FileHelper.java
        TC_HSRFormatter.java
        TC_NameHelper.java
        TC_NameValidator.java
        TC_NodeUtil.java
        TC_StringHelper.java
        TS_Util.java
  - org.rubypeople.rdt.tests.all
    - src
      - org
        rubypeople
        rdt
        tests
        all
        TS_RdtAllFunctionalTests.java
        TS_RdtAllUnitTests.java
  - org.rubypeople.rdt.ui.tests
    - src
      - org
        rubypeople
        rdt
        internal
        corext
        util
        RDocUtiltest.java
        ui
        RdtUiTestsPlugin.java
        TC_ResourceAdapterFactory.java
        TC_RubyFileMatcher.java
        TC_StackTraceLine.java
        TS_InternalUi.java
        rubyeditor
        TC_TabConverter.java
        TS_InternalUiRubyEditor.java
        search
        MarkOccurrencesTest.java
        MockTreeViewer.java
        TS_InternalUiRubySearch.java
        text
        TC_RubyPartitionScanner.java
        TC_RubyWordFinder.java
        TS_InternalUiText.java
        TestDocumentCommand.java
        ruby
        TC_RubyAutoIndentStrategy.java
        TC_RubyTokenScanner.java
        spelling
        SpellCheckEngineTest.java
        util
        InternalUIUtilTests.java
        StringMatcherTest.java
        TwoArrayQuickSorterTest.java
        ui
        tests
        TS_Ui.java

/**
 * BSD-style license; for more info see http://pmd.sourceforge.net/license.html
 * @authors: Zev Blut zb@ubit.com
 */
package org.rubypeople.rdt.internal.core.pmd;

import java.util.List;

public class RubyTokenizer implements Tokenizer {
    private boolean downcaseString = true;

    public void tokenize(SourceCode tokens, Tokens tokenEntries) {
        List code = tokens.getCode();
        int curLineOffset = 0;
        for (int i = 0; i < code.size(); i++) {
            String currentLine = (String) code.get(i);
            int loc = 0;
            int startOffset = 0;
            while (loc < currentLine.length()) {
                StringBuffer token = new StringBuffer();
                startOffset = curLineOffset + loc;
                loc = getTokenFromLine(currentLine, token, loc);
                if (token.length() > 0 && !isIgnorableString(token.toString())) {
                    if (downcaseString) {
                        token = new StringBuffer(token.toString().toLowerCase());
                    }
                    tokenEntries.add(new TokenEntry(token.toString(),
                            tokens.getFileName(),
                            i + 1, startOffset, startOffset + token.length()));
                }
            }
            curLineOffset += currentLine.length();
        }
        tokenEntries.add(TokenEntry.getEOF());
    }

    private int getTokenFromLine(String line, StringBuffer token, int loc) {
        for (int j = loc; j < line.length(); j++) {
            char tok = line.charAt(j);
            if (!Character.isWhitespace(tok) && !ignoreCharacter(tok)) {
                if (isComment(tok)) {
                    if (token.length() > 0) {
                        return j;
                    } else {
                        return getCommentToken(line, token, loc);
                    }
                } else if (isString(tok)) {
                    if (token.length() > 0) {
                        //if (loc == lin
                        return j; // we need to now parse the string as a seperate token.
                    } else {
                        // we are at the start of a string
                        return parseString(line, token, j, tok);
                    }
                } else {
                    token.append(tok);
                }
            } else {
                if (token.length() > 0) {
                    return j;
                }
            }
            loc = j;
        }
        return loc + 1;
    }

    private int parseString(String line, StringBuffer token, int loc, char stringType) {
        boolean escaped = false;
        boolean done = false;
        //System.out.println("Parsing String:" + stringType);
        //System.out.println("Starting loc:" + loc);
        // problem of strings that span multiple lines :-(
        char tok = ' '; // this will be replaced.
        while ((loc < line.length()) && !done) {
            tok = line.charAt(loc);
            if (escaped && tok == stringType) {
                //     System.out.println("Found an escaped string");
                escaped = false;
            } else if (tok == stringType && (token.length() > 0)) {
                // we are done
                //   System.out.println("Found an end string");
                done = true;
            } else if (tok == '\\') {
                // System.out.println("Found an escaped char");
                escaped = true;
            } else {
                // System.out.println("Adding char:" + tok + ";loc:" + loc);
                escaped = false;
            }
            //System.out.println("Adding char to String:" + token.toString());
            token.append(tok);
            loc++;
        }
        return loc + 1;
    }

    private boolean ignoreCharacter(char tok) {
        boolean result = false;
        switch (tok) {
            case '{':
            case '}':
            case '(':
            case ')':
            case ';':
            case ',':
                result = true;
                break;
            default :
                result = false;
        }
        return result;
    }

    private boolean isString(char tok) {
        boolean result = false;
        switch (tok) {
            case '\'':
            case '"':
                result = true;
                break;
            default:
                result = false;
        }
        return result;
    }

    private boolean isComment(char tok) {
        return tok == '#';
    }

    private int getCommentToken(String line, StringBuffer token, int loc) {
        while (loc < line.length()) {
            token.append(line.charAt(loc));
            loc++;
        }
        return loc;
    }

    private boolean isIgnorableString(String token) {
        return "do".equals(token) || "end".equals(token);
    }
}