BytecodeSourceParser.java example

Explorer

CFIDE-master
- src
  - eu
    - bibl
      - cfide
        Boot.java
        context
        CFIDEContext.java
        engine
        compiler
        BasicSourceCompiler.java
        CFIDECompiler.java
        CompilerException.java
        ICompiler.java
        builder
        BuilderException.java
        IBuilder.java
        cfideimpl
        BytecodeClassNodeBuilder.java
        LabelHandler.java
        MethodIndeciesHandler.java
        SourceOpcodeUtil.java
        parser
        BasicTokenParser.java
        IParser.java
        ParserException.java
        ParserToken.java
        cfideimpl
        BytecodeSourceParser.java
        tokens
        member
        ClassMemberToken.java
        FieldMemberToken.java
        MemberCloseToken.java
        MemberToken.java
        MetaItemToken.java
        MethodMemberToken.java
        using
        UsingASMToken.java
        UsingToken.java
        UsingVerToken.java
        decompiler
        AdvancedInstructionPrinter.java
        ClassNodeDecompilationUnit.java
        DecompilationUnit.java
        FieldNodeDecompilationUnit.java
        MethodNodeDecompilationUnit.java
        PrefixedStringBuilder.java
        launch
        JarLauncher.java
        dump
        CustomClassWriter.java
        CustomJarDumper.java
        plugin
        AbstractCFIDEPlugin.java
        PluginManager.java
        ui
        PluginViewerFrame.java
        PluginViewerTable.java
        PluginViewerTreeModel.java
        util
        FilterCollection.java
        StringArrayReader.java
        eventbus
        BusRegistry.java
        Event.java
        EventBus.java
        EventCancellable.java
        EventListenerData.java
        EventPriority.java
        EventStoppable.java
        EventTarget.java
        events
        ContextSwitchEvent.java
        io
        FileConstants.java
        config
        CFIDEConfig.java
        ConfigUtils.java
        GlobalConfig.java
        ui
        IDEFrame.java
        IDETabbedPane.java
        ProjectPanel.java
        UISettings.java
        editor
        EditorTabbedPane.java
        EditorTextTab.java
        tree
        ClassTreeNode.java
        ClassViewerTree.java
        DefaultPackageTreeNode.java
        PackageTreeNode.java

package eu.bibl.cfide.engine.compiler.parser.cfideimpl;

import java.util.ArrayList;
import java.util.List;

import eu.bibl.cfide.context.CFIDEContext;
import eu.bibl.cfide.engine.compiler.parser.BasicTokenParser;
import eu.bibl.cfide.engine.compiler.parser.ParserException;
import eu.bibl.cfide.engine.compiler.parser.ParserToken;
import eu.bibl.cfide.engine.compiler.parser.cfideimpl.tokens.member.ClassMemberToken;
import eu.bibl.cfide.engine.compiler.parser.cfideimpl.tokens.member.FieldMemberToken;
import eu.bibl.cfide.engine.compiler.parser.cfideimpl.tokens.member.MemberCloseToken;
import eu.bibl.cfide.engine.compiler.parser.cfideimpl.tokens.member.MethodMemberToken;
import eu.bibl.cfide.engine.compiler.parser.cfideimpl.tokens.using.UsingToken;
import eu.bibl.cfide.engine.util.StringArrayReader;

public class BytecodeSourceParser extends BasicTokenParser {
	
	protected CFIDEContext context;
	
	public BytecodeSourceParser(CFIDEContext context) {
		this.context = context;
	}
	
	@Override
	public List<ParserToken> parse(String text) throws ParserException {
		StringArrayReader reader = new StringArrayReader(scanStringTokens(text));
		List<ParserToken> tokens = new ArrayList<ParserToken>();
		
		int line = 1; // track line numbers
		try {
			while (reader.canReadNext()) {
				String sToken = reader.read();
				String uToken = sToken.toUpperCase();
				
				if (sToken.equals("\n")) {
					line++;
					continue;
				} else if (uToken.equals("}")) {
					tokens.add(new MemberCloseToken());
				}
				
				if (uToken.equals("USING")) {
					int i = reader.index();
					ParserToken token = UsingToken.create(reader);
					tokens.add(token);
					reader.set(i + 1);
				} else if (uToken.equals("CLASS:")) {
					int i = reader.index();
					ParserToken token = ClassMemberToken.create(reader);
					tokens.add(token);
					reader.set(i + 1);
				} else if (uToken.equals("FIELD:")) {
					int i = reader.index();
					ParserToken token = FieldMemberToken.create(reader);
					tokens.add(token);
					reader.set(i + 1);
				} else if (uToken.equals("METHOD:")) {
					int i = reader.index();
					ParserToken token = MethodMemberToken.create(reader);
					tokens.add(token);
					reader.set(i + 1);
				}
			}
		} catch (Exception e) {
			throw new ParserException("Parser error on line " + line, e);
		}
		
		return tokens;
	}
	
	/**
	 * Turns a string, probably with spacing and new lines are filters out everything unnecessary such as: <br>
	 * <ul>
	 * <li>Spaces</li>
	 * <li>Tabs</li>
	 * <li>New lines</li>
	 * </ul>
	 * <code>
	 * 		invokestatic MyClass.myMethod:desc()
	 * 		ldc "my name is so \"cool\""
	 * </code> <br>
	 * would be turned into: <br>
	 * <ul>
	 * <li>invokestatic</li>,
	 * <li>MyClass.myMethod:desc()</li>,
	 * <li>ldc</li>,
	 * <li>"my name is so \"cool\""</li>
	 * </ul>
	 * Also supports single line comments, but does not add them as data to return. <br>
	 * The returned list contains '\n' characters if present so provide line number support.
	 * @see TextToBytecodeParser#getNextStringToken(char[], int)
	 * @param text Raw input text to
	 * @return {@link List} of Strings
	 */
	protected List<String> scanStringTokens(String text) {
		char[] chars = text.toCharArray();
		List<String> tokens = new ArrayList<String>();
		boolean blocking = false;
		for (int i = 0; i < chars.length; i++) {
			char c = chars[i];
			if (blocking) {// if we're currently in a comment
				if (c == '\n') {// if new line, comment ends, start parsing
					blocking = false;
					tokens.add("\n");
					continue;
				}
			} else {
				if ((c == '/') && (chars[i + 1] == '/')) {// comment start
					blocking = true;
					i++;
				} else {
					String token = getNextStringToken(chars, i);
					if (token.length() > 0) { // prevent empty tokens: http://xn--wxa.pw/dfk
						int read = token.length();
						
						if (token.contains("\n")) {
							for (int j = i; j < (i + read); j++) {
								char c1 = chars[j];
								if (c1 == '\n') {
									tokens.add("\n");
								}
							}
							token = token.replace("\n", "");
							read = token.length();
							tokens.add(token);
							i += read;
						} else {
							tokens.add(token);
							i += read;// skip the amount of characters we just read
						}
					}
				}
			}
		}
		return tokens;
	}
	
	/**
	 * Reads characters until it finds either a line break, a space or a tab. <br>
	 * <b>N.B.</b> The line break is returned at the end.<br>
	 * This method also has the ability to read string literals with escaped strings inside of them. <br>
	 * <code>"\"\""</code> <br>
	 * would be 1 token. <br>
	 * @param chars Input character array
	 * @param start Last tokens end index
	 * @return Next nonwhitespace (except '\n') valid token
	 */
	protected String getNextStringToken(char[] chars, int start) {
		StringBuilder sb = new StringBuilder();
		int len = chars.length;
		int locked = 0;
		int depth = 0; // used when locked == 2
		
		while (start < len) {
			char c = chars[start++];
			if (locked == 0) {// 0 = not locked, 1 = "", 2 = <>
				if (c == '"') {
					locked = 1;
				} else if (c == '<') {
					locked = 2;
				} else {
					if (Character.isWhitespace(c) && (c != '\n')) {
						break;
					} else if (c == '\n') {
						sb.append(c);
						break;
					}
				}
			} else if (locked == 1) {// in a string "" block, don't break loop on '\n'
				if ((c == '"') && (chars[start - 2] != '\\')) { // check for unescapped " and -2 because of the ++ before
					locked = 0;
				}
			} else if (locked == 2) {
				if (c == '<') {
					depth++;
				} else if (c == '>') {
					depth--;
					if (depth <= 0) {
						locked = 0;
					}
				}
			}
			
			sb.append(c);
		}
		return sb.toString();
	}
}