RobotUnicodeConverter.java example

Explorer

k3-master
- k3-sample
- k3-samples-deployed
  - logo
    - k3.sample.maven.logo.model
      - src
        kmLogo
        ASM
        ASMFactory.java
        ASMPackage.java
        Back.java
        BinaryExp.java
        Block.java
        Clear.java
        Constant.java
        ControlStructure.java
        Div.java
        Equals.java
        Expression.java
        Forward.java
        Greater.java
        If.java
        Instruction.java
        Left.java
        LogoProgram.java
        Lower.java
        Minus.java
        Mult.java
        Parameter.java
        ParameterCall.java
        PenDown.java
        PenUp.java
        Plus.java
        Primitive.java
        ProcCall.java
        ProcDeclaration.java
        Repeat.java
        Right.java
        While.java
        impl
        ASMFactoryImpl.java
        ASMPackageImpl.java
        BackImpl.java
        BinaryExpImpl.java
        BlockImpl.java
        ClearImpl.java
        ConstantImpl.java
        ControlStructureImpl.java
        DivImpl.java
        EqualsImpl.java
        ExpressionImpl.java
        ForwardImpl.java
        GreaterImpl.java
        IfImpl.java
        InstructionImpl.java
        LeftImpl.java
        LogoProgramImpl.java
        LowerImpl.java
        MinusImpl.java
        MultImpl.java
        ParameterCallImpl.java
        ParameterImpl.java
        PenDownImpl.java
        PenUpImpl.java
        PlusImpl.java
        PrimitiveImpl.java
        ProcCallImpl.java
        ProcDeclarationImpl.java
        RepeatImpl.java
        RightImpl.java
        WhileImpl.java
        util
        ASMAdapterFactory.java
        ASMSwitch.java
        KmLogoFactory.java
        KmLogoPackage.java
        impl
        KmLogoFactoryImpl.java
        KmLogoPackageImpl.java
        vmlogo
        CallStack.java
        Context.java
        Point.java
        Segment.java
        StackFrame.java
        Turtle.java
        VmlogoFactory.java
        VmlogoPackage.java
        impl
        CallStackImpl.java
        ContextImpl.java
        PointImpl.java
        SegmentImpl.java
        StackFrameImpl.java
        TurtleImpl.java
        VmlogoFactoryImpl.java
        VmlogoPackageImpl.java
        util
        VmlogoAdapterFactory.java
        VmlogoSwitch.java
- k3-samples-incomplete
  - cellular_automata
    - org.kermeta.language.sample.cellularautomata.geometry.model
      - src
        geometry
        Dimension.java
        Geometry.java
        GeometryFactory.java
        GeometryPackage.java
        RegularGeometry.java
        impl
        DimensionImpl.java
        GeometryFactoryImpl.java
        GeometryImpl.java
        GeometryPackageImpl.java
        RegularGeometryImpl.java
        util
        GeometryAdapterFactory.java
        GeometrySwitch.java
    - org.kermeta.language.sample.cellularautomata.geometry.model.edit
      - src
        geometry
        provider
        DimensionItemProvider.java
        GeometryEditPlugin.java
        GeometryItemProvider.java
        GeometryItemProviderAdapterFactory.java
        RegularGeometryItemProvider.java
    - org.kermeta.language.sample.cellularautomata.rules.core.cs
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        CoreRuntimeModule.java
        CoreStandaloneSetup.java
        formatting
        CoreFormatter.java
        scoping
        CoreScopeProvider.java
        validation
        CoreJavaValidator.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        AbstractCoreRuntimeModule.java
        CoreStandaloneSetupGenerated.java
        parseTreeConstruction
        CoreParsetreeConstructor.java
        parser
        antlr
        CoreAntlrTokenFileProvider.java
        CoreParser.java
        internal
        InternalCoreLexer.java
        InternalCoreParser.java
        services
        CoreGrammarAccess.java
        validation
        AbstractCoreJavaValidator.java
    - org.kermeta.language.sample.cellularautomata.rules.core.cs.ui
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        CoreUiModule.java
        contentassist
        CoreProposalProvider.java
        labeling
        CoreDescriptionLabelProvider.java
        CoreLabelProvider.java
        outline
        CoreOutlineTreeProvider.java
        quickfix
        CoreQuickfixProvider.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        AbstractCoreUiModule.java
        CoreExecutableExtensionFactory.java
        contentassist
        AbstractCoreProposalProvider.java
        antlr
        CoreParser.java
        internal
        InternalCoreLexer.java
        InternalCoreParser.java
        internal
        CoreActivator.java
    - org.kermeta.language.sample.cellularautomata.rules.core.model
      - src
        core
        Add.java
        And.java
        BinaryExpression.java
        Conditional.java
        CoreFactory.java
        CorePackage.java
        CurrentCellPopulation.java
        Div.java
        Equal.java
        Filter.java
        Greater.java
        IntegerExpression.java
        IntegerLiteral.java
        Lower.java
        Minus.java
        Mod.java
        Mult.java
        Not.java
        Or.java
        Rule.java
        UMinus.java
        UnaryExpression.java
        impl
        AddImpl.java
        AndImpl.java
        BinaryExpressionImpl.java
        ConditionalImpl.java
        CoreFactoryImpl.java
        CorePackageImpl.java
        DivImpl.java
        EqualImpl.java
        FilterImpl.java
        GreaterImpl.java
        IntegerExpressionImpl.java
        IntegerLiteralImpl.java
        LowerImpl.java
        MinusImpl.java
        ModImpl.java
        MultImpl.java
        NotImpl.java
        OrImpl.java
        RuleImpl.java
        UMinusImpl.java
        UnaryExpressionImpl.java
        util
        CoreAdapterFactory.java
        CoreSwitch.java
    - org.kermeta.language.sample.cellularautomata.rules.core.model.edit
      - src
        core
        provider
        AddItemProvider.java
        AndItemProvider.java
        BinaryExpressionItemProvider.java
        ConditionalItemProvider.java
        CoreItemProviderAdapterFactory.java
        DivItemProvider.java
        EqualItemProvider.java
        FilterItemProvider.java
        GreaterItemProvider.java
        IntegerExpressionItemProvider.java
        IntegerLiteralItemProvider.java
        LowerItemProvider.java
        MinusItemProvider.java
        ModItemProvider.java
        MultItemProvider.java
        NotItemProvider.java
        OrItemProvider.java
        RuleItemProvider.java
        Rules_coreEditPlugin.java
        UMinusItemProvider.java
        UnaryExpressionItemProvider.java
    - org.kermeta.language.sample.cellularautomata.rules.evolution.cs
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        EvolRuntimeModule.java
        EvolStandaloneSetup.java
        formatting
        EvolFormatter.java
        scoping
        EvolScopeProvider.java
        validation
        EvolJavaValidator.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        AbstractEvolRuntimeModule.java
        EvolStandaloneSetupGenerated.java
        parseTreeConstruction
        EvolParsetreeConstructor.java
        parser
        antlr
        EvolAntlrTokenFileProvider.java
        EvolParser.java
        internal
        InternalEvolLexer.java
        InternalEvolParser.java
        services
        EvolGrammarAccess.java
        validation
        AbstractEvolJavaValidator.java
    - org.kermeta.language.sample.cellularautomata.rules.evolution.cs.ui
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        EvolUiModule.java
        contentassist
        EvolProposalProvider.java
        labeling
        EvolDescriptionLabelProvider.java
        EvolLabelProvider.java
        outline
        EvolOutlineTreeProvider.java
        quickfix
        EvolQuickfixProvider.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        AbstractEvolUiModule.java
        EvolExecutableExtensionFactory.java
        contentassist
        AbstractEvolProposalProvider.java
        antlr
        EvolParser.java
        internal
        InternalEvolLexer.java
        InternalEvolParser.java
        internal
        EvolActivator.java
    - org.kermeta.language.sample.cellularautomata.rules.evolution.model
      - src
        evol
        CellularAutomata.java
        CurrentCellPopulation.java
        EvolFactory.java
        EvolPackage.java
        Max.java
        Min.java
        NeighborsExpression.java
        PopulationRange.java
        Size.java
        Sum.java
        impl
        CellularAutomataImpl.java
        CurrentCellPopulationImpl.java
        EvolFactoryImpl.java
        EvolPackageImpl.java
        MaxImpl.java
        MinImpl.java
        NeighborsExpressionImpl.java
        PopulationRangeImpl.java
        SizeImpl.java
        SumImpl.java
        util
        EvolAdapterFactory.java
        EvolSwitch.java
    - org.kermeta.language.sample.cellularautomata.rules.initialization.cs
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        InitRuntimeModule.java
        InitStandaloneSetup.java
        formatting
        InitFormatter.java
        scoping
        InitScopeProvider.java
        validation
        InitJavaValidator.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        AbstractInitRuntimeModule.java
        InitStandaloneSetupGenerated.java
        parseTreeConstruction
        InitParsetreeConstructor.java
        parser
        antlr
        InitAntlrTokenFileProvider.java
        InitParser.java
        internal
        InternalInitLexer.java
        InternalInitParser.java
        services
        InitGrammarAccess.java
        validation
        AbstractInitJavaValidator.java
    - org.kermeta.language.sample.cellularautomata.rules.initialization.cs.ui
      - src
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        InitUiModule.java
        contentassist
        InitProposalProvider.java
        labeling
        InitDescriptionLabelProvider.java
        InitLabelProvider.java
        outline
        InitOutlineTreeProvider.java
        quickfix
        InitQuickfixProvider.java
      - src-gen
        org
        kermeta
        language
        sample
        cellularautomata
        rules
        ui
        AbstractInitUiModule.java
        InitExecutableExtensionFactory.java
        contentassist
        AbstractInitProposalProvider.java
        antlr
        InitParser.java
        internal
        InternalInitLexer.java
        InternalInitParser.java
        internal
        InitActivator.java
    - org.kermeta.language.sample.cellularautomata.rules.initialization.model
      - src
        ruleInit
        CellularAutomatatInitialization.java
        CoordinateRange.java
        GlobalPosition.java
        InitFactory.java
        InitPackage.java
        PositionLiteral.java
        impl
        CellularAutomatatInitializationImpl.java
        CoordinateRangeImpl.java
        GlobalPositionImpl.java
        InitFactoryImpl.java
        InitPackageImpl.java
        PositionLiteralImpl.java
        util
        InitAdapterFactory.java
        InitSwitch.java
    - org.kermeta.language.sample.cellularautomata.rules.initialization.model.edit
      - src
        ruleInit
        provider
        CellularAutomatatInitializationItemProvider.java
        CoordinateRangeItemProvider.java
        GlobalPositionItemProvider.java
        InitItemProviderAdapterFactory.java
        PositionLiteralItemProvider.java
        Rules_initEditPlugin.java
    - org.kermeta.language.sample.cellularautomata.rules.initialization.model.editor
      - src
        ruleInit
        presentation
        InitActionBarContributor.java
        InitEditor.java
        InitModelWizard.java
        Rules_initEditorPlugin.java
    - org.kermeta.language.sample.cellularautomata.vm.model
      - src
        vm
        Cell.java
        Universe.java
        VmFactory.java
        VmPackage.java
        impl
        CellImpl.java
        UniverseImpl.java
        VmFactoryImpl.java
        VmPackageImpl.java
        util
        VmAdapterFactory.java
        VmSwitch.java
  - class2rdbms
    - fr.inria.triskell.k3.sample.class2rdbms.classmm.model
      - src
        ClassMM
        Association.java
        Attribute.java
        Class.java
        ClassMMFactory.java
        ClassMMPackage.java
        ClassModel.java
        Classifier.java
        PrimitiveDataType.java
        impl
        AssociationImpl.java
        AttributeImpl.java
        ClassImpl.java
        ClassMMFactoryImpl.java
        ClassMMPackageImpl.java
        ClassModelImpl.java
        ClassifierImpl.java
        PrimitiveDataTypeImpl.java
        util
        ClassMMAdapterFactory.java
        ClassMMSwitch.java
    - fr.inria.triskell.k3.sample.class3rdbms.rdbmsmm.model
      - src
        RDBMSMM
        Column.java
        FKey.java
        RDBMSMMFactory.java
        RDBMSMMPackage.java
        RDBMSModel.java
        Table.java
        impl
        ColumnImpl.java
        FKeyImpl.java
        RDBMSMMFactoryImpl.java
        RDBMSMMPackageImpl.java
        RDBMSModelImpl.java
        TableImpl.java
        util
        RDBMSMMAdapterFactory.java
        RDBMSMMSwitch.java
- k3-tools
  - fr.inria.diverse.k3.tools.plantuml.mavenplugin
    - src
      - main
        java
        fr
        inria
        diverse
        k3
        tools
        plantuml
        mavenplugin
        App.java
        K3ToPlantUMLMojo.java
- k3.eclipse
  - fr.inria.diverse.k3.al.annotationprocessor.plugin
    - src
      - fr
        inria
        diverse
        k3
        al
        annotationprocessor
        plugin
        Activator.java
  - fr.inria.diverse.k3.sample.deployer
    - src
      - main
        java
        fr
        inria
        diverse
        k3
        sample
        deployer
        Activator.java
        wizards
        AbstractExampleWizard.java
        K3LogoExampleWizard.java
        K3SamplePluginHelloEcoreExampleWizard.java
        K3fsmExampleWizard.java
  - fr.inria.diverse.k3.ui
    - src
      - fr
        inria
        diverse
        k3
        ui
        Activator.java
        builder
        AddRemoveK3NatureHandler.java
        AspectMappingPropertiesChecker.java
        JavaAspectFinderResourceVisitor.java
        K3Builder.java
        K3Nature.java
        tools
        ErrorMessage.java
        GenerateGenModelCode.java
        K3FileTemplates.java
        ToolsString.java
        classpath
        ManageClasspath.java
        ManageClasspathMaven.java
        ManageClasspathPlugin.java
        ManageClasspathStandAlone.java
        wizards
        Messages.java
        NewK3ProjectWizard.java
        NewXtendClassK3AspectWizard.java
        NewXtendClassK3AspectWizardPage.java
        XtendK3CreatorUtil.java
        pages
        NewK3ProjectCustomWizardPage.java
        NewK3ProjectWizardFields.java
        NewK3ProjectWizardPage.java
        xtend
        ide
        support
        K3XtendExecutableExtensionFactory.java
  - fr.inria.diverse.k3.ui.templates
    - src
      - fr
        inria
        diverse
        k3
        ui
        templates
        Activator.java
        IHelpContextIds.java
        K3TemplateMessages.java
        K3TemplateSection.java
        k3al
        MiniAspectSampleNewWizard.java
        MiniAspectSampleTemplate.java
        MiniEcoreAspectSampleNewWizard.java
        MiniEcoreAspectSampleTemplate.java
        UserEcoreBasicAspectNewWizard.java
        UserEcoreBasicAspectTemplate.java
        UserEcoreBasicAspectWithMelangeNewWizard.java
        UserEcoreBasicAspectWithMelangeTemplate.java

/**
 * <copyright>
 * </copyright>
 *
 * 
 */
package robot.resource.robot.util;

/**
 * A UnicodeConverter can read an input stream and convert unicode escape
 * sequences (backslash + uXXXX) to actual unicode characters. Each escaped
 * unicode sequence (6 bytes) is replaced by the respective UTF-8 byte sequence (1
 * to 4 bytes).
 */
public class RobotUnicodeConverter extends robot.resource.robot.mopp.RobotInputStreamProcessor {
	
	private int[] stack = new int[4];
	private int stackPosition = -1;
	
	private static final char BACKSLASH = '\\';
	
	/**
	 * The original input stream.
	 */
	private java.io.InputStream inputStream;
	
	/**
	 * Creates a new UnicodeConverter that reads from the given stream.
	 * 
	 * @param inputStream the original stream to read from
	 */
	public RobotUnicodeConverter(java.io.InputStream inputStream) {
		this.inputStream = inputStream;
	}
	
	/**
	 * Reads one character from the stream. Escaped unicode characters are converted
	 * to UTF-8 byte sequences (i.e., up to four bytes).
	 */
	@Override	
	public int read() throws java.io.IOException {
		if (!stackIsEmpty()) {
			int result = pop();
			return result;
		}
		int read = inputStream.read();
		
		// Must have format \\uXXXX where XXXX is a hex number
		if (read >= 0) {
			char c = (char) read;
			if (c == BACKSLASH) {
				int next = inputStream.read();
				char nextChar = (char) next;
				if (nextChar == 'u') {
					// Now we found the 'u' we need to find another 4 hex digits
					// Note: shifting left by 4 is the same as multiplying by 16
					int v = 0; // Accumulator
					boolean complete = true;
					int j = 0;
					while (j < 4) {
						next = inputStream.read();
						nextChar = (char) next;
						if (nextChar == 'u') {
							// ignore more u characters
							continue;
						}
						j++;
						if (next < 0) {
							complete = false;
							break;
						}
						switch (nextChar) {
							case 48: // '0'
							case 49: // '1'
							case 50: // '2'
							case 51: // '3'
							case 52: // '4'
							case 53: // '5'
							case 54: // '6'
							case 55: // '7'
							case 56: // '8'
							case 57: // '9'
							v = ((v << 4) + nextChar) - 48;
							break;
							
							case 97: // 'a'
							case 98: // 'b'
							case 99: // 'c'
							case 100: // 'd'
							case 101: // 'e'
							case 102: // 'f'
							v = ((v << 4) + 10 + nextChar) - 97;
							break;
							
							case 65: // 'A'
							case 66: // 'B'
							case 67: // 'C'
							case 68: // 'D'
							case 69: // 'E'
							case 70: // 'F'
							v = ((v << 4) + 10 + nextChar) - 65;
							break;
							default:							// this case can never happen if the unicode escape sequences are correct
							v = 0;
							// clear the accumulator
							break;
						}
					}
					// for each of the 4 digits
					
					if (complete) {
						// We got a full conversion
						return encodePushAndReturn(v);
					}
				} else {
					// was: lookAheadCharacter = next;
					encodePush(next);
				}
			} else {
				return read;
			}
		}
		// do not encode negative numbers, because they signal EOF
		return read;
	}
	
	private int encodePushAndReturn(int next) {
		byte[] encoded = encode(next);
		// we must add the bytes backwards because we use a stack
		// we do not push the first byte since it is returned immediately
		for (int i = encoded.length - 1; i >= 1; i--) {
			push(unsignedByteToInt(encoded[i]));
		}
		return unsignedByteToInt(encoded[0]);
	}
	
	private void encodePush(int next) {
		byte[] encoded = encode(next);
		// we must add the bytes backwards because we use a stack
		for (int i = encoded.length - 1; i >= 0; i--) {
			push(unsignedByteToInt(encoded[i]));
		}
	}
	
	private int pop() {
		assert stackPosition >= 0;
		int result = stack[stackPosition];
		stackPosition--;
		return result;
	}
	
	private void push(int aByte) {
		stackPosition++;
		assert stackPosition < stack.length;
		stack[stackPosition] = aByte;
	}
	
	private boolean stackIsEmpty() {
		return stackPosition < 0;
	}
	
	public static int unsignedByteToInt(byte b) {
		return (int) b & 0xFF;
	}
	
	public static byte[] encode(int ch) {
		// return encode(new int[]{ch});
		int bytesNeeded = 0;
		if (ch < 0x80) {
			++bytesNeeded;
		} else if (ch < 0x0800) {
			bytesNeeded += 2;
		} else if (ch < 0x10000) {
			bytesNeeded += 3;
		} else {
			bytesNeeded += 4;
		}
		// allocate a byte[] of the necessary size
		byte[] utf8 = new byte[bytesNeeded];
		// do the conversion from character code points to utf-8
		int bytes = 0;
		if (ch < 0x80) {
			utf8[bytes++] = (byte) ch;
		} else if (ch < 0x0800) {
			utf8[bytes++] = (byte) (ch >> 6 | 0xC0);
			utf8[bytes++] = (byte) (ch & 0x3F | 0x80);
		} else if (ch < 0x10000) {
			utf8[bytes++] = (byte) (ch >> 12 | 0xE0);
			utf8[bytes++] = (byte) (ch >> 6 & 0x3F | 0x80);
			utf8[bytes++] = (byte) (ch & 0x3F | 0x80);
		} else {
			utf8[bytes++] = (byte) (ch >> 18 | 0xF0);
			utf8[bytes++] = (byte) (ch >> 12 & 0x3F | 0x80);
			utf8[bytes++] = (byte) (ch >> 6 & 0x3F | 0x80);
			utf8[bytes++] = (byte) (ch & 0x3F | 0x80);
		}
		return utf8;
	}
	
	public static byte[] encode(int[] ch) {
		// determine how many bytes are needed for the complete conversion
		int bytesNeeded = 0;
		for (int i = 0; i < ch.length; i++) {
			if (ch[i] < 0x80) {
				++bytesNeeded;
			} else if (ch[i] < 0x0800) {
				bytesNeeded += 2;
			} else if (ch[i] < 0x10000) {
				bytesNeeded += 3;
			} else {
				bytesNeeded += 4;
			}
		}
		// allocate a byte[] of the necessary size
		byte[] utf8 = new byte[bytesNeeded];
		// do the conversion from character code points to utf-8
		for (int i = 0, bytes = 0; i < ch.length; i++) {
			if (ch[i] < 0x80) {
				utf8[bytes++] = (byte) ch[i];
			} else if (ch[i] < 0x0800) {
				utf8[bytes++] = (byte) (ch[i] >> 6 | 0xC0);
				utf8[bytes++] = (byte) (ch[i] & 0x3F | 0x80);
			} else if (ch[i] < 0x10000) {
				utf8[bytes++] = (byte) (ch[i] >> 12 | 0xE0);
				utf8[bytes++] = (byte) (ch[i] >> 6 & 0x3F | 0x80);
				utf8[bytes++] = (byte) (ch[i] & 0x3F | 0x80);
			} else {
				utf8[bytes++] = (byte) (ch[i] >> 18 | 0xF0);
				utf8[bytes++] = (byte) (ch[i] >> 12 & 0x3F | 0x80);
				utf8[bytes++] = (byte) (ch[i] >> 6 & 0x3F | 0x80);
				utf8[bytes++] = (byte) (ch[i] & 0x3F | 0x80);
			}
		}
		return utf8;
	}
	
	public String getOutputEncoding() {
		return "UTF-8";
	}
}