Unicode.java example

Explorer

service-framework-master
- src
  - com
    - example
      - controller
        ApplicationController.java
        admin
        TagAdminController.java
        tag
        TagController.java
      - model
        BlogTag.java
        Tag.java
        TagGroup.java
        TagSynonym.java
        TagWiki.java
      - service
        tag
        RemoteDataService.java
        impl
        DefaultRemoteDataService.java
      - util
        CommonUtils.java
  - net
    - csdn
      - AutoGeneration.java
      - ServiceFramwork.java
      - annotation
        AnnotationException.java
        Hint.java
        Scope.java
        Service.java
        Util.java
        association
        ManyToManyHint.java
        NotMapping.java
        filter
        AfterFilter.java
        AroundFilter.java
        BeforeFilter.java
        jpa
        callback
        AfterLoad.java
        AfterSave.java
        AfterUpdate.java
        BeforeDestroy.java
        BeforeSave.java
        BeforeUpdate.java
        EntityCallback.java
        rest
        At.java
        validate
        Validate.java
      - bootstrap
        Application.java
        Bootstrap.java
        MyTranslator.java
        loader
        Loader.java
        impl
        ControllerLoader.java
        LoggerLoader.java
        ModelLoader.java
        ModuelLoader.java
        ServiceLoader.java
        UtilLoader.java
        ValidatorLoader.java
      - common
        Base64.java
        Booleans.java
        Classes.java
        Strings.java
        Type.java
        Unicode.java
        collect
        MapBuilder.java
        Tuple.java
        collections
        WowCollections.java
        WowLists.java
        WowMaps.java
        WowSerializable.java
        io
        Streams.java
        jline
        ANSI.java
        logging
        CSLogger.java
        CSLoggerFactory.java
        Loggers.java
        log4j
        ConsoleAppender.java
        JLinePatternLayout.java
        Log4jCSLogger.java
        Log4jFactory.java
        LogConfigurator.java
        support
        AbstractCSLogger.java
        MessageFormat.java
        network
        NetworkUtils.java
        param
        ParamBinding.java
        path
        PathTrie.java
        Url.java
        property
        PropertyPlaceholder.java
        settings
        ImmutableSettings.java
        InternalSettingsPreparer.java
        NoClassSettingsException.java
        Settings.java
        thread
        ThreadLocals.java
        unit
        ByteSizeUnit.java
        ByteSizeValue.java
        SizeUnit.java
        SizeValue.java
        TimeValue.java
      - enhancer
        AssociatedHelper.java
        BitEnhancer.java
        Enhancer.java
        EnhancerHelper.java
      - env
        Environment.java
      - exception
        ArgumentErrorException.java
        ConfigurationException.java
        ExceptionHandler.java
        FailedToResolveConfigException.java
        ParseException.java
        RecordExistedException.java
        RecordNotFoundException.java
        RenderFinish.java
        SettingsException.java
      - filter
        FilterHelper.java
      - jpa
        JPA.java
        association
        Association.java
        context
        JPAConfig.java
        JPAContext.java
        enhancer
        ClassMethodEnhancer.java
        InstanceMethodEnhancer.java
        JPAEnhancer.java
        PropertyEnhancer.java
        ValidatorEnhancer.java
        exception
        JPAQueryException.java
        hql
        WowCommonParser.java
        WowJoinParser.java
        WowSelectParser.java
        WowWhereParser.java
        model
        GenericModel.java
        JPABase.java
        JPQL.java
        Model.java
        type
        DBInfo.java
        DBType.java
        impl
        MysqlType.java
      - modules
        cache
        CacheModule.java
        RedisClient.java
        compress
        bzip2
        BZip2Constants.java
        CBZip2InputStream.java
        CBZip2OutputStream.java
        CRC.java
        gzip
        GZip.java
        lzf
        BufferRecycler.java
        ChunkEncoder.java
        LZF.java
        LZFChunk.java
        LZFDecoder.java
        LZFEncoder.java
        LZFInputStream.java
        LZFOutputStream.java
        package-info.java
        http
        ApplicationController.java
        DateJsonValueProcessor.java
        DefaultRestRequest.java
        HttpModule.java
        HttpServer.java
        JSONObjectUtils.java
        RestController.java
        RestRequest.java
        RestResponse.java
        RestStatus.java
        RestUtils.java
        ResultFormat.java
        ViewType.java
        support
        HttpStatus.java
        version
        Version.java
        mock
        MockRestRequest.java
        MockRestResponse.java
        persist
        PersistServiceModule.java
        mongodb
        MongoClient.java
        mysql
        DataSourceManager.java
        MysqlClient.java
        scan
        DefaultScanService.java
        ScanModule.java
        ScanService.java
        component
        ClasspathUrlFinder.java
        DirectoryIteratorFactory.java
        FileIterator.java
        FileProtocolIteratorFactory.java
        Filter.java
        InputStreamWrapper.java
        IteratorFactory.java
        JarIterator.java
        StreamIterator.java
        settings
        SettingsModule.java
        threadpool
        DefaultThreadPoolService.java
        ThreadPoolModule.java
        ThreadPoolService.java
        transport
        DefaultHttpTransportService.java
        HttpTransportService.java
        TransportModule.java
      - reflect
        ReflectHelper.java
      - validate
        BaseValidateParse.java
        ValidateHelper.java
        ValidateParse.java
        ValidateResult.java
        impl
        Associated.java
        Format.java
        Length.java
        Numericality.java
        Presence.java
        Uniqueness.java
- test
  - DynamicSuiteRunner.java
  - net
    - csdn
      - jpa
        hql
        WowJoinParserTest.java
        WowWhereParserTest.java
      - junit
        IocTest.java
        JettyTest.java
  - runner
    - DynamicSuite.java
  - test
    - com
      - example
        controller
        TagControllerTest.java
        model
        TagTest.java

package net.csdn.common;

import net.csdn.common.thread.ThreadLocals;

import java.util.Arrays;

/**
 * BlogInfo: william
 * Date: 11-9-5
 * Time: 下午10:18
 */
public class Unicode {

    private static ThreadLocal<ThreadLocals.CleanableValue<UnicodeUtil.UTF8Result>> cachedUtf8Result = new ThreadLocal<ThreadLocals.CleanableValue<UnicodeUtil.UTF8Result>>() {
        @Override
        protected ThreadLocals.CleanableValue<UnicodeUtil.UTF8Result> initialValue() {
            return new ThreadLocals.CleanableValue<UnicodeUtil.UTF8Result>(new UnicodeUtil.UTF8Result());
        }
    };

    private static ThreadLocal<ThreadLocals.CleanableValue<UTF16Result>> cachedUtf16Result = new ThreadLocal<ThreadLocals.CleanableValue<UTF16Result>>() {
        @Override
        protected ThreadLocals.CleanableValue<UTF16Result> initialValue() {
            return new ThreadLocals.CleanableValue<UTF16Result>(new UTF16Result());
        }
    };

    public static byte[] fromStringAsBytes(String source) {
        if (source == null) {
            return null;
        }
        UnicodeUtil.UTF8Result result = unsafeFromStringAsUtf8(source);
        return Arrays.copyOfRange(result.result, 0, result.length);
    }

    public static UnicodeUtil.UTF8Result fromStringAsUtf8(String source) {
        if (source == null) {
            return null;
        }
        UnicodeUtil.UTF8Result result = new UnicodeUtil.UTF8Result();
        UnicodeUtil.UTF16toUTF8(source, 0, source.length(), result);
        return result;
    }

    public static UnicodeUtil.UTF8Result unsafeFromStringAsUtf8(String source) {
        if (source == null) {
            return null;
        }
        UnicodeUtil.UTF8Result result = cachedUtf8Result.get().get();
        UnicodeUtil.UTF16toUTF8(source, 0, source.length(), result);
        return result;
    }

    public static String fromBytes(byte[] source) {
        return fromBytes(source, 0, source.length);
    }

    public static String fromBytes(byte[] source, int offset, int length) {
        if (source == null) {
            return null;
        }
        UTF16Result result = unsafeFromBytesAsUtf16(source, offset, length);
        return new String(result.result, 0, result.length);
    }

    public static UTF16Result fromBytesAsUtf16(byte[] source) {
        return fromBytesAsUtf16(source, 0, source.length);
    }

    public static UTF16Result fromBytesAsUtf16(byte[] source, int offset, int length) {
        if (source == null) {
            return null;
        }
        UTF16Result result = new UTF16Result();
        UTF8toUTF16(source, offset, length, result);
        return result;
    }

    public static UTF16Result unsafeFromBytesAsUtf16(byte[] source) {
        return unsafeFromBytesAsUtf16(source, 0, source.length);
    }

    public static UTF16Result unsafeFromBytesAsUtf16(byte[] source, int offset, int length) {
        if (source == null) {
            return null;
        }
        UTF16Result result = cachedUtf16Result.get().get();
        UTF8toUTF16(source, offset, length, result);
        return result;
    }

    // LUCENE MONITOR

    // an optimized version of UTF16Result that does not hold the offsets since we don't need them
    // they are only used with continuous writing to the same utf16 (without "clearing it")

    public static final class UTF16Result {
        public char[] result = new char[10];
        //        public int[] offsets = new int[10];
        public int length;

        public void setLength(int newLength) {
            if (result.length < newLength) {
                char[] newArray = new char[(int) (1.5 * newLength)];
                System.arraycopy(result, 0, newArray, 0, length);
                result = newArray;
            }
            length = newLength;
        }

        public void copyText(UTF16Result other) {
            setLength(other.length);
            System.arraycopy(other.result, 0, result, 0, length);
        }
    }


    /**
     * Convert UTF8 bytes into UTF16 characters.  If offset
     * is non-zero, conversion starts at that starting point
     * in utf8, re-using the results from the previous call
     * up until offset.
     */
    public static void UTF8toUTF16(final byte[] utf8, final int offset, final int length, final UTF16Result result) {

        final int end = offset + length;
        char[] out = result.result;
//        if (result.offsets.length <= end) {
//            int[] newOffsets = new int[2 * end];
//            System.arraycopy(result.offsets, 0, newOffsets, 0, result.offsets.length);
//            result.offsets = newOffsets;
//        }
//        final int[] offsets = result.offsets;

        // If incremental decoding fell in the middle of a
        // single unicode character, rollback to its start:
        int upto = offset;
//        while (offsets[upto] == -1)
//            upto--;

        int outUpto = 0; // offsets[upto];

        // Pre-allocate for worst case 1-for-1
        if (outUpto + length >= out.length) {
            char[] newOut = new char[2 * (outUpto + length)];
            System.arraycopy(out, 0, newOut, 0, outUpto);
            result.result = out = newOut;
        }

        while (upto < end) {

            final int b = utf8[upto] & 0xff;
            final int ch;

            upto += 1; // CHANGE
//            offsets[upto++] = outUpto;

            if (b < 0xc0) {
                assert b < 0x80;
                ch = b;
            } else if (b < 0xe0) {
                ch = ((b & 0x1f) << 6) + (utf8[upto] & 0x3f);
                upto += 1; // CHANGE
//                offsets[upto++] = -1;
            } else if (b < 0xf0) {
                ch = ((b & 0xf) << 12) + ((utf8[upto] & 0x3f) << 6) + (utf8[upto + 1] & 0x3f);
                upto += 2; // CHANGE
//                offsets[upto++] = -1;
//                offsets[upto++] = -1;
            } else {
                assert b < 0xf8;
                ch = ((b & 0x7) << 18) + ((utf8[upto] & 0x3f) << 12) + ((utf8[upto + 1] & 0x3f) << 6) + (utf8[upto + 2] & 0x3f);
                upto += 3; // CHANGE
//                offsets[upto++] = -1;
//                offsets[upto++] = -1;
//                offsets[upto++] = -1;
            }

            if (ch <= UNI_MAX_BMP) {
                // target is a character <= 0xFFFF
                out[outUpto++] = (char) ch;
            } else {
                // target is a character in range 0xFFFF - 0x10FFFF
                final int chHalf = ch - HALF_BASE;
                out[outUpto++] = (char) ((chHalf >> HALF_SHIFT) + UnicodeUtil.UNI_SUR_HIGH_START);
                out[outUpto++] = (char) ((chHalf & HALF_MASK) + UnicodeUtil.UNI_SUR_LOW_START);
            }
        }

//        offsets[upto] = outUpto;
        result.length = outUpto;
    }

    private static final long UNI_MAX_BMP = 0x0000FFFF;

    private static final int HALF_BASE = 0x0010000;
    private static final long HALF_SHIFT = 10;
    private static final long HALF_MASK = 0x3FFL;
}

final class UnicodeUtil {

    public static final int UNI_SUR_HIGH_START = 0xD800;
    public static final int UNI_SUR_HIGH_END = 0xDBFF;
    public static final int UNI_SUR_LOW_START = 0xDC00;
    public static final int UNI_SUR_LOW_END = 0xDFFF;
    public static final int UNI_REPLACEMENT_CHAR = 0xFFFD;

    private static final long UNI_MAX_BMP = 0x0000FFFF;

    private static final int HALF_BASE = 0x0010000;
    private static final long HALF_SHIFT = 10;
    private static final long HALF_MASK = 0x3FFL;

    public static final class UTF8Result {
        public byte[] result = new byte[10];
        public int length;

        public void setLength(int newLength) {
            if (result.length < newLength) {
                byte[] newArray = new byte[(int) (1.5 * newLength)];
                System.arraycopy(result, 0, newArray, 0, length);
                result = newArray;
            }
            length = newLength;
        }
    }

    public static final class UTF16Result {
        public char[] result = new char[10];
        public int[] offsets = new int[10];
        public int length;

        public void setLength(int newLength) {
            if (result.length < newLength) {
                char[] newArray = new char[(int) (1.5 * newLength)];
                System.arraycopy(result, 0, newArray, 0, length);
                result = newArray;
            }
            length = newLength;
        }

        public void copyText(UTF16Result other) {
            setLength(other.length);
            System.arraycopy(other.result, 0, result, 0, length);
        }
    }

    /**
     * Encode characters from a char[] source, starting at
     * offset and stopping when the character 0xffff is seen.
     * Returns the number of bytes written to bytesOut.
     */
    public static void UTF16toUTF8(final char[] source, final int offset, UTF8Result result) {

        int upto = 0;
        int i = offset;
        byte[] out = result.result;

        while (true) {

            final int code = (int) source[i++];

            if (upto + 4 > out.length) {
                byte[] newOut = new byte[2 * out.length];
                assert newOut.length >= upto + 4;
                System.arraycopy(out, 0, newOut, 0, upto);
                result.result = out = newOut;
            }
            if (code < 0x80)
                out[upto++] = (byte) code;
            else if (code < 0x800) {
                out[upto++] = (byte) (0xC0 | (code >> 6));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else if (code < 0xD800 || code > 0xDFFF) {
                if (code == 0xffff)
                    // END
                    break;
                out[upto++] = (byte) (0xE0 | (code >> 12));
                out[upto++] = (byte) (0x80 | ((code >> 6) & 0x3F));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else {
                // surrogate pair
                // confirm valid high surrogate
                if (code < 0xDC00 && source[i] != 0xffff) {
                    int utf32 = (int) source[i];
                    // confirm valid low surrogate and write pair
                    if (utf32 >= 0xDC00 && utf32 <= 0xDFFF) {
                        utf32 = ((code - 0xD7C0) << 10) + (utf32 & 0x3FF);
                        i++;
                        out[upto++] = (byte) (0xF0 | (utf32 >> 18));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 12) & 0x3F));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 6) & 0x3F));
                        out[upto++] = (byte) (0x80 | (utf32 & 0x3F));
                        continue;
                    }
                }
                // replace unpaired surrogate or out-of-order low surrogate
                // with substitution character
                out[upto++] = (byte) 0xEF;
                out[upto++] = (byte) 0xBF;
                out[upto++] = (byte) 0xBD;
            }
        }
        //assert matches(source, offset, i-offset-1, out, upto);
        result.length = upto;
    }

    /**
     * Encode characters from a char[] source, starting at
     * offset for length chars.  Returns the number of bytes
     * written to bytesOut.
     */
    public static void UTF16toUTF8(final char[] source, final int offset, final int length, UTF8Result result) {

        int upto = 0;
        int i = offset;
        final int end = offset + length;
        byte[] out = result.result;

        while (i < end) {

            final int code = (int) source[i++];

            if (upto + 4 > out.length) {
                byte[] newOut = new byte[2 * out.length];
                assert newOut.length >= upto + 4;
                System.arraycopy(out, 0, newOut, 0, upto);
                result.result = out = newOut;
            }
            if (code < 0x80)
                out[upto++] = (byte) code;
            else if (code < 0x800) {
                out[upto++] = (byte) (0xC0 | (code >> 6));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else if (code < 0xD800 || code > 0xDFFF) {
                out[upto++] = (byte) (0xE0 | (code >> 12));
                out[upto++] = (byte) (0x80 | ((code >> 6) & 0x3F));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else {
                // surrogate pair
                // confirm valid high surrogate
                if (code < 0xDC00 && i < end && source[i] != 0xffff) {
                    int utf32 = (int) source[i];
                    // confirm valid low surrogate and write pair
                    if (utf32 >= 0xDC00 && utf32 <= 0xDFFF) {
                        utf32 = ((code - 0xD7C0) << 10) + (utf32 & 0x3FF);
                        i++;
                        out[upto++] = (byte) (0xF0 | (utf32 >> 18));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 12) & 0x3F));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 6) & 0x3F));
                        out[upto++] = (byte) (0x80 | (utf32 & 0x3F));
                        continue;
                    }
                }
                // replace unpaired surrogate or out-of-order low surrogate
                // with substitution character
                out[upto++] = (byte) 0xEF;
                out[upto++] = (byte) 0xBF;
                out[upto++] = (byte) 0xBD;
            }
        }
        //assert matches(source, offset, length, out, upto);
        result.length = upto;
    }

    /**
     * Encode characters from this String, starting at offset
     * for length characters.  Returns the number of bytes
     * written to bytesOut.
     */
    public static void UTF16toUTF8(final String s, final int offset, final int length, UTF8Result result) {
        final int end = offset + length;

        byte[] out = result.result;

        int upto = 0;
        for (int i = offset; i < end; i++) {
            final int code = (int) s.charAt(i);

            if (upto + 4 > out.length) {
                byte[] newOut = new byte[2 * out.length];
                assert newOut.length >= upto + 4;
                System.arraycopy(out, 0, newOut, 0, upto);
                result.result = out = newOut;
            }
            if (code < 0x80)
                out[upto++] = (byte) code;
            else if (code < 0x800) {
                out[upto++] = (byte) (0xC0 | (code >> 6));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else if (code < 0xD800 || code > 0xDFFF) {
                out[upto++] = (byte) (0xE0 | (code >> 12));
                out[upto++] = (byte) (0x80 | ((code >> 6) & 0x3F));
                out[upto++] = (byte) (0x80 | (code & 0x3F));
            } else {
                // surrogate pair
                // confirm valid high surrogate
                if (code < 0xDC00 && (i < end - 1)) {
                    int utf32 = (int) s.charAt(i + 1);
                    // confirm valid low surrogate and write pair
                    if (utf32 >= 0xDC00 && utf32 <= 0xDFFF) {
                        utf32 = ((code - 0xD7C0) << 10) + (utf32 & 0x3FF);
                        i++;
                        out[upto++] = (byte) (0xF0 | (utf32 >> 18));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 12) & 0x3F));
                        out[upto++] = (byte) (0x80 | ((utf32 >> 6) & 0x3F));
                        out[upto++] = (byte) (0x80 | (utf32 & 0x3F));
                        continue;
                    }
                }
                // replace unpaired surrogate or out-of-order low surrogate
                // with substitution character
                out[upto++] = (byte) 0xEF;
                out[upto++] = (byte) 0xBF;
                out[upto++] = (byte) 0xBD;
            }
        }
        //assert matches(s, offset, length, out, upto);
        result.length = upto;
    }

    /**
     * Convert UTF8 bytes into UTF16 characters.  If offset
     * is non-zero, conversion starts at that starting point
     * in utf8, re-using the results from the previous call
     * up until offset.
     */
    public static void UTF8toUTF16(final byte[] utf8, final int offset, final int length, final UTF16Result result) {

        final int end = offset + length;
        char[] out = result.result;
        if (result.offsets.length <= end) {
            int[] newOffsets = new int[2 * end];
            System.arraycopy(result.offsets, 0, newOffsets, 0, result.offsets.length);
            result.offsets = newOffsets;
        }
        final int[] offsets = result.offsets;

        // If incremental decoding fell in the middle of a
        // single unicode character, rollback to its start:
        int upto = offset;
        while (offsets[upto] == -1)
            upto--;

        int outUpto = offsets[upto];

        // Pre-allocate for worst case 1-for-1
        if (outUpto + length >= out.length) {
            char[] newOut = new char[2 * (outUpto + length)];
            System.arraycopy(out, 0, newOut, 0, outUpto);
            result.result = out = newOut;
        }

        while (upto < end) {

            final int b = utf8[upto] & 0xff;
            final int ch;

            offsets[upto++] = outUpto;

            if (b < 0xc0) {
                assert b < 0x80;
                ch = b;
            } else if (b < 0xe0) {
                ch = ((b & 0x1f) << 6) + (utf8[upto] & 0x3f);
                offsets[upto++] = -1;
            } else if (b < 0xf0) {
                ch = ((b & 0xf) << 12) + ((utf8[upto] & 0x3f) << 6) + (utf8[upto + 1] & 0x3f);
                offsets[upto++] = -1;
                offsets[upto++] = -1;
            } else {
                assert b < 0xf8;
                ch = ((b & 0x7) << 18) + ((utf8[upto] & 0x3f) << 12) + ((utf8[upto + 1] & 0x3f) << 6) + (utf8[upto + 2] & 0x3f);
                offsets[upto++] = -1;
                offsets[upto++] = -1;
                offsets[upto++] = -1;
            }

            if (ch <= UNI_MAX_BMP) {
                // target is a character <= 0xFFFF
                out[outUpto++] = (char) ch;
            } else {
                // target is a character in range 0xFFFF - 0x10FFFF
                final int chHalf = ch - HALF_BASE;
                out[outUpto++] = (char) ((chHalf >> HALF_SHIFT) + UNI_SUR_HIGH_START);
                out[outUpto++] = (char) ((chHalf & HALF_MASK) + UNI_SUR_LOW_START);
            }
        }

        offsets[upto] = outUpto;
        result.length = outUpto;
    }

    // Only called from assert
    /*
    private static boolean matches(char[] source, int offset, int length, byte[] result, int upto) {
      try {
        String s1 = new String(source, offset, length);
        String s2 = new String(result, 0, upto, "UTF-8");
        if (!s1.equals(s2)) {
          //System.out.println("DIFF: s1 len=" + s1.length());
          //for(int i=0;i<s1.length();i++)
          //  System.out.println("    " + i + ": " + (int) s1.charAt(i));
          //System.out.println("s2 len=" + s2.length());
          //for(int i=0;i<s2.length();i++)
          //  System.out.println("    " + i + ": " + (int) s2.charAt(i));

          // If the input string was invalid, then the
          // difference is OK
          if (!validUTF16String(s1))
            return true;

          return false;
        }
        return s1.equals(s2);
      } catch (UnsupportedEncodingException uee) {
        return false;
      }
    }

    // Only called from assert
    private static boolean matches(String source, int offset, int length, byte[] result, int upto) {
      try {
        String s1 = source.substring(offset, offset+length);
        String s2 = new String(result, 0, upto, "UTF-8");
        if (!s1.equals(s2)) {
          // Allow a difference if s1 is not valid UTF-16

          //System.out.println("DIFF: s1 len=" + s1.length());
          //for(int i=0;i<s1.length();i++)
          //  System.out.println("    " + i + ": " + (int) s1.charAt(i));
          //System.out.println("  s2 len=" + s2.length());
          //for(int i=0;i<s2.length();i++)
          //  System.out.println("    " + i + ": " + (int) s2.charAt(i));

          // If the input string was invalid, then the
          // difference is OK
          if (!validUTF16String(s1))
            return true;

          return false;
        }
        return s1.equals(s2);
      } catch (UnsupportedEncodingException uee) {
        return false;
      }
    }

    public static final boolean validUTF16String(String s) {
      final int size = s.length();
      for(int i=0;i<size;i++) {
        char ch = s.charAt(i);
        if (ch >= UNI_SUR_HIGH_START && ch <= UNI_SUR_HIGH_END) {
          if (i < size-1) {
            i++;
            char nextCH = s.charAt(i);
            if (nextCH >= UNI_SUR_LOW_START && nextCH <= UNI_SUR_LOW_END) {
              // Valid surrogate pair
            } else
              // Unmatched high surrogate
              return false;
          } else
            // Unmatched high surrogate
            return false;
        } else if (ch >= UNI_SUR_LOW_START && ch <= UNI_SUR_LOW_END)
          // Unmatched low surrogate
          return false;
      }

      return true;
    }

    public static final boolean validUTF16String(char[] s, int size) {
      for(int i=0;i<size;i++) {
        char ch = s[i];
        if (ch >= UNI_SUR_HIGH_START && ch <= UNI_SUR_HIGH_END) {
          if (i < size-1) {
            i++;
            char nextCH = s[i];
            if (nextCH >= UNI_SUR_LOW_START && nextCH <= UNI_SUR_LOW_END) {
              // Valid surrogate pair
            } else
              return false;
          } else
            return false;
        } else if (ch >= UNI_SUR_LOW_START && ch <= UNI_SUR_LOW_END)
          // Unmatched low surrogate
          return false;
      }

      return true;
    }
    */
}