ModifiedUTF8CharsetTest.java example

Explorer

cloudhopper-commons-master
- ch-commons-charset
  - src
    - main
      - java
        com
        cloudhopper
        commons
        charset
        AirwideIA5Charset.java
        BaseCharset.java
        CharSequenceAccessor.java
        Charset.java
        CharsetUtil.java
        GSMBitPacker.java
        GSMCharset.java
        ISO885915Charset.java
        ISO88591Charset.java
        JavaCharset.java
        MobileTextUtil.java
        ModifiedUTF8Charset.java
        PackedGSMCharset.java
        TMobileNlGSMCharset.java
        UCS2Charset.java
        UCS2LECharset.java
        UTF8Charset.java
        VFD2GSMCharset.java
        VFTRGSMCharset.java
    - test
      - java
        com
        cloudhopper
        commons
        charset
        CharSequenceAccessorTest.java
        CharsetUtilTest.java
        GSMBitPackerTest.java
        GSMCharsetTest.java
        MobileTextUtilTest.java
        ModifiedUTF8CharsetTest.java
        TMobileNlGSMCharsetTest.java
        UTF8CharsetTest.java
        demo
        BenchmarkMain.java
        Charset2Main.java
        Charset3Main.java
        Charset4Main.java
        Charset5Main.java
        Charset6Main.java
        CharsetMain.java
        GSMBenchmarkMain.java
        PrintGSMMain.java
        UTF8BenchmarkMain.java
- ch-commons-gsm
  - src
    - main
      - java
        com
        cloudhopper
        commons
        gsm
        DataCoding.java
        GsmConstants.java
        GsmUtil.java
        Npi.java
        Ton.java
        TypeOfAddress.java
    - test
      - java
        com
        cloudhopper
        commons
        gsm
        DataCodingTest.java
        GsmUtilTest.java
        TypeOfAddressTest.java
        demo
        DataCodingMain.java
- ch-commons-io
  - src
    - main
      - java
        com
        cloudhopper
        commons
        io
        FileChangedListener.java
        FileMonitor.java
        FileStore.java
        FileStoreException.java
        Id.java
        IdGenerator.java
        SimpleNIOFileStore.java
        UUIDIdGenerator.java
    - test
      - java
        com
        cloudhopper
        commons
        io
        demo
        FileServerMain.java
        IdTestMain.java
- ch-commons-locale
  - src
    - main
      - java
        com
        cloudhopper
        commons
        locale
        Country.java
        CountryUtil.java
        E164CountryCode.java
        E164CountryCodeUtil.java
        TimeZone.java
        TimeZoneUtil.java
    - test
      - java
        com
        cloudhopper
        commons
        locale
        CountryUtilTest.java
        E164CountryCodeUtilTest.java
        TimeZoneUtilTest.java
- ch-commons-rfs
  - src
    - demo
      - java
        com
        cloudhopper
        commons
        rfs
        RFSMain.java
    - main
      - java
        com
        cloudhopper
        commons
        rfs
        FileSystemException.java
        Protocol.java
        RemoteFileSystem.java
        RemoteFileSystemFactory.java
        provider
        BaseRemoteFileSystem.java
        FtpRemoteFileSystem.java
        SftpRemoteFileSystem.java
- ch-commons-sql
  - src
    - demo
      - java
        com
        cloudhopper
        commons
        sql
        ConnectionDemo.java
        ConnectionDemo2.java
    - main
      - java
        com
        cloudhopper
        commons
        sql
        DataSourceConfiguration.java
        DataSourceManager.java
        DataSourceProvider.java
        DatabaseVendor.java
        JdbcUtil.java
        ManagedDataSource.java
        ManagedDataSourceMBean.java
        SQLConfigurationException.java
        SQLMissingDependencyException.java
        adapter
        BasicDataSource.java
        BasicDataSourceAdapter.java
        BasicManagedDataSource.java
        DataSourceAdapter.java
        package-info.java
        c3p0
        C3P0CustomManagementCoordinator.java
        C3P0DataSourceAdapter.java
        C3P0ManagedDataSource.java
        package-info.java
        package-info.java
        proxool
        ProxoolDataSourceAdapter.java
        ProxoolManagedDataSource.java
        package-info.java
    - test
      - java
        com
        cloudhopper
        commons
        sql
        DataSourceConfigurationTest.java
        DataSourceManagerTest.java
- ch-commons-ssl
  - src
    - main
      - java
        com
        cloudhopper
        commons
        ssl
        AliasedX509ExtendedKeyManager.java
        CertificateValidator.java
        SslConfiguration.java
        SslContextFactory.java
    - test
      - java
        com
        cloudhopper
        commons
        ssl
        SslContextFactoryTest.java
- ch-commons-util
  - src
    - main
      - java
        com
        cloudhopper
        commons
        util
        AddressFormatException.java
        BeanProperty.java
        BeanUtil.java
        BufferException.java
        BufferIsEmptyException.java
        BufferIsFullException.java
        BufferSizeException.java
        ByteArrayUtil.java
        ByteBuffer.java
        ByteUtil.java
        CircularIndex.java
        ClassUtil.java
        CompressionUtil.java
        CountingRejectedExecutionHandler.java
        DateTimeUtil.java
        DecimalUtil.java
        DigitLookupMap.java
        EncryptUtil.java
        EnvironmentException.java
        EnvironmentUtil.java
        FastByteArrayOutputStream.java
        FileAlreadyExistsException.java
        FileUtil.java
        Hasher.java
        HexString.java
        HexUtil.java
        LoadBalancedList.java
        LoadBalancedLists.java
        ManagementUtil.java
        MetaFieldInfo.java
        MetaFieldUtil.java
        NameValue.java
        NamingThreadFactory.java
        PeriodFormatterUtil.java
        RandomUtil.java
        RoundRobinLoadBalancedList.java
        RunningAverage.java
        RunningTotal.java
        Sequencer.java
        SimpleMap.java
        StackTraceUtil.java
        StringLookupMap.java
        StringUtil.java
        SubstitutionException.java
        ThreadUtil.java
        TimedStateBoolean.java
        URL.java
        URLParser.java
        UnwrappedWeakReference.java
        annotation
        Level.java
        MetaField.java
        codec
        Base64Codec.java
        URLCodec.java
        URLDecoder.java
        URLEncoder.java
        URLEncoderOutputStream.java
        filefilter
        CompositeFileFilter.java
        FileExtensionFilter.java
        FileNameDateTimeFilter.java
        FileNameEndsWithFilter.java
        FileNameStartsWithFilter.java
        time
        DateTimeDay.java
        DateTimeDuration.java
        DateTimeFiveMinutes.java
        DateTimeHour.java
        DateTimeMonth.java
        DateTimePeriod.java
        DateTimePeriodData.java
        DateTimePeriodDataUtil.java
        DateTimePeriodSelector.java
        DateTimeYear.java
        windowing
        DefaultWindowFuture.java
        DuplicateKeyException.java
        OfferTimeoutException.java
        PendingOfferAbortedException.java
        Window.java
        WindowFuture.java
        WindowListener.java
        WindowMonitor.java
    - test
      - java
        com
        cloudhopper
        commons
        util
        BeanUtilTest.java
        ByteArrayUtilTest.java
        ByteBufferTest.java
        CircularIndexTest.java
        ClassUtilTest.java
        CompressionUtilTest.java
        DateTimeUtilTest.java
        DecimalUtilTest.java
        DigitLookupMapTest.java
        EncryptUtilTest.java
        EnvironmentUtilTest.java
        FileFilterTest.java
        FileUtilTest.java
        HasherTest.java
        HexUtilTest.java
        LoadBalancedListsTest.java
        MetaFieldUtilTest.java
        PeriodFormatterUtilTest.java
        RandomUtilTest.java
        RoundRobinLoadBalancedListTest.java
        RunningAverageTest.java
        StringLookupMapTest.java
        StringUtilTest.java
        ThreadUtilTest.java
        URLParserTest.java
        URLTest.java
        UnwrappedWeakReferenceTest.java
        demo
        CompressionUtilMain.java
        EncryptUtilMain.java
        EnvironmentUtilMain.java
        RandomUtilMain.java
        URLParserMain.java
        UptimeMain.java
        Window2Main.java
        WindowMain.java
        sample
        InternetPerson.java
        Person.java
        ServerConfig.java
        ServerConfigException.java
        time
        DateTimeDayTest.java
        DateTimeFiveMinutesTest.java
        DateTimeHourTest.java
        DateTimeMonthTest.java
        DateTimePeriodDataUtilTest.java
        DateTimePeriodSelectorTest.java
        DateTimePeriodTest.java
        DateTimeYearTest.java
        windowing
        WindowTest.java
- ch-commons-xbean
  - src
    - main
      - java
        com
        cloudhopper
        commons
        xbean
        BasePropertyException.java
        CollectionHelper.java
        ConversionException.java
        ConversionOverflowException.java
        PropertyAlreadySetException.java
        PropertyConversionException.java
        PropertyInvalidTypeException.java
        PropertyInvocationException.java
        PropertyIsEmptyException.java
        PropertyNoAttributesExpectedException.java
        PropertyNotFoundException.java
        PropertyPermissionException.java
        RootTagMismatchException.java
        TypeConverter.java
        TypeConverterUtil.java
        XPathNotFoundException.java
        XmlBean.java
        XmlBeanClassException.java
        XmlBeanException.java
        XmlBeanFactory.java
        XmlBeanProperty.java
        package-info.java
        type
        BooleanPrimitiveTypeConverter.java
        BooleanTypeConverter.java
        BytePrimitiveTypeConverter.java
        ByteTypeConverter.java
        DoublePrimitiveTypeConverter.java
        DoubleTypeConverter.java
        FileTypeConverter.java
        FloatPrimitiveTypeConverter.java
        FloatTypeConverter.java
        IntegerPrimitiveTypeConverter.java
        IntegerTypeConverter.java
        LongPrimitiveTypeConverter.java
        LongTypeConverter.java
        ShortPrimitiveTypeConverter.java
        ShortTypeConverter.java
        StringTypeConverter.java
        URLTypeConverter.java
        package-info.java
        util
        NumberRadixResult.java
        NumberRadixUtil.java
        PropertiesReplacementUtil.java
        TimeUnitUtil.java
        xml
        SimpleHandler.java
        SimpleHandlerAdapter.java
        Version.java
        XPath.java
        XmlParser.java
    - test
      - java
        com
        cloudhopper
        commons
        xbean
        XmlBeanAddTest.java
        XmlBeanCollectionTest.java
        XmlBeanConcreteTypeTest.java
        XmlBeanEnumTest.java
        XmlBeanMapTest.java
        XmlBeanModifiedRootTest.java
        XmlBeanRuntimeClassTest.java
        XmlBeanTest.java
        XmlBeanTypeTest.java
        demo
        AnnotationInfoMain.java
        GenericInfoMain.java
        XmlBeanMain.java
        type
        ByteTypeConverterTest.java
        DoubleTypeConverterTest.java
        FloatTypeConverterTest.java
        IntegerTypeConverterTest.java
        LongTypeConverterTest.java
        ShortTypeConverterTest.java
        URLTypeConverterTest.java
        util
        NumberRadixUtilTest.java
- ch-httpclient-util
  - src
    - demo
      - java
        com
        cloudhopper
        httpclient
        util
        HttpPostMain.java
        HttpSender.java
        HttpServerMain.java
        HttpsGetMain.java
        HttpsServerMain.java
    - main
      - java
        com
        cloudhopper
        httpclient
        util
        DoNotVerifySSLCertificateTrustManager.java
        HttpClientFactory.java
        HttpClientUtil.java
        PreemptiveBasicAuthHttpRequestInterceptor.java
        SchemeFactory.java
        UnexpectedHttpStatusCodeException.java
- ch-jetty
  - src
    - main
      - java
        com
        cloudhopper
        jetty
        HttpConnectorConfiguration.java
        HttpServerConfiguration.java
        HttpSslConnectorConfiguration.java
        JettyExecutorThreadPool.java
        JettyHttpServer.java
        JettyHttpServerFactory.java
    - test
      - java
        com
        cloudhopper
        jetty
        demo
        HelloServlet.java
        HttpServerMain.java
- ch-sxmp
  - src
    - demo
      - java
        com
        cloudhopper
        sxmp
        DeliverMain.java
        Post.java
        PostMO.java
        PostReport.java
        PostUTF8MO.java
        SenderMain.java
        SubmitMain.java
    - main
      - java
        com
        cloudhopper
        sxmp
        Account.java
        Application.java
        DeliverRequest.java
        DeliverResponse.java
        DeliveryReportRequest.java
        DeliveryReportResponse.java
        DeliveryStatus.java
        ErrorResponse.java
        MessageRequest.java
        MobileAddress.java
        Operation.java
        OptionalParamMap.java
        PartialOperation.java
        Priority.java
        Request.java
        Response.java
        SubmitRequest.java
        SubmitResponse.java
        SxmpErrorCode.java
        SxmpErrorException.java
        SxmpParser.java
        SxmpParsingException.java
        SxmpProcessor.java
        SxmpSender.java
        SxmpSession.java
        SxmpWriter.java
        TextEncoding.java
        servlet
        HttpStatusCodeException.java
        SxmpServletProcessor.java
        util
        MobileAddressUtil.java
        ToStringUtil.java
        XmlEscapeUtil.java
    - test
      - java
        com
        cloudhopper
        sxmp
        SubmitRequestTest.java
        SxmpParserTest.java
        SxmpSessionTest.java
        SxmpWriterTest.java
        demo
        ParserMain.java
        SubmitMain.java
        servlet
        SxmpServletProcessorTest.java

package com.cloudhopper.commons.charset;

/*
 * #%L
 * ch-commons-charset
 * %%
 * Copyright (C) 2012 Cloudhopper by Twitter
 * %%
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 * 
 *      http://www.apache.org/licenses/LICENSE-2.0
 * 
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 * #L%
 */

// third party imports
import com.cloudhopper.commons.util.HexUtil;
import org.junit.*;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

/**
 *
 * @author joelauer (twitter: @jjlauer or <a href="http://twitter.com/jjlauer" target=window>http://twitter.com/jjlauer</a>)
 */
public class ModifiedUTF8CharsetTest {
    private static final Logger logger = LoggerFactory.getLogger(ModifiedUTF8CharsetTest.class);

    String nullString = "\u0000";
    String controlCharsString = createStringWithCharRange('\u0001', 0x20);
    String asciiOnlyString = " !\"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~";
    String iso88591CharsString = createStringWithCharRange('\u0080', 128);
    String first7EFFString = createStringWithCharRange('\u0100', 0x7EFF);
    String entireString = createStringWithCharRange('\u0000', 0x7FFF);
    String upperRangeString = createStringWithCharRange('\u7FFF', 0x8000);
    
    static public String createStringWithCharRange(char start, int length) {
        StringBuilder buf = new StringBuilder(length);
        int end = start+length;
        for (int i = start; i < end; i++) {
            buf.append((char)i);
        }
        return buf.toString();
    }
    
    @Test
    public void compareAgainstJVM() throws Exception {
        byte[] expected = null;
        byte[] actual = null;
        String actualString = null;
        
        String[] strings = new String[] {
            nullString, controlCharsString, asciiOnlyString, iso88591CharsString, first7EFFString, entireString
        };
        
        int i = 0;
        for (String s : strings) {
            expected = s.getBytes("UTF-8");
            actual = CharsetUtil.CHARSET_MODIFIED_UTF8.encode(s);
            //logger.info("  string: " + s);
            //logger.info("expected: " + HexUtil.toHexString(expected));
            //logger.info("  actual: " + HexUtil.toHexString(actual));
            // verify our length calculator is correct
            Assert.assertEquals(expected.length, ModifiedUTF8Charset.calculateByteLength(s));
            Assert.assertArrayEquals("string: " + s, expected, actual);
            // try to decode the byte array and make sure it matches the expected string
            actualString = CharsetUtil.CHARSET_MODIFIED_UTF8.decode(expected);
            Assert.assertEquals(s, actualString);
            // verify a decode to a stringbuffer works as expected
            StringBuilder actualStringBuffer = new StringBuilder();
            CharsetUtil.decode(expected, actualStringBuffer, CharsetUtil.CHARSET_MODIFIED_UTF8);
            Assert.assertEquals(s, actualStringBuffer.toString());
            i++;
        }
        
        // upper range of java values are where modified UTF-8 falls on its face
        // its still safe to use as long as modified UTF-8 bytes are used to decode
        // the values as well -- verify the entire range decodes back to the same values
        byte[] encoded = CharsetUtil.CHARSET_MODIFIED_UTF8.encode(upperRangeString);
        String decoded = CharsetUtil.decode(encoded, CharsetUtil.CHARSET_MODIFIED_UTF8);
        Assert.assertEquals(upperRangeString, decoded);
    }
    
    @Test
    public void calculateByteLength() throws Exception {
        String sample = null;
        // test the incredibly fast method for calculating a Java strings UTF-8 byte length
        Assert.assertEquals(0, ModifiedUTF8Charset.calculateByteLength(null));
        Assert.assertEquals(0, ModifiedUTF8Charset.calculateByteLength(""));
        Assert.assertEquals(1, ModifiedUTF8Charset.calculateByteLength("a"));
        Assert.assertEquals(2, ModifiedUTF8Charset.calculateByteLength("\n\r"));
        sample = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";
        Assert.assertEquals(sample.getBytes("UTF8").length, ModifiedUTF8Charset.calculateByteLength(sample));
        sample = "\u20ac";
        Assert.assertEquals(sample.getBytes("UTF8").length, ModifiedUTF8Charset.calculateByteLength(sample));
        sample = "\u20ac\u0623";
        Assert.assertEquals(sample.getBytes("UTF8").length, ModifiedUTF8Charset.calculateByteLength(sample));
        sample = "\u00A7\u00E5\uFFFF";
        Assert.assertEquals(sample.getBytes("UTF8").length, ModifiedUTF8Charset.calculateByteLength(sample));
    }
    
    @Test
    public void emoticons() throws Exception {
        // follows sample of unit test in for UTF8Charset
        // these chars triggered a problem in production -- these are specifically
        // not supported for decoding -- but should work to/from for serialization
        // U+1F631 is a very high range example of an emoticon (something more people are using)
        // UTF-8 bytes look like this: F09F98B1
        // UTF-16 bytes look like this: D83DDE31
        // JavaScript escapes: \uD83D\uDE31
        byte[] bytes = HexUtil.toByteArray("F09F98B1");
        String str = "\uD83D\uDE31";    // this is the UTF-16 version of the UTF-8 bytes
        
        try {
            String t = CharsetUtil.CHARSET_MODIFIED_UTF8.decode(bytes);
            Assert.fail("exception should have been thrown");
        } catch (IllegalArgumentException e) {
            // correct behavior -- this UTF-8 char is NOT supported!
        }
        
        // try serializing and deserializing
        byte[] encoded = CharsetUtil.CHARSET_MODIFIED_UTF8.encode(str);
        // this is what the Modified UTF-8 version looks like: EDA0BDEDB8B1     // 6 bytes instead of 4
        //logger.info(HexUtil.toHexString(encoded));
        String decoded = CharsetUtil.CHARSET_MODIFIED_UTF8.decode(encoded);
        
        Assert.assertEquals(str, decoded);
    }
}