SparkTest.java example

Explorer

btpka3.github.com-master
- ShapeContext
  - src
    - main
      - java
        CannyEdgeDetector.java
        DrawingListener.java
        DrawingPanel.java
        ExitListener.java
        GUI.java
        JPanels.java
        LogPolarGrid.java
        ShapeContext.java
        SixChoicePanel.java
        WindowUtilities.java
- android
  - Hi
    - app
      - src
        androidTest
        java
        io
        github
        btpka3
        hi
        ApplicationTest.java
        main
        java
        io
        github
        btpka3
        hi
        Main1Activity.java
        MainActivity.java
        MyTime2IntentService.java
        MyTimeIntentService.java
        test
        java
        io
        github
        btpka3
        hi
        ExampleUnitTest.java
- gradle
  - my-gradle-java
    - src
      - main
        java
        me
        test
        TestJavadoc.java
    - sub-module-a
      - src
        main
        java
        me
        test
        AAA.java
    - sub-module-b
      - src
        main
        java
        me
        test
        BBB.java
- java
  - access
    - my-access-db
      - src
        main
        java
        me
        test
        Test.java
  - aliyun
    - MNS
      - my-mns
        src
        main
        java
        com
        aliyun
        mns
        samples
        HttpEndpoint.java
        Queue
        ComsumerDemo.java
        CreateQueueDemo.java
        DeleteQueueDemo.java
        ListQueueDemo.java
        ProducerDemo.java
        QueueSample.java
        Sample.java
        TopicSample.java
  - android
    - my-first-android
      - src
        me
        bptka3
        MyActivity.java
  - cas
    - my-cas-server-webapp
      - src
        main
        java
        me
        test
        cas
        server
        MyPasswordEncoder.java
        MySearchModeSearchDatabaseAuthenticationHandler.java
  - cxf
    - first-cxf
      - src
        main
        java
        me
        test
        server
        MyMathImpl.java
        MyMathImpl2.java
        Server.java
        test
        MyException001.java
        MyServ001.java
        MyServ001Client.java
        MyServ001Impl.java
        Person.java
  - demo-web
    - src
      - main
        java
        JsonMessage.java
  - elasticsearch
    - elasticsearch-analysis-hypy
      - src
        main
        java
        com
        github
        btpka3
        elasticsearch
        plugin
        analysis
        PinyinAbbrAnalysisBinderProcessor.java
        PinyinAbbrIndicesAnalysis.java
        PinyinAbbrIndicesAnalysisModule.java
        PinyinAbbrPlugin.java
        lucene
        analysis
        PinyinAbbrAnalyzer.java
        PinyinAbbrTokenFilter.java
        PinyinAbbrTokenizer.java
        PinyinTokenFilter.java
        PinyinTokenizer.java
        synonym
        PinyinSynonymMap.java
        test
        java
        com
        github
        btpka3
        lucene
        analysis
        EdgeNGramTokenFilterTest.java
        EdgeNGramTokenizerTest.java
        PinyinAbbrTokenizerTest.java
        PinyinTest.java
        StandardAnalyzerTest.java
        SynonymFilterTest.java
    - first-es-java
      - src
        main
        java
        me
        test
        EsTest.java
  - first-captcha
    - src
      - main
        java
        me
        test
        FontTest.java
        JCaptchaController.java
        MyChineseTextProducer.java
        MyWordRenderer.java
        ReCaptchaController.java
        SimpleCaptchaController.java
        cage
        Main.java
        kaptcha
        ConfigEx.java
        ConfigHelperEx.java
        Main.java
        NoiseImpl.java
  - first-cassandra
    - src
      - main
        java
        com
        datastax
        driver
        core
        querybuilder
        QueryBuilderEx.java
        me
        test
        Test.java
        spring
        data
        TestRepo.java
        TestSpringData.java
        domain
        User.java
        repo
        UserRepository.java
  - first-logback
    - src
      - main
        java
        me
        test
        LogbackMain.java
  - first-zk
    - src
      - main
        java
        me
        test
        LockTest.java
        SpringTest.java
  - hibernate
    - first-hibernate
      - src
        main
        java
        me
        test
        HibernateTest.java
        JpaAndQueryDslTest.java
        JpaTest.java
        domain
        User.java
        ex
        LocalSessionFactoryBeanEx.java
    - first-hibernate-tools
      - src
        main
        java
        me
        test
        domain
        User4Ddl.java
        User4Hbm.java
  - jdk
    - FirstEDP
      - src
        main
        java
        me
        test
        MyAsynEventManager.java
        MyEvent.java
        MyEventListener.java
        MyEventListenerImpl.java
        MySyncEventManager.java
    - TestJAAS
      - PlatformSrc
        me
        test
        jaas
        platform
        Main.java
        SecurityConstants.java
        SecurityPolicySpi.java
      - ProviderASrc
        me
        test
        jaas
        provider
        a
        TaskA.java
      - ProviderBSrc
        me
        test
        jaas
        provider
        b
        TaskB.java
    - TestJDK
      - src
        main
        java
        me
        test
        LoopTest.java
        TestJodaTime.java
        biz
        BankNum.java
        IdNum.java
        TestOrder.java
        jdk
        java
        JdbcSample.java
        io
        PipeTest.java
        lang
        Autoboxing.java
        Autoboxing1.java
        CallSetterInConstructor.java
        DoubleTest.java
        GenericTest.java
        StopTask.java
        SwithTest1.java
        ThreadGroupTest.java
        invoke
        CallSiteTest.java
        math
        BigDecimalTest.java
        net
        ParseUrl.java
        socket
        MyEchoClient.java
        MyEchoServer.java
        nio
        BufferTest.java
        ChannelTest.java
        NioEchoServer.java
        PipeChannelTest.java
        charset
        CharsetTester.java
        rmi
        server
        MyRMIServerSocketFactory.java
        MyRmiClientSocketFactory.java
        time
        DurationTest.java
        util
        CountLine.java
        ExportLine.java
        MyScanner.java
        concurrent
        atomic
        AtomicBooleanTest.java
        regex
        TestRegex.java
        stream
        IntStreamTest.java
        zip
        Zip.java
        javax
        crypto
        DESTest.java
        script
        Main.java
    - first-jmx
      - src
        main
        java
        me
        test
        first
        jmx
        MyClient.java
        MyServer.java
        MyServerMBean.java
  - jetty
    - first-exec-war
      - src
        execWar
        java
        Main.java
        main
        java
        me
        test
        HelloServlet.java
        LogFilter.java
  - jna
    - first-jna
      - src
        main
        java
        me
        test
        ComContainer.java
        LParamUnion.java
        MyUser32.java
        OleFactory.java
        Test01.java
        Test02.java
        Test03.java
        Test04.java
        Test05.java
        VK.java
    - my-http-login
      - src
        main
        java
        me
        test
        HttpLogin.java
  - lucence
    - first-lucence
      - src
        main
        java
        me
        test
        AnalyzerCN.java
        Search.java
        WriteIndex.java
  - maven
    - first-jar
      - src
        main
        java
        me
        test
        maven
        first
        jar
        Main.java
        test
        java
        me
        test
        maven
        first
        jar
        MainTest.java
    - first-war
      - src
        main
        java
        me
        test
        Hi.java
    - greeting-maven-plugin
      - src
        main
        java
        me
        test
        maven
        greeting
        mojo
        GreetingMojo.java
    - hello-maven-plugin
      - src
        main
        java
        sample
        plugin
        App.java
        test
        java
        sample
        plugin
        AppTest.java
    - hi-archetype
      - src
        main
        resources
        archetype-resources
        src
        main
        java
        App.java
        test
        java
        AppTest.java
  - my-express
    - src
      - main
        java
        me
        test
        sto
        Sto.java
  - my-hc
    - src
      - main
        java
        me
        test
        TestSocksProxy.java
        TestWeather.java
  - my-jackson2
    - src
      - main
        java
        me
        test
        Test.java
  - my-jasypt
    - src
      - main
        java
        me
        test
        AESUtil.java
        DESedeUtil.java
        GenAESKey.java
        Main.java
        RSAUtil.java
  - my-mail
    - src
      - test
        java
        me
        test
        TestEmail.java
  - my-mssql
    - src
      - main
        java
        me
        test
        MsSqlTest.java
  - my-poj
    - me
      - Main001.java
      - Main002.java
    - p1000
      - Main.java
    - p1001
      - Main.java
    - p1002
      - Main.java
  - my-proxyed-war
    - src
      - main
        java
        me
        test
        MyFilter.java
        MyRequest.java
  - my-session
    - src
      - main
        java
        me
        test
        ContextHolder.java
        MySessionFilter.java
        ReverseProxyInfoFilter.java
        SessionManager.java
        redis
        MyRequest.java
        MyResponse.java
        MySession.java
        MySessionManager.java
  - mybatis
    - MBG-ext
      - src
        main
        java
        me
        test
        mbg
        plugins
        RenameSqlIdPlugin.java
    - PageVsRowBounds
      - PrepareDB
        src
        main
        java
        me
        test
        PrepareDB.java
        TestJdbcQuery.java
      - TestPage
        src
        main
        java
        com
        tc
        his
        api
        model
        Person.java
        PersonCriteria.java
        provider
        dao
        PersonDao.java
        service
        PersonService.java
        impl
        PersonServiceImpl.java
        me
        test
        TestPage.java
      - TestRowBounds
        src
        main
        java
        com
        tc
        his
        api
        model
        Person.java
        PersonCriteria.java
        provider
        dao
        PersonDao.java
        service
        PersonService.java
        impl
        PersonServiceImpl.java
        me
        test
        TestRowBounds.java
      - mybatis-ext-zll
        src
        main
        java
        com
        tc
        his
        api
        model
        Page.java
        provider
        dao
        MyBatisRepository.java
        plugin
        PostgrePaginationPlugin.java
        RenameJavaClientPlugin.java
        RenameXmlFilePlugin.java
    - first-mybatis
      - src
        main
        java
        me
        test
        Main.java
        MainStartDB.java
  - ocr
    - first-tess4j
      - src
        main
        java
        me
        test
        TesseractExample.java
  - quartz
    - first-quartz-spring
      - src
        main
        java
        me
        test
        first
        quartz
        Demo.java
        EchoJob.java
        HelloJob.java
        QuartzTestMain.java
        Util.java
        a
        JobA.java
        QuartzDemo.java
        package-info.java
        b
        ApplicationContextHolder.java
        JobB.java
        JobBDemo.java
        MyRunnable.java
        package-info.java
        c
        package-info.java
        spring
        HelloJob.java
        M.java
        SimpleExample.java
        org
        quartz
        examples
        example1
        HelloJob.java
        SimpleExample.java
        example10
        PlugInExample.java
        SimpleJob.java
        example11
        LoadExample.java
        SimpleJob.java
        example12
        RemoteClientExample.java
        RemoteServerExample.java
        SimpleJob.java
        example13
        ClusterExample.java
        SimpleRecoveryJob.java
        SimpleRecoveryStatefulJob.java
        example14
        PriorityExample.java
        TriggerEchoJob.java
        example15
        ClusterExample.java
        SimpleRecoveryJob.java
        SimpleRecoveryStatefulJob.java
        example2
        SimpleJob.java
        SimpleTriggerExample.java
        example3
        CronTriggerExample.java
        SimpleJob.java
        example4
        ColorJob.java
        JobStateExample.java
        example5
        MisfireExample.java
        StatefulDumbJob.java
        example6
        BadJob1.java
        BadJob2.java
        JobExceptionExample.java
        example7
        DumbInterruptableJob.java
        InterruptExample.java
        example8
        CalendarExample.java
        SimpleJob.java
        example9
        Job1Listener.java
        ListenerExample.java
        SimpleJob1.java
        SimpleJob2.java
  - spark
    - my-spark
      - src
        main
        java
        me
        test
        spark
        MatrixTest.java
        SparkTest.java
  - spring
    - aop-demo
      - src
        main
        java
        me
        test
        anno
        AnnoMain.java
        MyAnnoAspect.java
        task
        TaskA.java
        TaskB.java
        xml
        MyPojoAspectLogic.java
        XmlMain.java
    - first-acl
      - src
        main
        java
        sample
        contact
        AddDeleteContactController.java
        AddPermission.java
        AddPermissionValidator.java
        AdminPermissionController.java
        ClientApplication.java
        Contact.java
        ContactDao.java
        ContactDaoSpring.java
        ContactManager.java
        ContactManagerBackend.java
        DataSourcePopulator.java
        IndexController.java
        WebContact.java
        WebContactValidator.java
    - first-amqp
      - src
        main
        java
        EmitLog.java
        EmitLogDirect.java
        EmitLogHeader.java
        EmitLogTopic.java
        NewTask.java
        RPCClient.java
        RPCServer.java
        ReceiveLogHeader.java
        ReceiveLogs.java
        ReceiveLogsDirect.java
        ReceiveLogsTopic.java
        Recv.java
        Send.java
        Worker.java
        me
        test
        amqp
        RpcBroker.java
        RpcConsumer.java
        RpcProducer.java
        org
        springframework
        amqp
        helloworld
        BrokerConfigurationApplication.java
        Consumer.java
        HelloWorldConfiguration.java
        Producer.java
        async
        Consumer.java
        ConsumerConfiguration.java
        HelloWorldHandler.java
        Producer.java
        ProducerConfiguration.java
    - first-cache
      - src
        generated
        java
        me
        test
        first
        cache
        QUser.java
        User.java
        main
        java
        me
        test
        first
        cache
        ErrorController.java
        Main.java
        MyExceptionHandler.java
        QueryDslJdbcTemplate.java
        UserBiz.java
        UserController.java
    - first-cas4
      - first-cas4-server
        src
        main
        java
        me
        test
        SimpleTestUsernamePasswordAuthenticationHandler.java
      - pac4j-oauth-tencent
        src
        main
        java
        org
        pac4j
        oauth
        client
        TencentAttributesDefinition.java
        TencentClient.java
        profile
        tencent
        TencentProfile.java
        scribe
        builder
        api
        TencentApi.java
        oauth
        TencentOAuth20ServiceImpl.java
        test
        java
        org
        pac4j
        oauth
        client
        TestOAuthClient.java
        TestTencentClient.java
    - first-db-router
      - src
        main
        java
        me
        test
        action
        TestAction.java
        UserAction.java
        db
        router
        AnnatationDataSourceKeyResolver.java
        ComposeDataSourceKeyResolver.java
        CrossDbTransNotSupportedException.java
        DataSouceKeyNotFoundException.java
        DataSourceKey.java
        DataSourceKeyAdvice.java
        DataSourceKeyMapper.java
        DataSourceKeyResolver.java
        FirstParamDataSourceKeyResolver.java
        MapDataSourceKeyMapper.java
        NopDataSourceKeyMapper.java
        ParamDataSourceKeyResolver.java
        RoutingDataSourceImpl.java
        service
        TestTransService.java
        TestTransServiceImpl.java
        UpdateRecord.java
        User.java
        UserService.java
        UserServiceImpl.java
    - first-redis-cache
      - src
        generated
        java
        me
        test
        first
        redis
        cache
        QUser.java
        User.java
        main
        java
        me
        test
        first
        redis
        cache
        Main.java
        QueryDslJdbcTemplate.java
        UserBiz.java
        UserController.java
    - first-spring-aop
      - src
        main
        java
        me
        test
        MyAspect.java
        MyImpl.java
        MyInterface.java
        test
        java
        me
        test
        CGlibAopTest.java
        JdkAopTest.java
    - first-spring-jdo
      - first-spring-jdo-api
        src
        main
        java
        me
        test
        first
        spring
        jdo
        entity
        User.java
      - first-spring-jdo-app
        src
        main
        java
        me
        test
        first
        spring
        jdo
        Main.java
        UserDao.java
        UserDaoDslImpl.java
        UserDaoJdoImpl.java
      - first-spring-jdo-dsl
        src
        main
        java
        me
        test
        first
        spring
        jdo
        entity
        QUser.java
    - first-spring-ldap
      - src
        main
        java
        me
        test
        Auth.java
        LdapAuth.java
        ListDn.java
        ListMail.java
        ListPerson.java
        MySSLSocketFactory.java
        QuerySingleUser.java
    - first-spring-security
      - src
        main
        java
        me
        test
        MyController.java
        MyUserDetailsService.java
    - first-spring-webflow
      - src
        main
        java
        me
        test
        action
        LoginAction.java
    - first-spring-ws
      - src
        main
        java
        me
        test
        client
        Client.java
        server
        Config.java
        MyMathEndpoint.java
    - first-sso
      - first-spring-cas
        src
        main
        java
        me
        test
        MyController.java
        TestCasRESTfulApi.java
      - first-spring-stateless
        src
        main
        java
        me
        test
        CasAuthenticationEntryPointEx.java
        CasAuthenticationProviderEx.java
        MySessionListener.java
        ServicePropertiesEx.java
    - jdo
      - first-spring-jdo
        src
        main
        java
        me
        test
        first
        spring
        jdo
        Main.java
        PersonDAO.java
        PersonDAOImpl.java
        entity
        Person.java
    - jpa
      - first-spring-jpa
        src
        main
        java
        me
        test
        first
        spring
        jpa
        Person.java
    - mvc
      - first-spring-form
        src
        main
        java
        me
        test
        CaseMode.java
        CheckCase.java
        CheckCaseValidator.java
        CodeBean.java
        User.java
        UserController.java
      - first-spring-rs
        src
        main
        java
        me
        test
        first
        spring
        rs
        controller
        ErrorController.java
        FileController.java
        UserController.java
        exception
        BusinessException.java
        MyExceptionResolver.java
        http
        ContentRange.java
        Range.java
        SortBy.java
        interceptor
        CacheControlInterceptor.java
        jaxb
        DateAdapter.java
      - spring-mvc-simple
        src
        main
        java
        me
        test
        ExtensionFilter.java
    - my-spring-csrf-guard
      - src
        main
        java
        me
        test
        csrf
        CsrfHandlerInterceptor.java
        CsrfJsonController.java
        CsrfRequestDataValueProcessor.java
        CsrfTokenManager.java
        InvalidCsrfTokenException.java
        filter
        ExtensionFilter.java
        MatchItem.java
        OriginFilter.java
        RefererFilter.java
    - rmi
      - first-spring-rmi
        src
        main
        java
        me
        test
        spring
        rmi
        modify
        Callback.java
        Client.java
        ClientCallback.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
        pojo
        Client.java
        ClientCallback.java
        RMIUtil.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
        traditional
        Callback.java
        Client.java
        ClientCallback.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
    - test-jsr303
      - src
        main
        java
        me
        test
        Person.java
        test
        java
        me
        test
        PersonTest.java
  - zk
    - src
      - main
        java
        me
        test
        DataMonitor.java
        Executor.java
- js
  - cordova
    - my-cordova-plugin
      - src
        android
        src
        main
        java
        io
        github
        btpka3
        my_cordova_plugin
        MyCordovaPlugin.java
  - dojo
    - my
      - Adc.java
- owasp
  - first-AntiSamy
    - src
      - main
        java
        me
        test
        AntiSamyDemo.java
        AntiSamyTest.java
        Test123.java

package me.test.spark;

import org.apache.spark.Accumulable;
import org.apache.spark.AccumulableParam;
import org.apache.spark.Accumulator;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.*;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import scala.Tuple2;

import java.security.SecureRandom;
import java.util.*;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.IntStream;

public class SparkTest {

    static Logger log = LoggerFactory.getLogger(SparkTest.class);

    public static void main(String[] args) {

        //hello();
        withIterator();
        //stopAll();
//        cartesian();
    }

    /**
     * 第一个学习例子。测试每个线程到底跑了多少个job。
     */
    public static void hello() {

        SparkConf conf = new SparkConf()
                .setAppName("btpka3")
                .setMaster("local[2]");

        JavaSparkContext jsc = new JavaSparkContext(conf);

        List<Integer> data = Arrays.asList(1, 2, 3, 4, 5, 1, 1, 2);
        JavaRDD<Integer> distData = jsc.parallelize(data);
        JavaPairRDD<Integer, Integer> counts = distData.mapToPair(
                new PairFunction<Integer, Integer, Integer>() {
                    @Override
                    public Tuple2<Integer, Integer> call(Integer s) {
                        //return new Tuple2<Integer, Integer>(s, 1);
                        return new Tuple2<Integer, Integer>((int) Thread.currentThread().getId(), 1);
                    }
                })
                .reduceByKey(new Function2<Integer, Integer, Integer>() {
                    @Override
                    public Integer call(Integer i1, Integer i2) {
                        return i1 + i2;
                    }
                });
        System.out.println("=======================================");
        System.out.println(counts.collectAsMap());
        System.out.println("---------------------------------------");
        jsc.stop();
    }


    /**
     * 1. 尝试使用 Iterator 作为数据源。
     * 2. 一条记录生成多条
     * 3. 生成的多条记录再分配给其他work执行
     */
    public static void withIterator() {

        SparkConf conf = new SparkConf()
                .setAppName("btpka3")
                .setMaster("local[4]");

        final JavaSparkContext jsc = new JavaSparkContext(conf);

        JavaRDD<Integer> rdd = jsc.parallelize(Arrays.asList(1, 2));
        rdd = rdd.flatMap(
                new FlatMapFunction<Integer, Integer>() {
                    @Override
                    public Iterable<Integer> call(Integer t) throws Exception {
                        return new Iterable<Integer>() {
                            @Override
                            public Iterator<Integer> iterator() {
                                return IntStream.range(t * 100 + 0, t * 100 + 20).iterator();
                            }
                        };
                    }
                }
        );
        System.out.println("======: " + rdd.collect());

        // NOTICE: 将数据重新分片，否则仅会在当前worker上执行，不会分给其他worker执行。
        rdd = rdd.repartition(4);
        JavaPairRDD<Integer, List<Integer>> counts = rdd.mapToPair(
                new PairFunction<Integer, Integer, List<Integer>>() {

                    // key = thread id , value = number
                    @Override
                    public Tuple2<Integer, List<Integer>> call(Integer s) {
                        return new Tuple2<Integer, List<Integer>>(
                                Integer.valueOf((int) Thread.currentThread().getId()),
                                Arrays.asList(s));
                    }
                })
                .reduceByKey(new Function2<List<Integer>, List<Integer>, List<Integer>>() {
                    @Override
                    public List<Integer> call(List<Integer> i1, List<Integer> i2) {
                        List<Integer> l = new ArrayList<Integer>();
                        l.addAll(i1);
                        l.addAll(i2);
                        return l;
                    }
                });

        System.out.println("=======================================");
        System.out.println(counts.collectAsMap());
        System.out.println("---------------------------------------");
        jsc.stop();
    }

    /**
     * 如何快速终止其他worker？
     */
    public static void stopAll() {

        //String master = "local[4]";
        String master = "spark://127.0.0.1:7077";
        SparkConf conf = new SparkConf()
                .setAppName("btpka3")
                .set("spark.driver.cores", "1")
                .set("spark.driver.memory", "5120m")
                .set("spark.executor.memory", "512m")
                .setMaster(master);

        //SparkConf conf = new SparkConf();

        final JavaSparkContext jsc = new JavaSparkContext(conf);
        final Accumulator<Integer> acc1 = jsc.accumulator(0);
        final Accumulator<Integer> acc2 = jsc.accumulator(0);
        final AtomicInteger actualSeconds = new AtomicInteger();
        // 不行， JavaRDD#foreachPartition 是分布式执行的。
        //final AtomicInteger expectedSeconds = new AtomicInteger();
        final Accumulator<Integer> expectedSeconds1 = jsc.accumulator(0);


        //final Accumulator<Integer> accMap = jsc.accumulator(new HashMap<String, Integer>(), new MapAccumulator());
        final Accumulable<Map<String, Integer>, Map<String, Integer>> accMap1 = jsc.accumulable(new HashMap<String, Integer>(), new MapAccumulable());
        final Accumulable<Map<String, List>, Map<String, List>> accMap2 = jsc.accumulable(new HashMap<String, List>(), new MapListAccumulable());

        final List<Integer> a = Arrays.asList(0);

        // 准备一组数据，并随机插入，期待总执行时间小于等于25秒
        List<Integer> data = new LinkedList<>();
        for (int i = 0; i < 99; i++) {
            data.add(i);
        }
        SecureRandom r = new SecureRandom();
        int pos = r.nextInt(data.size());
        data.add(pos, -1);


        JavaRDD<Integer> distData = jsc.parallelize(data);
        // 默认是4, 为了测试，将其分片为 4*5=20片，
        // 即：100个数据，4个worker的话，每片应当有5个数据，共需5次循环即可完成，最长执行时间为5*5=秒。
        // 则实际任务执行时间估计是（不包含任务分配所花费的时间） :
        // i + 5*n 秒。其中 i是在特定分片数据中的位置（下标）。n是0~4。鉴于在执行的任务不能被终止，理想的任务执行时间是 5*(n+1) 秒
        // FIXME: 如何确定每片数据的内容——即确定i的值
        System.out.println("11111111111111111111111111111111111111");
        log.info("partition's default count = " + distData.getNumPartitions());
        distData = distData.repartition(4 * 5);
        System.out.println("partition's new     count = " + distData.getNumPartitions());

        distData.foreachPartition(new VoidFunction<Iterator<Integer>>() {
            @Override
            public void call(Iterator<Integer> intIterator) throws Exception {
//                if (expectedSeconds.get() > 0) {
//                    return;
//                }
                int i = 0;
                while (intIterator.hasNext()) {
                    int v = intIterator.next();
                    if (v < 0) {
                        expectedSeconds1.add(i + 1);
                        //expectedSeconds.set(i + 1);
                    }
                    i++;
                }
            }
        });

        new Thread() {
            public void run() {
                Date start = new Date();
                System.out.println("----- started at : " + start);
                int i = 0;
                try {
                    while (acc2.value() == 0 && i < 60) {
                        i++;
                        Thread.sleep(500);
                    }
                    jsc.cancelAllJobs();
                    System.out.println("watching thread exited on success");
                } catch (InterruptedException e) {
                    e.printStackTrace();
                    System.out.println("watching thread exited on error");
                }
                Date end = new Date();
                actualSeconds.addAndGet((int) (end.getTime() - start.getTime()) / 1000);
                System.out.println("----- finished at : " + end + ", cost " + actualSeconds + " seconds");
                // cancel：只能cancel尚未被调度的任务？已经在执行的不能被终止？
                System.out.println("expected secondes is " + expectedSeconds1 + ", actual is " + actualSeconds);
            }
        }.start();

        JavaRDD<Integer> counts = distData.map(new Function<Integer, Integer>() {

            @Override
            public Integer call(Integer v1) throws Exception {
                Thread.sleep(1000);
                acc1.add(1);

                Map<String, Integer> m = new HashMap<String, Integer>();
                m.put(String.valueOf(Thread.currentThread().getId()), 1);
                accMap1.add(m);

                Map<String, List> m2 = new HashMap<String, List>();
                m2.put(String.valueOf(Thread.currentThread().getId()), Arrays.asList(v1));
                accMap2.add(m2);

                if (v1 < 0) {
                    acc2.add(1);
                }
                a.set(0, a.get(0) + 1);
                return v1 + 1;
            }

        });
        System.out.println("=======================================" + Thread.currentThread().getId());
        try {
            System.out.println(counts.toArray());
        } catch (Exception e) {
            log.error("toArray err", e);
        }
        System.out.println("local list a = " + a);
        System.out.println("acc1 = " + acc1.value());
        System.out.println("accMap1 = " + accMap1);
        System.out.println("accMap2 = " + accMap2);


        System.out.println("---------------------------------------");
        //jsc.stop();
    }


    /**
     * 笛卡尔乘积。
     */
    public static void cartesian() {

        SparkConf conf = new SparkConf()
                .setAppName("btpka3")
                .setMaster("local[2]");

        JavaSparkContext jsc = new JavaSparkContext(conf);

        JavaRDD<String> rdd1 = jsc.parallelize(Arrays.asList("a", "b", "c"));
        JavaRDD<String> rdd2 = jsc.parallelize(Arrays.asList("1", "2", "3"));
        JavaRDD<String> rdd3 = jsc.parallelize(Arrays.asList("x", "y", "z"));

        JavaPairRDD<String, String> s1 = rdd1.cartesian(rdd2);
        JavaPairRDD<Tuple2<String, String>, String> s2 = s1.cartesian(rdd3);
        System.out.println("=======================================");
        System.out.println(s1.collect());
        System.out.println(s2.collect());
        System.out.println("---------------------------------------");
        jsc.stop();
    }


    // NOTICE: MapAccumulator是scala的tratit，并实现了部分方法，是否因此无法被Java类实现？

//    public static class MapAccumulator implements AccumulatorParam<Map<String, Integer>> {
//        private Map<String, Integer> value = new HashMap<String, Integer>();
//
//        @Override
//        public Map addAccumulator(Map<String, Integer> t1, Map<String, Integer> t2) {
//            return addInPlace(t1, t2);
//        }
//
//        @Override
//        public Map addInPlace(Map<String, Integer> t1, Map<String, Integer> t2) {
//            for (Map.Entry<String, Integer> entry : t2.entrySet()) {
//                String key = entry.getKey();
//                Integer value = entry.getValue();
//                Integer i = t1.get(key);
//                if (i == null) {
//                    i = 0;
//                }
//                if (value != null) {
//                    i = i + value;
//                }
//                t1.put(key, i);
//            }
//            return t1;
//        }
//
//        @Override
//        public Map zero(Map initialValue) {
//            return initialValue;
//        }
//    }

    public static class MapAccumulable implements AccumulableParam<Map<String, Integer>, Map<String, Integer>> {
        private Map<String, Integer> value = new HashMap<String, Integer>();

        @Override
        public Map addAccumulator(Map<String, Integer> t1, Map<String, Integer> t2) {
            return addInPlace(t1, t2);
        }

        @Override
        public Map addInPlace(Map<String, Integer> t1, Map<String, Integer> t2) {
            for (Map.Entry<String, Integer> entry : t2.entrySet()) {
                String key = entry.getKey();
                Integer value = entry.getValue();
                Integer i = t1.get(key);
                if (i == null) {
                    i = 0;
                }
                if (value != null) {
                    i = i + value;
                }
                t1.put(key, i);
            }
            return t1;
        }

        @Override
        public Map zero(Map initialValue) {
            return initialValue;
        }
    }


    public static class MapListAccumulable implements AccumulableParam<Map<String, List>, Map<String, List>> {
        private Map<String, Integer> value = new HashMap<String, Integer>();

        @Override
        public Map addAccumulator(Map<String, List> t1, Map<String, List> t2) {
            return addInPlace(t1, t2);
        }

        @Override
        public Map addInPlace(Map<String, List> t1, Map<String, List> t2) {
            for (Map.Entry<String, List> entry : t2.entrySet()) {
                String key = entry.getKey();
                List value = entry.getValue();
                List i = t1.get(key);
                if (i == null) {
                    i = new ArrayList();
                }
                if (value != null) {
                    i.addAll(value);
                }
                t1.put(key, i);
            }
            return t1;
        }

        @Override
        public Map zero(Map initialValue) {
            return initialValue;
        }
    }

}