AnalyzerCN.java example

Explorer

btpka3.github.com-master
- ShapeContext
  - src
    - main
      - java
        CannyEdgeDetector.java
        DrawingListener.java
        DrawingPanel.java
        ExitListener.java
        GUI.java
        JPanels.java
        LogPolarGrid.java
        ShapeContext.java
        SixChoicePanel.java
        WindowUtilities.java
- android
  - Hi
    - app
      - src
        androidTest
        java
        io
        github
        btpka3
        hi
        ApplicationTest.java
        main
        java
        io
        github
        btpka3
        hi
        Main1Activity.java
        MainActivity.java
        MyTime2IntentService.java
        MyTimeIntentService.java
        test
        java
        io
        github
        btpka3
        hi
        ExampleUnitTest.java
- gradle
  - my-gradle-java
    - src
      - main
        java
        me
        test
        TestJavadoc.java
    - sub-module-a
      - src
        main
        java
        me
        test
        AAA.java
    - sub-module-b
      - src
        main
        java
        me
        test
        BBB.java
- java
  - access
    - my-access-db
      - src
        main
        java
        me
        test
        Test.java
  - aliyun
    - MNS
      - my-mns
        src
        main
        java
        com
        aliyun
        mns
        samples
        HttpEndpoint.java
        Queue
        ComsumerDemo.java
        CreateQueueDemo.java
        DeleteQueueDemo.java
        ListQueueDemo.java
        ProducerDemo.java
        QueueSample.java
        Sample.java
        TopicSample.java
  - android
    - my-first-android
      - src
        me
        bptka3
        MyActivity.java
  - cas
    - my-cas-server-webapp
      - src
        main
        java
        me
        test
        cas
        server
        MyPasswordEncoder.java
        MySearchModeSearchDatabaseAuthenticationHandler.java
  - cxf
    - first-cxf
      - src
        main
        java
        me
        test
        server
        MyMathImpl.java
        MyMathImpl2.java
        Server.java
        test
        MyException001.java
        MyServ001.java
        MyServ001Client.java
        MyServ001Impl.java
        Person.java
  - demo-web
    - src
      - main
        java
        JsonMessage.java
  - elasticsearch
    - elasticsearch-analysis-hypy
      - src
        main
        java
        com
        github
        btpka3
        elasticsearch
        plugin
        analysis
        PinyinAbbrAnalysisBinderProcessor.java
        PinyinAbbrIndicesAnalysis.java
        PinyinAbbrIndicesAnalysisModule.java
        PinyinAbbrPlugin.java
        lucene
        analysis
        PinyinAbbrAnalyzer.java
        PinyinAbbrTokenFilter.java
        PinyinAbbrTokenizer.java
        PinyinTokenFilter.java
        PinyinTokenizer.java
        synonym
        PinyinSynonymMap.java
        test
        java
        com
        github
        btpka3
        lucene
        analysis
        EdgeNGramTokenFilterTest.java
        EdgeNGramTokenizerTest.java
        PinyinAbbrTokenizerTest.java
        PinyinTest.java
        StandardAnalyzerTest.java
        SynonymFilterTest.java
    - first-es-java
      - src
        main
        java
        me
        test
        EsTest.java
  - first-captcha
    - src
      - main
        java
        me
        test
        FontTest.java
        JCaptchaController.java
        MyChineseTextProducer.java
        MyWordRenderer.java
        ReCaptchaController.java
        SimpleCaptchaController.java
        cage
        Main.java
        kaptcha
        ConfigEx.java
        ConfigHelperEx.java
        Main.java
        NoiseImpl.java
  - first-cassandra
    - src
      - main
        java
        com
        datastax
        driver
        core
        querybuilder
        QueryBuilderEx.java
        me
        test
        Test.java
        spring
        data
        TestRepo.java
        TestSpringData.java
        domain
        User.java
        repo
        UserRepository.java
  - first-logback
    - src
      - main
        java
        me
        test
        LogbackMain.java
  - first-zk
    - src
      - main
        java
        me
        test
        LockTest.java
        SpringTest.java
  - hibernate
    - first-hibernate
      - src
        main
        java
        me
        test
        HibernateTest.java
        JpaAndQueryDslTest.java
        JpaTest.java
        domain
        User.java
        ex
        LocalSessionFactoryBeanEx.java
    - first-hibernate-tools
      - src
        main
        java
        me
        test
        domain
        User4Ddl.java
        User4Hbm.java
  - jdk
    - FirstEDP
      - src
        main
        java
        me
        test
        MyAsynEventManager.java
        MyEvent.java
        MyEventListener.java
        MyEventListenerImpl.java
        MySyncEventManager.java
    - TestJAAS
      - PlatformSrc
        me
        test
        jaas
        platform
        Main.java
        SecurityConstants.java
        SecurityPolicySpi.java
      - ProviderASrc
        me
        test
        jaas
        provider
        a
        TaskA.java
      - ProviderBSrc
        me
        test
        jaas
        provider
        b
        TaskB.java
    - TestJDK
      - src
        main
        java
        me
        test
        LoopTest.java
        TestJodaTime.java
        biz
        BankNum.java
        IdNum.java
        TestOrder.java
        jdk
        java
        JdbcSample.java
        io
        PipeTest.java
        lang
        Autoboxing.java
        Autoboxing1.java
        CallSetterInConstructor.java
        DoubleTest.java
        GenericTest.java
        StopTask.java
        SwithTest1.java
        ThreadGroupTest.java
        invoke
        CallSiteTest.java
        math
        BigDecimalTest.java
        net
        ParseUrl.java
        socket
        MyEchoClient.java
        MyEchoServer.java
        nio
        BufferTest.java
        ChannelTest.java
        NioEchoServer.java
        PipeChannelTest.java
        charset
        CharsetTester.java
        rmi
        server
        MyRMIServerSocketFactory.java
        MyRmiClientSocketFactory.java
        time
        DurationTest.java
        util
        CountLine.java
        ExportLine.java
        MyScanner.java
        concurrent
        atomic
        AtomicBooleanTest.java
        regex
        TestRegex.java
        stream
        IntStreamTest.java
        zip
        Zip.java
        javax
        crypto
        DESTest.java
        script
        Main.java
    - first-jmx
      - src
        main
        java
        me
        test
        first
        jmx
        MyClient.java
        MyServer.java
        MyServerMBean.java
  - jetty
    - first-exec-war
      - src
        execWar
        java
        Main.java
        main
        java
        me
        test
        HelloServlet.java
        LogFilter.java
  - jna
    - first-jna
      - src
        main
        java
        me
        test
        ComContainer.java
        LParamUnion.java
        MyUser32.java
        OleFactory.java
        Test01.java
        Test02.java
        Test03.java
        Test04.java
        Test05.java
        VK.java
    - my-http-login
      - src
        main
        java
        me
        test
        HttpLogin.java
  - lucence
    - first-lucence
      - src
        main
        java
        me
        test
        AnalyzerCN.java
        Search.java
        WriteIndex.java
  - maven
    - first-jar
      - src
        main
        java
        me
        test
        maven
        first
        jar
        Main.java
        test
        java
        me
        test
        maven
        first
        jar
        MainTest.java
    - first-war
      - src
        main
        java
        me
        test
        Hi.java
    - greeting-maven-plugin
      - src
        main
        java
        me
        test
        maven
        greeting
        mojo
        GreetingMojo.java
    - hello-maven-plugin
      - src
        main
        java
        sample
        plugin
        App.java
        test
        java
        sample
        plugin
        AppTest.java
    - hi-archetype
      - src
        main
        resources
        archetype-resources
        src
        main
        java
        App.java
        test
        java
        AppTest.java
  - my-express
    - src
      - main
        java
        me
        test
        sto
        Sto.java
  - my-hc
    - src
      - main
        java
        me
        test
        TestSocksProxy.java
        TestWeather.java
  - my-jackson2
    - src
      - main
        java
        me
        test
        Test.java
  - my-jasypt
    - src
      - main
        java
        me
        test
        AESUtil.java
        DESedeUtil.java
        GenAESKey.java
        Main.java
        RSAUtil.java
  - my-mail
    - src
      - test
        java
        me
        test
        TestEmail.java
  - my-mssql
    - src
      - main
        java
        me
        test
        MsSqlTest.java
  - my-poj
    - me
      - Main001.java
      - Main002.java
    - p1000
      - Main.java
    - p1001
      - Main.java
    - p1002
      - Main.java
  - my-proxyed-war
    - src
      - main
        java
        me
        test
        MyFilter.java
        MyRequest.java
  - my-session
    - src
      - main
        java
        me
        test
        ContextHolder.java
        MySessionFilter.java
        ReverseProxyInfoFilter.java
        SessionManager.java
        redis
        MyRequest.java
        MyResponse.java
        MySession.java
        MySessionManager.java
  - mybatis
    - MBG-ext
      - src
        main
        java
        me
        test
        mbg
        plugins
        RenameSqlIdPlugin.java
    - PageVsRowBounds
      - PrepareDB
        src
        main
        java
        me
        test
        PrepareDB.java
        TestJdbcQuery.java
      - TestPage
        src
        main
        java
        com
        tc
        his
        api
        model
        Person.java
        PersonCriteria.java
        provider
        dao
        PersonDao.java
        service
        PersonService.java
        impl
        PersonServiceImpl.java
        me
        test
        TestPage.java
      - TestRowBounds
        src
        main
        java
        com
        tc
        his
        api
        model
        Person.java
        PersonCriteria.java
        provider
        dao
        PersonDao.java
        service
        PersonService.java
        impl
        PersonServiceImpl.java
        me
        test
        TestRowBounds.java
      - mybatis-ext-zll
        src
        main
        java
        com
        tc
        his
        api
        model
        Page.java
        provider
        dao
        MyBatisRepository.java
        plugin
        PostgrePaginationPlugin.java
        RenameJavaClientPlugin.java
        RenameXmlFilePlugin.java
    - first-mybatis
      - src
        main
        java
        me
        test
        Main.java
        MainStartDB.java
  - ocr
    - first-tess4j
      - src
        main
        java
        me
        test
        TesseractExample.java
  - quartz
    - first-quartz-spring
      - src
        main
        java
        me
        test
        first
        quartz
        Demo.java
        EchoJob.java
        HelloJob.java
        QuartzTestMain.java
        Util.java
        a
        JobA.java
        QuartzDemo.java
        package-info.java
        b
        ApplicationContextHolder.java
        JobB.java
        JobBDemo.java
        MyRunnable.java
        package-info.java
        c
        package-info.java
        spring
        HelloJob.java
        M.java
        SimpleExample.java
        org
        quartz
        examples
        example1
        HelloJob.java
        SimpleExample.java
        example10
        PlugInExample.java
        SimpleJob.java
        example11
        LoadExample.java
        SimpleJob.java
        example12
        RemoteClientExample.java
        RemoteServerExample.java
        SimpleJob.java
        example13
        ClusterExample.java
        SimpleRecoveryJob.java
        SimpleRecoveryStatefulJob.java
        example14
        PriorityExample.java
        TriggerEchoJob.java
        example15
        ClusterExample.java
        SimpleRecoveryJob.java
        SimpleRecoveryStatefulJob.java
        example2
        SimpleJob.java
        SimpleTriggerExample.java
        example3
        CronTriggerExample.java
        SimpleJob.java
        example4
        ColorJob.java
        JobStateExample.java
        example5
        MisfireExample.java
        StatefulDumbJob.java
        example6
        BadJob1.java
        BadJob2.java
        JobExceptionExample.java
        example7
        DumbInterruptableJob.java
        InterruptExample.java
        example8
        CalendarExample.java
        SimpleJob.java
        example9
        Job1Listener.java
        ListenerExample.java
        SimpleJob1.java
        SimpleJob2.java
  - spark
    - my-spark
      - src
        main
        java
        me
        test
        spark
        MatrixTest.java
        SparkTest.java
  - spring
    - aop-demo
      - src
        main
        java
        me
        test
        anno
        AnnoMain.java
        MyAnnoAspect.java
        task
        TaskA.java
        TaskB.java
        xml
        MyPojoAspectLogic.java
        XmlMain.java
    - first-acl
      - src
        main
        java
        sample
        contact
        AddDeleteContactController.java
        AddPermission.java
        AddPermissionValidator.java
        AdminPermissionController.java
        ClientApplication.java
        Contact.java
        ContactDao.java
        ContactDaoSpring.java
        ContactManager.java
        ContactManagerBackend.java
        DataSourcePopulator.java
        IndexController.java
        WebContact.java
        WebContactValidator.java
    - first-amqp
      - src
        main
        java
        EmitLog.java
        EmitLogDirect.java
        EmitLogHeader.java
        EmitLogTopic.java
        NewTask.java
        RPCClient.java
        RPCServer.java
        ReceiveLogHeader.java
        ReceiveLogs.java
        ReceiveLogsDirect.java
        ReceiveLogsTopic.java
        Recv.java
        Send.java
        Worker.java
        me
        test
        amqp
        RpcBroker.java
        RpcConsumer.java
        RpcProducer.java
        org
        springframework
        amqp
        helloworld
        BrokerConfigurationApplication.java
        Consumer.java
        HelloWorldConfiguration.java
        Producer.java
        async
        Consumer.java
        ConsumerConfiguration.java
        HelloWorldHandler.java
        Producer.java
        ProducerConfiguration.java
    - first-cache
      - src
        generated
        java
        me
        test
        first
        cache
        QUser.java
        User.java
        main
        java
        me
        test
        first
        cache
        ErrorController.java
        Main.java
        MyExceptionHandler.java
        QueryDslJdbcTemplate.java
        UserBiz.java
        UserController.java
    - first-cas4
      - first-cas4-server
        src
        main
        java
        me
        test
        SimpleTestUsernamePasswordAuthenticationHandler.java
      - pac4j-oauth-tencent
        src
        main
        java
        org
        pac4j
        oauth
        client
        TencentAttributesDefinition.java
        TencentClient.java
        profile
        tencent
        TencentProfile.java
        scribe
        builder
        api
        TencentApi.java
        oauth
        TencentOAuth20ServiceImpl.java
        test
        java
        org
        pac4j
        oauth
        client
        TestOAuthClient.java
        TestTencentClient.java
    - first-db-router
      - src
        main
        java
        me
        test
        action
        TestAction.java
        UserAction.java
        db
        router
        AnnatationDataSourceKeyResolver.java
        ComposeDataSourceKeyResolver.java
        CrossDbTransNotSupportedException.java
        DataSouceKeyNotFoundException.java
        DataSourceKey.java
        DataSourceKeyAdvice.java
        DataSourceKeyMapper.java
        DataSourceKeyResolver.java
        FirstParamDataSourceKeyResolver.java
        MapDataSourceKeyMapper.java
        NopDataSourceKeyMapper.java
        ParamDataSourceKeyResolver.java
        RoutingDataSourceImpl.java
        service
        TestTransService.java
        TestTransServiceImpl.java
        UpdateRecord.java
        User.java
        UserService.java
        UserServiceImpl.java
    - first-redis-cache
      - src
        generated
        java
        me
        test
        first
        redis
        cache
        QUser.java
        User.java
        main
        java
        me
        test
        first
        redis
        cache
        Main.java
        QueryDslJdbcTemplate.java
        UserBiz.java
        UserController.java
    - first-spring-aop
      - src
        main
        java
        me
        test
        MyAspect.java
        MyImpl.java
        MyInterface.java
        test
        java
        me
        test
        CGlibAopTest.java
        JdkAopTest.java
    - first-spring-jdo
      - first-spring-jdo-api
        src
        main
        java
        me
        test
        first
        spring
        jdo
        entity
        User.java
      - first-spring-jdo-app
        src
        main
        java
        me
        test
        first
        spring
        jdo
        Main.java
        UserDao.java
        UserDaoDslImpl.java
        UserDaoJdoImpl.java
      - first-spring-jdo-dsl
        src
        main
        java
        me
        test
        first
        spring
        jdo
        entity
        QUser.java
    - first-spring-ldap
      - src
        main
        java
        me
        test
        Auth.java
        LdapAuth.java
        ListDn.java
        ListMail.java
        ListPerson.java
        MySSLSocketFactory.java
        QuerySingleUser.java
    - first-spring-security
      - src
        main
        java
        me
        test
        MyController.java
        MyUserDetailsService.java
    - first-spring-webflow
      - src
        main
        java
        me
        test
        action
        LoginAction.java
    - first-spring-ws
      - src
        main
        java
        me
        test
        client
        Client.java
        server
        Config.java
        MyMathEndpoint.java
    - first-sso
      - first-spring-cas
        src
        main
        java
        me
        test
        MyController.java
        TestCasRESTfulApi.java
      - first-spring-stateless
        src
        main
        java
        me
        test
        CasAuthenticationEntryPointEx.java
        CasAuthenticationProviderEx.java
        MySessionListener.java
        ServicePropertiesEx.java
    - jdo
      - first-spring-jdo
        src
        main
        java
        me
        test
        first
        spring
        jdo
        Main.java
        PersonDAO.java
        PersonDAOImpl.java
        entity
        Person.java
    - jpa
      - first-spring-jpa
        src
        main
        java
        me
        test
        first
        spring
        jpa
        Person.java
    - mvc
      - first-spring-form
        src
        main
        java
        me
        test
        CaseMode.java
        CheckCase.java
        CheckCaseValidator.java
        CodeBean.java
        User.java
        UserController.java
      - first-spring-rs
        src
        main
        java
        me
        test
        first
        spring
        rs
        controller
        ErrorController.java
        FileController.java
        UserController.java
        exception
        BusinessException.java
        MyExceptionResolver.java
        http
        ContentRange.java
        Range.java
        SortBy.java
        interceptor
        CacheControlInterceptor.java
        jaxb
        DateAdapter.java
      - spring-mvc-simple
        src
        main
        java
        me
        test
        ExtensionFilter.java
    - my-spring-csrf-guard
      - src
        main
        java
        me
        test
        csrf
        CsrfHandlerInterceptor.java
        CsrfJsonController.java
        CsrfRequestDataValueProcessor.java
        CsrfTokenManager.java
        InvalidCsrfTokenException.java
        filter
        ExtensionFilter.java
        MatchItem.java
        OriginFilter.java
        RefererFilter.java
    - rmi
      - first-spring-rmi
        src
        main
        java
        me
        test
        spring
        rmi
        modify
        Callback.java
        Client.java
        ClientCallback.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
        pojo
        Client.java
        ClientCallback.java
        RMIUtil.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
        traditional
        Callback.java
        Client.java
        ClientCallback.java
        Server.java
        ServerCallback.java
        ServerInterface.java
        ServerInterfaceImpl.java
    - test-jsr303
      - src
        main
        java
        me
        test
        Person.java
        test
        java
        me
        test
        PersonTest.java
  - zk
    - src
      - main
        java
        me
        test
        DataMonitor.java
        Executor.java
- js
  - cordova
    - my-cordova-plugin
      - src
        android
        src
        main
        java
        io
        github
        btpka3
        my_cordova_plugin
        MyCordovaPlugin.java
  - dojo
    - my
      - Adc.java
- owasp
  - first-AntiSamy
    - src
      - main
        java
        me
        test
        AntiSamyDemo.java
        AntiSamyTest.java
        Test123.java

package me.test;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.cjk.CJKAnalyzer;
import org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer;
import org.apache.lucene.analysis.core.SimpleAnalyzer;
import org.apache.lucene.analysis.core.StopAnalyzer;
import org.apache.lucene.analysis.core.WhitespaceAnalyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.analysis.util.CharArraySet;
import org.apache.lucene.util.Version;

/**
 * 查看分词结果。
 * http://www.iteye.com/news/9637
 *
 * @author zll
 *
 */
public class AnalyzerCN {

    static final String str = "Lucene是apache软件基金会4 jakarta项目组的一个子项目，"
            + "是一个开放源代码的全文检索引擎工具包，即它不是一个完整的全文检索引擎，"
            + "而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，"
            + "部分文本分析引擎（英文与德文两种西方语言）。"
            + "Apache LuceneTM is a high-performance, "
            + "full-featured text search engine library written entirely in Java. "
            + "It is a technology suitable for nearly any application "
            + "that requires full-text search, especially cross-platform.";

    public static void main(String[] args) {
        System.out.println("         : " + str);
        testWhitespaceAnalyzer();
        testSimpleAnalyzer();
        testStopAnalyzer();
        testStandardAnalyzer();
        testCJKAnalyzer();
        testSmartChineseAnalyzer();
    }

    /**
     * WhitespaceAnalyzer
     * 只以空格作为分词分隔符。不太实用。
     */
    private static void testWhitespaceAnalyzer() {
        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new WhitespaceAnalyzer(Version.LUCENE_47);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testWhitespaceAnalyzer : " + result);
    }

    /**
     * SimpleAnalyzer
     * 以非字母符来分割文本信息，并将语汇单元统一为小写形式，并去掉数字类型的字符。很明显不适用于中文环境。
     */
    private static void testSimpleAnalyzer() {
        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new SimpleAnalyzer(Version.LUCENE_47);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testSimpleAnalyzer : " + result);
    }

    /**
     * StopAnalyzer
     * 停顿词分析器会去除一些常有a,the,an等等，也可以自定义禁用词，不适用于中文环境。
     */
    private static void testStopAnalyzer() {
        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new StopAnalyzer(Version.LUCENE_47);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testStopAnalyzer : " + result);
    }

    /**
     * StandardAnalyzer
     * 标准分析器是Lucene内置的分析器,会将语汇单元转成小写形式，并去除停用词及标点符号，很明显也是不适合于中文环境
     */
    private static void testStandardAnalyzer() {
        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testStandardAnalyzer : " + result);
    }

    /**
     * 中日韩分析器，能对中，日，韩语言进行分析的分词器，但是对中文支持效果一般，一般不用
     */
    private static void testCJKAnalyzer() {
        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new CJKAnalyzer(Version.LUCENE_47);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testCJKAnalyzer : " + result);
    }

    /**
     * SmartChineseAnalyzer
     * 基于 Hidden Markov Model.基于
     * 对中文支持稍好，但扩展性差，扩展词库，禁用词库和同义词库等不好处理
     */
    private static void testSmartChineseAnalyzer() {

        // 自定义停用词
        String[] myStopWords = { "的", "了", "呢", "，", "0", "：", ",", "是", "流" };
        CharArraySet cas = new CharArraySet(Version.LUCENE_47, 0, true);
        for (int i = 0; i < myStopWords.length; i++) {
            cas.add(myStopWords[i]);
        }
        Iterator<Object> itor = SmartChineseAnalyzer.getDefaultStopSet().iterator();
        while (itor.hasNext()) {
            cas.add(itor.next());
        }

        List<String> result = new ArrayList<String>();
        Analyzer analyzer = new SmartChineseAnalyzer(Version.LUCENE_47, cas);
        try {
            TokenStream tokenStream = analyzer.tokenStream("field", str);
            CharTermAttribute term = tokenStream.addAttribute(CharTermAttribute.class);
            tokenStream.reset();
            while (tokenStream.incrementToken()) {
                result.add(term.toString());
            }
            tokenStream.end();
            tokenStream.close();
        } catch (IOException e1) {
            e1.printStackTrace();
        }

        System.out.println("testSmartChineseAnalyzer : " + result);
    }

}