CharTokenizer.java example

Explorer

folioxml-master
- commandline
  - src
    - folioxml
      - command
        Main.java
      - export
        ExportRunner.java
  - testsrc
    - folioxml
      - export
        TestExportRunner.java
- contrib
  - folioxml-lucene
    - src
      - folioxml
        export
        plugins
        ResolveHyperlinks.java
        lucene
        FieldCollector.java
        IndexFieldOpts.java
        IndexFieldOptsProvider.java
        InfobaseFieldOptsSet.java
        InfobaseSetIndexer.java
        analysis
        AnalyzerPicker.java
        DynamicAnalyzer.java
        ListAnalyzer.java
        ListTokenizer.java
        LowercaseKeywordAnalyzer.java
        folio
        FolioEnuAnalyzer.java
        FolioEnuPhraseAnalyzer.java
        FolioEnuTokenizer.java
        LookAroundCharTokenizer.java
        TokenCombiner.java
        folioQueryParser
        QueryParser.java
        QueryToken.java
        QueryTokenReader.java
    - testsrc
      - apache
        lucene
        CharTokenizer.java
      - folioxml
        directexport
        SimultaneousTest.java
        lucene
        analysis
        folio
        TokenCombinerTest.java
        folioQueryParser
        QueryParserTest.java
        tests
        Indexer.java
- core
  - folioxml
- diff_match_patch
  - oldtest
    - name
      - fraser
        neil
        plaintext
        diff_match_patch_test.java
  - src
    - name
      - fraser
        neil
        plaintext
        diff_match_patch.java

package apache.lucene;

import folioxml.lucene.analysis.folio.FolioEnuTokenizer;
import folioxml.lucene.analysis.folio.TokenCombiner;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.junit.Test;

import java.io.IOException;
import java.io.StringReader;

public class CharTokenizer {


    @Test
    public void TestBufferingCodeOnFolio() throws IOException {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < 2046; i++) {
            sb.append(" ");
        }
        String token = "thisisasingletokenandshouldnotbebroken";
        sb.append(token);
        Tokenizer lt = new FolioEnuTokenizer();
        lt.reset();
        lt.setReader(new StringReader(sb.toString()));
        lt.incrementToken();
        assert (lt.getAttribute(CharTermAttribute.class).toString().equals(token));

    }

    @Test
    public void TestBufferingCodeOnFolioPhrase() throws IOException {
        StringBuilder sb = new StringBuilder();
        for (int i = 0; i < 2046; i++) {
            sb.append(" ");
        }
        String token = "thisisasingletokenandshouldnotbebroken";
        sb.append(token);
        Tokenizer t = new FolioEnuTokenizer();
        t.setReader(new StringReader(sb.toString()));
        TokenStream lt = new TokenCombiner(t, ' ');
        lt.incrementToken();
        assert (lt.getAttribute(CharTermAttribute.class).toString().equals(token));

    }
}