ExportCollector.java example

Explorer

elasticsearch-inout-plugin-master
- src
  - main
    - java
      - crate
        elasticsearch
        action
        dump
        DumpAction.java
        TransportDumpAction.java
        parser
        DumpDirectoryParseElement.java
        DumpParser.java
        export
        AbstractTransportExportAction.java
        ExportAction.java
        ExportContext.java
        ExportRequest.java
        ExportResponse.java
        ShardExportRequest.java
        ShardExportResponse.java
        TransportExportAction.java
        parser
        ExportCompressionParseElement.java
        ExportForceOverwriteParseElement.java
        ExportMappingsParseElement.java
        ExportOutputCmdParseElement.java
        ExportOutputFileParseElement.java
        ExportParser.java
        ExportSettingsParseElement.java
        IExportParser.java
        import_
        AbstractTransportImportAction.java
        ImportAction.java
        ImportContext.java
        ImportRequest.java
        ImportResponse.java
        NodeImportRequest.java
        NodeImportResponse.java
        TransportImportAction.java
        parser
        DirectoryParseElement.java
        FilePatternParseElement.java
        IImportParser.java
        ImportCompressionParseElement.java
        ImportMappingsParseElement.java
        ImportParseElement.java
        ImportParseException.java
        ImportParser.java
        ImportSettingsParseElement.java
        reindex
        ReindexAction.java
        ReindexParser.java
        TransportReindexAction.java
        restore
        RestoreAction.java
        TransportRestoreAction.java
        parser
        RestoreParser.java
        searchinto
        AbstractTransportSearchIntoAction.java
        SearchIntoAction.java
        SearchIntoContext.java
        SearchIntoRequest.java
        SearchIntoResponse.java
        ShardSearchIntoRequest.java
        ShardSearchIntoResponse.java
        TransportSearchIntoAction.java
        parser
        AbstractSearchIntoParser.java
        FieldsParseElement.java
        ISearchIntoParser.java
        InvalidNodeAddressException.java
        SearchIntoParser.java
        TargetNodesParseElement.java
        client
        action
        export
        ExportRequestBuilder.java
        import_
        ImportRequestBuilder.java
        searchinto
        SearchIntoRequestBuilder.java
        export
        ExportCollector.java
        ExportException.java
        ExportFields.java
        Exporter.java
        Output.java
        OutputCommand.java
        OutputFile.java
        StreamConsumer.java
        import_
        ImportBulkListener.java
        Importer.java
        module
        dump
        DumpModule.java
        export
        ExportModule.java
        import_
        ImportModule.java
        reindex
        ReindexModule.java
        restore
        RestoreModule.java
        searchinto
        SearchIntoModule.java
        plugin
        inout
        InOutPlugin.java
        rest
        action
        admin
        dump
        RestDumpAction.java
        export
        RestExportAction.java
        import_
        RestImportAction.java
        reindex
        RestReindexAction.java
        restore
        RestRestoreAction.java
        searchinto
        RestSearchIntoAction.java
        searchinto
        BulkWriterCollector.java
        Writer.java
        WriterCollector.java
        WriterCollectorFactory.java
        WriterException.java
        WriterResult.java
        mapping
        FieldReader.java
        FieldWriter.java
        IndexRequestBuilder.java
        MappedFields.java
        OutputMapping.java
  - test
    - java
      - crate
        elasticsearch
        client
        transport
        TransportClientTest.java
        doctests
        DocTest.java
        StoreEsSetup.java
        StoreLocalClientProvider.java
        export
        OutputCommandTest.java
        StreamConsumerTest.java
        module
        AbstractRestActionTest.java
        dump
        test
        RestDumpActionTest.java
        export
        test
        RestExportActionTest.java
        import_
        test
        RestImportActionTest.java
        reindex
        test
        RestReindexActionTest.java
        restore
        test
        RestRestoreActionTest.java
        searchinto
        test
        RestSearchIntoActionTest.java

package crate.elasticsearch.export;

import static org.elasticsearch.common.collect.Lists.newArrayList;

import java.io.IOException;
import java.io.OutputStream;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;

import org.apache.lucene.index.AtomicReaderContext;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.search.Collector;
import org.apache.lucene.search.Scorer;
import org.elasticsearch.common.bytes.BytesReference;
import org.elasticsearch.common.io.stream.BytesStreamOutput;
import org.elasticsearch.common.text.StringAndBytesText;
import org.elasticsearch.common.text.Text;
import org.elasticsearch.common.xcontent.ToXContent;
import org.elasticsearch.common.xcontent.XContentBuilder;
import org.elasticsearch.common.xcontent.XContentFactory;
import org.elasticsearch.common.xcontent.XContentType;
import org.elasticsearch.index.fieldvisitor.CustomFieldsVisitor;
import org.elasticsearch.index.fieldvisitor.FieldsVisitor;
import org.elasticsearch.index.fieldvisitor.JustUidFieldsVisitor;
import org.elasticsearch.index.fieldvisitor.UidAndSourceFieldsVisitor;
import org.elasticsearch.index.mapper.DocumentMapper;
import org.elasticsearch.index.mapper.FieldMappers;
import org.elasticsearch.index.mapper.internal.SourceFieldMapper;
import org.elasticsearch.search.SearchHitField;
import org.elasticsearch.search.fetch.FetchSubPhase;
import org.elasticsearch.search.internal.InternalSearchHit;
import org.elasticsearch.search.internal.InternalSearchHitField;

import crate.elasticsearch.action.export.ExportContext;


public class ExportCollector extends Collector {

    private IndexReader currentReader;
    private long numExported = 0;
    private final FieldsVisitor fieldsVisitor;
    private final ExportContext context;

    private List<String> extractFieldNames;
    boolean sourceRequested;
    private final ExportFields exportFields;
    private final OutputStream out;
    private AtomicReaderContext arc;
    private final FetchSubPhase[] fetchSubPhases;

    public ExportCollector(ExportContext context,
                           OutputStream os, FetchSubPhase[] fetchSubPhases) {
        this.out = os;
        this.context = context;
        this.fetchSubPhases = fetchSubPhases;
        this.exportFields = new ExportFields(context.fieldNames());
        sourceRequested = false;

        if (!context.hasFieldNames()) {
            if (context.hasPartialFields()) {
                // partial fields need the source, so fetch it, but don't return it
                fieldsVisitor = new UidAndSourceFieldsVisitor();
            } else if (context.hasScriptFields()) {
                // we ask for script fields, and no field names, don't load the source
                fieldsVisitor = new JustUidFieldsVisitor();
            } else {
                sourceRequested = true;
                fieldsVisitor = new UidAndSourceFieldsVisitor();
            }
        } else if (context.fieldNames().isEmpty()) {
            fieldsVisitor = new JustUidFieldsVisitor();
        } else {
            boolean loadAllStored = false;
            Set<String> fieldNames = null;
            for (String fieldName : context.fieldNames()) {
                if (fieldName.equals("*")) {
                    loadAllStored = true;
                    continue;
                }
                if (fieldName.equals(SourceFieldMapper.NAME)) {
                    sourceRequested = true;
                    continue;
                }
                FieldMappers x = context.smartNameFieldMappers
                        (fieldName);
                if (x != null && x.mapper().fieldType().stored()) {
                    if (fieldNames == null) {
                        fieldNames = new HashSet<String>();
                    }
                    fieldNames.add(x.mapper().names().indexName());
                } else {
                    if (extractFieldNames == null) {
                        extractFieldNames = newArrayList();
                    }
                    extractFieldNames.add(fieldName);
                }
            }
            if (loadAllStored) {
                if (sourceRequested || extractFieldNames != null) {
                    fieldsVisitor = new CustomFieldsVisitor(true, true); // load everything, including _source
                } else {
                    fieldsVisitor = new CustomFieldsVisitor(true, false);
                }
            } else if (fieldNames != null) {
                boolean loadSource = extractFieldNames != null || sourceRequested;
                fieldsVisitor = new CustomFieldsVisitor(fieldNames, loadSource);
            } else if (extractFieldNames != null || sourceRequested) {
                fieldsVisitor = new UidAndSourceFieldsVisitor();
            } else {
                fieldsVisitor = new JustUidFieldsVisitor();
            }
        }
    }

    @Override
    public void setNextReader(AtomicReaderContext context) throws IOException {
        this.arc = context;
        this.currentReader = context.reader();
    }

    @Override
    public boolean acceptsDocsOutOfOrder() {
        return true;
    }

    @Override
    public void setScorer(Scorer scorer) throws IOException {
    }

    public long numExported(){
        return numExported;
    }

    @Override
    public void collect(int doc) throws IOException {
        fieldsVisitor.reset();
        currentReader.document(doc, fieldsVisitor);

        Map<String, SearchHitField> searchFields = null;
        if (fieldsVisitor.fields() != null) {
            searchFields = new HashMap<String, SearchHitField>(fieldsVisitor.fields().size());
            for (Map.Entry<String, List<Object>> entry : fieldsVisitor.fields().entrySet()) {
                searchFields.put(entry.getKey(), new InternalSearchHitField(entry.getKey(), entry.getValue()));
            }
        }

        DocumentMapper documentMapper = context.mapperService()
                .documentMapper(fieldsVisitor.uid().type());
        Text typeText;
        if (documentMapper == null) {
            typeText = new StringAndBytesText(fieldsVisitor.uid().type());
        } else {
            typeText = documentMapper.typeText();
        }

        InternalSearchHit searchHit = new InternalSearchHit(doc,
                fieldsVisitor.uid().id(), typeText,
                sourceRequested ? fieldsVisitor.source() : null,
                searchFields);

        for (FetchSubPhase fetchSubPhase : fetchSubPhases) {
            FetchSubPhase.HitContext hitContext = new FetchSubPhase.HitContext();
            if (fetchSubPhase.hitExecutionNeeded(context)) {
                hitContext.reset(searchHit, arc, doc, context.searcher().getIndexReader(), doc, fieldsVisitor);
                fetchSubPhase.hitExecute(context, hitContext);
            }
        }

        searchHit.shardTarget(context.shardTarget());
        exportFields.hit(searchHit);
        BytesStreamOutput os = new BytesStreamOutput();
        XContentBuilder builder = new XContentBuilder(XContentFactory.xContent(XContentType.JSON), os);
        exportFields.toXContent(builder, ToXContent.EMPTY_PARAMS);
        builder.flush();
        BytesReference bytes = os.bytes();
        out.write(bytes.array(), bytes.arrayOffset(), bytes.length());
        out.write('\n');
        out.flush();
        numExported++;
    }

}