CsvLoader.java example

Explorer

diqube-master
- build
  - maven
    - diqube-build-java-ts-api
      - src
        main
        java
        org
        diqube
        build
        mojo
        TypeScriptProperty.java
    - diqube-build-java-ts-maven-plugin
      - src
        main
        java
        org
        diqube
        build
        mojo
        GenerateTsMojo.java
    - diqube-build-refresh-files-maven-plugin
      - src
        main
        java
        org
        diqube
        build
        mojo
        RefreshMojo.java
- diqube-buildinfo
  - src
    - main
      - java
        org
        diqube
        buildinfo
        BuildInfo.java
- diqube-cache
  - src
    - main
      - java
        org
        diqube
        cache
        Cache.java
        ConstantTimeCache.java
        CountingCache.java
        DeletableCache.java
        FlaggingCache.java
        NoopCache.java
        WritableCache.java
        WritableFlaggingCache.java
    - test
      - java
        org
        diqube
        cache
        ConstantTimeCacheTest.java
        CountingCacheTest.java
- diqube-cluster
  - src
    - main
      - java
        org
        diqube
        cluster
        ClusterLayout.java
        ClusterLayoutStateMachine.java
        ClusterLayoutStateMachineImplementation.java
        ClusterManagementServiceHandler.java
        ClusterManager.java
        KeepAliveServiceHandler.java
- diqube-config
  - src
    - main
      - java
        org
        diqube
        config
        Config.java
        ConfigKey.java
        ConfigurationManager.java
        ConfigurationPostProcessor.java
        DerivedConfigKey.java
        derived
        AbstractDerivedConfigValueProvider.java
        DerivedConsensusDataDirConfigValueProvider.java
        DerivedDataDirConfigValueProvider.java
        DerivedFlattenDiskCacheLocationConfigValueProvider.java
        DerivedInternalDbDirConfigValueProvider.java
- diqube-connection
  - src
    - main
      - java
        org
        diqube
        connection
        ClusterNodeStatusDetailListener.java
        Connection.java
        ConnectionException.java
        ConnectionFactory.java
        ConnectionOrLocalHelper.java
        ConnectionPool.java
        DefaultConnectionFactory.java
        DiqubeClientSocket.java
        NodeAddress.java
        OurNodeAddressProvider.java
        ServiceProvider.java
        SocketListener.java
        integrity
        IntegrityCheckingProtocol.java
        IntegritySecretHelper.java
    - test
      - java
        org
        diqube
        connection
        ConnectionPoolTest.java
        integrity
        IntegrityCheckingProtocolTest.java
        IntegritySecretHelperTestUtil.java
- diqube-consensus
  - src
    - main
      - java
        org
        diqube
        consensus
        AbstractConsensusStateMachine.java
        ConsensusClient.java
        ConsensusClusterNodeAddressProvider.java
        ConsensusIsLeaderProvider.java
        ConsensusMethod.java
        ConsensusServer.java
        ConsensusStateMachine.java
        ConsensusStateMachineClientInterruptedException.java
        ConsensusStateMachineImplementation.java
        ConsensusStateMachineManager.java
        ConsensusUtil.java
        DefaultConsensusClient.java
        internal
        ClusterConsensusConnectionRegistry.java
        ClusterConsensusHandler.java
        DiqubeCatalystClient.java
        DiqubeCatalystConnection.java
        DiqubeCatalystConnectionFactory.java
        DiqubeCatalystSerializer.java
        DiqubeCatalystServer.java
        DiqubeCatalystTransport.java
- diqube-consensus-test
  - src
    - main
      - java
        org
        diqube
        consensus
        test
        TestConsensusClient.java
        TestConsensusIsLeaderProvider.java
- diqube-context
  - src
    - main
      - java
        org
        diqube
        context
        AutoInstatiate.java
        InjectOptional.java
        Profiles.java
        shutdown
        ContextShutdownListener.java
        ShutdownAfter.java
        ShutdownBefore.java
        ShutdownUtil.java
- diqube-data
  - src
    - main
      - java
        org
        diqube
        data
        column
        AbstractConstantColumnShard.java
        AbstractStandardColumnShard.java
        AdjustableColumnPage.java
        AdjustableStandardColumnShard.java
        ColumnPage.java
        ColumnPageFactory.java
        ColumnShard.java
        ColumnShardFactory.java
        ColumnType.java
        ConstantColumnShard.java
        DefaultColumnPage.java
        StandardColumnShard.java
        StandardColumnShardDeserializationDelegationManager.java
        dictionary
        Dictionary.java
        DictionaryDeserializationDelegationManager.java
        SerializableDictionary.java
        flatten
        FlattenDataFactory.java
        FlattenedTable.java
        table
        AdjustableTable.java
        DefaultTable.java
        DefaultTableShard.java
        Table.java
        TableFactory.java
        TableShard.java
        types
        dbl
        DefaultDoubleStandardColumnShard.java
        DoubleColumnShard.java
        DoubleColumnShardFactory.java
        DoubleConstantColumnShard.java
        DoubleStandardColumnShard.java
        dict
        ConstantDoubleDictionary.java
        DoubleDictionary.java
        FpcDoubleDictionary.java
        FpcPage.java
        lng
        DefaultLongStandardColumnShard.java
        LongColumnShard.java
        LongColumnShardFactory.java
        LongConstantColumnShard.java
        LongStandardColumnShard.java
        array
        AbstractExplorableCompressedLongArray.java
        AbstractTransitiveExplorableCompressedLongArray.java
        BitEfficientLongArray.java
        CompressedLongArray.java
        CompressedLongArrayDeserializationDelegationManager.java
        CompressedLongArrayUtil.java
        ExplorableCompressedLongArray.java
        ReferenceBasedLongArray.java
        RunLengthLongArray.java
        TransitiveExplorableCompressedLongArray.java
        dict
        ArrayCompressedLongDictionary.java
        ConstantLongDictionary.java
        EmptyLongDictionary.java
        LongDictionary.java
        LongDictionarySerializationDelegationManager.java
        str
        DefaultStringStandardColumnShard.java
        StringColumnShard.java
        StringColumnShardFactory.java
        StringConstantColumnShard.java
        StringStandardColumnShard.java
        dict
        ConstantStringDictionary.java
        ParentNode.java
        StringDictionary.java
        TerminalNode.java
        TrieNode.java
        TrieStringDictionary.java
        TrieUtil.java
        TrieValueAnalyzer.java
        util
        StandardColumnShardUtil.java
    - test
      - java
        org
        diqube
        data
        types
        dbl
        DoubleColumnSerializationTest.java
        FpcDoubleDictionaryTest.java
        FpcPageTest.java
        lng
        LongColumnSerializationTest.java
        compression
        AbstractCompressedLongArrayTest.java
        ArrayCompressedLongDictionaryTest.java
        BitEfficientLongArrayTest.java
        BitEfficientRatioTest.java
        ReferenceBasedLongArrayTest.java
        ReferenceBasedWithBitEfficientLongArrayTest.java
        ReferenceBasedWithBitEfficientRatioTest.java
        RunLengthLongArrayTest.java
        RunLengthWithBitEfficientLongArrayTest.java
        RunLengthWithBitEfficientRatioTest.java
        str
        StringColumnSerializationTest.java
        TrieStringDictionaryTest.java
        TrieTestUtil.java
- diqube-data-serialize
  - src
    - main
      - java
        org
        diqube
        data
        serialize
        DataDeserializer.java
        DataSerializable.java
        DataSerializableIgnore.java
        DataSerialization.java
        DataSerializationDelegationManager.java
        DataSerializationManager.java
        DataSerializer.java
        DeserializationException.java
        SerializationException.java
- diqube-diql
  - src
    - main
      - java
        org
        diqube
        diql
        DiqlParseUtil.java
        ParseException.java
        request
        ComparisonRequest.java
        ExecutionRequest.java
        ExecutionRequestInfo.java
        FromRequest.java
        FunctionRequest.java
        GroupRequest.java
        OrderRequest.java
        ResolveValueRequest.java
        visitors
        AnyValueVisitor.java
        ComparisonVisitor.java
        ExecutionRequestVisitorEnvironment.java
        GroupByVisitor.java
        OrderVisitor.java
        ResultValueVisitor.java
        SelectStmtVisitor.java
        TableNameVisitor.java
- diqube-execution
  - src
    - main
      - java
        org
        diqube
        execution
        ColumnVersionBuiltHelper.java
        ColumnVersionManager.java
        ColumnVersionManagerFactory.java
        ExecutablePlan.java
        ExecutablePlanFactory.java
        ExecutablePlanFromRemoteBuilder.java
        ExecutablePlanFromRemoteBuilderFactory.java
        ExecutablePlanInfo.java
        ExecutablePlanStep.java
        ExecutablePlanStepFromRemoteFactory.java
        ExecutionPercentage.java
        RemoteExecutionPlanOptimizer.java
        RemotesTriggeredListener.java
        consumers
        AbstractDoneConsumer.java
        AbstractPlanStepBasedGenericConsumer.java
        AbstractThreadedColumnBuiltConsumer.java
        AbstractThreadedColumnDictIdConsumer.java
        AbstractThreadedColumnValueConsumer.java
        AbstractThreadedColumnVersionBuiltConsumer.java
        AbstractThreadedGroupConsumer.java
        AbstractThreadedGroupDeltaConsumer.java
        AbstractThreadedGroupFinalAggregationConsumer.java
        AbstractThreadedGroupIntermediaryAggregationConsumer.java
        AbstractThreadedOrderedRowIdConsumer.java
        AbstractThreadedOverwritingRowIdConsumer.java
        AbstractThreadedRowIdConsumer.java
        AbstractThreadedTableFlattenedConsumer.java
        ColumnBuiltConsumer.java
        ColumnDictIdConsumer.java
        ColumnValueConsumer.java
        ColumnVersionBuiltConsumer.java
        ContinuousConsumer.java
        DoneConsumer.java
        GenericConsumer.java
        GroupConsumer.java
        GroupDeltaConsumer.java
        GroupFinalAggregationConsumer.java
        GroupIntermediaryAggregationConsumer.java
        OrderedRowIdConsumer.java
        OverwritingConsumer.java
        OverwritingRowIdConsumer.java
        RowIdConsumer.java
        TableFlattenedConsumer.java
        exception
        ExecutablePlanBuildException.java
        ExecutablePlanExecutionException.java
        steps
        AbstractThreadedExecutablePlanStep.java
        BuildColumnFromValuesStep.java
        ColumnAggregationStep.java
        ExecuteRemotePlanOnShardsStep.java
        FilterRequestedColumnsAndActiveRowIdsStep.java
        FlattenStep.java
        GroupFinalAggregationStep.java
        GroupIdAdjustingStep.java
        GroupIntermediaryAggregationStep.java
        GroupStep.java
        HavingResultStep.java
        OrderStep.java
        OverwritingRowIdAndStep.java
        OverwritingRowIdNotStep.java
        OverwritingRowIdOrStep.java
        ProjectStep.java
        RepeatedProjectStep.java
        ResolveColumnDictIdsStep.java
        ResolveValuesStep.java
        RowIdAndStep.java
        RowIdEqualsStep.java
        RowIdInequalStep.java
        RowIdNotStep.java
        RowIdOrStep.java
        RowIdSinkStep.java
- diqube-executionenv
  - src
    - main
      - java
        org
        diqube
        executionenv
        AbstractExecutionEnvironment.java
        DefaultExecutionEnvironment.java
        DelegatingExecutionEnvironment.java
        ExecutionEnvironment.java
        ExecutionEnvironmentFactory.java
        FlattenedTableInstanceManager.java
        TableRegistry.java
        VersionedExecutionEnvironment.java
        cache
        ColumnShardCache.java
        ColumnShardCacheRegistry.java
        DefaultColumnShardCache.java
        NoopColumnShardCache.java
        WritableColumnShardCache.java
        querystats
        AbstractQueryableColumnShardFacade.java
        QueryableColumnShard.java
        QueryableDoubleColumnShard.java
        QueryableDoubleColumnShardFacade.java
        QueryableLongColumnShard.java
        QueryableLongColumnShardFacade.java
        QueryableStringColumnShard.java
        QueryableStringColumnShardFacade.java
        resolver
        QueryableDoubleColumnShardResolver.java
        QueryableLongColumnShardResolver.java
        QueryableStringColumnShardResolver.java
        util
        ColumnPatternUtil.java
    - test
      - java
        org
        diqube
        cache
        CountingCacheTestUtil.java
        executionenv
        FlattenedTableInstanceManagerTest.java
        util
        ColumnPatternUtilTest.java
- diqube-file
  - src
    - main
      - java
        org
        diqube
        file
        DiqubeFileFactory.java
        DiqubeFileReader.java
        DiqubeFileWriter.java
        internaldb
        InternalDbFileReader.java
        InternalDbFileUtil.java
        InternalDbFileWriter.java
- diqube-flatten
  - src
    - main
      - java
        org
        diqube
        flatten
        FlattenManager.java
        FlattenedTableDiskCache.java
        FlattenedTableUtil.java
        Flattener.java
        NoopFlattenedTableDiskCache.java
        QueryMasterFlattenService.java
    - test
      - java
        org
        diqube
        flatten
        FlattenedTableUtilTest.java
        FlattenerTest.java
- diqube-function
  - src
    - main
      - java
        org
        diqube
        function
        AggregationFunction.java
        Function.java
        FunctionException.java
        FunctionFactory.java
        IntermediaryResult.java
        ProjectionFunction.java
        aggregate
        AnyDoubleFunction.java
        AnyLongFunction.java
        AnyStringFunction.java
        AvgDoubleFunction.java
        AvgLongFunction.java
        ConcatGroupFunction.java
        CountFunction.java
        MaxDoubleFunction.java
        MaxLongFunction.java
        MinDoubleFunction.java
        MinLongFunction.java
        QuantileDoubleFunction.java
        QuantileLongFunction.java
        QuartileVariationCoefficientDoubleFunction.java
        QuartileVariationCoefficientLongFunction.java
        RelativeStandardDeviationDoubleFunction.java
        RelativeStandardDeviationLongFunction.java
        StandardDeviationDoubleFunction.java
        StandardDeviationLongFunction.java
        SumDoubleFunction.java
        SumLongFunction.java
        VarDoubleFunction.java
        VarLongFunction.java
        result
        IntermediaryResultValueIterator.java
        IntermediaryResultValueSink.java
        serialization
        DefaultIntermediateResultSerializationResolver.java
        IntermediateResultSerialization.java
        IntermediateResultSerializationResolver.java
        util
        BigDecimalHelper.java
        SerializedAVLTreeDigest.java
        projection
        AbstractSingleParamProjectionFunction.java
        AbstractSingleParamSameColTypeProjectionFunction.java
        AbstractTwoParamProjectionFunction.java
        AbstractTwoParamSameColTypeProjectionFunction.java
        AddDoubleFunction.java
        AddLongFunction.java
        ConcatFunction.java
        DivDoubleFunction.java
        DivLongFunction.java
        DoubleLongFunction.java
        DoubleStringFunction.java
        HostStringFunction.java
        IdDoubleFunction.java
        IdLongFunction.java
        IdStringFunction.java
        IntStringFunction.java
        LogDoubleFunction.java
        LogLongFunction.java
        LongStringFunction.java
        MulDoubleFunction.java
        MulLongFunction.java
        RoundToLongFunction.java
        StringDoubleFunction.java
        StringLongFunction.java
        SubDoubleFunction.java
        SubLongFunction.java
        TopLevelDomainStringFunction.java
- diqube-hadoop
  - src
    - main
      - java
        org
        diqube
        hadoop
        DiqubeOutputFormat.java
        DiqubeRecordWriter.java
        DiqubeRow.java
- diqube-im
  - src
    - main
      - java
        org
        diqube
        im
        CachingConsensusSUserProvider.java
        IdentityHandler.java
        IdentityStateMachine.java
        IdentityStateMachineImplementation.java
        SUserProvider.java
        SuperuserCheckUtil.java
        callback
        IdentityCallbackRegistryCleaner.java
        IdentityCallbackRegistryStateMachine.java
        IdentityCallbackRegistryStateMachineImplementation.java
        logout
        LogoutCleaner.java
        LogoutStateMachine.java
        LogoutStateMachineImplementation.java
        ticket
        ServerTicketRsaKeyFileProvider.java
- diqube-itest
  - src
    - test
      - java
        org
        diqube
        connection
        DefaultDiqubeConnectionFactoryTestUtil.java
        DiqubeClientSocketTestFactory.java
        integrity
        IntegritySecretHelperTestUtil.java
        itest
        AbstractDiqubeIntegrationTest.java
        annotations
        NeedsProcessPid.java
        NeedsServer.java
        NeedsTomcat.java
        control
        LogfileSaver.java
        ServerClusterControl.java
        ServerControl.java
        TomcatControl.java
        ToolControl.java
        tests
        ClusterFlattenIntegrationTest.java
        DeadServerIntegrationTest.java
        DiqlExecutionIntegrationTest.java
        FlattenIntegrationTest.java
        LoginLogoutIntegrationTest.java
        MergeDeployIntegrationTest.java
        QueryCancelIntegrationTest.java
        QueryTimeoutIntegrationTest.java
        SimpleServerDeployIntegrationTest.java
        TableMetadataIntegrationTest.java
        TableTicketIntegrationTest.java
        TransposeDeployIntegrationTest.java
        util
        ClusterFlattenServiceTestUtil.java
        IdentityCallbackServiceTestUtil.java
        ProcessPidUtil.java
        QueryResultServiceTestUtil.java
        ServiceTestUtil.java
        TestDataGenerator.java
        Unzip.java
        Waiter.java
        Zip.java
- diqube-listeners
  - src
    - main
      - java
        org
        diqube
        listeners
        ClusterManagerListener.java
        ConsensusListener.java
        ServingListener.java
        TableLoadListener.java
        providers
        LoadedTablesProvider.java
        OurNodeAddressStringProvider.java
- diqube-loader
  - src
    - main
      - java
        org
        diqube
        loader
        CsvLoader.java
        DiqubeLoader.java
        JsonLoader.java
        LoadException.java
        Loader.java
        LoaderColumnInfo.java
        columnshard
        ColumnPageBuilder.java
        ColumnShardBuilder.java
        ColumnShardBuilderFactory.java
        ColumnShardBuilderManager.java
        SparseColumnShardBuilder.java
        compression
        CompressedDoubleDictionaryBuilder.java
        CompressedLongArrayBuilder.java
        CompressedLongDictionaryBuilder.java
        CompressedStringDictionaryBuilder.java
        util
        ParallelLoadAndTransposeHelper.java
        TransposeThread.java
    - test
      - java
        org
        diqube
        loader
        ColumnShardBuilderTest.java
        CsvLoaderTest.java
        JsonLoaderTest.java
        compression
        CompressedLongDictionaryBuilderTest.java
        CompressedStringDictionaryBuilderTest.java
- diqube-metadata
  - src
    - main
      - java
        org
        diqube
        metadata
        DefaultTableMetadataManager.java
        TableMetadataHandler.java
        TableMetadataManager.java
        consensus
        TableMetadataStateMachine.java
        TableMetadataStateMachineImplementation.java
        create
        FieldUtil.java
        TableMetadataMerger.java
        TableMetadataRecomputeRequestListener.java
        TableShardMetadataBuilder.java
        TableShardMetadataBuilderFactory.java
        inspect
        TableMetadataInspector.java
        TableMetadataInspectorFactory.java
        exception
        ColumnNameInvalidException.java
        util
        CurrentFlattenedTableNameUtil.java
    - test
      - java
        org
        diqube
        metadata
        TableMetadataMergerTest.java
        TableMetadataTestUtil.java
        TableShardMetadataBuilderTest.java
- diqube-name
  - src
    - main
      - java
        org
        diqube
        name
        FlattenedTableNameUtil.java
        FunctionBasedColumnNameBuilder.java
        FunctionBasedColumnNameBuilderFactory.java
        RepeatedColumnNameGenerator.java
- diqube-optimize
  - src
    - main
      - java
        org
        diqube
        optimize
        ExecutionRequestOptimizer.java
        OptimizerComparisonInfo.java
        OptimizerComparisonInfoBuilder.java
        PushToLeafsWhereNotOptimizer.java
        WhereNotOptimizer.java
- diqube-permission
  - src
    - main
      - java
        org
        diqube
        permission
        PermissionCheckUtil.java
        Permissions.java
        TableAccessPermissionUtil.java
- diqube-plan
  - src
    - main
      - java
        org
        diqube
        plan
        ExecutionPlanBuilder.java
        ExecutionPlanBuilderFactory.java
        ExecutionPlannerFactory.java
        PlannerColumnInfo.java
        PlannerColumnInfoBuilder.java
        RemoteExecutionPlanFactory.java
        exception
        PlanBuildException.java
        ValidationException.java
        planner
        ColumnManager.java
        ComparisonRequestBuilder.java
        ComparisonRequestUtil.java
        ExecutionPlanner.java
        HavingBuilder.java
        MasterColumnManager.java
        MasterOrderHandler.java
        MasterResolveManager.java
        MasterWireManager.java
        OrderRequestBuilder.java
        RemoteColumnManager.java
        RemoteOrderHandler.java
        RemoteResolveManager.java
        RemoteWireManager.java
        ResolveManager.java
        WhereBuilder.java
        WireManager.java
        validate
        DefaultExecutionRequestValidator.java
        ExecutionRequestValidator.java
    - test
      - java
        org
        diqube
        plan
        GroupStepTest.java
        ParserTest.java
        RowIdEqualsStepTest.java
- diqube-queries
  - src
    - main
      - java
        org
        diqube
        queries
        QueryRegistry.java
        QueryStats.java
        QueryStatsManager.java
        QueryUuid.java
        QueryUuidProvider.java
- diqube-remote
  - diqube-remote-cluster
    - src
      - main
        java
        org
        diqube
        remote
        cluster
        ClusterConsensusServiceConstants.java
        ClusterFlattenServiceConstants.java
        ClusterManagementServiceConstants.java
        ClusterQueryServiceConstants.java
        RClusterQueryStatsUtil.java
        RIntermediateAggregationResultUtil.java
  - diqube-remote-query
    - src
      - main
        java
        org
        diqube
        remote
        query
        ClusterInformationServiceConstants.java
        FlattenPreparationServiceConstants.java
        IdentityCallbackServiceConstants.java
        IdentityServiceConstants.java
        KeepAliveServiceConstants.java
        QueryResultServiceConstants.java
        QueryServiceConstants.java
        TableMetadataServiceConstants.java
        TicketInfoUtil.java
- diqube-server
  - src
    - main
      - java
        org
        diqube
        server
        ClusterInformationServiceHandler.java
        ControlFileManager.java
        NewDataWatcher.java
        Server.java
        ServerImplementation.java
        control
        ControlFileFactory.java
        ControlFileLoader.java
        ControlFileUnloader.java
        metadata
        ServerTableMetadataPublisher.java
        ServerTableMetadataRecomputeRequestListener.java
        querymaster
        flatten
        FlattenPreparationServiceHandler.java
        query
        MasterQueryExecutor.java
        MasterQueryExecutorFactory.java
        MasterQueryStatisticsMerger.java
        QueryServiceHandler.java
        datatype
        DataTypeInvalidException.java
        QueryDataTypeResolver.java
        QueryDataTypeResolverFactory.java
        validate
        MasterExecutionRequestValidator.java
        queryremote
        flatten
        ClusterFlattenServiceHandler.java
        DelegatingFlattenedTableDiskCache.java
        FlattenedControlFileFlattenedTableDiskCache.java
        query
        ClusterQueryServiceHandler.java
        RemoteExecutionPlanExecutor.java
        thrift
        ThriftServer.java
        util
        ExecutablePlanQueryStatsUtil.java
    - test
      - java
        org
        diqube
        connection
        ConnectionPoolTestUtil.java
        consensus
        ConsensusServerTestUtil.java
        executionenv
        cache
        DefaultColumnShardCacheTestUtil.java
        server
        config
        ControlFileLoaderTest.java
        DefaultConfigValuesAvailable.java
        execution
        AbstractCacheDoubleDiqlExecutionTest.java
        AbstractDiqlExecutionTest.java
        AbstractRemoteEmulatingDiqlExecutionTest.java
        CacheDoubleTestUtil.java
        GroupDiqlExecutionTest.java
        GroupHavingDiqlExecutionTest.java
        OrderSplitDiqlExecutionTest.java
        QueryMasterParallelDiqlExecutionTest.java
        SimpleDiqlExecutionTest.java
        TestDataProvider.java
        dbl
        DoubleGroupDiqlExecutionTest.java
        DoubleOrderSplitDiqlExecutionTest.java
        DoubleProjectionDiqlExecutionTest.java
        DoubleQueryMasterParallelDiqlExecutionTest.java
        DoubleSimpleDiqlExecutionTest.java
        DoubleTestDataProvider.java
        lng
        GroupIdAdjustingEmulatingDiqlExecutionTest.java
        LongColumnAggregationAndRepeatedProjectionDiqlExecutionTest.java
        LongGroupDiqlExecutionTest.java
        LongGroupHavingDiqlExecutionTest.java
        LongOrderSplitDiqlExecutionTest.java
        LongProjectionDiqlExecutionTest.java
        LongQueryMasterParallelDiqlExecutionTest.java
        LongRepeatedProjectionCacheExecutionTest.java
        LongSimpleDiqlExecutionTest.java
        LongTestDataProvider.java
        str
        StringGeneralDiqlExecutionTest.java
        StringGroupDiqlExecutionTest.java
        StringOrderSplitDiqlExecutionTest.java
        StringProjectionDiqlExecutionTest.java
        StringQueryMasterParallelDiqlExecutionTest.java
        StringSimpleDiqlExecutionTest.java
        StringTestDataProvider.java
        util
        NoopClusterQueryService.java
        metadata
        ServerTableMetadataPublisherTestUtil.java
        query
        validate
        MasterExecutionRequestValidatorTest.java
        queryremote
        flatten
        FlattenedControlFileFlattenedTableDiskCacheTest.java
- diqube-test-util
  - src
    - main
      - java
        org
        diqube
        testutil
        LoggingTestNgListener.java
        TestContextOverrideBean.java
- diqube-threads
  - src
    - main
      - java
        org
        diqube
        threads
        DiqubeFixedThreadPoolExecutor.java
        ExecutorManager.java
        QueryThreadFactory.java
        test
        TestExecutors.java
- diqube-thrift
  - diqube-thrift-base
    - src
      - main
        java
        org
        diqube
        thrift
        base
        services
        DiqubeThriftService.java
        DiqubeThriftServiceInfoManager.java
        util
        RNodeAddressUtil.java
        RUuidUtil.java
        RValueUtil.java
  - diqube-thrift-util
    - src
      - main
        java
        org
        diqube
        thrift
        util
        RememberingTransport.java
- diqube-ticket
  - src
    - main
      - java
        org
        diqube
        ticket
        IdentityCallbackHandler.java
        TicketRsaKeyFileProvider.java
        TicketRsaKeyManager.java
        TicketSignatureService.java
        TicketUtil.java
        TicketValidityService.java
        TicketVendor.java
    - test
      - java
        org
        diqube
        ticket
        TicketSignatureServiceTest.java
        TicketUtilTest.java
        TicketValidityServiceTest.java
        TicketVendorTest.java
- diqube-tool
  - src
    - main
      - java
        org
        diqube
        tool
        Tool.java
        ToolFunction.java
        ToolFunctionName.java
        im
        AbstractActualIdentityToolFunction.java
        AddPermissionActualIdentityToolFunction.java
        ChangeEmailActualIdentityToolFunction.java
        ChangePasswordActualIdentityToolFunction.java
        CreateUserActualIdentityToolFunction.java
        DeletePermissionActualIdentityToolFunction.java
        DeleteUserActualIdentityToolFunction.java
        GetEmailActualIdentityToolFunction.java
        GetPermissionsActualIdentityToolFunction.java
        IdentityToolFunction.java
        IsActualIdentityToolFunction.java
        internal
        NoopTicketRsaKeyFileProvider.java
        ToolOurNodeAddressProvider.java
        info
        Info.java
        InfoImplementation.java
        merge
        Merge.java
        MergeImplementation.java
        transpose
        Transpose.java
        TransposeImplementation.java
        version
        Version.java
- diqube-ui
  - src
    - main
      - java
        org
        diqube
        ui
        DiqubeServletConfig.java
        DiqubeServletContextListener.java
        KeepAliveServiceHandler.java
        QueryResultServiceHandler.java
        ThriftServlet.java
        UiQueryRegistry.java
        WebServlet.java
        analysis
        AnalysisFactory.java
        QueryBuilder.java
        UiAnalysis.java
        UiQube.java
        UiQuery.java
        UiSlice.java
        UiSliceDisjunction.java
        db
        UiDatabase.java
        UiDatabaseFactory.java
        UiDbProvider.java
        hsqldb
        HsqlUiDatabase.java
        ticket
        TicketValiditySubscriber.java
        TicketsAcceptableProvider.java
        UiTicketRsaKeyFileProvider.java
        websocket
        DiqubeServerApplicationConfig.java
        WebSocketEndpoint.java
        request
        AbstractCommandClusterInteraction.java
        CommandClusterInteraction.java
        CommandResultHandler.java
        JsonRequest.java
        JsonRequestDeserializer.java
        JsonRequestRegistry.java
        commands
        AsyncJsonCommand.java
        CancelJsonCommand.java
        CommandInformation.java
        JsonCommand.java
        ListAllTablesJsonCommand.java
        LoginJsonCommand.java
        LogoutJsonCommand.java
        PlainQueryJsonCommand.java
        VersionJsonCommand.java
        analysis
        AbstractAnalysisAdjustingJsonCommand.java
        AdjustQueryOrderingJsonCommand.java
        AnalysisJsonCommand.java
        AnalysisQueryJsonCommand.java
        CloneAnalysisJsonCommand.java
        CreateAnalysisJsonCommand.java
        CreateQubeJsonCommand.java
        CreateQueryJsonCommand.java
        CreateSliceJsonCommand.java
        ListAllAnalysisJsonCommand.java
        NewestAnalysisVersionJsonCommand.java
        QueryInfoJsonCommand.java
        RemoveQubeJsonCommand.java
        RemoveQueryJsonCommand.java
        RemoveSliceJsonCommand.java
        UpdateQubeJsonCommand.java
        UpdateQueryJsonCommand.java
        UpdateSliceJsonCommand.java
        util
        QueryInfoJsonResultBuilder.java
        QueryInfoJsonResultBuilderFactory.java
        result
        ExceptionJsonResult.java
        JsonResult.java
        JsonResultDataType.java
        JsonResultEnvelope.java
        JsonResultSerializer.java
        StatsJsonResult.java
        TableJsonResult.java
        TableNameListJsonResult.java
        TicketJsonResult.java
        VersionJsonResult.java
        analysis
        AnalysisJsonResult.java
        AnalysisRefJsonResult.java
        AnalysisVersionJsonResult.java
        QubeJsonResult.java
        QueryInfoJsonResult.java
        QueryJsonResult.java
        SliceJsonResult.java
    - test
      - java
        org
        diqube
        ui
        analysis
        QueryBuilderTest.java
- diqube-util
  - src
    - main
      - java
        org
        diqube
        util
        ArrayViewLongList.java
        BigByteBuffer.java
        BouncyCastleUtil.java
        CloseableNoException.java
        ColumnOrValue.java
        DelegateRunnable.java
        DiqubeCollectors.java
        DiqubeIterables.java
        DoubleUtil.java
        HashingBatchCollector.java
        Holder.java
        IoUtils.java
        NullUtil.java
        Pair.java
        PrimitiveUtils.java
        ReadCountInputStream.java
        SafeObjectInputStream.java
        SortedSetUnionIterator.java
        SortedSetUnionStreamSupplier.java
        TopologicalSort.java
        Triple.java
        exception
        WrappingException.java
    - test
      - java
        org
        diqube
        util
        BigByteBufferTest.java

/**
 * diqube: Distributed Query Base.
 *
 * Copyright (C) 2015 Bastian Gloeckle
 *
 * This file is part of diqube.
 *
 * diqube is free software: you can redistribute it and/or modify
 * it under the terms of the GNU Affero General Public License as
 * published by the Free Software Foundation, either version 3 of the
 * License, or (at your option) any later version.
 *
 * This program is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 * GNU Affero General Public License for more details.
 *
 * You should have received a copy of the GNU Affero General Public License
 * along with this program.  If not, see <http://www.gnu.org/licenses/>.
 */
package org.diqube.loader;

import java.io.IOException;
import java.io.RandomAccessFile;
import java.nio.ByteBuffer;
import java.nio.channels.FileChannel.MapMode;
import java.util.Arrays;
import java.util.Collection;
import java.util.LinkedList;
import java.util.List;
import java.util.Spliterator;
import java.util.concurrent.ConcurrentLinkedDeque;
import java.util.function.Consumer;
import java.util.stream.Stream;
import java.util.stream.StreamSupport;

import javax.inject.Inject;

import org.diqube.context.AutoInstatiate;
import org.diqube.data.column.StandardColumnShard;
import org.diqube.data.table.TableFactory;
import org.diqube.data.table.TableShard;
import org.diqube.loader.columnshard.ColumnShardBuilderFactory;
import org.diqube.loader.columnshard.ColumnShardBuilderManager;
import org.diqube.loader.util.ParallelLoadAndTransposeHelper;
import org.diqube.threads.ExecutorManager;
import org.diqube.util.BigByteBuffer;
import org.diqube.util.HashingBatchCollector;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import com.opencsv.CSVParser;

/**
 * Simple {@link Loader} that loads CSV files.
 * 
 * <p>
 * This loader does not support hierarchical data.
 * 
 * <p>
 * This loader will return only one TableShard for a whole CSV input file.
 * 
 * @author Bastian Gloeckle
 */
@AutoInstatiate
public class CsvLoader implements Loader {

  private static final Logger logger = LoggerFactory.getLogger(CsvLoader.class);

  /**
   * The rows of the CSV are parsed and loaded into memory in a batched format. Each batch/buffer contains approx. this
   * amount of entries.
   */
  private static final int COLUMN_BUFFER_SIZE = 1_000;

  @Inject
  private ColumnShardBuilderFactory columnShardBuilderManagerFactory;

  @Inject
  private TableFactory tableFactory;

  @Inject
  private ExecutorManager executorManager;

  @Override
  public Collection<TableShard> load(long firstRowId, String filename, String tableName, LoaderColumnInfo columnInfo)
      throws LoadException {
    ColumnShardBuilderManager columnManager;

    logger.info("Reading data for new table '{}' from '{}'.", new Object[] { tableName, filename });

    try (RandomAccessFile f = new RandomAccessFile(filename, "r")) {
      BigByteBuffer buf = new BigByteBuffer(f.getChannel(), MapMode.READ_ONLY, b -> b.load());

      columnManager = readColumnData(firstRowId, buf, tableName, columnInfo);

      // close file as soon as possible and free the ByteBuffer.
      buf = null;
    } catch (IOException e) {
      throw new LoadException("Could not load " + filename, e);
    }

    return createTableShard(columnManager, tableName);
  }

  @Override
  public Collection<TableShard> load(long firstRowId, BigByteBuffer csvBuffer, String tableName,
      LoaderColumnInfo columnInfo) throws LoadException {
    ColumnShardBuilderManager columnManager = readColumnData(firstRowId, csvBuffer, tableName, columnInfo);
    return createTableShard(columnManager, tableName);
  }

  /**
   * Reads all data from the CSV that is provided in a {@link ByteBuffer} and returns a
   * {@link ColumnShardBuilderManager} that is ready for building the columns.
   * 
   * @param firstRowId
   *          The first rowId to be used.
   * @param buf
   *          The input buffer, containing CSV data.
   * @param tableName
   *          The name of the resulting table.
   * @param columnInfo
   *          Information about each column that this CSV contains.
   * 
   * @return A {@link ColumnShardBuilderManager} that has all the data of all the columns of the CSV already added to
   *         it. It is ready for building the columns using {@link ColumnShardBuilderManager#buildAndFree(String)}.
   * @throws LoadException
   *           If something cannot be loaded.
   */
  private ColumnShardBuilderManager readColumnData(long firstRowId, BigByteBuffer buf, String tableName,
      LoaderColumnInfo columnInfo) throws LoadException {
    String[] header;
    ColumnShardBuilderManager columnBuilderManager =
        columnShardBuilderManagerFactory.createColumnShardBuilderManager(columnInfo, firstRowId);

    // Read CSV Header to learn of the columns that we need to import.
    int numChars = 0;
    while (numChars < buf.size() && buf.get(numChars) != '\n')
      numChars++;
    if (numChars >= buf.size())
      throw new LoadException("Could not identify CSV header.");

    byte[] b = new byte[numChars];
    buf.get(0, b, 0, numChars);
    try {
      header = new CSVParser().parseLine(new String(b));
    } catch (IOException e) {
      throw new LoadException("Could not parse CSV header.", e);
    }

    // TODO #16 do auto-recognition of data types of columns (or make it explicitly "enable/disable" in .control file).

    // TODO #17 validate column names

    logger.info("New table '{}' contains {} columns, reading columnar data.",
        new Object[] { tableName, header.length });

    // Initialize the input stream.
    Stream<String> stream = StreamSupport.stream(new LineSpliterator(buf, numChars + 1, buf.size(), numChars, 1), true);

    ParallelLoadAndTransposeHelper transposer =
        new ParallelLoadAndTransposeHelper(executorManager, columnInfo, columnBuilderManager, header, tableName);

    transposer.transpose(firstRowId, new Consumer<ConcurrentLinkedDeque<String[][]>>() {
      @Override
      public void accept(ConcurrentLinkedDeque<String[][]> rowWiseTarget) {
        // Start parsing CSV lines in parallel, bucketing the results into the rowWiseTarget deque from where they
        // will be fetched by the transposer.
        // Arrays are non-colliding, so using HashingBatchCollector is fine.
        stream.parallel().map(CsvLoader::parseCsvLine)
            .collect(new HashingBatchCollector<String[]>( //
                COLUMN_BUFFER_SIZE, // Try to make buckets of this size
                (len) -> new String[len][], // Factory implementation on how to create a new result object.
                a -> rowWiseTarget.add(a)) // When there is a new result, put it into csvLines.
        );
      }
    });

    return columnBuilderManager;
  }

  /**
   * Takes a fully filled {@link ColumnShardBuilderManager} and creates a {@link TableShard} out of it.
   * 
   * @param columnManager
   *          The {@link ColumnShardBuilderManager} that has the data of all columns to be created already filled in.
   * @param tableName
   *          Name of the result table.
   * @return The created {@link TableShard}.
   */
  private Collection<TableShard> createTableShard(ColumnShardBuilderManager columnManager, String tableName) {
    logger.info("Read data for new table shard for table {}. Compressing and creating final representation...",
        tableName);

    // Build the columns.
    List<StandardColumnShard> columns = new LinkedList<>();
    for (String colName : columnManager.getAllColumnsWithValues()) {
      StandardColumnShard columnShard = columnManager.buildAndFree(colName);

      columns.add(columnShard);
    }

    logger.info("Columns for new table shard of table {} created, creating table shard...", tableName);
    TableShard tableShard = tableFactory.createDefaultTableShard(tableName, columns);

    logger.info("Table shard for table {} created successfully.", tableName);
    return Arrays.asList(tableShard);
  }

  /**
   * Helper method that CSV-parses a single line.
   * 
   * @param line
   *          The input line
   * @return Parsed String values.
   */
  public static String[] parseCsvLine(String line) {
    try {
      return new CSVParser().parseLine(line);
    } catch (Exception e) {
      throw new RuntimeException("Could not parse CSV.", e);
    }
  }

  /**
   * A {@link Spliterator} that splits an input {@link ByteBuffer} by line-ends (\n character).
   * 
   * <p>
   * This Spliterator reports that the data is immutable, so the input ByteBuffer must not be changed while the
   * Spliterator is active.
   *
   * @author Bastian Gloeckle
   */
  private static class LineSpliterator implements Spliterator<String> {

    private BigByteBuffer buf;
    private long startPos;
    private long maxPos;
    private long sumLineLength;
    private long sumLines;

    public LineSpliterator(BigByteBuffer buf, long startPos, long maxPos, long sumLineLength, long sumLines) {
      this.buf = buf;
      this.startPos = startPos;
      this.maxPos = maxPos;
    }

    @Override
    public boolean tryAdvance(Consumer<? super String> action) {
      long pos = startPos;
      while (pos < maxPos && buf.get(pos) != '\n')
        pos++;
      if (pos >= maxPos)
        // ignore last not-full line, as it might have been truncated.
        return false;

      if (pos - startPos > Integer.MAX_VALUE)
        throw new RuntimeException("Cannot load CSV because there's a line that is bigger than 2GB.");

      byte[] b = new byte[(int) (pos - startPos)];
      for (int j = 0; j < b.length; j++)
        b[j] = buf.get(j + startPos);
      action.accept(new String(b));
      startPos = pos + 1;

      sumLineLength += b.length;
      sumLines++;

      return true;
    }

    @Override
    public Spliterator<String> trySplit() {
      long middle = startPos + ((maxPos - startPos) >> 1);
      while (middle < maxPos && buf.get(middle) != '\n')
        middle++;

      if (middle >= maxPos)
        return null;

      LineSpliterator newSplit = new LineSpliterator(buf, middle + 1, maxPos, sumLineLength, sumLines);
      maxPos = middle;

      return newSplit;
    }

    @Override
    public long estimateSize() {
      return (long) ((maxPos - startPos) / ((double) sumLineLength / sumLines));
    }

    @Override
    public int characteristics() {
      return Spliterator.IMMUTABLE | Spliterator.NONNULL;
    }
  }

}