JCublasNDArray.java example

Explorer

nd4j-master
- nd4j-backends
  - nd4j-api-parent
    - nd4j-api
      - src
        main
        java
        org
        nd4j
        linalg
        activations
        Activation.java
        BaseActivationFunction.java
        IActivation.java
        impl
        ActivationCube.java
        ActivationELU.java
        ActivationHardSigmoid.java
        ActivationHardTanH.java
        ActivationIdentity.java
        ActivationLReLU.java
        ActivationRReLU.java
        ActivationRationalTanh.java
        ActivationReLU.java
        ActivationRectifiedTanh.java
        ActivationSigmoid.java
        ActivationSoftPlus.java
        ActivationSoftSign.java
        ActivationSoftmax.java
        ActivationTanH.java
        api
        blas
        Blas.java
        BlasBufferUtil.java
        BlasException.java
        Lapack.java
        Level1.java
        Level2.java
        Level3.java
        impl
        BaseLapack.java
        BaseLevel.java
        BaseLevel1.java
        BaseLevel2.java
        BaseLevel3.java
        params
        GemmParams.java
        GemvParameters.java
        complex
        BaseComplexNDArray.java
        IComplexNDArray.java
        concurrency
        AffinityManager.java
        BasicAffinityManager.java
        environment
        Nd4jEnvironment.java
        instrumentation
        DataBufferLogEntry.java
        InMemoryInstrumentation.java
        Instrumentation.java
        LogEntry.java
        iter
        FirstAxisIterator.java
        FlatIterator.java
        INDArrayIterator.java
        LinearIndexLookup.java
        NdIndexIterator.java
        ndarray
        BaseNDArray.java
        BaseNDArrayProxy.java
        BaseShapeInfoProvider.java
        INDArray.java
        NdArrayJSONReader.java
        NdArrayJSONWriter.java
        ShapeInfoProvider.java
        ops
        Accumulation.java
        BaseAccumulation.java
        BaseBroadcastOp.java
        BaseIndexAccumulation.java
        BaseLossFunction.java
        BaseOp.java
        BaseScalarOp.java
        BaseTransformOp.java
        BroadcastOp.java
        GridOp.java
        IndexAccumulation.java
        LossFunction.java
        MetaOp.java
        Op.java
        RandomOp.java
        ScalarOp.java
        TadCollapseAccumulation.java
        TransformOp.java
        aggregates
        Aggregate.java
        BaseAggregate.java
        Batch.java
        impl
        AggregateAxpy.java
        AggregateCBOW.java
        AggregateDot.java
        AggregateGEMM.java
        AggregateSkipGram.java
        HierarchicSoftmax.java
        exception
        BlasOpErrorMessage.java
        IllegalOpException.java
        executioner
        DefaultOpExecutioner.java
        GridExecutioner.java
        OpExecutioner.java
        OpExecutionerUtil.java
        factory
        DefaultOpFactory.java
        OpFactory.java
        grid
        GridDescriptor.java
        GridPointers.java
        OpDescriptor.java
        impl
        accum
        ASum.java
        Bias.java
        Dot.java
        EqualsWithEps.java
        MatchCondition.java
        Max.java
        Mean.java
        Min.java
        Norm1.java
        Norm2.java
        NormMax.java
        Prod.java
        StandardDeviation.java
        Sum.java
        Variance.java
        distances
        CosineSimilarity.java
        EuclideanDistance.java
        ManhattanDistance.java
        broadcast
        BroadcastAddOp.java
        BroadcastCopyOp.java
        BroadcastDimensions.java
        BroadcastDivOp.java
        BroadcastMulOp.java
        BroadcastRDivOp.java
        BroadcastRSubOp.java
        BroadcastSubOp.java
        grid
        BaseGridOp.java
        FreeGridOp.java
        indexaccum
        FirstIndex.java
        IAMax.java
        IAMin.java
        IMax.java
        IMin.java
        LastIndex.java
        meta
        BaseMetaOp.java
        InvertedPredicateMetaOp.java
        PostulateMetaOp.java
        PredicateMetaOp.java
        ReduceMetaOp.java
        scalar
        ScalarAdd.java
        ScalarDivision.java
        ScalarFMod.java
        ScalarMax.java
        ScalarMin.java
        ScalarMultiplication.java
        ScalarRemainder.java
        ScalarReverseDivision.java
        ScalarReverseSubtraction.java
        ScalarSet.java
        ScalarSubtraction.java
        comparison
        ScalarEquals.java
        ScalarGreaterThan.java
        ScalarGreaterThanOrEqual.java
        ScalarLessThan.java
        ScalarLessThanOrEqual.java
        ScalarNotEquals.java
        ScalarSetValue.java
        transforms
        ACos.java
        ASin.java
        ATan.java
        Abs.java
        And.java
        Ceil.java
        Cos.java
        Cube.java
        CubeDerivative.java
        ELU.java
        ELUDerivative.java
        Exp.java
        Floor.java
        HardSigmoid.java
        HardSigmoidDerivative.java
        HardTanh.java
        HardTanhDerivative.java
        Histogram.java
        Identity.java
        IsMax.java
        LeakyReLU.java
        LeakyReLUDerivative.java
        LegacyDropOut.java
        LegacyDropOutInverted.java
        Log.java
        LogSoftMax.java
        LogX.java
        MaxOut.java
        Negative.java
        Not.java
        OneMinus.java
        Ones.java
        Or.java
        Pow.java
        RationalTanh.java
        RationalTanhDerivative.java
        RectifedLinear.java
        RectifiedTanh.java
        RectifiedTanhDerivative.java
        ReplaceNans.java
        Round.java
        Set.java
        SetRange.java
        Sigmoid.java
        SigmoidDerivative.java
        Sign.java
        Sin.java
        SoftMax.java
        SoftMaxDerivative.java
        SoftPlus.java
        SoftSign.java
        SoftSignDerivative.java
        Sqrt.java
        Stabilize.java
        Step.java
        Tanh.java
        TanhDerivative.java
        TimesOneMinus.java
        VectorFFT.java
        VectorIFFT.java
        Xor.java
        arithmetic
        AddOp.java
        Axpy.java
        CopyOp.java
        DivOp.java
        FModOp.java
        MulOp.java
        RDivOp.java
        RSubOp.java
        RemainderOp.java
        SubOp.java
        comparison
        CompareAndReplace.java
        CompareAndSet.java
        Eps.java
        EqualTo.java
        GreaterThan.java
        GreaterThanOrEqual.java
        LessThan.java
        LessThanOrEqual.java
        Max.java
        Min.java
        NotEqualTo.java
        convolution
        Col2Im.java
        Im2col.java
        random
        BaseRandomOp.java
        impl
        BernoulliDistribution.java
        BinomialDistribution.java
        BinomialDistributionEx.java
        Choice.java
        DropOut.java
        DropOutInverted.java
        GaussianDistribution.java
        Linspace.java
        ProbablisticMerge.java
        UniformDistribution.java
        rng
        DefaultRandom.java
        Random.java
        distribution
        BaseDistribution.java
        Distribution.java
        factory
        DefaultDistributionFactory.java
        DistributionFactory.java
        impl
        BinomialDistribution.java
        NormalDistribution.java
        SaddlePointExpansion.java
        UniformDistribution.java
        shape
        Shape.java
        ShapeDescriptor.java
        StridePermutation.java
        loop
        coordinatefunction
        CoordinateFunction.java
        CopyCoordinateFunction.java
        four
        LoopFunction4.java
        RawArrayIterationInformation4.java
        one
        LoopFunction1.java
        RawArrayIterationInformation1.java
        three
        LoopFunction3.java
        RawArrayIterationInformation3.java
        two
        CopyLoopFunction.java
        LoopFunction2.java
        RawArrayIterationInformation2.java
        cache
        ArrayDescriptor.java
        BasicConstantHandler.java
        ConstantHandler.java
        TADManager.java
        TadDescriptor.java
        checkutil
        CheckUtil.java
        NDArrayCreationUtil.java
        compression
        AbstractStorage.java
        BasicNDArrayCompressor.java
        CompressedDataBuffer.java
        CompressionAlgorithm.java
        CompressionDescriptor.java
        CompressionType.java
        NDArrayCompressor.java
        convolution
        BaseConvolution.java
        Convolution.java
        ConvolutionInstance.java
        DefaultConvolutionInstance.java
        OldConvolution.java
        dataset
        BalanceMinibatches.java
        DataSet.java
        ExistingMiniBatchDataSetIterator.java
        MiniBatchFileDataSetIterator.java
        MultiDataSet.java
        SplitTestAndTrain.java
        ViewIterator.java
        api
        DataSet.java
        DataSetPreProcessor.java
        DataSetUtil.java
        MultiDataSet.java
        MultiDataSetPreProcessor.java
        iterator
        BaseDatasetIterator.java
        CachingDataSetIterator.java
        DataSetIterator.java
        DataSetIteratorFactory.java
        KFoldIterator.java
        MultiDataSetIterator.java
        MultiDataSetIteratorFactory.java
        MultipleEpochsIterator.java
        ParallelDataSetIterator.java
        ParallelMultiDataSetIterator.java
        SamplingDataSetIterator.java
        StandardScaler.java
        TestDataSetIterator.java
        TestMultiDataSetIterator.java
        cache
        DataSetCache.java
        InFileAndMemoryDataSetCache.java
        InFileDataSetCache.java
        InMemoryDataSetCache.java
        enums
        InequalityHandling.java
        fetcher
        BaseDataFetcher.java
        DataSetFetcher.java
        preprocessor
        AbstractDataSetNormalizer.java
        AbstractMultiDataSetNormalizer.java
        AbstractNormalizer.java
        DataNormalization.java
        ImageFlatteningDataSetPreProcessor.java
        ImagePreProcessingScaler.java
        MinMaxStrategy.java
        MultiDataNormalization.java
        MultiNormalizerHybrid.java
        MultiNormalizerMinMaxScaler.java
        MultiNormalizerStandardize.java
        Normalizer.java
        NormalizerMinMaxScaler.java
        NormalizerStandardize.java
        NormalizerStrategy.java
        StandardizeStrategy.java
        VGG16ImagePreProcessor.java
        serializer
        CustomSerializerStrategy.java
        MinMaxSerializerStrategy.java
        MultiHybridSerializerStrategy.java
        MultiMinMaxSerializerStrategy.java
        MultiStandardizeSerializerStrategy.java
        NormalizerSerializer.java
        NormalizerSerializerStrategy.java
        NormalizerType.java
        StandardizeSerializerStrategy.java
        stats
        DistributionStats.java
        MinMaxStats.java
        NormalizerStats.java
        dimensionalityreduction
        PCA.java
        eigen
        Eigen.java
        exception
        ND4JException.java
        ND4JIllegalStateException.java
        executors
        ExecutorServiceProvider.java
        factory
        BaseBlasWrapper.java
        BaseNDArrayFactory.java
        BlasWrapper.java
        DataTypeValidation.java
        NDArrayFactory.java
        Nd4j.java
        RandomFactory.java
        fft
        BaseFFTInstance.java
        DefaultFFTInstance.java
        FFT.java
        FFTInstance.java
        heartbeat
        Heartbeat.java
        reports
        Environment.java
        Event.java
        Task.java
        utils
        EnvironmentUtils.java
        TaskUtils.java
        indexing
        BooleanIndexing.java
        INDArrayIndex.java
        IndexInfo.java
        Indices.java
        IntervalIndex.java
        NDArrayIndex.java
        NDArrayIndexAll.java
        NDArrayIndexEmpty.java
        NewAxis.java
        PointIndex.java
        ShapeOffsetResolution.java
        SpecifiedIndex.java
        conditions
        AbsValueGreaterThan.java
        AbsValueLessThan.java
        And.java
        BaseCondition.java
        Condition.java
        ConditionBuilder.java
        ConditionEquals.java
        Conditions.java
        EpsilonEquals.java
        EpsilonNotEquals.java
        EqualsCondition.java
        GreaterThan.java
        GreaterThanOrEqual.java
        IsInfinite.java
        IsNaN.java
        LessThan.java
        LessThanOrEqual.java
        Not.java
        NotEqualsCondition.java
        Or.java
        functions
        Identity.java
        StableNumber.java
        Value.java
        Zero.java
        inverse
        InvertMatrix.java
        learning
        AdaDeltaUpdater.java
        AdaGradUpdater.java
        AdaMaxUpdater.java
        AdamUpdater.java
        GradientUpdater.java
        NesterovsUpdater.java
        NoOpUpdater.java
        RmsPropUpdater.java
        SgdUpdater.java
        config
        AdaDelta.java
        AdaGrad.java
        AdaMax.java
        Adam.java
        IUpdater.java
        Nesterovs.java
        NoOp.java
        RmsProp.java
        Sgd.java
        legacy
        AdaGrad.java
        lossfunctions
        ILossFunction.java
        LossCalculation.java
        LossFunctions.java
        LossUtil.java
        impl
        LossBinaryXENT.java
        LossCosineProximity.java
        LossHinge.java
        LossKLD.java
        LossL1.java
        LossL2.java
        LossMAE.java
        LossMAPE.java
        LossMCXENT.java
        LossMSE.java
        LossMSLE.java
        LossNegativeLogLikelihood.java
        LossPoisson.java
        LossSquaredHinge.java
        serde
        RowVectorDeserializer.java
        RowVectorSerializer.java
        memory
        BasicMemoryManager.java
        MemoryManager.java
        abstracts
        DummyWorkspace.java
        Nd4jWorkspace.java
        provider
        BasicWorkspaceManager.java
        stash
        BasicStash.java
        BasicStashManager.java
        Stash.java
        StashManager.java
        ops
        transforms
        Transforms.java
        profiler
        OpProfiler.java
        data
        StackAggregator.java
        StringAggregator.java
        StringCounter.java
        primitives
        ComparableAtomicLong.java
        StackComparator.java
        StackDescriptor.java
        StackNode.java
        StackTree.java
        TimeSet.java
        string
        NDArrayStrings.java
        util
        ComplexNDArrayUtil.java
        ComplexUtil.java
        DeviceLocal.java
        DeviceLocalNDArray.java
        FeatureUtil.java
        HashUtil.java
        LinAlgExceptions.java
        NDArrayMath.java
        NDArrayUtil.java
    - nd4j-native-api
      - src
        main
        java
        org
        nd4j
        compression
        impl
        AbstractCompressor.java
        Float16.java
        Float8.java
        Gzip.java
        Int16.java
        Int8.java
        NoOp.java
        Uint8.java
        nativeblas
        DefaultPointerConverter.java
        NativeLapack.java
        NativeOps.java
        NativeOpsHolder.java
        Nd4jBlas.java
        PointerConverter.java
        rng
        NativeRandom.java
        deallocator
        GarbageStateReference.java
        NativePack.java
        NativeRandomDeallocator.java
        storage
        CompressedRamStorage.java
  - nd4j-backend-impls
    - nd4j-cuda
      - src
        main
        java
        org
        nd4j
        jita
        allocator
        Allocator.java
        concurrency
        AtomicState.java
        DeviceAllocationsTracker.java
        Lock.java
        RRWLock.java
        context
        ContextPack.java
        ContextPool.java
        ExternalContext.java
        impl
        BasicContextPool.java
        LimitedContextPool.java
        PackedContextPool.java
        enums
        AccessState.java
        Aggressiveness.java
        AllocationStatus.java
        CudaConstants.java
        SyncState.java
        garbage
        GarbageBufferReference.java
        GarbageResourceReference.java
        impl
        AllocationPoint.java
        AllocationShape.java
        AtomicAllocator.java
        NestedPoint.java
        pointers
        CudaPointer.java
        PointersPair.java
        cuda
        CUcontext.java
        cublasHandle_t.java
        cudaEvent_t.java
        cudaStream_t.java
        cusolverDnHandle_t.java
        tad
        BasicTADManager.java
        DeviceTADManager.java
        time
        RateTimer.java
        Ring.java
        TimeProvider.java
        impl
        BinaryTimer.java
        SimpleTimer.java
        providers
        MillisecondsProvider.java
        NanosecondsProvider.java
        OperativeProvider.java
        rings
        LockedRing.java
        utils
        AllocationUtils.java
        balance
        Balancer.java
        concurrency
        CudaAffinityManager.java
        EventsProvider.java
        conf
        Configuration.java
        CudaEnvironment.java
        DeviceInformation.java
        constant
        ConstantProtector.java
        CudaConstantHandler.java
        ProtectedCudaConstantHandler.java
        ProtectedCudaShapeInfoProvider.java
        flow
        FlowController.java
        impl
        AsynchronousFlowController.java
        GridFlowController.java
        SynchronousFlowController.java
        handler
        MemoryHandler.java
        impl
        CudaZeroHandler.java
        memory
        CudaMemoryManager.java
        MemoryProvider.java
        impl
        CudaCachingZeroProvider.java
        CudaDirectProvider.java
        CudaFullCachingProvider.java
        workspace
        CudaWorkspace.java
        CudaWorkspaceManager.java
        linalg
        jcublas
        CachedShapeInfoProvider.java
        CublasPointer.java
        JCublasBackend.java
        JCublasNDArray.java
        JCublasNDArrayFactory.java
        JCublasWrapper.java
        blas
        CudaBlas.java
        JcublasLapack.java
        JcublasLevel1.java
        JcublasLevel2.java
        JcublasLevel3.java
        buffer
        AddressRetriever.java
        BaseCudaDataBuffer.java
        CudaDoubleDataBuffer.java
        CudaFloatDataBuffer.java
        CudaHalfDataBuffer.java
        CudaIntDataBuffer.java
        DevicePointerInfo.java
        JCudaBuffer.java
        factory
        CudaDataBufferFactory.java
        complex
        ComplexDouble.java
        ComplexFloat.java
        JCublasComplexNDArray.java
        context
        ContextHolder.java
        CudaContext.java
        ops
        executioner
        CudaExecutioner.java
        CudaGridExecutioner.java
        aggregates
        AggregateDescriptor.java
        rng
        CudaNativeRandom.java
        util
        CudaArgs.java
        FFTUtils.java
        OpUtil.java
        nativeblas
        Nd4jCuda.java
        Nd4jCudaPresets.java
        test
        java
        jcuda
        jcublas
        ops
        ArrayUtilsTests.java
        AveragingTests.java
        CublasTests.java
        CudaAccumTests.java
        CudaBlasTests.java
        CudaBroadcastTests.java
        CudaExecutionerTest.java
        CudaIndexReduceTests.java
        CudaPairwiseTrainformsTests.java
        CudaReduce3Tests.java
        CudaScalarsTests.java
        CudaTransformsTests.java
        DevicesTests.java
        DoublesTests.java
        ElementWiseStrideTests.java
        EndlessTests.java
        HalfOpsTests.java
        LapackTest.java
        ShufflesTests.java
        SporadicTests.java
        org
        nd4j
        jita
        allocator
        concurrency
        AtomicStateTest.java
        DeviceAllocationsTrackerTest.java
        impl
        AtomicAllocatorTest.java
        tad
        BasicTADManagerTest.java
        time
        impl
        BinaryTimerTest.java
        SimpleTimerTest.java
        utils
        AllocationUtilsTest.java
        concurrency
        CudaAffinityManagerTest.java
        constant
        ProtectedCudaConstantHandlerTest.java
        ProtectedCudaShapeInfoProviderTest.java
        flow
        impl
        AsynchronousFlowControllerTest.java
        memory
        impl
        CudaDirectProviderTest.java
        CudaFullCachingProviderTest.java
        DelayedMemoryTest.java
        WeirdSparkTests.java
        linalg
        jcublas
        buffer
        CudaFloatDataBufferTest.java
        CudaHalfDataBufferTest.java
        CudaHalfsTest.java
        ops
        executioner
        GridExecutionerTest.java
        GridRunningTests.java
        MetaOpTests.java
    - nd4j-native
      - src
        main
        java
        org
        nd4j
        linalg
        cpu
        nativecpu
        BlasWrapper.java
        CpuAffinityManager.java
        CpuBackend.java
        CpuMemoryManager.java
        CpuNDArrayFactory.java
        CpuTADManager.java
        DirectShapeInfoProvider.java
        NDArray.java
        blas
        CpuBlas.java
        CpuLapack.java
        CpuLevel1.java
        CpuLevel2.java
        CpuLevel3.java
        cache
        ConstantBuffersCache.java
        complex
        ComplexDouble.java
        ComplexFloat.java
        ComplexNDArray.java
        ops
        NativeOpExecutioner.java
        rng
        CpuNativeRandom.java
        workspace
        CpuWorkspace.java
        CpuWorkspaceManager.java
        nativeblas
        Nd4jCpu.java
        Nd4jCpuPresets.java
        test
        java
        org
        nd4j
        linalg
        cpu
        nativecpu
        ops
        EndlessTests.java
        NativeOpExecutionerTest.java
        ShufflesTest.java
        ZipTests.java
  - nd4j-tests
    - src
      - test
        java
        org
        nd4j
        linalg
        AveragingTests.java
        BaseComplexNDArrayTests.java
        BaseNd4jTest.java
        ComplexNDArrayTestsC.java
        ComplexNDArrayTestsFortran.java
        InputValidationTests.java
        LoneTest.java
        MmulBug.java
        NDArrayTestsFortran.java
        Nd4jTestSuite.java
        Nd4jTestsC.java
        Nd4jTestsComparisonC.java
        Nd4jTestsComparisonFortran.java
        ShufflesTests.java
        TestPCA.java
        activations
        TestActivationJson.java
        aggregates
        AggregatesTests.java
        HierarchicSoftmaxTests.java
        api
        TestNDArrayCreation.java
        TestNDArrayCreationUtil.java
        blas
        LapackTest.java
        Level1Test.java
        Level2Test.java
        Level3Test.java
        params
        ParamsTestsF.java
        buffer
        DataTypeValidationTests.java
        DoubleDataBufferTest.java
        FloatDataBufferTest.java
        IntDataBufferTests.java
        indexing
        IndexingIterationTests.java
        IndexingTests.java
        IndexingTestsC.java
        ShapeResolutionTestsC.java
        resolve
        NDArrayIndexResolveTests.java
        shape
        IndexShapeTests.java
        IndexShapeTests2d.java
        iterator
        NDIndexIteratorTest.java
        ndarray
        TestJSON.java
        TestJSONC.java
        TestNdArrReadWriteTxt.java
        TestNdArrReadWriteTxtC.java
        TestNdArrReadWriteTxtOpt.java
        TestNdArrReadWriteTxtOptC.java
        TestSerialization.java
        TestSerializationDoubleToFloat.java
        TestSerializationFloatToDouble.java
        rng
        RngTests.java
        string
        TestFormatting.java
        tad
        TestTensorAlongDimension.java
        complex
        ComplexNumberTests.java
        compression
        CompressionMagicTests.java
        CompressionSerDeTests.java
        CompressionTests.java
        convolution
        ConvolutionTests.java
        ConvolutionTestsC.java
        crash
        CrashTest.java
        SpecialTests.java
        dataset
        BalanceMinibatchesTest.java
        BaseDatasetIterator.java
        CachingDataSetIteratorTest.java
        DataSetTest.java
        ImagePreProcessortTest.java
        IrisDataFetcher.java
        IrisDataSetIterator.java
        IrisUtils.java
        KFoldIteratorTest.java
        MinMaxStatsTest.java
        MiniBatchFileDataSetIteratorTest.java
        MultiDataSetTest.java
        MultiNormalizerHybridTest.java
        MultiNormalizerMinMaxScalerTest.java
        MultiNormalizerStandardizeTest.java
        NormalizerMinMaxScalerTest.java
        NormalizerSerializerTest.java
        NormalizerStandardizeLabelsTest.java
        NormalizerStandardizeTest.java
        NormalizerTests.java
        PreProcessor3D4DTest.java
        StandardScalerTest.java
        api
        preprocessor
        MinMaxStrategyTest.java
        factory
        Nd4jTest.java
        fft
        FFTTests.java
        IFFTTests.java
        indexing
        BooleanIndexingTest.java
        TransformsTest.java
        inverse
        TestInvertMatrices.java
        lapack
        LapackTestsC.java
        LapackTestsF.java
        learning
        UpdaterTest.java
        lossfunctions
        LossFunctionGradientChecks.java
        LossFunctionJson.java
        ops
        DerivativeTests.java
        OpExecutionerTests.java
        OpExecutionerTestsC.java
        RationalTanhTest.java
        broadcast
        row
        RowVectorOpsC.java
        copy
        CopyTest.java
        profiling
        InfNanTests.java
        OperationProfilerTests.java
        StackAggregatorTests.java
        rng
        RandomPerformanceTests.java
        RandomTests.java
        serde
        BasicSerDeTests.java
        shape
        NDArrayMathTests.java
        ShapeBufferTests.java
        ShapeTests.java
        ShapeTestsC.java
        StaticShapeTests.java
        TADTests.java
        concat
        ConcatTests.java
        ConcatTestsC.java
        padding
        PaddingTests.java
        PaddingTestsC.java
        indexing
        IndexingTests.java
        IndexingTestsC.java
        ones
        LeadingAndTrailingOnes.java
        LeadingAndTrailingOnesC.java
        reshape
        ReshapeTests.java
        slicing
        SlicingTests.java
        SlicingTestsC.java
        storage
        CompressedRamStorageTests.java
        util
        ShapeTest.java
        ShapeTestC.java
        TestArrayUtils.java
        TestCollections.java
        TestOpExecutionerUtil.java
        workspace
        BasicWorkspaceTests.java
        EndlessWorkspaceTests.java
        SpecialWorkspaceTests.java
        WorkspaceProviderTests.java
        serde
        base64
        Nd4jBase64Test.java
        jackson
        NdArraySerializerTest.java
        VectorSerializeTest.java
- nd4j-buffer
  - src
    - main
      - java
        org
        nd4j
        linalg
        api
        buffer
        BaseDataBuffer.java
        DataBuffer.java
        DoubleBuffer.java
        FloatBuffer.java
        IntBuffer.java
        allocation
        MemoryStrategy.java
        factory
        AllocatorFactory.java
        AllocatorInstanceHolder.java
        DataBufferFactory.java
        DefaultDataBufferFactory.java
        unsafe
        UnsafeHolder.java
        util
        AllocUtil.java
        DataTypeUtil.java
        LibUtils.java
        complex
        BaseComplexDouble.java
        BaseComplexFloat.java
        IComplexDouble.java
        IComplexFloat.java
        IComplexNumber.java
        memory
        MemoryWorkspace.java
        MemoryWorkspaceManager.java
        conf
        WorkspaceConfiguration.java
        enums
        AllocationPolicy.java
        LearningPolicy.java
        MemoryKind.java
        MirroringPolicy.java
        ResetPolicy.java
        SpillPolicy.java
        pointers
        ImmortalFloatPointer.java
        PagedPointer.java
        PointersPair.java
- nd4j-bytebuddy
  - src
    - main
      - java
        org
        nd4j
        bytebuddy
        arithmetic
        ByteBuddyIntArithmetic.java
        IntegerArithmeticByteCodeAppender.java
        relative
        RelativeByteBuddyIntArithmetic.java
        RelativeIntegerArithmeticByteCodeAppender.java
        op
        RelativeOperationByteCodeAppender.java
        RelativeOperationImplementation.java
        stackmanipulation
        OpStackManipulation.java
        arrays
        assign
        AssignArrayValueAppender.java
        AssignImplmentation.java
        AssignValue.java
        relative
        novalue
        RelativeAssignNoValueArrayValueAppender.java
        RelativeAssignNoValueImplementation.java
        noindex
        ArrayStore.java
        ArrayStoreImplementation.java
        op
        AssignOpAppender.java
        AssignOpImplementation.java
        withvalue
        RelativeArrayAssignWithValueImplementation.java
        RelativeArrayAssignWithValueValueAppender.java
        create
        CreateArrayByteCodeAppender.java
        IntArrayCreation.java
        noreturn
        CreateArrayByteCodeAppender.java
        IntArrayCreation.java
        relative
        RelativeCreateArrayByteCodeAppender.java
        RelativeIntArrayCreation.java
        simple
        SimpleCreateArrayByteCodeAppender.java
        SimpleCreateArrayImplementation.java
        stackmanipulation
        CreateIntArrayStackManipulation.java
        retrieve
        relative
        RelativeRetrieveArrayImplementation.java
        RelativeRetrieveArrayValueAppender.java
        novalue
        noindex
        ArrayRetrieve.java
        ArrayStoreImplementation.java
        stackmanipulation
        ArrayStackManipulation.java
        branching
        stackmanipulation
        IfeqNotEquals.java
        constant
        ConstantIntImplementation.java
        IntConstantByteCodeAppender.java
        createint
        StoreInt.java
        StoreIntImplementation.java
        dup
        Duplicate.java
        Duplicate2.java
        Duplicate2Implementation.java
        DuplicateImplementation.java
        frame
        VisitFrameFullInt.java
        VisitFrameSameInt.java
        gotoop
        GoToOp.java
        labelvisit
        LabelVisitorStackManipulation.java
        load
        LoadDeclaredInternalInteger.java
        LoadIntegerImplementation.java
        loadref
        LoadDeclaredInternalReference.java
        LoadReferenceImplementation.java
        relative
        RelativeLoadDeclaredInternalReference.java
        RelativeLoadDeclaredReferenceImplementation.java
        method
        args
        LoadArgsAppender.java
        LoadArgsImplementation.java
        integer
        LoadIntParam.java
        LoadIntParamImplementation.java
        relative
        RelativeLoadIntParam.java
        RelativeLoadIntParamImplementation.java
        reference
        LoadReferenceParam.java
        LoadReferenceParamImplementation.java
        returnref
        ReturnAppender.java
        ReturnAppenderImplementation.java
        shape
        IndexMapper.java
        OffsetMapper.java
        ShapeMapper.java
        SubMapper.java
        stackmanipulation
        StackManipulationByteCodeAppender.java
        StackManipulationImplementation.java
        storeint
        StoreInt.java
        StoreIntImplementation.java
        stackmanipulation
        StoreIntStackManipulation.java
        storeref
        StoreImplementation.java
        StoreRef.java
        stackmanipulation
        StoreRefStackManipulation.java
        util
        OpCodeUtil.java
    - test
      - java
        org
        nd4j
        bytebuddy
        aggregate
        TestAggregateByteCodeAppender.java
        arithmetic
        ByteBuddyArithmeticTest.java
        arrays
        IntArrayCreationTest.java
        assign
        AssignImplementationTest.java
        retrieve
        relative
        RelativeRetrieveTest.java
        createint
        CreateIntTests.java
        method
        LoadIntParamTest.java
        shape
        ShapeMapperTest.java
- nd4j-common
  - src
    - main
      - java
        org
        nd4j
        linalg
        collection
        CompactHeapStringList.java
        io
        AbstractFileResolvingResource.java
        AbstractResource.java
        Assert.java
        ClassPathResource.java
        ClassUtils.java
        CollectionUtils.java
        InputStreamSource.java
        ObjectUtils.java
        ReflectionUtils.java
        Resource.java
        ResourceUtils.java
        StringUtils.java
        VfsResource.java
        VfsUtils.java
        util
        AbstractNumber.java
        ArrayUtil.java
        Bernoulli.java
        BigDecimalMath.java
        Factorial.java
        InputStreamUtil.java
        JarResource.java
        LinkedMultiValueMap.java
        MathUtils.java
        MultiValueMap.java
        NioUtil.java
        Paths.java
        Rational.java
        ReflectionUtil.java
        SerializationUtils.java
        SynchronizedTable.java
- nd4j-context
  - src
    - main
      - java
        org
        nd4j
        context
        Nd4jContext.java
        linalg
        factory
        Nd4jBackend.java
- nd4j-instrumentation
  - src
    - main
      - java
        org
        nd4j
        instrumentation
        server
        InstrumentationApplication.java
        InstrumentationResource.java
        Nd4jInstrumentationConfiguration.java
- nd4j-jdbc
  - nd4j-jdbc-api
    - src
      - main
        java
        org
        nd4j
        jdbc
        driverfinder
        DriverFinder.java
        loader
        api
        JDBCNDArrayIO.java
        impl
        BaseLoader.java
  - nd4j-jdbc-mysql
    - src
      - main
        java
        org
        nd4j
        jdbc
        mysql
        MysqlLoader.java
      - test
        java
        org
        nd4j
        jdbc
        mysql
        MysqlLoaderTest.java
- nd4j-parameter-server-parent
  - nd4j-parameter-server
    - src
      - main
        java
        org
        nd4j
        parameterserver
        ParameterServerListener.java
        ParameterServerSubscriber.java
        PublishingListener.java
        updater
        BaseParameterUpdater.java
        ParameterServerUpdater.java
        SoftSyncParameterUpdater.java
        SynchronousParameterUpdater.java
        TimeDelayedParameterUpdater.java
        storage
        BaseUpdateStorage.java
        InMemoryUpdateStorage.java
        NoUpdateStorage.java
        UpdateStorage.java
        util
        CheckSocket.java
      - test
        java
        org
        nd4j
        parameterserver
        updater
        ParameterServerUpdaterTests.java
        storage
        UpdaterStorageTests.java
  - nd4j-parameter-server-client
    - src
      - main
        java
        org
        nd4j
        parameterserver
        client
        ParameterServerClient.java
      - test
        java
        org
        nd4j
        parameterserver
        background
        BackgroundDaemonStarter.java
        RemoteParameterServerClientTests.java
        client
        ParameterServerClientPartialTest.java
        ParameterServerClientTest.java
  - nd4j-parameter-server-node
    - src
      - main
        java
        org
        nd4j
        parameterserver
        distributed
        VoidParameterServer.java
        conf
        VoidConfiguration.java
        enums
        ExecutionMode.java
        FaultToleranceStrategy.java
        NodeRole.java
        logic
        ClientRouter.java
        RetransmissionHandler.java
        SequenceProvider.java
        Storage.java
        completion
        Clipboard.java
        FrameCompletionHandler.java
        RequestDescriptor.java
        retransmission
        DefaultRetransmissionHandler.java
        routing
        BaseRouter.java
        InterleavedRouter.java
        RandomRouter.java
        StaticRouter.java
        sequence
        BasicSequenceProvider.java
        storage
        BaseStorage.java
        WordVectorStorage.java
        messages
        BaseVoidMessage.java
        Chain.java
        DistributedMessage.java
        Frame.java
        MeaningfulMessage.java
        RequestMessage.java
        TrainingMessage.java
        VoidAggregation.java
        VoidMessage.java
        aggregations
        BaseAggregation.java
        DotAggregation.java
        InitializationAggregation.java
        VectorAggregation.java
        complete
        BaseCompleteMessage.java
        FrameCompleteMessage.java
        InitializationCompleteMessage.java
        IntroductionCompleteMessage.java
        VectorCompleteMessage.java
        intercom
        DistributedAssignMessage.java
        DistributedCbowDotMessage.java
        DistributedInitializationMessage.java
        DistributedIntroductionMessage.java
        DistributedSgDotMessage.java
        DistributedShutdownMessage.java
        DistributedSkipGramMessage.java
        DistributedSolidMessage.java
        DistributedVectorMessage.java
        requests
        AssignRequestMessage.java
        CbowRequestMessage.java
        InitializationRequestMessage.java
        IntroductionRequestMessage.java
        ShutdownRequestMessage.java
        SkipGramRequestMessage.java
        VectorRequestMessage.java
        training
        BaseTrainer.java
        TrainerProvider.java
        TrainingDriver.java
        chains
        CbowChain.java
        SkipGramChain.java
        impl
        CbowTrainer.java
        SkipGramTrainer.java
        transport
        BaseTransport.java
        LocalTransport.java
        MulticastTransport.java
        RoutedTransport.java
        Transport.java
        node
        ParameterServerNode.java
      - test
        java
        org
        nd4j
        parameterserver
        distributed
        VoidParameterServerStressTest.java
        VoidParameterServerTest.java
        logic
        ClipboardTest.java
        FrameCompletionHandlerTest.java
        routing
        InterleavedRouterTest.java
        messages
        FrameTest.java
        VoidMessageTest.java
        aggregations
        VoidAggregationTest.java
        transport
        RoutedTransportTest.java
        node
        ParameterServerNodeTest.java
  - nd4j-parameter-server-rocksdb-storage
    - src
      - main
        java
        org
        nd4j
        parameterserver
        updater
        storage
        RocksDbStorage.java
      - test
        java
        org
        nd4j
        parameterserver
        updater
        storage
        UpdaterStorageTests.java
  - nd4j-parameter-server-status
    - src
      - main
        java
        org
        nd4j
        parameterserver
        status
        play
        BaseStatusStorage.java
        InMemoryStatusStorage.java
        MapDbStatusStorage.java
        StatusServer.java
        StatusStorage.java
      - test
        java
        org
        nd4j
        parameterserver
        status
        play
        StatusServerTests.java
        StorageTests.java
  - nd4j-parameterserver-model
    - src
      - main
        java
        org
        nd4j
        parameterserver
        model
        MasterConnectionInfo.java
        MasterStatus.java
        ServerState.java
        ServerType.java
        ServerTypeJson.java
        SlaveConnectionInfo.java
        SlaveStatus.java
        SubscriberState.java
- nd4j-perf
  - src
    - main
      - java
        org
        nd4j
        linalg
        benchmark
        accum
        SumBenchmarkPerformer.java
        SumOpRunner.java
        addirowvector
        AddiRowVectorBenchmarkPerformer.java
        AddiRowVectorOpRunner.java
        api
        BaseBenchmarkPerformer.java
        BenchMarkPerformer.java
        OpRunner.java
        app
        BenchmarkRunnerApp.java
        convolution
        ConvolutionBenchmarkPerformer.java
        ConvolutionOpRunner.java
        dimensionwise
        DimensionWiseBenchmarkPerformer.java
        DimensionWiseOpRunner.java
        elementwise
        AddiRowVectorBenchmarkPerformer.java
        AddiRowVectorOpRunner.java
        fft
        FFTBenchmarkPerformer.java
        FFTOpRunner.java
        gemm
        GemmBenchmarkPerformer.java
        GemmOpRunner.java
        linearview
        LinearViewBenchmarkPerformer.java
        LinearViewOpRunner.java
        getput
        GetPutScalarLinearViewBenchmarkPerformer.java
        GetPutScalarLinearViewOpRunner.java
        scalar
        ScalarBenchmarkPerformer.java
        ScalarOpRunner.java
        transform
        TransformBenchmarkPerformer.java
        TransformOpRunner.java
        nocopy
        TransformBenchmarkPerformer.java
        TransformOpRunner.java
- nd4j-serde
  - nd4j-aeron
    - src
      - main
        java
        org
        nd4j
        aeron
        ipc
        AeronConnectionInformation.java
        AeronNDArrayPublisher.java
        AeronNDArraySerde.java
        AeronNDArraySubscriber.java
        AeronUtil.java
        LowLatencyMediaDriver.java
        NDArrayCallback.java
        NDArrayFragmentHandler.java
        NDArrayHolder.java
        NDArrayMessage.java
        chunk
        ChunkAccumulator.java
        InMemoryChunkAccumulator.java
        NDArrayMessageChunk.java
        response
        AeronNDArrayResponder.java
        HostPortPublisher.java
        NDArrayResponseFragmentHandler.java
        ndarrayholder
        InMemoryNDArrayHolder.java
        util
        AeronStat.java
        BufferUtil.java
        LogInspector.java
      - test
        java
        org
        nd4j
        aeron
        ipc
        AeronNDArraySerdeTest.java
        LargeNdArrayIpcTest.java
        NDArrayMessageTest.java
        NdArrayIpcTest.java
        chunk
        ChunkAccumulatorTests.java
        NDArrayMessageChunkTests.java
        response
        AeronNDArrayResponseTest.java
  - nd4j-base64
    - src
      - main
        java
        org
        nd4j
        serde
        base64
        Nd4jBase64.java
  - nd4j-camel-routes
    - nd4j-kafka
      - src
        main
        java
        org
        nd4j
        camel
        kafka
        KafkaConnectionInformation.java
        Nd4jKafkaConsumer.java
        Nd4jKafkaProducer.java
        Nd4jKafkaRoute.java
        test
        java
        org
        nd4j
        kafka
        EmbeddedKafkaCluster.java
        EmbeddedZookeeper.java
        Nd4jKafkaRouteTest.java
        SystemTime.java
        TestUtils.java
  - nd4j-gson
    - src
      - main
        java
        org
        nd4j
        serde
        gson
        GsonDeserializationUtils.java
      - test
        java
        org
        nd4j
        serde
        gson
        GsonDeserializationUtilsTest.java
  - nd4j-jackson
    - src
      - main
        java
        org
        nd4j
        shade
        serde
        jackson
        VectorDeSerializer.java
        VectorSerializer.java
        ndarray
        NDArrayDeSerializer.java
        NDArraySerializer.java
        shaded
        NDArrayDeSerializer.java
        NDArraySerializer.java
  - nd4j-jackson-reflectionloader
    - src
      - main
        java
        org
        nd4j
        reflectionloader
        JacksonReflectionLoader.java
      - test
        java
        org
        nd4j
        reflectionloader
        JacksonReflectionLoaderTest.java
        testclasses
        TestInterface1.java
        TestInterface2.java
        TestInterface22.java
        TestInterfaceImpl1.java
        TestInterfaceImpl21.java
  - nd4j-kryo
    - src
      - main
        java
        org
        nd4j
        Nd4jRegistrator.java
        Nd4jSerializer.java
      - test
        java
        org
        nd4j
        TestNd4jKryoSerialization.java

/*-
 *
 *  * Copyright 2015 Skymind,Inc.
 *  *
 *  *    Licensed under the Apache License, Version 2.0 (the "License");
 *  *    you may not use this file except in compliance with the License.
 *  *    You may obtain a copy of the License at
 *  *
 *  *        http://www.apache.org/licenses/LICENSE-2.0
 *  *
 *  *    Unless required by applicable law or agreed to in writing, software
 *  *    distributed under the License is distributed on an "AS IS" BASIS,
 *  *    WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 *  *    See the License for the specific language governing permissions and
 *  *    limitations under the License.
 *
 *
 */

package org.nd4j.linalg.jcublas;


import org.nd4j.jita.allocator.enums.CudaConstants;
import org.nd4j.jita.allocator.impl.AllocationPoint;
import org.nd4j.jita.allocator.impl.AtomicAllocator;
import org.nd4j.linalg.api.buffer.DataBuffer;
import org.nd4j.linalg.api.buffer.FloatBuffer;
import org.nd4j.linalg.api.memory.MemoryWorkspace;
import org.nd4j.linalg.api.ndarray.BaseNDArray;
import org.nd4j.linalg.api.ndarray.BaseNDArrayProxy;
import org.nd4j.linalg.api.ndarray.INDArray;
import org.nd4j.linalg.api.ops.executioner.GridExecutioner;
import org.nd4j.linalg.exception.ND4JIllegalStateException;
import org.nd4j.linalg.factory.Nd4j;
import org.nd4j.linalg.jcublas.context.CudaContext;
import org.nd4j.nativeblas.NativeOpsHolder;

import java.util.List;

/**
 *
 *
 * Created by mjk on 8/23/14.
 *
 * @author mjk
 * @author Adam Gibson
 * @author raver119@gmail.com
 */

public class JCublasNDArray extends BaseNDArray {
    public JCublasNDArray(double[][] data) {
        super(data);
    }

    public JCublasNDArray(double[][] data, char ordering) {
        super(data, ordering);
    }

    public JCublasNDArray(int[] shape, DataBuffer buffer) {
        super(shape, buffer);
    }

    /**
     * Create this JCublasNDArray with the given data and shape and 0 offset
     *
     * @param data     the data to use
     * @param shape    the shape of the JCublasNDArray
     * @param ordering
     */
    public JCublasNDArray(float[] data, int[] shape, char ordering) {
        super(data, shape, ordering);
    }

    /**
     * @param data     the data to use
     * @param shape    the shape of the JCublasNDArray
     * @param offset   the desired offset
     * @param ordering the ordering of the JCublasNDArray
     */
    public JCublasNDArray(float[] data, int[] shape, int offset, char ordering) {
        super(data, shape, offset, ordering);
    }

    /**
     * Construct an JCublasNDArray of the specified shape
     * with an empty data array
     *
     * @param shape    the shape of the JCublasNDArray
     * @param stride   the stride of the JCublasNDArray
     * @param offset   the desired offset
     * @param ordering the ordering of the JCublasNDArray
     */
    public JCublasNDArray(int[] shape, int[] stride, int offset, char ordering) {
        super(shape, stride, offset, ordering);
    }

    /**
     * Construct an JCublasNDArray of the specified shape, with optional initialization
     *
     * @param shape    the shape of the JCublasNDArray
     * @param stride   the stride of the JCublasNDArray
     * @param offset   the desired offset
     * @param ordering the ordering of the JCublasNDArray
     * @param initialize Whether to initialize the INDArray. If true: initialize. If false: don't.
     */
    public JCublasNDArray(int[] shape, int[] stride, int offset, char ordering, boolean initialize) {
        super(shape, stride, offset, ordering, initialize);
    }

    /**
     * Create the JCublasNDArray with
     * the specified shape and stride and an offset of 0
     *
     * @param shape    the shape of the JCublasNDArray
     * @param stride   the stride of the JCublasNDArray
     * @param ordering the ordering of the JCublasNDArray
     */
    public JCublasNDArray(int[] shape, int[] stride, char ordering) {

        super(shape, stride, ordering);

    }

    public JCublasNDArray(int[] shape, int offset, char ordering) {

        super(shape, offset, ordering);

    }

    public JCublasNDArray(int[] shape) {

        super(shape);

    }

    /**
     * Creates a new <i>n</i> times <i>m</i> <tt>DoubleMatrix</tt>.
     *
     * @param newRows    the number of rows (<i>n</i>) of the new matrix.
     * @param newColumns the number of columns (<i>m</i>) of the new matrix.
     * @param ordering
     */
    public JCublasNDArray(int newRows, int newColumns, char ordering) {
        super(newRows, newColumns, ordering);

    }

    /**
     * Create an JCublasNDArray from the specified slices.
     * This will go through and merge all of the
     * data from each slice in to one JCublasNDArray
     * which will then take the specified shape
     *
     * @param slices   the slices to merge
     * @param shape    the shape of the JCublasNDArray
     * @param ordering
     */
    public JCublasNDArray(List<INDArray> slices, int[] shape, char ordering) {

        super(slices, shape, ordering);

    }

    /**
     * Create an JCublasNDArray from the specified slices.
     * This will go through and merge all of the
     * data from each slice in to one JCublasNDArray
     * which will then take the specified shape
     *
     * @param slices   the slices to merge
     * @param shape    the shape of the JCublasNDArray
     * @param stride
     * @param ordering
     */
    public JCublasNDArray(List<INDArray> slices, int[] shape, int[] stride, char ordering) {
        super(slices, shape, stride, ordering);

    }

    public JCublasNDArray(float[] data, int[] shape, int[] stride, char ordering) {
        super(data, shape, stride, ordering);

    }

    public JCublasNDArray(float[] data, int[] shape, int[] stride, int offset, char ordering) {
        super(data, shape, stride, offset, ordering);

    }

    public JCublasNDArray(DataBuffer data, int[] shape, int[] stride, int offset) {
        super(data, shape, stride, offset);
    }

    public JCublasNDArray(int[] data, int[] shape, int[] strides) {
        super(data, shape, strides);
    }

    public JCublasNDArray(DataBuffer data, int[] shape) {
        super(data, shape);
    }

    public JCublasNDArray(DataBuffer buffer, int[] shape, int offset) {
        super(buffer, shape, offset);
    }

    /**
     * Create this JCublasNDArray with the given data and shape and 0 offset
     *
     * @param data  the data to use
     * @param shape the shape of the JCublasNDArray
     */
    public JCublasNDArray(float[] data, int[] shape) {
        super(data, shape);
    }

    public JCublasNDArray(float[] data, int[] shape, int offset) {

        super(data, shape, offset);

    }

    /**
     * Construct an JCublasNDArray of the specified shape
     * with an empty data array
     *
     * @param shape  the shape of the JCublasNDArray
     * @param stride the stride of the JCublasNDArray
     * @param offset the desired offset
     */
    public JCublasNDArray(int[] shape, int[] stride, int offset) {

        super(shape, stride, offset);
    }

    /**
     * Create the JCublasNDArray with
     * the specified shape and stride and an offset of 0
     *
     * @param shape  the shape of the JCublasNDArray
     * @param stride the stride of the JCublasNDArray
     */
    public JCublasNDArray(int[] shape, int[] stride) {
        super(shape, stride);
    }

    public JCublasNDArray(int[] shape, int offset) {
        super(shape, offset);
    }

    public JCublasNDArray(int[] shape, char ordering) {
        super(shape, ordering);
    }

    /**
     * Creates a new <i>n</i> times <i>m</i> <tt>DoubleMatrix</tt>.
     *
     * @param newRows    the number of rows (<i>n</i>) of the new matrix.
     * @param newColumns the number of columns (<i>m</i>) of the new matrix.
     */
    public JCublasNDArray(int newRows, int newColumns) {
        super(newRows, newColumns);
    }

    /**
     * Create an JCublasNDArray from the specified slices.
     * This will go through and merge all of the
     * data from each slice in to one JCublasNDArray
     * which will then take the specified shape
     *
     * @param slices the slices to merge
     * @param shape  the shape of the JCublasNDArray
     */
    public JCublasNDArray(List<INDArray> slices, int[] shape) {
        super(slices, shape);
    }

    /**
     * Create an JCublasNDArray from the specified slices.
     * This will go through and merge all of the
     * data from each slice in to one JCublasNDArray
     * which will then take the specified shape
     *
     * @param slices the slices to merge
     * @param shape  the shape of the JCublasNDArray
     * @param stride
     */
    public JCublasNDArray(List<INDArray> slices, int[] shape, int[] stride) {
        super(slices, shape, stride);

    }

    public JCublasNDArray(float[] data, int[] shape, int[] stride) {
        super(data, shape, stride);
    }


    public JCublasNDArray(float[] data, int[] shape, int[] stride, int offset) {
        super(data, shape, stride, offset);
    }

    public JCublasNDArray(float[] data) {
        super(data);
    }


    public JCublasNDArray(JCublasNDArray doubleMatrix) {
        this(new int[] {doubleMatrix.rows, doubleMatrix.columns});
        this.data = dup().data();
    }

    public JCublasNDArray(double[] data, int[] shape, int[] stride, int offset) {
        super(data, shape, stride, offset);
    }

    public JCublasNDArray(float[][] floats) {
        super(floats);
    }

    public JCublasNDArray(float[][] data, char ordering) {
        super(data, ordering);
    }

    public JCublasNDArray(DataBuffer buffer, int[] shape, int offset, char ordering) {
        super(buffer, shape, offset, ordering);
    }

    public JCublasNDArray() {}

    public JCublasNDArray(DataBuffer buffer) {
        super(buffer);
    }

    public JCublasNDArray(DataBuffer buffer, int[] shape, int[] stride, int offset, char ordering) {
        super(buffer, shape, stride, offset, ordering);
    }

    public JCublasNDArray(float[] data, char order) {
        super(data, order);
    }

    public JCublasNDArray(FloatBuffer floatBuffer, char order) {
        super(floatBuffer, order);
    }

    public JCublasNDArray(DataBuffer buffer, int[] shape, int[] strides) {
        super(buffer, shape, strides);
    }

    public JCublasNDArray(double[] data, int[] shape, char ordering) {
        super(data, shape, ordering);
    }

    public JCublasNDArray(double[] data, int[] shape, int[] stride, int offset, char ordering) {
        super(data, shape, stride, offset, ordering);
    }

    @Override
    public INDArray dup() {
        if (this.isCompressed() && this.ordering() == Nd4j.order().charValue()) {
            INDArray ret = Nd4j.createArrayFromShapeBuffer(data().dup(), this.shapeInfoDataBuffer());
            ret.markAsCompressed(true);
            return ret;
        }
        /*
            Special case for cuda: if we have not a view, and shapes do match - we
        */
        /*
        if (!isView() && ordering() == Nd4j.order() && Shape.strideDescendingCAscendingF(this)) {
            AtomicAllocator allocator = AtomicAllocator.getInstance();
            INDArray array = Nd4j.createUninitialized(shape(), ordering());
        
            CudaContext context = allocator.getFlowController().prepareAction(array, this);
        
            Configuration configuration = CudaEnvironment.getInstance().getConfiguration();
        
            if (configuration.getMemoryModel() == Configuration.MemoryModel.IMMEDIATE && configuration.getFirstMemory() == AllocationStatus.DEVICE) {
        //                log.info("Path 0");
                allocator.memcpyDevice(array.data(), allocator.getPointer(this.data, context), this.data.length() * this.data().getElementSize(), 0, context);
            } else if (configuration.getMemoryModel() == Configuration.MemoryModel.DELAYED || configuration.getFirstMemory() == AllocationStatus.HOST) {
                AllocationPoint pointSrc = allocator.getAllocationPoint(this);
                AllocationPoint pointDst = allocator.getAllocationPoint(array);
        
                if (pointSrc.getAllocationStatus() == AllocationStatus.HOST) {
        //                    log.info("Path A");
                    NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getPointers().getHostPointer(), pointSrc.getPointers().getHostPointer(), length * data.getElementSize(), CudaConstants.cudaMemcpyHostToHost, context.getOldStream());
                } else {
        //                    log.info("Path B. SRC dId: [{}], DST dId: [{}], cId: [{}]", pointSrc.getDeviceId(), pointDst.getDeviceId(), allocator.getDeviceId());
                    // this code branch is possible only with DELAYED memoryModel and src point being allocated on device
                    if (pointDst.getAllocationStatus() != AllocationStatus.DEVICE) {
                        allocator.getMemoryHandler().alloc(AllocationStatus.DEVICE, pointDst, pointDst.getShape(), false);
                    }
        
                    NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getPointers().getDevicePointer(), pointSrc.getPointers().getHostPointer(), length * data.getElementSize(), CudaConstants.cudaMemcpyHostToDevice, context.getOldStream());
                }
            }
        
            allocator.getFlowController().registerAction(context, array, this);
            return array;
        } else */return super.dup();
    }

    @Override
    public INDArray dup(char order) {
        if (this.isCompressed() && this.ordering() == order) {
            INDArray ret = Nd4j.createArrayFromShapeBuffer(data().dup(), this.shapeInfoDataBuffer());
            ret.markAsCompressed(true);
            return ret;
        }
        /*
        if (!isView() && ordering() == order && Shape.strideDescendingCAscendingF(this)) {
            AtomicAllocator allocator = AtomicAllocator.getInstance();
            INDArray array = Nd4j.createUninitialized(shape(), order);
        
            CudaContext context = allocator.getFlowController().prepareAction(array, this);
        
            Configuration configuration = CudaEnvironment.getInstance().getConfiguration();
        
            if (configuration.getMemoryModel() == Configuration.MemoryModel.IMMEDIATE && configuration.getFirstMemory() == AllocationStatus.DEVICE) {
                allocator.memcpyDevice(array.data(), allocator.getPointer(this.data, context), this.data.length() * this.data().getElementSize(), 0, context);
            } else if (configuration.getMemoryModel() == Configuration.MemoryModel.DELAYED || configuration.getFirstMemory() == AllocationStatus.HOST) {
                AllocationPoint pointSrc = allocator.getAllocationPoint(this);
                AllocationPoint pointDst = allocator.getAllocationPoint(array);
        
                if (pointSrc.getAllocationStatus() == AllocationStatus.HOST) {
                    NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getPointers().getHostPointer(), pointSrc.getPointers().getHostPointer(), length * data.getElementSize(), CudaConstants.cudaMemcpyHostToHost, context.getOldStream());
                } else {
                    // this code branch is possible only with DELAYED memoryModel and src point being allocated on device
                    if (pointDst.getAllocationStatus() != AllocationStatus.DEVICE) {
                        allocator.getMemoryHandler().alloc(AllocationStatus.DEVICE, pointDst, pointDst.getShape(), false);
                    }
        
                    NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getPointers().getDevicePointer(), pointSrc.getPointers().getDevicePointer(), length * data.getElementSize(), CudaConstants.cudaMemcpyHostToDevice, context.getOldStream());
                }
            }
        
            allocator.getFlowController().registerAction(context, array, this);
        
            return array;
        } else */return super.dup(order);
    }

    @Override
    public boolean equals(Object o) {
        //if (o != null) AtomicAllocator.getInstance().synchronizeHostData((INDArray) o);
        //AtomicAllocator.getInstance().synchronizeHostData(this);
        return super.equals(o);
    }

    /**
     * Generate string representation of the matrix.
     */
    @Override
    public String toString() {

        return super.toString();
    }

    /**
     *
     * PLEASE NOTE: Never use this method, unless you 100% have to
     *
     * @param buffer
     */
    public void setShapeInfoDataBuffer(DataBuffer buffer) {
        this.shapeInformation = buffer;
        this.javaShapeInformation = shapeInformation.asInt();
    }

    private Object writeReplace() throws java.io.ObjectStreamException {
        return new BaseNDArrayProxy(this);
    }

    @Override
    public INDArray permutei(int... rearrange) {
        if (Nd4j.getExecutioner() instanceof GridExecutioner)
            ((GridExecutioner) Nd4j.getExecutioner()).flushQueue();

        return super.permutei(rearrange);
    }

    /**
     * This method does direct array copy. Impossible to use on views or mixed orders.
     *
     * PLEASE NOTE: YOU SHOULD NEVER USE THIS METHOD, UNLESS YOU 100% CLEAR ABOUT IT
     *
     * @return
     */
    @Override
    public synchronized INDArray unsafeDuplication() {
        INDArray ret = Nd4j.createUninitialized(this.shape(), this.ordering());

        if (Nd4j.getExecutioner() instanceof GridExecutioner)
            ((GridExecutioner) Nd4j.getExecutioner()).flushQueue();

        AtomicAllocator allocator = AtomicAllocator.getInstance();
        CudaContext context = (CudaContext) allocator.getDeviceContext().getContext();

        allocator.memcpyDevice(ret.data(), allocator.getAllocationPoint(this.data).getDevicePointer(),
                        this.data.length() * this.data().getElementSize(), 0, context);
        context.syncOldStream();

        return ret;
    }

    @Override
    public INDArray leverageTo(String id) {
        if (!isAttached()) {
//            log.info("Skipping detached");
            return this;
        }

        if (!Nd4j.getWorkspaceManager().checkIfWorkspaceExists(id)) {
//            log.info("Skipping non-existent");
            return this;
        }

        MemoryWorkspace current = Nd4j.getMemoryManager().getCurrentWorkspace();

        MemoryWorkspace target = Nd4j.getWorkspaceManager().getWorkspaceForCurrentThread(id);

        if (current == target) {
//            log.info("Skipping equals A");
            return this;
        }

        if (this.data.getParentWorkspace() == target) {
//            log.info("Skipping equals B");
            return this;
        }

        Nd4j.getMemoryManager().setCurrentWorkspace(target);

//        log.info("Leveraging...");

        INDArray copy = null;
        if (!this.isView()) {
        //if (1 < 0) {
            Nd4j.getExecutioner().commit();

            DataBuffer buffer = Nd4j.createBuffer(this.lengthLong(), false);

            AllocationPoint pointDst = AtomicAllocator.getInstance().getAllocationPoint(buffer);
            AllocationPoint pointSrc = AtomicAllocator.getInstance().getAllocationPoint(this.data);

            CudaContext context = AtomicAllocator.getInstance().getFlowController().prepareAction(pointDst, pointSrc);
/*
            if (NativeOpsHolder.getInstance().getDeviceNativeOps().memsetAsync(pointDst.getDevicePointer(), 0, 1, 0, context.getOldStream()) == 0)
                throw new ND4JIllegalStateException("memsetAsync 1 failed");

            context.syncOldStream();

            if (NativeOpsHolder.getInstance().getDeviceNativeOps().memsetAsync(pointSrc.getDevicePointer(), 0, 1, 0, context.getOldStream()) == 0)
                throw new ND4JIllegalStateException("memsetAsync 2 failed");

            context.syncOldStream();
*/
            if (pointSrc.isActualOnDeviceSide()) {
                if (NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getDevicePointer(), pointSrc.getDevicePointer(), this.lengthLong() * Nd4j.sizeOfDataType(buffer.dataType()), CudaConstants.cudaMemcpyDeviceToDevice, context.getOldStream()) == 0)
                    throw new ND4JIllegalStateException("memcpyAsync failed");
            } else {
                if (NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getDevicePointer(), pointSrc.getHostPointer(), this.lengthLong() * Nd4j.sizeOfDataType(buffer.dataType()), CudaConstants.cudaMemcpyHostToDevice, context.getOldStream()) == 0)
                    throw new ND4JIllegalStateException("memcpyAsync failed");
            }

            context.syncOldStream();

            copy = Nd4j.createArrayFromShapeBuffer(buffer, this.shapeInfoDataBuffer());

            // tag buffer as valid on device side
            pointDst.tickHostRead();
            pointDst.tickDeviceWrite();

            AtomicAllocator.getInstance().getFlowController().registerAction(context, pointDst, pointSrc);
        } else {
            copy = this.dup(this.ordering());

            Nd4j.getExecutioner().commit();
        }

        Nd4j.getMemoryManager().setCurrentWorkspace(current);

        return copy;
    }


    /**
     * This method pulls this INDArray into current Workspace.
     *
     * PLEASE NOTE: If there's no current Workspace - INDArray returned as is
     *
     * @return
     */
    @Override
    public INDArray migrate() {
        MemoryWorkspace current = Nd4j.getMemoryManager().getCurrentWorkspace();

        if (current == null)
            return this;

        INDArray copy = null;

        if (!this.isView()) {
            if (Nd4j.getExecutioner() instanceof GridExecutioner)
                ((GridExecutioner) Nd4j.getExecutioner()).flushQueue();

            DataBuffer buffer = Nd4j.createBuffer(this.lengthLong(), false);

            AllocationPoint pointDst = AtomicAllocator.getInstance().getAllocationPoint(buffer);
            AllocationPoint pointSrc = AtomicAllocator.getInstance().getAllocationPoint(this.data);

//            CudaContext context = (CudaContext) AtomicAllocator.getInstance().getDeviceContext().getContext();

            CudaContext context = AtomicAllocator.getInstance().getFlowController().prepareAction(pointDst, pointSrc);
            if (pointSrc.isActualOnDeviceSide()) {
                if (NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getDevicePointer(), pointSrc.getDevicePointer(), this.lengthLong() * Nd4j.sizeOfDataType(buffer.dataType()), CudaConstants.cudaMemcpyDeviceToDevice, context.getOldStream()) == 0)
                    throw new ND4JIllegalStateException("memcpyAsync failed");
            } else {
                if (NativeOpsHolder.getInstance().getDeviceNativeOps().memcpyAsync(pointDst.getDevicePointer(), pointSrc.getHostPointer(), this.lengthLong() * Nd4j.sizeOfDataType(buffer.dataType()), CudaConstants.cudaMemcpyHostToDevice, context.getOldStream()) == 0)
                    throw new ND4JIllegalStateException("memcpyAsync failed");
            }

            context.syncOldStream();

            if (pointDst.getDeviceId() != Nd4j.getMemoryManager().getCurrentWorkspace().getDeviceId()) {
                //log.info("Swapping [{}] -> [{}]", pointDst.getDeviceId(), Nd4j.getMemoryManager().getCurrentWorkspace().getDeviceId());
                pointDst.setDeviceId(Nd4j.getMemoryManager().getCurrentWorkspace().getDeviceId());
            }

            copy = Nd4j.createArrayFromShapeBuffer(buffer, this.shapeInfoDataBuffer());

            // tag buffer as valid on device side
            pointDst.tickHostRead();
            pointDst.tickDeviceWrite();

            AtomicAllocator.getInstance().getFlowController().registerAction(context, pointDst, pointSrc);
        } else {
            copy = this.dup(this.ordering());
        }

        return copy;
    }
}