LSTMHelpers.java example

Explorer

deeplearning4j-master
- deeplearning4j-core
  - src
    - main
      - java
        org
        deeplearning4j
        api
        storage
        Persistable.java
        StatsStorage.java
        StatsStorageEvent.java
        StatsStorageListener.java
        StatsStorageRouter.java
        StatsStorageRouterProvider.java
        StorageMetaData.java
        StorageType.java
        impl
        CollectionStatsStorageRouter.java
        RemoteUIStatsStorageRouter.java
        listener
        RoutingIterationListener.java
        base
        IrisUtils.java
        MnistFetcher.java
        clustering
        algorithm
        BaseClusteringAlgorithm.java
        ClusteringAlgorithm.java
        condition
        ClusteringAlgorithmCondition.java
        ConvergenceCondition.java
        FixedIterationCountCondition.java
        VarianceVariationCondition.java
        iteration
        IterationHistory.java
        IterationInfo.java
        optimisation
        ClusteringOptimization.java
        ClusteringOptimizationType.java
        strategy
        BaseClusteringStrategy.java
        ClusteringStrategy.java
        ClusteringStrategyType.java
        FixedClusterCountStrategy.java
        OptimisationStrategy.java
        cluster
        Cluster.java
        ClusterSet.java
        ClusterUtils.java
        Point.java
        PointClassification.java
        info
        ClusterInfo.java
        ClusterSetInfo.java
        kdtree
        HyperRect.java
        KDTree.java
        kmeans
        KMeansClustering.java
        quadtree
        Cell.java
        QuadTree.java
        sptree
        Cell.java
        DataPoint.java
        HeapItem.java
        SpTree.java
        vptree
        VPTree.java
        package-info.java
        datasets
        DataSets.java
        datavec
        RecordReaderDataSetIterator.java
        RecordReaderMultiDataSetIterator.java
        SequenceRecordReaderDataSetIterator.java
        exception
        ZeroLengthSequenceException.java
        fetchers
        CurvesDataFetcher.java
        IrisDataFetcher.java
        MnistDataFetcher.java
        iterator
        CurvesDataSetIterator.java
        impl
        CifarDataSetIterator.java
        IrisDataSetIterator.java
        LFWDataSetIterator.java
        MnistDataSetIterator.java
        RawMnistDataSetIterator.java
        mnist
        MnistDbFile.java
        MnistImageFile.java
        MnistLabelFile.java
        MnistManager.java
        draw
        DrawReconstruction.java
        LoadAndDraw.java
        rearrange
        LocalUnstructuredDataFormatter.java
        test
        TestDataSetIterator.java
        vectorizer
        Vectorizer.java
        evaluation
        EvaluationTools.java
        parallelism
        AsyncIterator.java
        ConcurrentHashSet.java
        MagicQueue.java
        plot
        BarnesHutTsne.java
        Tsne.java
        ui
        UiConnectionInfo.java
        util
        ModelGuesser.java
    - test
      - java
        org
        deeplearning4j
        base
        MnistFetcherTest.java
        clustering
        kdtree
        KDTreeTest.java
        quadtree
        QuadTreeTest.java
        sptree
        SPTreeTest.java
        vptree
        VpTreeNodeTest.java
        datasets
        datavec
        RecordReaderDataSetiteratorTest.java
        RecordReaderMultiDataSetIteratorTest.java
        tools
        SpecialImageRecordReader.java
        fetchers
        IrisDataFetcherTest.java
        iterator
        AbstractDataSetIteratorTest.java
        AsyncDataSetIteratorTest.java
        AsyncMultiDataSetIteratorTest.java
        DataSetIteratorTest.java
        JointParallelDataSetIteratorTest.java
        MultipleEpochsIteratorTest.java
        SamplingTest.java
        TestAsyncIterator.java
        tools
        SimpleVariableGenerator.java
        VariableMultiTimeseriesGenerator.java
        VariableTimeseriesGenerator.java
        rearrange
        LocalUnstructuredDataFormatterTest.java
        earlystopping
        TestEarlyStopping.java
        TestEarlyStoppingCompGraph.java
        eval
        EvalTest.java
        EvaluationBinaryTest.java
        EvaluationToolsTests.java
        ROCBinaryTest.java
        ROCTest.java
        RegressionEvalTest.java
        exceptions
        TestInvalidConfigurations.java
        TestInvalidInput.java
        TestRecordReaders.java
        gradientcheck
        BNGradientCheckTest.java
        CNN1DGradientCheckTest.java
        CNNGradientCheckTest.java
        GlobalPoolingGradientCheckTests.java
        GradientCheckTests.java
        GradientCheckTestsComputationGraph.java
        GradientCheckTestsMasking.java
        LRNGradientCheckTests.java
        LSTMGradientCheckTests.java
        LossFunctionGradientCheck.java
        VaeGradientCheckTests.java
        nn
        conf
        ComputationGraphConfigurationTest.java
        MultiLayerNeuralNetConfigurationTest.java
        MultiNeuralNetConfLayerBuilderTest.java
        NeuralNetConfigurationTest.java
        layers
        LayerBuilderTest.java
        LayerConfigTest.java
        LayerConfigValidationTest.java
        misc
        TestGraphVertex.java
        preprocessor
        CNNProcessorTest.java
        CustomPreprocessorTest.java
        TestPreProcessors.java
        custom
        MyCustomPreprocessor.java
        graph
        ComputationGraphTestRNN.java
        TestCompGraphCNN.java
        TestComputationGraphNetwork.java
        TestSetGetParameters.java
        TestVariableLengthTSCG.java
        graphnodes
        TestGraphNodes.java
        layers
        ActivationLayerTest.java
        BaseLayerTest.java
        CenterLossOutputLayerTest.java
        DropoutLayerTest.java
        FrozenLayerTest.java
        OutputLayerTest.java
        SeedTest.java
        TestDropout.java
        convolution
        ConvolutionLayerSetupTest.java
        ConvolutionLayerTest.java
        SubsamplingLayerTest.java
        TestConvolutionModes.java
        custom
        TestCustomActivation.java
        TestCustomLayers.java
        testclasses
        CustomActivation.java
        CustomLayer.java
        CustomLayerImpl.java
        CustomOutputLayer.java
        CustomOutputLayerImpl.java
        feedforward
        autoencoder
        AutoEncoderTest.java
        dense
        DenseTest.java
        embedding
        EmbeddingLayerTest.java
        rbm
        RBMTests.java
        normalization
        BatchNormalizationTest.java
        LocalResponseTest.java
        pooling
        GlobalPoolingMaskingTests.java
        recurrent
        GravesBidirectionalLSTMTest.java
        GravesLSTMTest.java
        variational
        TestReconstructionDistributions.java
        TestVAE.java
        multilayer
        BackPropMLPTest.java
        GravesLSTMOutputTest.java
        MultiLayerTest.java
        MultiLayerTestRNN.java
        TestMasking.java
        TestSetGetParameters.java
        TestVariableLengthTS.java
        transferlearning
        TestTransferLearningJson.java
        TransferLearningCompGraphTest.java
        TransferLearningComplex.java
        TransferLearningHelperTest.java
        TransferLearningMLNTest.java
        updater
        TestDecayPolicies.java
        TestGradientNormalization.java
        TestUpdaters.java
        custom
        CustomGradientUpdater.java
        CustomIUpdater.java
        TestCustomUpdater.java
        weights
        WeightInitUtilTest.java
        optimize
        solver
        BackTrackLineSearchTest.java
        TestOptimizers.java
        optimizer
        listener
        AssertWeightsDifferentIerationListener.java
        TestListenerSetting.java
        TestParamAndGradientIterationListener.java
        parallelism
        AsyncIteratorTest.java
        MagicQueueTest.java
        MultiBooleanTest.java
        ParallelExistingMiniBatchDataSetIteratorTest.java
        plot
        BarnesHutTsneTest.java
        regressiontest
        RegressionTest050.java
        RegressionTest060.java
        RegressionTest071.java
        RegressionTest080.java
        TestDistributionDeserializer.java
        ui
        UiConnectionInfoTest.java
        util
        ArrayUtilTest.java
        EnumUtilTest.java
        ModelGuesserTest.java
        ModelSerializerTest.java
        MovingWindowMatrixTest.java
        RandomUtils.java
        SerializationUtilsTest.java
        TestUIDProvider.java
        TimeSeriesUtilsTest.java
- deeplearning4j-cuda
  - src
    - main
      - java
        org
        deeplearning4j
        nn
        layers
        BaseCudnnHelper.java
        convolution
        CudnnConvolutionHelper.java
        subsampling
        CudnnSubsamplingHelper.java
        normalization
        CudnnBatchNormalizationHelper.java
        CudnnLocalResponseNormalizationHelper.java
    - test
      - java
        org
        deeplearning4j
        convolution
        TestConvolution.java
        gradientcheck
        CuDNNGradientChecks.java
- deeplearning4j-graph
  - src
    - main
      - java
        org
        deeplearning4j
        graph
        api
        BaseGraph.java
        Edge.java
        IGraph.java
        IVertexSequence.java
        NoEdgeHandling.java
        Vertex.java
        data
        EdgeLineProcessor.java
        GraphLoader.java
        VertexLoader.java
        impl
        DelimitedEdgeLineProcessor.java
        DelimitedVertexLoader.java
        WeightedEdgeLineProcessor.java
        exception
        NoEdgesException.java
        ParseException.java
        graph
        Graph.java
        VertexSequence.java
        iterator
        GraphWalkIterator.java
        RandomWalkIterator.java
        WeightedRandomWalkIterator.java
        parallel
        GraphWalkIteratorProvider.java
        RandomWalkGraphIteratorProvider.java
        WeightedRandomWalkGraphIteratorProvider.java
        models
        BinaryTree.java
        GraphVectors.java
        deepwalk
        DeepWalk.java
        GraphHuffman.java
        embeddings
        GraphVectorLookupTable.java
        GraphVectorsImpl.java
        InMemoryGraphLookupTable.java
        loader
        GraphVectorSerializer.java
        vertexfactory
        IntegerVertexFactory.java
        StringVertexFactory.java
        VertexFactory.java
        VoidVertexFactory.java
    - test
      - java
        org
        deeplearning4j
        graph
        data
        TestGraphLoading.java
        TestGraphLoadingWeighted.java
        graph
        TestGraph.java
        models
        deepwalk
        DeepWalkGradientCheck.java
        TestDeepWalk.java
        TestGraphHuffman.java
- deeplearning4j-keras
  - src
    - main
      - java
        org
        deeplearning4j
        keras
        DeepLearning4jEntryPoint.java
        EntryPointFitParameters.java
        HDF5MiniBatchDataSetIterator.java
        KerasModelType.java
        NDArrayHDF5Reader.java
        NeuralNetworkReader.java
        Server.java
    - test
      - java
        org
        deeplearning4j
        keras
        DeepLearning4jEntryPointTest.java
        StringsEndsWithPredicate.java
- deeplearning4j-modelimport
  - src
    - main
      - java
        org
        deeplearning4j
        nn
        modelimport
        keras
        Hdf5Archive.java
        InvalidKerasConfigurationException.java
        KerasLayer.java
        KerasModel.java
        KerasModelImport.java
        KerasSequentialModel.java
        Model.java
        ModelConfiguration.java
        UnsupportedKerasConfigurationException.java
        layers
        KerasActivation.java
        KerasBatchNormalization.java
        KerasConvolution.java
        KerasDense.java
        KerasDropout.java
        KerasEmbedding.java
        KerasFlatten.java
        KerasGlobalPooling.java
        KerasInput.java
        KerasLoss.java
        KerasLstm.java
        KerasMerge.java
        KerasPooling.java
        KerasZeroPadding.java
        preprocessors
        TensorFlowCnnToFeedForwardPreProcessor.java
        trainedmodels
        TrainedModelHelper.java
        TrainedModels.java
        Utils
        ImageNetLabels.java
    - test
      - java
        org
        deeplearning4j
        nn
        modelimport
        keras
        KerasLayerTest.java
        KerasModelConfigurationTest.java
        KerasModelEndToEndTest.java
- deeplearning4j-nearestneighbor-server
  - src
    - main
      - java
        org
        datavec
        spark
        transform
        FunctionUtil.java
        NearestNeighborsServer.java
        deeplearning4j
        nearestneighbor
        model
        Base64NDArrayBody.java
        BatchRecord.java
        CSVRecord.java
        NearestNeighborRequest.java
        NearestNeighborsResult.java
        NearstNeighborsResults.java
        server
        FunctionUtil.java
        NearestNeighbor.java
        NearestNeighborsServer.java
    - test
      - java
        org
        deeplearning4j
        nearestneighbor
        server
        NearestNeighborTest.java
        NearestNeighborsServerTest.java
- deeplearning4j-nlp-parent
  - deeplearning4j-nlp
    - src
      - main
        java
        org
        deeplearning4j
        bagofwords
        vectorizer
        BagOfWordsVectorizer.java
        BaseTextVectorizer.java
        Builder.java
        DefaultInputStreamCreator.java
        TextVectorizer.java
        TfidfVectorizer.java
        datasets
        iterator
        ReutersNewsGroupsDataSetIterator.java
        loader
        ReutersNewsGroupsLoader.java
        iterator
        CnnSentenceDataSetIterator.java
        LabeledSentenceProvider.java
        provider
        CollectionLabeledSentenceProvider.java
        FileLabeledSentenceProvider.java
        LabelAwareConverter.java
        models
        embeddings
        WeightLookupTable.java
        inmemory
        InMemoryLookupTable.java
        learning
        ElementsLearningAlgorithm.java
        SequenceLearningAlgorithm.java
        impl
        elements
        CBOW.java
        GloVe.java
        RandomUtils.java
        SkipGram.java
        sequence
        DBOW.java
        DM.java
        loader
        VectorsConfiguration.java
        WordVectorSerializer.java
        reader
        ModelUtils.java
        impl
        BasicModelUtils.java
        FlatModelUtils.java
        TreeModelUtils.java
        wordvectors
        WordVectors.java
        WordVectorsImpl.java
        glove
        AbstractCoOccurrences.java
        Glove.java
        GloveWeightLookupTable.java
        count
        ASCIICoOccurrenceReader.java
        ASCIICoOccurrenceWriter.java
        BinaryCoOccurrenceReader.java
        BinaryCoOccurrenceWriter.java
        CoOccurenceReader.java
        CoOccurrenceWeight.java
        CoOccurrenceWriter.java
        CountMap.java
        RoundCount.java
        node2vec
        Node2Vec.java
        paragraphvectors
        ParagraphVectors.java
        sequencevectors
        SequenceVectors.java
        enums
        ListenerEvent.java
        graph
        enums
        NoEdgeHandling.java
        PopularityMode.java
        SamplingMode.java
        SpreadSpectrum.java
        WalkDirection.java
        WalkMode.java
        exception
        NoEdgesException.java
        ParseException.java
        huffman
        BinaryTree.java
        GraphHuffman.java
        primitives
        Edge.java
        Graph.java
        IGraph.java
        Vertex.java
        vertex
        AbstractVertexFactory.java
        VertexFactory.java
        walkers
        GraphWalker.java
        impl
        NearestVertexWalker.java
        PopularityWalker.java
        RandomWalker.java
        WeightedWalker.java
        interfaces
        SequenceElementFactory.java
        SequenceIterator.java
        VectorsListener.java
        iterators
        AbstractSequenceIterator.java
        FilteredSequenceIterator.java
        SynchronizedSequenceIterator.java
        listeners
        ScoreListener.java
        SerializingListener.java
        SimilarityListener.java
        sequence
        Sequence.java
        SequenceElement.java
        ShallowSequenceElement.java
        serialization
        AbstractElementFactory.java
        VocabWordFactory.java
        transformers
        SequenceTransformer.java
        impl
        GraphTransformer.java
        SentenceTransformer.java
        iterables
        BasicTransformerIterator.java
        ParallelTransformerIterator.java
        word2vec
        Huffman.java
        InputStreamCreator.java
        StaticWord2Vec.java
        StreamWork.java
        VocabWord.java
        VocabWork.java
        Word2Vec.java
        iterator
        Word2VecDataFetcher.java
        Word2VecDataSetIterator.java
        wordstore
        HuffmanNode.java
        VocabCache.java
        VocabConstructor.java
        VocabularyHolder.java
        VocabularyWord.java
        inmemory
        AbstractCache.java
        InMemoryLookupCache.java
        text
        documentiterator
        AsyncLabelAwareIterator.java
        BasicLabelAwareIterator.java
        DocumentIterator.java
        FileDocumentIterator.java
        FileLabelAwareIterator.java
        FilenamesLabelAwareIterator.java
        LabelAwareDocumentIterator.java
        LabelAwareIterator.java
        LabelledDocument.java
        LabelsSource.java
        SimpleLabelAwareIterator.java
        interoperability
        DocumentIteratorConverter.java
        inputsanitation
        InputHomogenization.java
        invertedindex
        InvertedIndex.java
        labels
        LabelsProvider.java
        movingwindow
        ContextLabelRetriever.java
        Util.java
        Window.java
        WindowConverter.java
        Windows.java
        WordConverter.java
        sentenceiterator
        AggregatingSentenceIterator.java
        BaseSentenceIterator.java
        BasicLineIterator.java
        BasicResultSetIterator.java
        CollectionSentenceIterator.java
        FileSentenceIterator.java
        LineSentenceIterator.java
        MutipleEpochsSentenceIterator.java
        PrefetchingSentenceIterator.java
        SentenceIterator.java
        SentencePreProcessor.java
        StreamLineIterator.java
        SynchronizedSentenceIterator.java
        interoperability
        SentenceIteratorConverter.java
        labelaware
        LabelAwareFileSentenceIterator.java
        LabelAwareListSentenceIterator.java
        LabelAwareSentenceIterator.java
        stopwords
        StopWords.java
        tokenization
        tokenizer
        DefaultStreamTokenizer.java
        DefaultTokenizer.java
        NGramTokenizer.java
        TokenPreProcess.java
        Tokenizer.java
        preprocessor
        CommonPreprocessor.java
        EndingPreProcessor.java
        LowCasePreProcessor.java
        StringCleaning.java
        tokenizerfactory
        DefaultTokenizerFactory.java
        NGramTokenizerFactory.java
        TokenizerFactory.java
      - test
        java
        org
        deeplearning4j
        bagofwords
        vectorizer
        BagOfWordsVectorizerTest.java
        TfidfVectorizerTest.java
        iterator
        TestCnnSentenceDataSetIterator.java
        models
        embeddings
        inmemory
        InMemoryLookupTableTest.java
        reader
        impl
        FlatModelUtilsTest.java
        wordvectors
        WordVectorsImplTest.java
        glove
        AbstractCoOccurrencesTest.java
        GloveTest.java
        count
        BinaryCoOccurrenceReaderTest.java
        RoundCountTest.java
        paragraphvectors
        ParagraphVectorsTest.java
        sequencevectors
        SequenceVectorsTest.java
        graph
        walkers
        impl
        PopularityWalkerTest.java
        RandomWalkerTest.java
        WeightedWalkerTest.java
        serialization
        AbstractElementFactoryTest.java
        VocabWordFactoryTest.java
        transformers
        impl
        GraphTransformerTest.java
        iterables
        ParallelTransformerIteratorTest.java
        word2vec
        Word2VecTestsSmall.java
        Word2VecVisualizationTests.java
        iterator
        Word2VecDataSetIteratorTest.java
        wordstore
        VocabConstructorTest.java
        VocabularyHolderTest.java
        inmemory
        AbstractCacheTest.java
        text
        documentiterator
        AsyncLabelAwareIteratorTest.java
        BasicLabelAwareIteratorTest.java
        DefaultDocumentIteratorTest.java
        FileDocumentIteratorTest.java
        FileLabelAwareIteratorTest.java
        FilenamesLabelAwareIteratorTest.java
        LabelsSourceTest.java
        sentenceiterator
        AggregatingSentenceIteratorTest.java
        BasicLineIteratorTest.java
        BasicResultSetIteratorTest.java
        MutipleEpochsSentenceIteratorTest.java
        PrefetchingSentenceIteratorTest.java
        StreamLineIteratorTest.java
        tokenization
        tokenizer
        DefaulTokenizerTests.java
        NGramTokenizerTest.java
        tokenprepreprocessor
        EndingPreProcessorTest.java
        wordstore
        InMemoryVocabStoreTests.java
  - deeplearning4j-nlp-japanese
    - src
      - main
        java
        com
        atilika
        kuromoji
        TokenBase.java
        TokenizerBase.java
        buffer
        BufferEntry.java
        FeatureInfoMap.java
        StringValueMapBuffer.java
        TokenInfoBuffer.java
        WordIdMap.java
        compile
        CharacterDefinitionsCompiler.java
        Compiler.java
        ConnectionCostsCompiler.java
        DictionaryCompilerBase.java
        DoubleArrayTrieCompiler.java
        ProgressLog.java
        TokenInfoBufferCompiler.java
        TokenInfoDictionaryCompilerBase.java
        UnknownDictionaryCompiler.java
        WordIdMapCompiler.java
        dict
        CharacterDefinitions.java
        ConnectionCosts.java
        Dictionary.java
        DictionaryEntryBase.java
        DictionaryField.java
        GenericDictionaryEntry.java
        InsertedDictionary.java
        TokenInfoDictionary.java
        UnknownDictionary.java
        UserDictionary.java
        io
        ByteBufferIO.java
        IntegerArrayIO.java
        StringArrayIO.java
        ipadic
        Token.java
        Tokenizer.java
        compile
        DictionaryCompiler.java
        DictionaryEntry.java
        TokenInfoDictionaryCompiler.java
        package-info.java
        trie
        DoubleArrayTrie.java
        PatriciaTrie.java
        PatriciaTrieFormatter.java
        Trie.java
        util
        DictionaryEntryLineParser.java
        FileResourceResolver.java
        KuromojiBinFilesFetcher.java
        ResourceResolver.java
        SimpleResourceResolver.java
        StringUtils.java
        UnknownDictionaryEntryParser.java
        viterbi
        TokenFactory.java
        ViterbiBuilder.java
        ViterbiFormatter.java
        ViterbiLattice.java
        ViterbiNode.java
        ViterbiSearcher.java
        org
        deeplearning4j
        text
        tokenization
        tokenizer
        JapaneseTokenizer.java
        tokenizerfactory
        JapaneseTokenizerFactory.java
      - test
        java
        com
        atilika
        kuromoji
        CommonCornerCasesTest.java
        TestUtils.java
        buffer
        StringValueMapBufferTest.java
        compile
        CharacterDefinitionsCompilerTest.java
        ConnectionCostsCompilerTest.java
        TokenInfoBufferCompilerTest.java
        UnknownDictionaryCompilerTest.java
        WordIdMapCompilerTest.java
        dict
        InsertedDictionaryTest.java
        UserDictionaryTest.java
        ipadic
        MultiThreadedTokenizerTest.java
        RandomizedInputTest.java
        SearchTokenizerTest.java
        TokenizerTest.java
        UserDictionaryTokenizerTest.java
        trie
        DoubleArrayTrieTest.java
        NodeTest.java
        PatriciaTrieTest.java
        TrieTest.java
        util
        DictionaryEntryLineParserTest.java
        org
        deeplearning4j
        text
        tokenization
        tokenizer
        JapaneseTokenizerTest.java
  - deeplearning4j-nlp-korean
    - src
      - main
        java
        org
        deeplearning4j
        text
        tokenization
        tokenizer
        KoreanTokenizer.java
        tokenizerfactory
        KoreanTokenizerFactory.java
      - test
        java
        org
        deeplearning4j
        text
        tokenization
        tokenizer
        KoreanTokenizerTest.java
        PerformanceTests.java
  - deeplearning4j-nlp-uima
    - src
      - main
        java
        org
        deeplearning4j
        text
        annotator
        PoStagger.java
        SentenceAnnotator.java
        StemmerAnnotator.java
        TokenizerAnnotator.java
        corpora
        sentiwordnet
        SWN3.java
        treeparser
        BinarizeTreeTransformer.java
        CollapseUnaries.java
        HeadWordFinder.java
        TreeFactory.java
        TreeIterator.java
        TreeParser.java
        TreeVectorizer.java
        transformer
        TreeTransformer.java
        sentenceiterator
        UimaSentenceIterator.java
        labelaware
        LabelAwareUimaSentenceIterator.java
        tokenization
        tokenizer
        ConcurrentTokenizer.java
        PosUimaTokenizer.java
        UimaTokenizer.java
        preprocessor
        CustomStemmingPreprocessor.java
        EmbeddedStemmingPreprocessor.java
        StemmingPreprocessor.java
        tokenizerfactory
        PosUimaTokenizerFactory.java
        UimaTokenizerFactory.java
        uima
        UimaResource.java
      - test
        java
        org
        deeplearning4j
        models
        UITest.java
        WordVectorSerializerTest.java
        embeddings
        loader
        VectorsConfigurationTest.java
        word2vec
        Word2VecTests.java
        iterator
        Word2VecIteratorTest.java
        text
        sentenceiterator
        SentenceIteratorTest.java
        tokenization
        tokenizer
        preprocessor
        StemmingPreprocessorTest.java
        tokenizerfactory
        PosUimaTokenizerFactoryTest.java
        treeparser
        TreeParserTest.java
        TreeTransformerTests.java
        util
        ContextLabelTest.java
- deeplearning4j-nn
  - src
    - main
      - java
        org
        deeplearning4j
        berkeley
        Counter.java
        CounterMap.java
        Factory.java
        Filter.java
        Iterators.java
        MapFactory.java
        MyMethod.java
        Pair.java
        PriorityQueue.java
        PriorityQueueInterface.java
        SloppyMath.java
        StringUtils.java
        Triple.java
        datasets
        fetchers
        BaseDataFetcher.java
        iterator
        AbstractDataSetIterator.java
        AsyncDataSetIterator.java
        AsyncMultiDataSetIterator.java
        AsyncShieldDataSetIterator.java
        AsyncShieldMultiDataSetIterator.java
        BaseDatasetIterator.java
        CombinedPreProcessor.java
        DataSetFetcher.java
        DoublesDataSetIterator.java
        DummyPreProcessor.java
        ExistingDataSetIterator.java
        FileSplitDataSetIterator.java
        FloatsDataSetIterator.java
        INDArrayDataSetIterator.java
        IteratorDataSetIterator.java
        IteratorMultiDataSetIterator.java
        MovingWindowBaseDataSetIterator.java
        MultipleEpochsIterator.java
        ReconstructionDataSetIterator.java
        SamplingDataSetIterator.java
        WorkspacesShieldDataSetIterator.java
        callbacks
        DataSetCallback.java
        DataSetDeserializer.java
        DefaultCallback.java
        FileCallback.java
        InterleavedDataSetCallback.java
        impl
        BenchmarkDataSetIterator.java
        BenchmarkMultiDataSetIterator.java
        ListDataSetIterator.java
        MovingWindowDataSetFetcher.java
        MultiDataSetIteratorAdapter.java
        SingletonMultiDataSetIterator.java
        parallel
        BaseParallelDataSetIterator.java
        FileSplitParallelDataSetIterator.java
        JointParallelDataSetIterator.java
        MultiBoolean.java
        earlystopping
        EarlyStoppingConfiguration.java
        EarlyStoppingModelSaver.java
        EarlyStoppingResult.java
        listener
        EarlyStoppingListener.java
        saver
        InMemoryModelSaver.java
        LocalFileGraphSaver.java
        LocalFileModelSaver.java
        scorecalc
        DataSetLossCalculator.java
        DataSetLossCalculatorCG.java
        ScoreCalculator.java
        termination
        BestScoreEpochTerminationCondition.java
        EpochTerminationCondition.java
        InvalidScoreIterationTerminationCondition.java
        IterationTerminationCondition.java
        MaxEpochsTerminationCondition.java
        MaxScoreIterationTerminationCondition.java
        MaxTimeIterationTerminationCondition.java
        ScoreImprovementEpochTerminationCondition.java
        trainer
        BaseEarlyStoppingTrainer.java
        EarlyStoppingGraphTrainer.java
        EarlyStoppingTrainer.java
        IEarlyStoppingTrainer.java
        eval
        BaseEvaluation.java
        ConfusionMatrix.java
        Evaluation.java
        EvaluationAveraging.java
        EvaluationBinary.java
        EvaluationUtils.java
        IEvaluation.java
        ROC.java
        ROCBinary.java
        ROCMultiClass.java
        RegressionEvaluation.java
        meta
        Prediction.java
        exception
        DL4JException.java
        DL4JInvalidConfigException.java
        DL4JInvalidInputException.java
        DeepLearningException.java
        InvalidStepException.java
        gradientcheck
        GradientCheckUtil.java
        nn
        api
        Classifier.java
        Layer.java
        MaskState.java
        Model.java
        NeuralNetworkPrototype.java
        OptimizationAlgorithm.java
        ParamInitializer.java
        Updater.java
        layers
        IOutputLayer.java
        RecurrentLayer.java
        conf
        BackpropType.java
        ComputationGraphConfiguration.java
        ConvolutionMode.java
        GradientNormalization.java
        InputPreProcessor.java
        LearningRatePolicy.java
        MultiLayerConfiguration.java
        NeuralNetConfiguration.java
        ReflectionsHelper.java
        Updater.java
        WorkspaceMode.java
        distribution
        BinomialDistribution.java
        Distribution.java
        Distributions.java
        GaussianDistribution.java
        NormalDistribution.java
        UniformDistribution.java
        serde
        LegacyDistributionDeserializer.java
        LegacyDistributionHelper.java
        graph
        ElementWiseVertex.java
        GraphVertex.java
        L2NormalizeVertex.java
        L2Vertex.java
        LayerVertex.java
        MergeVertex.java
        PreprocessorVertex.java
        ReshapeVertex.java
        ScaleVertex.java
        StackVertex.java
        SubsetVertex.java
        UnstackVertex.java
        rnn
        DuplicateToTimeSeriesVertex.java
        LastTimeStepVertex.java
        inputs
        InputType.java
        InvalidInputTypeException.java
        layers
        AbstractLSTM.java
        ActivationLayer.java
        AutoEncoder.java
        BaseOutputLayer.java
        BasePretrainNetwork.java
        BaseRecurrentLayer.java
        BatchNormalization.java
        CenterLossOutputLayer.java
        Convolution1DLayer.java
        ConvolutionLayer.java
        DenseLayer.java
        DropoutLayer.java
        EmbeddingLayer.java
        FeedForwardLayer.java
        GlobalPoolingLayer.java
        GravesBidirectionalLSTM.java
        GravesLSTM.java
        InputTypeUtil.java
        LSTM.java
        Layer.java
        LayerValidation.java
        LocalResponseNormalization.java
        LossLayer.java
        OutputLayer.java
        PoolingType.java
        RBM.java
        RnnOutputLayer.java
        Subsampling1DLayer.java
        SubsamplingLayer.java
        ZeroPaddingLayer.java
        setup
        ConvolutionLayerSetup.java
        variational
        BernoulliReconstructionDistribution.java
        CompositeReconstructionDistribution.java
        ExponentialReconstructionDistribution.java
        GaussianReconstructionDistribution.java
        LossFunctionWrapper.java
        ReconstructionDistribution.java
        VariationalAutoencoder.java
        module
        GraphBuilderModule.java
        preprocessor
        BaseInputPreProcessor.java
        BinomialSamplingPreProcessor.java
        CnnToFeedForwardPreProcessor.java
        CnnToRnnPreProcessor.java
        ComposableInputPreProcessor.java
        FeedForwardToCnnPreProcessor.java
        FeedForwardToRnnPreProcessor.java
        RnnToCnnPreProcessor.java
        RnnToFeedForwardPreProcessor.java
        UnitVarianceProcessor.java
        ZeroMeanAndUnitVariancePreProcessor.java
        ZeroMeanPrePreProcessor.java
        serde
        BaseNetConfigDeserializer.java
        ComputationGraphConfigurationDeserializer.java
        MultiLayerConfigurationDeserializer.java
        stepfunctions
        DefaultStepFunction.java
        GradientStepFunction.java
        NegativeDefaultStepFunction.java
        NegativeGradientStepFunction.java
        StepFunction.java
        gradient
        DefaultGradient.java
        Gradient.java
        graph
        ComputationGraph.java
        util
        ComputationGraphUtil.java
        vertex
        BaseGraphVertex.java
        GraphVertex.java
        VertexIndices.java
        impl
        ElementWiseVertex.java
        InputVertex.java
        L2NormalizeVertex.java
        L2Vertex.java
        LayerVertex.java
        MergeVertex.java
        PreprocessorVertex.java
        ReshapeVertex.java
        ScaleVertex.java
        StackVertex.java
        SubsetVertex.java
        UnstackVertex.java
        rnn
        DuplicateToTimeSeriesVertex.java
        LastTimeStepVertex.java
        layers
        ActivationLayer.java
        BaseLayer.java
        BaseOutputLayer.java
        BasePretrainNetwork.java
        DropoutLayer.java
        FrozenLayer.java
        LossLayer.java
        OutputLayer.java
        convolution
        Convolution1DLayer.java
        ConvolutionHelper.java
        ConvolutionLayer.java
        KernelValidationUtil.java
        ZeroPaddingLayer.java
        subsampling
        Subsampling1DLayer.java
        SubsamplingHelper.java
        SubsamplingLayer.java
        feedforward
        autoencoder
        AutoEncoder.java
        recursive
        Tree.java
        dense
        DenseLayer.java
        embedding
        EmbeddingLayer.java
        rbm
        RBM.java
        normalization
        BatchNormalization.java
        BatchNormalizationHelper.java
        LocalResponseNormalization.java
        LocalResponseNormalizationHelper.java
        pooling
        GlobalPoolingLayer.java
        recurrent
        BaseRecurrentLayer.java
        FwdPassReturn.java
        GravesBidirectionalLSTM.java
        GravesLSTM.java
        LSTM.java
        LSTMHelpers.java
        RnnOutputLayer.java
        training
        CenterLossOutputLayer.java
        variational
        VariationalAutoencoder.java
        multilayer
        MultiLayerNetwork.java
        params
        BatchNormalizationParamInitializer.java
        CenterLossParamInitializer.java
        ConvolutionParamInitializer.java
        DefaultParamInitializer.java
        EmptyParamInitializer.java
        GravesBidirectionalLSTMParamInitializer.java
        GravesLSTMParamInitializer.java
        LSTMParamInitializer.java
        PretrainParamInitializer.java
        VariationalAutoencoderParamInitializer.java
        simple
        binary
        BinaryClassificationResult.java
        multiclass
        RankClassificationResult.java
        transferlearning
        FineTuneConfiguration.java
        TransferLearning.java
        TransferLearningHelper.java
        updater
        BaseMultiLayerUpdater.java
        LayerUpdater.java
        MultiLayerUpdater.java
        UpdaterBlock.java
        UpdaterCreator.java
        UpdaterUtils.java
        graph
        ComputationGraphUpdater.java
        weights
        WeightInit.java
        WeightInitUtil.java
        optimize
        Solver.java
        api
        ConvexOptimizer.java
        InvocationType.java
        IterationListener.java
        LineOptimizer.java
        StepFunction.java
        TerminationCondition.java
        TrainingListener.java
        listeners
        CollectScoresIterationListener.java
        ComposableIterationListener.java
        EvaluativeListener.java
        ParamAndGradientIterationListener.java
        PerformanceListener.java
        ScoreIterationListener.java
        callbacks
        EvaluationCallback.java
        ModelSavingCallback.java
        solvers
        BackTrackLineSearch.java
        BaseOptimizer.java
        ConjugateGradient.java
        LBFGS.java
        LineGradientDescent.java
        StochasticGradientDescent.java
        stepfunctions
        DefaultStepFunction.java
        GradientStepFunction.java
        NegativeDefaultStepFunction.java
        NegativeGradientStepFunction.java
        StepFunctions.java
        terminations
        EpsTermination.java
        Norm2Termination.java
        TerminationConditions.java
        ZeroDirection.java
        util
        ArchiveUtils.java
        ByteUtil.java
        ConvolutionUtils.java
        DeepLearningIOUtil.java
        DiskBasedQueue.java
        Dl4jReflection.java
        Dropout.java
        EnumUtil.java
        FileOperations.java
        FingerPrintKeyer.java
        Index.java
        InputSplit.java
        LayerValidation.java
        MaskedReductionUtil.java
        MathUtils.java
        ModelSerializer.java
        MovingWindowMatrix.java
        MultiDimensionalMap.java
        MultiDimensionalSet.java
        MultiLayerUtil.java
        MultiThreadUtils.java
        RBMUtil.java
        ReflectionUtils.java
        SerializationUtils.java
        SetUtils.java
        StringCluster.java
        StringGrid.java
        StringUtils.java
        SummaryStatistics.java
        TestDataSetConsumer.java
        TimeSeriesUtils.java
        UIDProvider.java
        Viterbi.java
        reflections
        DL4JSubTypesScanner.java
    - test
      - java
        org
        deeplearning4j
        eval
        EvalTests.java
        nn
        simple
        multiclass
        RankClassificationResultTest.java
- deeplearning4j-scaleout
  - deeplearning4j-aws
    - src
      - main
        java
        org
        deeplearning4j
        aws
        dataset
        DataSetLoader.java
        ec2
        Ec2BoxCreator.java
        provision
        ClusterSetup.java
        DistributedDeepLearningTrainer.java
        HostProvisioner.java
        s3
        BaseS3.java
        reader
        BaseS3DataSetIterator.java
        BucketIterator.java
        BucketKeyListener.java
        S3Downloader.java
        uploader
        S3Uploader.java
  - deeplearning4j-scaleout-parallelwrapper
    - src
      - main
        java
        org
        deeplearning4j
        parallelism
        EarlyStoppingParallelTrainer.java
        ParallelInference.java
        ParallelWrapper.java
        factory
        DefaultTrainerContext.java
        TrainerContext.java
        inference
        InferenceMode.java
        InferenceObservable.java
        observers
        BasicInferenceObservable.java
        BasicInferenceObserver.java
        BatchedInferenceObservable.java
        main
        DataSetIteratorProviderFactory.java
        MultiDataSetProviderFactory.java
        ParallelWrapperMain.java
        trainer
        DefaultTrainer.java
        Trainer.java
      - test
        java
        org
        deeplearning4j
        parallelism
        ParallelInferenceTest.java
        ParallelWrapperTest.java
        TestListeners.java
        TestParallelEarlyStopping.java
        TestParallelEarlyStoppingUI.java
        inference
        observers
        BatchedInferenceObservableTest.java
        main
        MnistDataSetIteratorProviderFactory.java
        ParallelWrapperMainTest.java
  - deeplearning4j-scaleout-parallelwrapper-parameter-server
    - src
      - main
        java
        org
        deeplearning4j
        parallelism
        parameterserver
        ParameterServerTrainer.java
        ParameterServerTrainerContext.java
      - test
        java
        org
        deeplearning4j
        parallelism
        parameterserver
        ParameterServerParallelWrapperTest.java
  - dl4j-streaming
    - src
      - main
        java
        org
        deeplearning4j
        BasePipeline.java
        Pipeline.java
        Record.java
        StreamingPipeline.java
        streaming
        conversion
        dataset
        CSVRecordToDataSet.java
        RecordToDataSet.java
        ndarray
        CSVRecordToINDArray.java
        NDArrayRecordToNDArray.java
        RecordToNDArray.java
        kafka
        KafkaUriBuilder.java
        NDArrayConsumer.java
        NDArrayKafkaClient.java
        NDArrayPubSubRoute.java
        NDArrayPublisher.java
        NDArrayType.java
        routes
        CamelKafkaRouteBuilder.java
        DL4jServeRouteBuilder.java
        spark-1
        java
        org
        deeplearning4j
        streaming
        pipeline
        spark
        PrintDataSet.java
        StreamingContextUtils.java
        spark-2
        java
        org
        deeplearning4j
        streaming
        pipeline
        spark
        PrintDataSet.java
        StreamingContextUtils.java
      - test
        java
        org
        deeplearning4j
        streaming
        embedded
        EmbeddedKafkaCluster.java
        EmbeddedZookeeper.java
        JavaQueueStream.java
        StringOption.java
        SystemTime.java
        TestUtils.java
        kafka
        NDArrayPublisherTests.java
        routes
        Dl4jServingRouteTest.java
  - spark
    - dl4j-spark
      - src
        main
        java
        org
        deeplearning4j
        spark
        api
        RDDTrainingApproach.java
        Repartition.java
        RepartitionStrategy.java
        TrainingHook.java
        TrainingMaster.java
        TrainingResult.java
        TrainingWorker.java
        WorkerConfiguration.java
        stats
        CommonSparkTrainingStats.java
        SparkTrainingStats.java
        StatsCalculationHelper.java
        worker
        ExecuteWorkerFlatMap.java
        ExecuteWorkerMultiDataSetFlatMap.java
        ExecuteWorkerPDSFlatMap.java
        ExecuteWorkerPDSMDSFlatMap.java
        ExecuteWorkerPathFlatMap.java
        ExecuteWorkerPathMDSFlatMap.java
        NetBroadcastTuple.java
        data
        BatchAndExportDataSetsFunction.java
        BatchAndExportMultiDataSetsFunction.java
        BatchDataSetsFunction.java
        DataSetExportFunction.java
        DataSetProvider.java
        MultiDataSetExportFunction.java
        PathToDataSetFunction.java
        PathToMultiDataSetFunction.java
        SplitDataSetsFunction.java
        shuffle
        IntPartitioner.java
        SplitDataSetExamplesPairFlatMapFunction.java
        datavec
        DataVecByteDataSetFunction.java
        DataVecDataSetFunction.java
        DataVecSequenceDataSetFunction.java
        DataVecSequencePairDataSetFunction.java
        RDDMiniBatches.java
        RecordReaderFunction.java
        export
        StringToDataSetExportFunction.java
        earlystopping
        BaseSparkEarlyStoppingTrainer.java
        SparkDataSetLossCalculator.java
        SparkEarlyStoppingGraphTrainer.java
        SparkEarlyStoppingTrainer.java
        SparkLossCalculatorComputationGraph.java
        impl
        SparkListenable.java
        common
        Add.java
        CountPartitionsFunction.java
        LoadSerializedDataSetFunction.java
        SplitPartitionsFunction.java
        SplitPartitionsFunction2.java
        reduce
        IntDoubleReduceFunction.java
        repartition
        AssignIndexFunction.java
        BalancedPartitioner.java
        HashingBalancedPartitioner.java
        MapTupleToPairFlatMap.java
        score
        BaseVaeReconstructionProbWithKeyFunctionAdapter.java
        BaseVaeScoreWithKeyFunctionAdapter.java
        graph
        SparkComputationGraph.java
        dataset
        DataSetToMultiDataSetFn.java
        PairDataSetToMultiDataSetFn.java
        scoring
        ArrayPairToPair.java
        CGVaeReconstructionErrorWithKeyFunction.java
        CGVaeReconstructionProbWithKeyFunction.java
        GraphFeedForwardWithKeyFunction.java
        PairToArrayPair.java
        ScoreExamplesFunction.java
        ScoreExamplesWithKeyFunction.java
        ScoreFlatMapFunctionCGDataSet.java
        ScoreFlatMapFunctionCGMultiDataSet.java
        layer
        DL4jWorker.java
        IterativeReduceFlatMap.java
        SparkDl4jLayer.java
        listeners
        VanillaStatsStorageRouter.java
        VanillaStatsStorageRouterProvider.java
        multilayer
        SparkDl4jMultiLayer.java
        evaluation
        IEvaluateFlatMapFunction.java
        IEvaluationReduceFunction.java
        scoring
        FeedForwardWithKeyFunction.java
        ScoreExamplesFunction.java
        ScoreExamplesWithKeyFunction.java
        ScoreFlatMapFunction.java
        VaeReconstructionErrorWithKeyFunction.java
        VaeReconstructionProbWithKeyFunction.java
        paramavg
        ParameterAveragingTrainingMaster.java
        ParameterAveragingTrainingResult.java
        ParameterAveragingTrainingWorker.java
        aggregator
        ParameterAveragingAggregationTuple.java
        ParameterAveragingElementAddFunction.java
        ParameterAveragingElementCombineFunction.java
        stats
        ParameterAveragingTrainingMasterStats.java
        ParameterAveragingTrainingWorkerStats.java
        util
        ExportSupport.java
        iterator
        BaseDataSetIterator.java
        PathSparkDataSetIterator.java
        PathSparkMultiDataSetIterator.java
        PortableDataStreamDataSetIterator.java
        PortableDataStreamMultiDataSetIterator.java
        ordering
        DataSetOrdering.java
        stats
        BaseEventStats.java
        EventStats.java
        ExampleCountEventStats.java
        PartitionCountEventStats.java
        StatsUtils.java
        time
        NTPTimeSource.java
        SystemClockTimeSource.java
        TimeSource.java
        TimeSourceProvider.java
        util
        MLLibUtil.java
        SparkUtils.java
        serde
        StorageLevelDeserializer.java
        StorageLevelSerializer.java
        spark-1
        java
        org
        deeplearning4j
        spark
        util
        BaseDoubleFlatMapFunctionAdaptee.java
        BasePairFlatMapFunctionAdaptee.java
        spark-2
        java
        org
        deeplearning4j
        spark
        util
        BaseDoubleFlatMapFunctionAdaptee.java
        BasePairFlatMapFunctionAdaptee.java
        test
        java
        org
        deeplearning4j
        spark
        BaseSparkTest.java
        TestEarlyStoppingSpark.java
        TestEarlyStoppingSparkCompGraph.java
        common
        AddTest.java
        data
        TestShuffleExamples.java
        datavec
        MiniBatchTests.java
        TestDataVecDataSetFunctions.java
        TestExport.java
        TestPreProcessedData.java
        impl
        TestKryoWarning.java
        common
        repartition
        BalancedPartitionerTest.java
        HashingBalancedPartitionerTest.java
        customlayer
        TestCustomLayer.java
        layer
        CustomLayer.java
        CustomLayerImpl.java
        graph
        TestSparkComputationGraph.java
        layer
        TestSparkLayer.java
        multilayer
        TestMiscFunctions.java
        paramavg
        TestCompareParameterAveragingSparkVsSingleMachine.java
        TestJsonYaml.java
        TestSparkMultiLayerParameterAveraging.java
        util
        ExportSupportTest.java
        stats
        TestTrainingStatsCollection.java
        time
        TestTimeSource.java
        ui
        TestListeners.java
        util
        MLLIbUtilTest.java
        TestRepartitioning.java
    - dl4j-spark-ml
      - src
        test
        java
        org
        deeplearning4j
        spark
        ml
        impl
        AutoEncoderNetworkTest.java
        SparkDl4jNetworkTest.java
    - dl4j-spark-nlp
      - src
        main
        java
        org
        deeplearning4j
        spark
        models
        embeddings
        glove
        Glove.java
        GloveChange.java
        GloveParam.java
        GlovePerformer.java
        VocabWordPairs.java
        cooccurrences
        CoOccurrenceCalculator.java
        CoOccurrenceCounts.java
        word2vec
        FirstIterationFunction.java
        FirstIterationFunctionAdapter.java
        MapToPairFunction.java
        NegativeHolder.java
        SecondIterationFunction.java
        SentenceBatch.java
        VocabHolder.java
        Word2Vec.java
        Word2VecChange.java
        Word2VecFuncCall.java
        Word2VecParam.java
        Word2VecPerformer.java
        Word2VecPerformerVoid.java
        Word2VecSetup.java
        Word2VecVariables.java
        text
        accumulators
        MaxPerPartitionAccumulator.java
        WordFreqAccumulator.java
        functions
        CountCumSum.java
        FoldBetweenPartitionFunction.java
        FoldWithinPartitionFunction.java
        GetSentenceCountFunction.java
        MapPerPartitionVoidFunction.java
        ReduceSentenceCount.java
        TextPipeline.java
        TokenizerFunction.java
        UpdateWordFreqAccumulatorFunction.java
        WordsListToVocabWordsFunction.java
        test
        java
        org
        deeplearning4j
        spark
        models
        embeddings
        glove
        GloveTest.java
        word2vec
        Word2VecTest.java
        text
        BaseSparkTest.java
        TestFunction.java
        TextPipelineTest.java
    - dl4j-spark-nlp-java8
      - src
        main
        java
        org
        deeplearning4j
        spark
        models
        paragraphvectors
        SparkParagraphVectors.java
        functions
        DocumentSequenceConvertFunction.java
        KeySequenceConvertFunction.java
        sequencevectors
        SparkSequenceVectors.java
        export
        ExportContainer.java
        SparkModelExporter.java
        impl
        HdfsModelExporter.java
        VocabCacheExporter.java
        functions
        BaseTokenizerFunction.java
        CountFunction.java
        DistributedFunction.java
        ElementsFrequenciesAccumulator.java
        ExportFunction.java
        ExtraCountFunction.java
        ExtraElementsFrequenciesAccumulator.java
        ListSequenceConvertFunction.java
        PartitionTrainingFunction.java
        TokenizerFunction.java
        TrainingFunction.java
        VocabRddFunctionFlat.java
        learning
        SparkElementsLearningAlgorithm.java
        SparkSequenceLearningAlgorithm.java
        elements
        BaseSparkLearningAlgorithm.java
        SparkCBOW.java
        SparkSkipGram.java
        sequence
        BaseSparkSequenceLearningAlgorithm.java
        SparkDBOW.java
        SparkDM.java
        primitives
        ExtraCounter.java
        NetworkInformation.java
        utils
        NetworkOrganizer.java
        word2vec
        SparkWord2Vec.java
        test
        java
        org
        deeplearning4j
        spark
        models
        sequencevectors
        SparkSequenceVectorsTest.java
        export
        ExportContainerTest.java
        utils
        NetworkOrganizerTest.java
        word2vec
        SparkWord2VecTest.java
    - dl4j-spark-parameterserver
      - src
        main
        java
        org
        deeplearning4j
        spark
        parameterserver
        ParameterServerSubscriber.java
        ParameterServerTrainingHook.java
- deeplearning4j-ui-parent
  - deeplearning4j-play
    - src
      - main
        java
        org
        deeplearning4j
        ui
        api
        FunctionType.java
        HttpMethod.java
        I18N.java
        Route.java
        UIModule.java
        UIServer.java
        i18n
        DefaultI18N.java
        I18NProvider.java
        module
        convolutional
        ConvolutionalListenerModule.java
        defaultModule
        DefaultModule.java
        flow
        FlowListenerModule.java
        histogram
        HistogramModule.java
        remote
        RemoteReceiverModule.java
        train
        TrainModule.java
        TrainModuleUtils.java
        tsne
        TsneModule.java
        play
        PlayUIServer.java
        misc
        FunctionUtil.java
        staticroutes
        Assets.java
        I18NRoute.java
      - test
        java
        org
        deeplearning4j
        ui
        play
        TestPlayUI.java
        TestRemoteReceiver.java
  - deeplearning4j-ui
    - src
      - main
        java
        org
        deeplearning4j
        ui
        UiUtils.java
        WebReporter.java
        exception
        GenericExceptionMapper.java
        JsonExceptionMapper.java
        flow
        FlowIterationListener.java
        providers
        ObjectMapperProvider.java
        weights
        ConvolutionalIterationListener.java
        HistogramIterationListener.java
      - test
        java
        org
        deeplearning4j
        ui
        ApiTest.java
        BaseUiServerTest.java
        ManualTests.java
        TestRenders.java
        TestSerialization.java
        flow
        FlowIterationListenerTest.java
        TestFlowListener.java
        weights
        HistogramBinTest.java
        TestConvolutionalListener.java
        TestHistogramListener.java
  - deeplearning4j-ui-components
    - src
      - main
        java
        org
        deeplearning4j
        ui
        api
        Component.java
        LengthUnit.java
        Style.java
        Utils.java
        components
        chart
        Chart.java
        ChartHistogram.java
        ChartHorizontalBar.java
        ChartLine.java
        ChartScatter.java
        ChartStackedArea.java
        ChartTimeline.java
        style
        StyleChart.java
        component
        ComponentDiv.java
        style
        StyleDiv.java
        decorator
        DecoratorAccordion.java
        style
        StyleAccordion.java
        table
        ComponentTable.java
        style
        StyleTable.java
        text
        ComponentText.java
        style
        StyleText.java
        standalone
        ClassPathResource.java
        ComponentObject.java
        StaticPageUtil.java
      - test
        java
        org
        deeplearning4j
        ui
        TestComponentSerialization.java
        TestRendering.java
        TestStandAlone.java
  - deeplearning4j-ui-model
    - src
      - main
        java
        org
        deeplearning4j
        ui
        activation
        PathUpdate.java
        flow
        beans
        Coords.java
        Description.java
        LayerInfo.java
        LayerParams.java
        ModelInfo.java
        ModelState.java
        NodeReport.java
        data
        FlowStaticPersistable.java
        FlowUpdatePersistable.java
        nearestneighbors
        word2vec
        NearestNeighborsQuery.java
        renders
        PathUpdate.java
        stats
        BaseStatsListener.java
        J7StatsListener.java
        StatsListener.java
        api
        Histogram.java
        StatsInitializationConfiguration.java
        StatsInitializationReport.java
        StatsReport.java
        StatsType.java
        StatsUpdateConfiguration.java
        SummaryType.java
        impl
        DefaultStatsInitializationConfiguration.java
        DefaultStatsUpdateConfiguration.java
        SbeStatsInitializationReport.java
        SbeStatsReport.java
        SbeUtil.java
        java
        JavaStatsInitializationReport.java
        JavaStatsReport.java
        sbe
        GroupSizeEncodingDecoder.java
        GroupSizeEncodingEncoder.java
        InitFieldsPresentDecoder.java
        InitFieldsPresentEncoder.java
        MemoryType.java
        MessageHeaderDecoder.java
        MessageHeaderEncoder.java
        MetaAttribute.java
        StatSource.java
        StatType.java
        StaticInfoDecoder.java
        StaticInfoEncoder.java
        StatsType.java
        StorageMetaDataDecoder.java
        StorageMetaDataEncoder.java
        SummaryType.java
        UpdateDecoder.java
        UpdateEncoder.java
        UpdateFieldsPresentDecoder.java
        UpdateFieldsPresentEncoder.java
        VarDataUTF8Decoder.java
        VarDataUTF8Encoder.java
        storage
        AgronaPersistable.java
        BaseCollectionStatsStorage.java
        FileStatsStorage.java
        InMemoryStatsStorage.java
        impl
        JavaStorageMetaData.java
        QueuePairStatsStorageListener.java
        QueueStatsStorageListener.java
        SbeStorageMetaData.java
        mapdb
        MapDBStatsStorage.java
        sqlite
        J7FileStatsStorage.java
        weights
        ConvolutionListenerPersistable.java
        HistogramBin.java
        ModelAndGradient.java
        beans
        CompactModelAndGradient.java
      - test
        java
        org
        deeplearning4j
        ui
        TestStorageMetaData.java
        stats
        TestStatsClasses.java
        TestStatsListener.java
        TestTransferStatsCollection.java
        storage
        TestStatsStorage.java
  - deeplearning4j-ui-remote-iterationlisteners
    - src
      - main
        java
        org
        deeplearning4j
        ui
        WebReporter.java
        flow
        RemoteFlowIterationListener.java
        weights
        RemoteConvolutionalIterationListener.java
        RemoteHistogramIterationListener.java

package org.deeplearning4j.nn.layers.recurrent;

import lombok.extern.slf4j.Slf4j;
import org.deeplearning4j.berkeley.Pair;
import org.deeplearning4j.exception.DL4JInvalidInputException;
import org.deeplearning4j.nn.api.Layer;
import org.deeplearning4j.nn.conf.NeuralNetConfiguration;
import org.deeplearning4j.nn.gradient.DefaultGradient;
import org.deeplearning4j.nn.gradient.Gradient;
import org.deeplearning4j.nn.graph.ComputationGraph;
import org.deeplearning4j.util.Dropout;
import org.nd4j.linalg.activations.IActivation;
import org.nd4j.linalg.activations.impl.ActivationSigmoid;
import org.nd4j.linalg.api.blas.Level1;
import org.nd4j.linalg.api.memory.MemoryWorkspace;
import org.nd4j.linalg.api.ndarray.INDArray;
import org.nd4j.linalg.api.ops.impl.transforms.TimesOneMinus;
import org.nd4j.linalg.api.ops.impl.transforms.arithmetic.MulOp;
import org.nd4j.linalg.api.shape.Shape;
import org.nd4j.linalg.factory.Nd4j;
import org.nd4j.linalg.indexing.NDArrayIndex;

import java.util.Arrays;
import java.util.Map;

import static org.nd4j.linalg.indexing.NDArrayIndex.interval;
import static org.nd4j.linalg.indexing.NDArrayIndex.point;

/**
 *
 * RNN tutorial: http://deeplearning4j.org/usingrnns.html
 * READ THIS FIRST if you want to understand what the heck is happening here.
 *
 * Shared code for the standard "forwards" LSTM RNN and the bidirectional LSTM RNN
 * This was extracted from GravesLSTM and refactored into static helper functions.  The general reasoning for this was
 * so we only have math in one place, instead of two.
 *
 * Based on Graves: Supervised Sequence Labelling with Recurrent Neural Networks
 * http://www.cs.toronto.edu/~graves/phd.pdf
 * See also for full/vectorized equations (and a comparison to other LSTM variants):
 * Greff et al. 2015, "LSTM: A Search Space Odyssey", pg11.
 * <p>
 * When 'hasPeepholeConnections' is true, this is the "vanilla" variant in said paper<br>
 * When 'hasPeepholeConnections' is false, this is the "no peephole" variant<br>
 * http://arxiv.org/pdf/1503.04069.pdf
 *
 *
 * @author Alex Black (LSTM implementations)
 * @author Benjamin Joseph (refactoring for bidirectional LSTM)
 */
@Slf4j
public class LSTMHelpers {

    //    public static final String SIGMOID = "sigmoid";

    private LSTMHelpers() {}

    /**
     * Returns FwdPassReturn object with activations/INDArrays. Allows activateHelper to be used for forward pass, backward pass
     * and rnnTimeStep whilst being reasonably efficient for all
     */
    static public FwdPassReturn activateHelper(final Layer layer, final NeuralNetConfiguration conf,
                    final IActivation gateActivationFn, //Activation function for the gates - sigmoid or hard sigmoid (must be found in range 0 to 1)
                    final INDArray input, final INDArray recurrentWeights, //Shape: [hiddenLayerSize,4*hiddenLayerSize+3]; order: [wI,wF,wO,wG,wFF,wOO,wGG]
                    final INDArray originalInputWeights, //Shape: [n^(L-1),4*hiddenLayerSize]; order: [wi,wf,wo,wg]
                    final INDArray biases, //Shape: [4,hiddenLayerSize]; order: [bi,bf,bo,bg]^T
                    final boolean training, final INDArray originalPrevOutputActivations,
                    final INDArray originalPrevMemCellState, boolean forBackprop, boolean forwards,
                    final String inputWeightKey, INDArray maskArray, //Input mask: should only be used with bidirectional RNNs + variable length
                    final boolean hasPeepholeConnections            //True for GravesLSTM, false for LSTM
    ) {

        //Mini-batch data format: for mini-batch size m, nIn inputs, and T time series length
        //Data has shape [m,nIn,T]. Layer activations/output has shape [m,nHiddenUnits,T]
        if (input == null || input.length() == 0)
            throw new IllegalArgumentException("Invalid input: not set or 0 length");

        INDArray inputWeights = originalInputWeights;
        INDArray prevOutputActivations = originalPrevOutputActivations;

        boolean is2dInput = input.rank() < 3; //Edge case of T=1, may have shape [m,nIn], equiv. to [m,nIn,1]
        int timeSeriesLength = (is2dInput ? 1 : input.size(2));
        int hiddenLayerSize = recurrentWeights.size(0);
        int miniBatchSize = input.size(0);

        INDArray prevMemCellState;
        if (originalPrevMemCellState == null) {
            prevMemCellState = Nd4j.create(new int[] {miniBatchSize, hiddenLayerSize}, 'f');
        } else {
            prevMemCellState = originalPrevMemCellState.dup('f');
        }



        INDArray recurrentWeightsIFOG = recurrentWeights
                        .get(NDArrayIndex.all(), NDArrayIndex.interval(0, 4 * hiddenLayerSize)).dup('f');


        //Apply dropconnect to input (not recurrent) weights only:
        if (conf.isUseDropConnect() && training && conf.getLayer().getDropOut() > 0) {
            inputWeights = Dropout.applyDropConnect(layer, inputWeightKey);
        }

        INDArray wFFTranspose = null;
        INDArray wOOTranspose = null;
        INDArray wGGTranspose = null;

        if(hasPeepholeConnections){
            wFFTranspose = recurrentWeights
                    .get(NDArrayIndex.all(), interval(4 * hiddenLayerSize, 4 * hiddenLayerSize + 1)).transpose(); //current
            wOOTranspose = recurrentWeights
                    .get(NDArrayIndex.all(), interval(4 * hiddenLayerSize + 1, 4 * hiddenLayerSize + 2))
                    .transpose(); //current
            wGGTranspose = recurrentWeights
                    .get(NDArrayIndex.all(), interval(4 * hiddenLayerSize + 2, 4 * hiddenLayerSize + 3))
                    .transpose(); //previous

            if (timeSeriesLength > 1 || forBackprop) {
                wFFTranspose = Shape.toMmulCompatible(wFFTranspose);
                wOOTranspose = Shape.toMmulCompatible(wOOTranspose);
                wGGTranspose = Shape.toMmulCompatible(wGGTranspose);
            }
        }

        //Allocate arrays for activations:
        boolean sigmoidGates = gateActivationFn instanceof ActivationSigmoid;
        IActivation afn = conf.getLayer().getActivationFn();
        INDArray outputActivations = null;

        FwdPassReturn toReturn = new FwdPassReturn();
        if (forBackprop) {
            toReturn.fwdPassOutputAsArrays = new INDArray[timeSeriesLength];
            toReturn.memCellState = new INDArray[timeSeriesLength];
            toReturn.memCellActivations = new INDArray[timeSeriesLength];
            toReturn.iz = new INDArray[timeSeriesLength];
            toReturn.ia = new INDArray[timeSeriesLength];
            toReturn.fa = new INDArray[timeSeriesLength];
            toReturn.oa = new INDArray[timeSeriesLength];
            toReturn.ga = new INDArray[timeSeriesLength];
            if (!sigmoidGates) {
                toReturn.fz = new INDArray[timeSeriesLength];
                toReturn.oz = new INDArray[timeSeriesLength];
                toReturn.gz = new INDArray[timeSeriesLength];
            }
        } else {
            outputActivations = Nd4j.create(new int[] {miniBatchSize, hiddenLayerSize, timeSeriesLength}, 'f'); //F order to keep time steps together
            toReturn.fwdPassOutput = outputActivations;
        }

        Level1 l1BLAS = Nd4j.getBlasWrapper().level1();

        //Input validation: check input data matches nIn
        if (input.size(1) != inputWeights.size(0)) {
            throw new DL4JInvalidInputException("Received input with size(1) = " + input.size(1)
                            + " (input array shape = " + Arrays.toString(input.shape())
                            + "); input.size(1) must match layer nIn size (nIn = " + inputWeights.size(0) + ")");
        }
        //Input validation: check that if past state is provided, that it has same
        //These can be different if user forgets to call rnnClearPreviousState() between calls of rnnTimeStep
        if (prevOutputActivations != null && prevOutputActivations.size(0) != input.size(0)) {
            throw new DL4JInvalidInputException("Previous activations (stored state) number of examples = "
                            + prevOutputActivations.size(0) + " but input array number of examples = " + input.size(0)
                            + ". Possible cause: using rnnTimeStep() without calling"
                            + " rnnClearPreviousState() between different sequences?");
        }

        //initialize prevOutputActivations to zeroes
        if (prevOutputActivations == null) {
            prevOutputActivations = Nd4j.zeros(new int[] {miniBatchSize, hiddenLayerSize});
        }

        for (int iTimeIndex = 0; iTimeIndex < timeSeriesLength; iTimeIndex++) {
            int time = iTimeIndex;

            if (!forwards) {
                time = timeSeriesLength - iTimeIndex - 1;
            }


            INDArray miniBatchData = (is2dInput ? input : input.tensorAlongDimension(time, 1, 0)); //[Expected shape: [m,nIn]. Also deals with edge case of T=1, with 'time series' data of shape [m,nIn], equiv. to [m,nIn,1]
            miniBatchData = Shape.toMmulCompatible(miniBatchData);

            //Calculate activations for: network input + forget, output, input modulation gates. Next 3 lines are first part of those
            INDArray ifogActivations = miniBatchData.mmul(inputWeights); //Shape: [miniBatch,4*layerSize]
            Nd4j.gemm(prevOutputActivations, recurrentWeightsIFOG, ifogActivations, false, false, 1.0, 1.0);
            ifogActivations.addiRowVector(biases);

            INDArray inputActivations =
                            ifogActivations.get(NDArrayIndex.all(), NDArrayIndex.interval(0, hiddenLayerSize));
            if (forBackprop)
                toReturn.iz[time] = inputActivations.dup('f');
            conf.getLayer().getActivationFn().getActivation(inputActivations, training);
            if (forBackprop)
                toReturn.ia[time] = inputActivations;

            INDArray forgetGateActivations = ifogActivations.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(hiddenLayerSize, 2 * hiddenLayerSize));
            if(hasPeepholeConnections) {
                INDArray pmcellWFF = prevMemCellState.dup('f').muliRowVector(wFFTranspose);
                l1BLAS.axpy(pmcellWFF.length(), 1.0, pmcellWFF, forgetGateActivations); //y = a*x + y i.e., forgetGateActivations.addi(pmcellWFF)
            }
            //Above line: treats matrix as a vector. Can only do this because we're sure both pwcelWFF and forgetGateACtivations are f order, offset 0 and have same strides
            if (forBackprop && !sigmoidGates) {
                toReturn.fz[time] = forgetGateActivations.dup('f'); //Forget gate pre-out (z)
            }
            gateActivationFn.getActivation(forgetGateActivations, training);

            if (forBackprop)
                toReturn.fa[time] = forgetGateActivations;


            INDArray inputModGateActivations = ifogActivations.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(3 * hiddenLayerSize, 4 * hiddenLayerSize));
            if(hasPeepholeConnections) {
                INDArray pmcellWGG = prevMemCellState.dup('f').muliRowVector(wGGTranspose);
                l1BLAS.axpy(pmcellWGG.length(), 1.0, pmcellWGG, inputModGateActivations); //inputModGateActivations.addi(pmcellWGG)
            }
            if (forBackprop && !sigmoidGates) {
                toReturn.gz[time] = inputModGateActivations.dup('f'); //Input modulation gate pre-out (z)
            }
            gateActivationFn.getActivation(inputModGateActivations, training);
            if (forBackprop)
                toReturn.ga[time] = inputModGateActivations;

            //Memory cell state
            INDArray currentMemoryCellState;
            INDArray inputModMulInput;
            if (forBackprop) {
                currentMemoryCellState = prevMemCellState.dup('f').muli(forgetGateActivations);
                inputModMulInput = inputModGateActivations.dup('f').muli(inputActivations);
            } else {
                currentMemoryCellState = forgetGateActivations.muli(prevMemCellState);
                inputModMulInput = inputModGateActivations.muli(inputActivations);
            }
            l1BLAS.axpy(currentMemoryCellState.length(), 1.0, inputModMulInput, currentMemoryCellState); //currentMemoryCellState.addi(inputModMulInput)

            INDArray outputGateActivations = ifogActivations.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 3 * hiddenLayerSize));
            if(hasPeepholeConnections) {
                INDArray pmcellWOO = currentMemoryCellState.dup('f').muliRowVector(wOOTranspose);
                l1BLAS.axpy(pmcellWOO.length(), 1.0, pmcellWOO, outputGateActivations); //outputGateActivations.addi(pmcellWOO)
            }
            if (forBackprop && !sigmoidGates) {
                toReturn.oz[time] = outputGateActivations.dup('f'); //Output gate activations
            }
            gateActivationFn.getActivation(outputGateActivations, training);
            if (forBackprop)
                toReturn.oa[time] = outputGateActivations;

            //LSTM unit outputs:
            INDArray currMemoryCellActivation = afn.getActivation(currentMemoryCellState.dup('f'), training);
            INDArray currHiddenUnitActivations;
            if (forBackprop) {
                currHiddenUnitActivations = currMemoryCellActivation.dup('f').muli(outputGateActivations); //Expected shape: [m,hiddenLayerSize]
            } else {
                currHiddenUnitActivations = currMemoryCellActivation.muli(outputGateActivations); //Expected shape: [m,hiddenLayerSize]
            }

            if (maskArray != null) {
                //Mask array is present: bidirectional RNN -> need to zero out these activations to avoid
                // incorrectly using activations from masked time steps (i.e., want 0 initialization in both directions)
                //We *also* need to apply this to the memory cells, as they are carried forward
                //Mask array has shape [minibatch, timeSeriesLength] -> get column
                INDArray timeStepMaskColumn = maskArray.getColumn(time);
                currHiddenUnitActivations.muliColumnVector(timeStepMaskColumn);
                currentMemoryCellState.muliColumnVector(timeStepMaskColumn);
            }

            if (forBackprop) {
                toReturn.fwdPassOutputAsArrays[time] = currHiddenUnitActivations;
                toReturn.memCellState[time] = currentMemoryCellState;
                toReturn.memCellActivations[time] = currMemoryCellActivation;
            } else {
                outputActivations.tensorAlongDimension(time, 1, 0).assign(currHiddenUnitActivations);
            }

            prevOutputActivations = currHiddenUnitActivations;
            prevMemCellState = currentMemoryCellState;

            toReturn.lastAct = currHiddenUnitActivations;
            toReturn.lastMemCell = currentMemoryCellState;
        }



        //toReturn.leverageTo(ComputationGraph.workspaceExternal);

        return toReturn;
    }

    static public Pair<Gradient, INDArray> backpropGradientHelper(final NeuralNetConfiguration conf,
                    final IActivation gateActivationFn, final INDArray input, final INDArray recurrentWeights, //Shape: [hiddenLayerSize,4*hiddenLayerSize+3]; order: [wI,wF,wO,wG,wFF,wOO,wGG]
                    final INDArray inputWeights, //Shape: [n^(L-1),4*hiddenLayerSize]; order: [wi,wf,wo,wg]
                    final INDArray epsilon, final boolean truncatedBPTT, final int tbpttBackwardLength,
                    final FwdPassReturn fwdPass, final boolean forwards, final String inputWeightKey,
                    final String recurrentWeightKey, final String biasWeightKey,
                    final Map<String, INDArray> gradientViews, INDArray maskArray, //Input mask: should only be used with bidirectional RNNs + variable length
                    final boolean hasPeepholeConnections            //True for GravesLSTM, false for LSTM
    ) {


        //Expect errors to have shape: [miniBatchSize,n^(L+1),timeSeriesLength]
        int hiddenLayerSize = recurrentWeights.size(0); //i.e., n^L
        int prevLayerSize = inputWeights.size(0); //n^(L-1)
        int miniBatchSize = epsilon.size(0);
        boolean is2dInput = epsilon.rank() < 3; //Edge case: T=1 may have shape [miniBatchSize,n^(L+1)], equiv. to [miniBatchSize,n^(L+1),1]
        int timeSeriesLength = (is2dInput ? 1 : epsilon.size(2));

        INDArray wFFTranspose = null;
        INDArray wOOTranspose = null;
        INDArray wGGTranspose = null;
        if(hasPeepholeConnections){
            wFFTranspose = recurrentWeights.get(NDArrayIndex.all(), point(4 * hiddenLayerSize)).transpose();
            wOOTranspose = recurrentWeights.get(NDArrayIndex.all(), point(4 * hiddenLayerSize + 1)).transpose();
            wGGTranspose = recurrentWeights.get(NDArrayIndex.all(), point(4 * hiddenLayerSize + 2)).transpose();
        }


        INDArray wIFOG = recurrentWeights.get(NDArrayIndex.all(), NDArrayIndex.interval(0, 4 * hiddenLayerSize));
        //F order here so that content for time steps are together
        INDArray epsilonNext = Nd4j.create(new int[] {miniBatchSize, prevLayerSize, timeSeriesLength}, 'f'); //i.e., what would be W^L*(delta^L)^T. Shape: [m,n^(L-1),T]

        INDArray nablaCellStateNext = null;

        INDArray deltaifogNext = Nd4j.create(new int[] {miniBatchSize, 4 * hiddenLayerSize}, 'f');
        INDArray deltaiNext = deltaifogNext.get(NDArrayIndex.all(), NDArrayIndex.interval(0, hiddenLayerSize));
        INDArray deltafNext = deltaifogNext.get(NDArrayIndex.all(),
                        NDArrayIndex.interval(hiddenLayerSize, 2 * hiddenLayerSize));
        INDArray deltaoNext = deltaifogNext.get(NDArrayIndex.all(),
                        NDArrayIndex.interval(2 * hiddenLayerSize, 3 * hiddenLayerSize));
        INDArray deltagNext = deltaifogNext.get(NDArrayIndex.all(),
                        NDArrayIndex.interval(3 * hiddenLayerSize, 4 * hiddenLayerSize));

        Level1 l1BLAS = Nd4j.getBlasWrapper().level1();
        int endIdx = 0;

        if (truncatedBPTT) {
            endIdx = Math.max(0, timeSeriesLength - tbpttBackwardLength);
        }

        //Get gradients. Note that we have to manually zero these, as they might not be initialized (or still has data from last iteration)
        //Also note that they are in f order (as per param initializer) so can be used in gemm etc
        INDArray iwGradientsOut = gradientViews.get(inputWeightKey);
        INDArray rwGradientsOut = gradientViews.get(recurrentWeightKey); //Order: {I,F,O,G,FF,OO,GG}
        INDArray bGradientsOut = gradientViews.get(biasWeightKey);
        iwGradientsOut.assign(0);
        rwGradientsOut.assign(0);
        bGradientsOut.assign(0);

        INDArray rwGradientsIFOG =
                        rwGradientsOut.get(NDArrayIndex.all(), NDArrayIndex.interval(0, 4 * hiddenLayerSize));
        INDArray rwGradientsFF = null;
        INDArray rwGradientsOO = null;
        INDArray rwGradientsGG = null;
        if(hasPeepholeConnections){
            rwGradientsFF = rwGradientsOut.get(NDArrayIndex.all(), NDArrayIndex.point(4 * hiddenLayerSize));
            rwGradientsOO = rwGradientsOut.get(NDArrayIndex.all(), NDArrayIndex.point(4 * hiddenLayerSize + 1));
            rwGradientsGG = rwGradientsOut.get(NDArrayIndex.all(), NDArrayIndex.point(4 * hiddenLayerSize + 2));
        }

        boolean sigmoidGates = gateActivationFn instanceof ActivationSigmoid;
        IActivation afn = conf.getLayer().getActivationFn();

        // we check, if we have defined workspace here. If we don't - we working without workspace, and we're skipping internal LSTM one. Otherwise - we go for it
        MemoryWorkspace workspace = Nd4j.getMemoryManager().getCurrentWorkspace() != null && !Nd4j.getMemoryManager().getCurrentWorkspace().getId().equals(ComputationGraph.workspaceExternal) ? Nd4j.getWorkspaceManager().getWorkspaceForCurrentThread(ComputationGraph.workspaceConfigurationLSTM, ComputationGraph.workspaceLSTM) : null;

        INDArray timeStepMaskColumn = null;
        for (int iTimeIndex = timeSeriesLength - 1; iTimeIndex >= endIdx; iTimeIndex--) {

                // we're emulating try block here
                if (workspace != null)
                    workspace.notifyScopeEntered();


                int time = iTimeIndex;
                int inext = 1;

                if (!forwards) {
                    time = timeSeriesLength - iTimeIndex - 1;
                    inext = -1;
                }


                //First: calclate the components of nablaCellState that relies on the next time step deltas, so we can overwrite the deltas
                INDArray nablaCellState;
                if (iTimeIndex != timeSeriesLength - 1 && hasPeepholeConnections) {
                    nablaCellState = deltafNext.dup('f').muliRowVector(wFFTranspose);
                    l1BLAS.axpy(nablaCellState.length(), 1.0, deltagNext.dup('f').muliRowVector(wGGTranspose),
                            nablaCellState);
                } else {
                    nablaCellState = Nd4j.create(new int[]{miniBatchSize, hiddenLayerSize}, 'f');
                }

                INDArray prevMemCellState = (iTimeIndex == 0 ? null : fwdPass.memCellState[time - inext]);
                INDArray prevHiddenUnitActivation = (iTimeIndex == 0 ? null : fwdPass.fwdPassOutputAsArrays[time - inext]);
                INDArray currMemCellState = fwdPass.memCellState[time];


                //LSTM unit output errors (dL/d(a_out)); not to be confused with \delta=dL/d(z_out)
                INDArray epsilonSlice = (is2dInput ? epsilon : epsilon.tensorAlongDimension(time, 1, 0)); //(w^{L+1}*(delta^{(L+1)t})^T)^T or equiv.

                INDArray nablaOut = Shape.toOffsetZeroCopy(epsilonSlice, 'f'); //Shape: [m,n^L]
                if (iTimeIndex != timeSeriesLength - 1) {
                    //if t == timeSeriesLength-1 then deltaiNext etc are zeros
                    Nd4j.gemm(deltaifogNext, wIFOG, nablaOut, false, true, 1.0, 1.0);
                }

                //Output gate deltas:
                INDArray sigmahOfS = fwdPass.memCellActivations[time];
                INDArray ao = fwdPass.oa[time];

                //Normally would use zo.dup() in above line, but won't be using zo again (for this time step). Ditto for zf, zg, zi
                INDArray deltao = deltaoNext;
                Nd4j.getExecutioner().exec(new MulOp(nablaOut, sigmahOfS, deltao));
                if (sigmoidGates) {
                    INDArray sigmaoPrimeOfZo = Nd4j.getExecutioner().execAndReturn(new TimesOneMinus(ao.dup('f'))); //Equivalent to sigmoid deriv on zo
                    deltao.muli(sigmaoPrimeOfZo);
                } else {
                    deltao.assign(gateActivationFn.backprop(fwdPass.oz[time], deltao).getFirst()); //Deltao needs to be modified in-place
                    //TODO: optimize (no assign)
                }

                //Memory cell error:
                INDArray temp = afn.backprop(currMemCellState.dup('f'), ao.muli(nablaOut)).getFirst(); //TODO activation functions with params
                l1BLAS.axpy(nablaCellState.length(), 1.0, temp, nablaCellState);
                if (hasPeepholeConnections) {
                    INDArray deltaMulRowWOO = deltao.dup('f').muliRowVector(wOOTranspose);
                    l1BLAS.axpy(nablaCellState.length(), 1.0, deltaMulRowWOO, nablaCellState); //nablaCellState.addi(deltao.mulRowVector(wOOTranspose));
                }
                if (iTimeIndex != timeSeriesLength - 1) {
                    INDArray nextForgetGateAs = fwdPass.fa[time + inext];
                    int length = nablaCellState.length();
                    l1BLAS.axpy(length, 1.0, nextForgetGateAs.muli(nablaCellStateNext), nablaCellState); //nablaCellState.addi(nextForgetGateAs.mul(nablaCellStateNext))
                }


                //Store for use in next iteration, and IF we're in workspace, we need to push it out of current workspace
                nablaCellStateNext = workspace == null ? nablaCellState : nablaCellState.leverage();


                //Forget gate delta:
                INDArray af = fwdPass.fa[time];
                INDArray deltaf = null;
                if (iTimeIndex > 0) {
                    deltaf = deltafNext;
                    if (sigmoidGates) {
                        Nd4j.getExecutioner().exec(new TimesOneMinus(af, deltaf));
                        deltaf.muli(nablaCellState);
                        deltaf.muli(prevMemCellState);
                    } else {
                        INDArray temp2 = nablaCellState.mul(prevMemCellState);
                        deltaf.assign(gateActivationFn.backprop(fwdPass.fz[time].dup('f'), temp2).getFirst()); //deltaf needs to be modified in-place
                        //TODO activation functions with params
                    }
                }
                //Shape: [m,n^L]

                //Input modulation gate delta:
                INDArray ag = fwdPass.ga[time];
                INDArray ai = fwdPass.ia[time];
                INDArray deltag = deltagNext;
                if (sigmoidGates) {
                    Nd4j.getExecutioner().exec(new TimesOneMinus(ag, deltag)); //Equivalent to sigmoid deriv on zg
                    deltag.muli(ai);
                    deltag.muli(nablaCellState);
                } else {
                    INDArray temp2 = Nd4j.getExecutioner().execAndReturn(
                            new MulOp(ai, nablaCellState, Nd4j.createUninitialized(ai.shape(), 'f')));
                    deltag.assign(gateActivationFn.backprop(fwdPass.gz[time], temp2).getFirst());
                    //TODO activation functions with params; optimize (no assign)
                }
                //Shape: [m,n^L]

                //Network input delta:
                INDArray zi = fwdPass.iz[time];
                INDArray deltai = deltaiNext;
                temp = Nd4j.getExecutioner().execAndReturn(
                        new MulOp(ag, nablaCellState, Nd4j.createUninitialized(deltai.shape(), 'f')));
                deltai.assign(afn.backprop(zi, temp).getFirst());
                //TODO activation functions with params; also: optimize this (no assign)
                //Shape: [m,n^L]


                //Handle masking
                if (maskArray != null) {
                    //Mask array is present: bidirectional RNN -> need to zero out these errors to avoid using errors from a masked time step
                    // to calculate the parameter gradients.  Mask array has shape [minibatch, timeSeriesLength] -> get column(this time step)
                    timeStepMaskColumn = maskArray.getColumn(time);
                    deltaifogNext.muliColumnVector(timeStepMaskColumn);
                    //Later, the deltaifogNext is used to calculate: input weight gradients, recurrent weight gradients, bias gradients
                }

                INDArray prevLayerActivationSlice =
                        Shape.toMmulCompatible(is2dInput ? input : input.tensorAlongDimension(time, 1, 0));
                if (iTimeIndex > 0) {
                    //Again, deltaifog_current == deltaifogNext at this point... same array
                    Nd4j.gemm(prevLayerActivationSlice, deltaifogNext, iwGradientsOut, true, false, 1.0, 1.0);
                } else {
                    INDArray iwGradients_i =
                            iwGradientsOut.get(NDArrayIndex.all(), NDArrayIndex.interval(0, hiddenLayerSize));
                    Nd4j.gemm(prevLayerActivationSlice, deltai, iwGradients_i, true, false, 1.0, 1.0);
                    INDArray iwGradients_og = iwGradientsOut.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize));
                    INDArray deltaog = deltaifogNext.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize));
                    Nd4j.gemm(prevLayerActivationSlice, deltaog, iwGradients_og, true, false, 1.0, 1.0);
                }

                if (iTimeIndex > 0) {
                    //If t==0, then prevHiddenUnitActivation==zeros(n^L,n^L), so dL/dW for recurrent weights will end up as 0 anyway
                    //At this point: deltaifog and deltaifogNext are the same thing...
                    //So what we are actually doing here is sum of (prevAct^transpose * deltaifog_current)
                    Nd4j.gemm(prevHiddenUnitActivation, deltaifogNext, rwGradientsIFOG, true, false, 1.0, 1.0);

                    //Shape: [1,n^L]. sum(0) is sum over examples in mini-batch.
                    //Can use axpy here because result of sum and rwGradients[4 to 6] have order Nd4j.order(), via Nd4j.create()
                    if (hasPeepholeConnections) {
                        INDArray dLdwFF = deltaf.dup('f').muli(prevMemCellState).sum(0); //mul not mmul because these weights are from unit j->j only (whereas other recurrent weights are i->j for all i,j)
                        l1BLAS.axpy(hiddenLayerSize, 1.0, dLdwFF, rwGradientsFF); //rwGradients[4].addi(dLdwFF);    //dL/dw_{FF}
                        INDArray dLdwGG = deltag.dup('f').muli(prevMemCellState).sum(0);
                        l1BLAS.axpy(hiddenLayerSize, 1.0, dLdwGG, rwGradientsGG); //rwGradients[6].addi(dLdwGG);
                    }
                }

                if (hasPeepholeConnections) {
                    INDArray dLdwOO = deltao.dup('f').muli(currMemCellState).sum(0); //Expected shape: [n^L,1]. sum(0) is sum over examples in mini-batch.
                    l1BLAS.axpy(hiddenLayerSize, 1.0, dLdwOO, rwGradientsOO); //rwGradients[5].addi(dLdwOO);    //dL/dw_{OOxy}
                }

                if (iTimeIndex > 0) {
                    l1BLAS.axpy(4 * hiddenLayerSize, 1.0, deltaifogNext.sum(0), bGradientsOut);
                } else {
                    l1BLAS.axpy(hiddenLayerSize, 1.0, deltai.sum(0), bGradientsOut); //Sneaky way to do bGradients_i += deltai.sum(0)
                    INDArray ogBiasToAdd = deltaifogNext.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize)).sum(0);
                    INDArray ogBiasGrad = bGradientsOut.get(NDArrayIndex.point(0),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize));
                    l1BLAS.axpy(2 * hiddenLayerSize, 1.0, ogBiasToAdd, ogBiasGrad);
                }

                //Calculate epsilonNext - i.e., equiv. to what would be (w^L*(d^(Lt))^T)^T in a normal network
                //But here, need to add 4 weights * deltas for the IFOG gates
                INDArray epsilonNextSlice = epsilonNext.tensorAlongDimension(time, 1, 0); //This slice: f order and contiguous, due to epsilonNext being defined as f order.
                if (iTimeIndex > 0) {
                    Nd4j.gemm(deltaifogNext, inputWeights, epsilonNextSlice, false, true, 1.0, 1.0);
                } else {
                    //No contribution from forget gate at t=0
                    INDArray wi = inputWeights.get(NDArrayIndex.all(), NDArrayIndex.interval(0, hiddenLayerSize));
                    Nd4j.gemm(deltai, wi, epsilonNextSlice, false, true, 1.0, 1.0);
                    INDArray deltaog = deltaifogNext.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize));
                    INDArray wog = inputWeights.get(NDArrayIndex.all(),
                            NDArrayIndex.interval(2 * hiddenLayerSize, 4 * hiddenLayerSize));
                    Nd4j.gemm(deltaog, wog, epsilonNextSlice, false, true, 1.0, 1.0); //epsilonNextSlice.addi(deltao.mmul(woTranspose)).addi(deltag.mmul(wgTranspose));
                }

                if (maskArray != null) {
                    //Mask array is present: bidirectional RNN -> need to zero out these errors to avoid sending anything
                    // but 0s to the layer below at this time step (for the given example)
                    epsilonNextSlice.muliColumnVector(timeStepMaskColumn);
                }

                if (workspace != null)
                    workspace.close();
        }

        Gradient retGradient = new DefaultGradient();
        retGradient.gradientForVariable().put(inputWeightKey, iwGradientsOut);
        retGradient.gradientForVariable().put(recurrentWeightKey, rwGradientsOut);
        retGradient.gradientForVariable().put(biasWeightKey, bGradientsOut);

        return new Pair<>(retGradient, epsilonNext);
    }
}