Mila/Math_8Elementwise_8h_source.html

#pragma once

#include <cuda_runtime.h>

#include <cstddef>


namespace Mila::Dnn::Compute::Cuda::Kernels

{

    // ================================================================

    // Element-wise Binary Operations

    // ================================================================


    template<typename T>

    void launch_elementwise_add_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_subtract_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_multiply_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_divide_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_max_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_min_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    // ================================================================

    // Scalar Operations

    // ================================================================


    template<typename T>

    void launch_scalar_add_kernel( const T* src, T* dst, T scalar,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_scalar_multiply_kernel( const T* src, T* dst, T scalar,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_scalar_divide_kernel( const T* src, T* dst, T scalar,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_scalar_subtract_kernel( const T* src, T* dst, T scalar,

        size_t n, cudaStream_t stream );


    // ================================================================

    // Comparison Operations

    // ================================================================


    template<typename T>

    void launch_elementwise_equal_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_greater_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    template<typename T>

    void launch_elementwise_less_kernel( const T* src1, const T* src2, T* dst,

        size_t n, cudaStream_t stream );


    // ================================================================

    // Unary Operations

    // ================================================================


    template<typename T>

    void launch_abs_kernel( const T* src, T* dst, size_t n, cudaStream_t stream );


    template<typename T>

    void launch_negate_kernel( const T* src, T* dst, size_t n, cudaStream_t stream );


    template<typename T>

    void launch_square_kernel( const T* src, T* dst, size_t n, cudaStream_t stream );


    template<typename T>

    void launch_sqrt_kernel( const T* src, T* dst, size_t n, cudaStream_t stream );

}


Mila::Dnn::Compute::Cuda::Kernels
Definition Math.Elementwise.h:16

Mila::Dnn::Compute::Cuda::Kernels::launch_scalar_subtract_kernel
void launch_scalar_subtract_kernel(const T *src, T *dst, T scalar, size_t n, cudaStream_t stream)
Launch scalar subtraction: dst = src - scalar.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_less_kernel
void launch_elementwise_less_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise less than: dst = (src1 < src2) ?

Mila::Dnn::Compute::Cuda::Kernels::launch_scalar_divide_kernel
void launch_scalar_divide_kernel(const T *src, T *dst, T scalar, size_t n, cudaStream_t stream)
Launch scalar division: dst = src / scalar.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_subtract_kernel
void launch_elementwise_subtract_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise tensor subtraction: dst = src1 - src2.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_greater_kernel
void launch_elementwise_greater_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise greater than: dst = (src1 > src2) ?

Mila::Dnn::Compute::Cuda::Kernels::launch_sqrt_kernel
void launch_sqrt_kernel(const T *src, T *dst, size_t n, cudaStream_t stream)
Launch square root: dst = sqrt(src).

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_multiply_kernel
void launch_elementwise_multiply_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise tensor multiplication: dst = src1 * src2.

Mila::Dnn::Compute::Cuda::Kernels::launch_scalar_add_kernel
void launch_scalar_add_kernel(const T *src, T *dst, T scalar, size_t n, cudaStream_t stream)
Launch scalar addition: dst = src + scalar.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_divide_kernel
void launch_elementwise_divide_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise tensor division: dst = src1 / src2.

Mila::Dnn::Compute::Cuda::Kernels::launch_square_kernel
void launch_square_kernel(const T *src, T *dst, size_t n, cudaStream_t stream)
Launch square: dst = src * src.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_min_kernel
void launch_elementwise_min_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise minimum: dst = min(src1, src2).

Mila::Dnn::Compute::Cuda::Kernels::launch_negate_kernel
void launch_negate_kernel(const T *src, T *dst, size_t n, cudaStream_t stream)
Launch negation: dst = -src.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_add_kernel
void launch_elementwise_add_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise tensor addition: dst = src1 + src2.

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_max_kernel
void launch_elementwise_max_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise maximum: dst = max(src1, src2).

Mila::Dnn::Compute::Cuda::Kernels::launch_abs_kernel
void launch_abs_kernel(const T *src, T *dst, size_t n, cudaStream_t stream)
Launch absolute value: dst = abs(src).

Mila::Dnn::Compute::Cuda::Kernels::launch_elementwise_equal_kernel
void launch_elementwise_equal_kernel(const T *src1, const T *src2, T *dst, size_t n, cudaStream_t stream)
Launch element-wise equality: dst = (src1 == src2) ?

Mila::Dnn::Compute::Cuda::Kernels::launch_scalar_multiply_kernel
void launch_scalar_multiply_kernel(const T *src, T *dst, T scalar, size_t n, cudaStream_t stream)
Launch scalar multiplication: dst = src * scalar.