native kernel for funcs: ones, ones_like, zeros, zeros_like, full, full_like (#536)

Alexander-Makaryev · web-flow · commit c34e4f9300f0 · 2021-02-04T08:56:23.000-06:00
* native kernel for funcs: ones, ones_like, zeros, zeros_like, full, full_like
diff --git a/dpnp/backend/include/dpnp_iface.hpp b/dpnp/backend/include/dpnp_iface.hpp
@@ -284,6 +284,17 @@ INP_DLLEXPORT void dpnp_cov_c(void* array1_in, void* result1, size_t nrows, size
 template <typename _DataType>
 INP_DLLEXPORT void dpnp_det_c(void* array1_in, void* result1, size_t* shape, size_t ndim);
 
+/**
+ * @ingroup BACKEND_API
+ * @brief implementation of creating filled with value array function
+ *
+ * @param [out] result  Output array.
+ * @param [in]  value   Value in array.
+ * @param [in]  size    Number of elements in array.
+ */
+template <typename _DataType>
+INP_DLLEXPORT void dpnp_initval_c(void* result1, void* value, size_t size);
+
 /**
  * @ingroup BACKEND_API
  * @brief math library implementation of inv function
diff --git a/dpnp/backend/include/dpnp_iface_fptr.hpp b/dpnp/backend/include/dpnp_iface_fptr.hpp
@@ -100,6 +100,7 @@ enum class DPNPFuncName : size_t
     DPNP_FN_FLOOR_DIVIDE,             /**< Used in numpy.floor_divide() implementation  */
     DPNP_FN_FMOD,                     /**< Used in numpy.fmod() implementation  */
     DPNP_FN_HYPOT,                    /**< Used in numpy.hypot() implementation  */
+    DPNP_FN_INITVAL,                  /**< Used in numpy ones, ones_like, zeros, zeros_like, full, full_like impl  */
     DPNP_FN_INV,                      /**< Used in numpy.linalg.inv() implementation  */
     DPNP_FN_INVERT,                   /**< Used in numpy.invert() implementation  */
     DPNP_FN_KRON,                     /**< Used in numpy.kron() implementation  */
@@ -181,12 +182,13 @@ enum class DPNPFuncName : size_t
  */
 enum class DPNPFuncType : size_t
 {
-    DPNP_FT_NONE,    /**< Very first element of the enumeration */
-    DPNP_FT_INT,     /**< analog of numpy.int32 or int */
-    DPNP_FT_LONG,    /**< analog of numpy.int64 or long */
-    DPNP_FT_FLOAT,   /**< analog of numpy.float32 or float */
-    DPNP_FT_DOUBLE,  /**< analog of numpy.float32 or double */
-    DPNP_FT_CMPLX128 /**< analog of numpy.complex128 or std::complex<double> */
+    DPNP_FT_NONE,     /**< Very first element of the enumeration */
+    DPNP_FT_INT,      /**< analog of numpy.int32 or int */
+    DPNP_FT_LONG,     /**< analog of numpy.int64 or long */
+    DPNP_FT_FLOAT,    /**< analog of numpy.float32 or float */
+    DPNP_FT_DOUBLE,   /**< analog of numpy.float32 or double */
+    DPNP_FT_CMPLX128, /**< analog of numpy.complex128 or std::complex<double> */
+    DPNP_FT_BOOL      /**< analog of numpy.bool or numpy.bool_ or bool */
 };
 
 /**
diff --git a/dpnp/backend/kernels/dpnp_krnl_common.cpp b/dpnp/backend/kernels/dpnp_krnl_common.cpp
@@ -35,82 +35,6 @@
 namespace mkl_blas = oneapi::mkl::blas;
 namespace mkl_lapack = oneapi::mkl::lapack;
 
-template <typename _KernelNameSpecialization>
-class dpnp_matmul_c_kernel;
-
-template <typename _DataType>
-void dpnp_matmul_c(void* array1_in, void* array2_in, void* result1, size_t size_m, size_t size_n, size_t size_k)
-{
-    cl::sycl::event event;
-    _DataType* array_1 = reinterpret_cast<_DataType*>(array1_in);
-    _DataType* array_2 = reinterpret_cast<_DataType*>(array2_in);
-    _DataType* result = reinterpret_cast<_DataType*>(result1);
-
-    if (!size_m || !size_n || !size_k)
-    {
-        return;
-    }
-
-    if constexpr (std::is_same<_DataType, double>::value || std::is_same<_DataType, float>::value)
-    {
-        // using std::max for these ldx variables is required by math library
-        const std::int64_t lda = std::max<size_t>(1UL, size_k); // First dimensions of array_1
-        const std::int64_t ldb = std::max<size_t>(1UL, size_n); // First dimensions of array_2
-        const std::int64_t ldc = std::max<size_t>(1UL, size_n); // Fast dimensions of result
-
-        event = mkl_blas::gemm(DPNP_QUEUE,
-                               oneapi::mkl::transpose::nontrans,
-                               oneapi::mkl::transpose::nontrans,
-                               size_n,
-                               size_m,
-                               size_k,
-                               _DataType(1),
-                               array_2,
-                               ldb,
-                               array_1,
-                               lda,
-                               _DataType(0),
-                               result,
-                               ldc);
-    }
-    else
-    {
-        // input1: M x K
-        // input2: K x N
-        // result: M x N
-        const size_t dim_m = size_m; // shape1.front(); // First dimensions of array1
-        const size_t dim_n = size_n; // shape2.back();  // Last dimensions of array2
-        const size_t dim_k = size_k; // shape1.back(); // First dimensions of array2
-
-        cl::sycl::range<2> gws(dim_m, dim_n); // dimensions are: "i" and "j"
-
-        auto kernel_parallel_for_func = [=](cl::sycl::id<2> global_id) {
-            size_t i = global_id[0]; //for (size_t i = 0; i < size; ++i)
-            {
-                size_t j = global_id[1]; //for (size_t j = 0; j < size; ++j)
-                {
-                    _DataType acc = _DataType(0);
-                    for (size_t k = 0; k < dim_k; ++k)
-                    {
-                        const size_t index_1 = i * dim_k + k;
-                        const size_t index_2 = k * dim_n + j;
-                        acc += array_1[index_1] * array_2[index_2];
-                    }
-                    const size_t index_result = i * dim_n + j;
-                    result[index_result] = acc;
-                }
-            }
-        };
-
-        auto kernel_func = [&](cl::sycl::handler& cgh) {
-            cgh.parallel_for<class dpnp_matmul_c_kernel<_DataType>>(gws, kernel_parallel_for_func);
-        };
-
-        event = DPNP_QUEUE.submit(kernel_func);
-    }
-    event.wait();
-}
-
 template <typename _KernelNameSpecialization1, typename _KernelNameSpecialization2, typename _KernelNameSpecialization3>
 class dpnp_dot_c_kernel;
 
@@ -293,6 +217,111 @@ void dpnp_eigvals_c(const void* array_in, void* result1, size_t size)
     dpnp_memory_free_c(result_val_kern);
 }
 
+template <typename _DataType>
+class dpnp_initval_c_kernel;
+
+template <typename _DataType>
+void dpnp_initval_c(void* result1, void* value, size_t size)
+{
+    if (!size)
+    {
+        return;
+    }
+
+    _DataType* result = reinterpret_cast<_DataType*>(result1);
+    _DataType val = *(reinterpret_cast<_DataType*>(value));
+
+    cl::sycl::range<1> gws(size);
+    auto kernel_parallel_for_func = [=](cl::sycl::id<1> global_id) {
+        const size_t idx = global_id[0];
+        result[idx] = val;
+    };
+
+    auto kernel_func = [&](cl::sycl::handler& cgh) {
+        cgh.parallel_for<class dpnp_initval_c_kernel<_DataType>>(gws, kernel_parallel_for_func);
+    };
+
+    cl::sycl::event event = DPNP_QUEUE.submit(kernel_func);
+
+    event.wait();
+}
+
+template <typename _KernelNameSpecialization>
+class dpnp_matmul_c_kernel;
+
+template <typename _DataType>
+void dpnp_matmul_c(void* array1_in, void* array2_in, void* result1, size_t size_m, size_t size_n, size_t size_k)
+{
+    cl::sycl::event event;
+    _DataType* array_1 = reinterpret_cast<_DataType*>(array1_in);
+    _DataType* array_2 = reinterpret_cast<_DataType*>(array2_in);
+    _DataType* result = reinterpret_cast<_DataType*>(result1);
+
+    if (!size_m || !size_n || !size_k)
+    {
+        return;
+    }
+
+    if constexpr (std::is_same<_DataType, double>::value || std::is_same<_DataType, float>::value)
+    {
+        // using std::max for these ldx variables is required by math library
+        const std::int64_t lda = std::max<size_t>(1UL, size_k); // First dimensions of array_1
+        const std::int64_t ldb = std::max<size_t>(1UL, size_n); // First dimensions of array_2
+        const std::int64_t ldc = std::max<size_t>(1UL, size_n); // Fast dimensions of result
+
+        event = mkl_blas::gemm(DPNP_QUEUE,
+                               oneapi::mkl::transpose::nontrans,
+                               oneapi::mkl::transpose::nontrans,
+                               size_n,
+                               size_m,
+                               size_k,
+                               _DataType(1),
+                               array_2,
+                               ldb,
+                               array_1,
+                               lda,
+                               _DataType(0),
+                               result,
+                               ldc);
+    }
+    else
+    {
+        // input1: M x K
+        // input2: K x N
+        // result: M x N
+        const size_t dim_m = size_m; // shape1.front(); // First dimensions of array1
+        const size_t dim_n = size_n; // shape2.back();  // Last dimensions of array2
+        const size_t dim_k = size_k; // shape1.back(); // First dimensions of array2
+
+        cl::sycl::range<2> gws(dim_m, dim_n); // dimensions are: "i" and "j"
+
+        auto kernel_parallel_for_func = [=](cl::sycl::id<2> global_id) {
+            size_t i = global_id[0]; //for (size_t i = 0; i < size; ++i)
+            {
+                size_t j = global_id[1]; //for (size_t j = 0; j < size; ++j)
+                {
+                    _DataType acc = _DataType(0);
+                    for (size_t k = 0; k < dim_k; ++k)
+                    {
+                        const size_t index_1 = i * dim_k + k;
+                        const size_t index_2 = k * dim_n + j;
+                        acc += array_1[index_1] * array_2[index_2];
+                    }
+                    const size_t index_result = i * dim_n + j;
+                    result[index_result] = acc;
+                }
+            }
+        };
+
+        auto kernel_func = [&](cl::sycl::handler& cgh) {
+            cgh.parallel_for<class dpnp_matmul_c_kernel<_DataType>>(gws, kernel_parallel_for_func);
+        };
+
+        event = DPNP_QUEUE.submit(kernel_func);
+    }
+    event.wait();
+}
+
 void func_map_init_linalg(func_map_t& fmap)
 {
     fmap[DPNPFuncName::DPNP_FN_DOT][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_dot_c<int, int, int>};
@@ -321,6 +350,13 @@ void func_map_init_linalg(func_map_t& fmap)
     fmap[DPNPFuncName::DPNP_FN_EIGVALS][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_eigvals_c<float, float>};
     fmap[DPNPFuncName::DPNP_FN_EIGVALS][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_eigvals_c<double, double>};
 
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_BOOL][eft_BOOL] = {eft_BOOL, (void*)dpnp_initval_c<bool>};
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_initval_c<int>};
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_LNG][eft_LNG] = {eft_LNG, (void*)dpnp_initval_c<long>};
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_initval_c<float>};
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_initval_c<double>};
+    fmap[DPNPFuncName::DPNP_FN_INITVAL][eft_C128][eft_C128] = {eft_C128, (void*)dpnp_initval_c<std::complex<double>>};
+
     fmap[DPNPFuncName::DPNP_FN_MATMUL][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_matmul_c<int>};
     fmap[DPNPFuncName::DPNP_FN_MATMUL][eft_LNG][eft_LNG] = {eft_LNG, (void*)dpnp_matmul_c<long>};
     fmap[DPNPFuncName::DPNP_FN_MATMUL][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_matmul_c<float>};
diff --git a/dpnp/backend/kernels/dpnp_krnl_elemwise.cpp b/dpnp/backend/kernels/dpnp_krnl_elemwise.cpp
@@ -285,17 +285,17 @@ void dpnp_arange_c(size_t start, size_t step, void* result1, size_t size)
 
 static void func_map_init_elemwise_1arg_1type(func_map_t& fmap)
 {
-    fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_arange_c<double>};
-    fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_arange_c<float>};
     fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_arange_c<int>};
     fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_LNG][eft_LNG] = {eft_LNG, (void*)dpnp_arange_c<long>};
+    fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_arange_c<float>};
+    fmap[DPNPFuncName::DPNP_FN_ARANGE][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_arange_c<double>};
 
-    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_C128][eft_C128] = {eft_C128,
-                                                                  (void*)dpnp_conjugate_c<std::complex<double>>};
-    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_copy_c<double>};
-    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_copy_c<float>};
     fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_copy_c<int>};
     fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_LNG][eft_LNG] = {eft_LNG, (void*)dpnp_copy_c<long>};
+    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_FLT][eft_FLT] = {eft_FLT, (void*)dpnp_copy_c<float>};
+    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_DBL][eft_DBL] = {eft_DBL, (void*)dpnp_copy_c<double>};
+    fmap[DPNPFuncName::DPNP_FN_CONJIGUATE][eft_C128][eft_C128] = {eft_C128,
+                                                                  (void*)dpnp_conjugate_c<std::complex<double>>};
 
     fmap[DPNPFuncName::DPNP_FN_ERF][eft_INT][eft_INT] = {eft_INT, (void*)dpnp_erf_c<int>};
     fmap[DPNPFuncName::DPNP_FN_ERF][eft_LNG][eft_LNG] = {eft_LNG, (void*)dpnp_erf_c<long>};
diff --git a/dpnp/backend/src/dpnp_fptr.hpp b/dpnp/backend/src/dpnp_fptr.hpp
@@ -61,6 +61,7 @@ const DPNPFuncType eft_LNG = DPNPFuncType::DPNP_FT_LONG;
 const DPNPFuncType eft_FLT = DPNPFuncType::DPNP_FT_FLOAT;
 const DPNPFuncType eft_DBL = DPNPFuncType::DPNP_FT_DOUBLE;
 const DPNPFuncType eft_C128 = DPNPFuncType::DPNP_FT_CMPLX128;
+const DPNPFuncType eft_BOOL = DPNPFuncType::DPNP_FT_BOOL;
 
 /**
  * FPTR interface initialization functions
diff --git a/dpnp/dpnp_algo/dpnp_algo.pxd b/dpnp/dpnp_algo/dpnp_algo.pxd
@@ -73,6 +73,7 @@ cdef extern from "dpnp_iface_fptr.hpp" namespace "DPNPFuncName":  # need this na
         DPNP_FN_FLOOR_DIVIDE
         DPNP_FN_FMOD
         DPNP_FN_HYPOT
+        DPNP_FN_INITVAL
         DPNP_FN_INV
         DPNP_FN_INVERT
         DPNP_FN_KRON
@@ -151,6 +152,7 @@ cdef extern from "dpnp_iface_fptr.hpp" namespace "DPNPFuncType":  # need this na
         DPNP_FT_FLOAT
         DPNP_FT_DOUBLE
         DPNP_FT_CMPLX128
+        DPNP_FT_BOOL
 
 cdef extern from "dpnp_iface_fptr.hpp":
     struct DPNPFuncData:
diff --git a/dpnp/dpnp_algo/dpnp_algo.pyx b/dpnp/dpnp_algo/dpnp_algo.pyx
@@ -69,6 +69,8 @@ include "dpnp_algo_trigonometric.pyx"
 
 
 ctypedef void(*fptr_dpnp_arange_t)(size_t, size_t, void * , size_t)
+ctypedef void(*fptr_dpnp_initval_t)(void * , void * , size_t)
+
 
 cpdef dparray dpnp_arange(start, stop, step, dtype):
 
@@ -132,10 +134,19 @@ cpdef dparray dpnp_astype(dparray array1, dtype_target):
 
 
 cpdef dparray dpnp_init_val(shape, dtype, value):
+    cdef DPNPFuncType param1_type = dpnp_dtype_to_DPNPFuncType(dtype)
+
+    cdef DPNPFuncData kernel_data = get_dpnp_function_ptr(DPNP_FN_INITVAL, param1_type, param1_type)
+
+    result_type = dpnp_DPNPFuncType_to_dtype( < size_t > kernel_data.return_type)
     cdef dparray result = dparray(shape, dtype=dtype)
 
-    for i in range(result.size):
-        result[i] = value
+    # TODO: find better way to pass single value with type conversion
+    cdef dparray val_arr = dparray((1, ), dtype=dtype)
+    val_arr[0] = value
+
+    cdef fptr_dpnp_initval_t func = <fptr_dpnp_initval_t > kernel_data.ptr
+    func(result.get_data(), val_arr.get_data(), result.size)
 
     return result
 
@@ -244,16 +255,18 @@ Internal functions
 """
 cpdef DPNPFuncType dpnp_dtype_to_DPNPFuncType(dtype):
 
-    if dtype == numpy.float64:
+    if dtype in [numpy.float64, 'float64']:
         return DPNP_FT_DOUBLE
-    elif dtype == numpy.float32:
+    elif dtype in [numpy.float32,  'float32']:
         return DPNP_FT_FLOAT
-    elif dtype == numpy.int64:
+    elif dtype in [numpy.int64, 'int64', 'int', int]:
         return DPNP_FT_LONG
-    elif dtype == numpy.int32:
+    elif dtype in [numpy.int32, 'int32']:
         return DPNP_FT_INT
-    elif dtype == numpy.complex128:
+    elif dtype in [numpy.complex128, 'complex128']:
         return DPNP_FT_CMPLX128
+    elif dtype in [numpy.bool, numpy.bool_, 'bool']:
+        return DPNP_FT_BOOL
     else:
         checker_throw_type_error("dpnp_dtype_to_DPNPFuncType", dtype)
 
@@ -272,6 +285,8 @@ cpdef dpnp_DPNPFuncType_to_dtype(size_t type):
         return numpy.int32
     elif type == <size_t > DPNP_FT_CMPLX128:
         return numpy.complex128
+    elif type == <size_t > DPNP_FT_BOOL:
+        return numpy.bool
     else:
         checker_throw_type_error("dpnp_DPNPFuncType_to_dtype", type)
 
diff --git a/dpnp/dpnp_iface_arraycreation.py b/dpnp/dpnp_iface_arraycreation.py
@@ -616,7 +616,7 @@ def full(shape, fill_value, dtype=None, order='C'):
         if order not in ('C', 'c', None):
             checker_throw_value_error("full", "order", order, 'C')
 
-        _dtype = dtype if dtype is not None else type(fill_value)
+        _dtype = dtype if dtype is not None else dpnp.dtype(type(fill_value))
 
         return dpnp_init_val(shape, _dtype, fill_value)
 
@@ -981,7 +981,9 @@ def ones(shape, dtype=None, order='C'):
         if order not in ('C', 'c', None):
             checker_throw_value_error("ones", "order", order, 'C')
 
-        return dpnp_init_val(shape, dtype, 1)
+        _dtype = dtype if dtype is not None else dpnp.float64
+
+        return dpnp_init_val(shape, _dtype, 1)
 
     return numpy.ones(shape, dtype=dtype, order=order)
 
@@ -1148,7 +1150,9 @@ def zeros(shape, dtype=None, order='C'):
         if order not in ('C', 'c', None):
             checker_throw_value_error("zeros", "order", order, 'C')
 
-        return dpnp_init_val(shape, dtype, 0)
+        _dtype = dtype if dtype is not None else dpnp.float64
+
+        return dpnp_init_val(shape, _dtype, 0)
 
     return numpy.zeros(shape, dtype=dtype, order=order)
 
diff --git a/tests_external/skipped_tests_numpy.tbl b/tests_external/skipped_tests_numpy.tbl