IntelPython
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_common.cpp‎
Lines changed: 35 additions & 27 deletions b/‎dpnp/backend/kernels/dpnp_krnl_common.cpp‎
Lines changed: 35 additions & 27 deletions
diff --git a/‎dpnp/backend/kernels/dpnp_krnl_statistics.cpp‎
Lines changed: 0 additions & 1 deletion b/‎dpnp/backend/kernels/dpnp_krnl_statistics.cpp‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎dpnp/backend/src/dpnp_utils.hpp‎
Lines changed: 4 additions & 5 deletions b/‎dpnp/backend/src/dpnp_utils.hpp‎
Lines changed: 4 additions & 5 deletions
diff --git a/‎dpnp/dpnp_algo/dpnp_algo.pxd‎
Lines changed: 1 addition & 1 deletion b/‎dpnp/dpnp_algo/dpnp_algo.pxd‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎dpnp/dpnp_algo/dpnp_algo.pyx‎
Lines changed: 8 additions & 8 deletions b/‎dpnp/dpnp_algo/dpnp_algo.pyx‎
Lines changed: 8 additions & 8 deletions
diff --git a/‎dpnp/dpnp_algo/dpnp_algo_indexing.pyx‎
Lines changed: 17 additions & 17 deletions b/‎dpnp/dpnp_algo/dpnp_algo_indexing.pyx‎
Lines changed: 17 additions & 17 deletions
diff --git a/‎dpnp/dpnp_algo/dpnp_algo_linearalgebra.pyx‎
Lines changed: 12 additions & 11 deletions b/‎dpnp/dpnp_algo/dpnp_algo_linearalgebra.pyx‎
Lines changed: 12 additions & 11 deletions
diff --git a/‎dpnp/dpnp_container.py‎
Lines changed: 2 additions & 2 deletions b/‎dpnp/dpnp_container.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎dpnp/dpnp_iface.py‎
Lines changed: 1 addition & 0 deletions b/‎dpnp/dpnp_iface.py‎
Lines changed: 1 addition & 0 deletions
@@ -77,9 +77,14 @@ template <typename _KernelNameSpecialization1, typename _KernelNameSpecializatio
 class dpnp_dot_c_kernel;
 
 template <typename _DataType_output, typename _DataType_input1, typename _DataType_input2>
-cl::sycl::event dot(cl::sycl::queue &queue,
-                    _DataType_output *result_out, _DataType_input1 *input1_in, _DataType_input2 *input2_in, size_t input1_strides, size_t input2_strides, size_t size,
-                    const cl::sycl::vector_class<cl::sycl::event> &dependencies = {})
+cl::sycl::event dot(cl::sycl::queue& queue,
+                    _DataType_output* result_out,
+                    _DataType_input1* input1_in,
+                    _DataType_input2* input2_in,
+                    size_t input1_strides,
+                    size_t input2_strides,
+                    size_t size,
+                    const cl::sycl::vector_class<cl::sycl::event>& dependencies = {})
 {
     (void)dependencies;
 
@@ -100,16 +105,15 @@ cl::sycl::event dot(cl::sycl::queue &queue,
     else
     {
 #if LIBSYCL_VERSION_GREATER(5, 3, 0)
-        event = queue.submit([&](sycl::handler &cgh)
-        {
+        event = queue.submit([&](sycl::handler& cgh) {
             cgh.parallel_for(sycl::range<1>{size},
-            cl::sycl::reduction(result_out,
-                                std::plus<_DataType_output>(),
-                                cl::sycl::property::reduction::initialize_to_identity{}),
-            [=](cl::sycl::id<1> idx, auto& sum)
-            {
-                sum += static_cast <_DataType_output>(input1_in[idx * input1_strides]) * static_cast <_DataType_output>(input2_in[idx * input2_strides]);
-            });
+                             cl::sycl::reduction(result_out,
+                                                 std::plus<_DataType_output>(),
+                                                 cl::sycl::property::reduction::initialize_to_identity{}),
+                             [=](cl::sycl::id<1> idx, auto& sum) {
+                                 sum += static_cast<_DataType_output>(input1_in[idx * input1_strides]) *
+                                        static_cast<_DataType_output>(input2_in[idx * input2_strides]);
+                             });
         });
         // for some reason few such kernels cannot work in parallel
         // looks like a bug in level0 because with opencl works fine
@@ -190,7 +194,7 @@ void dpnp_dot_c(void* result_out,
     {
         // there is no support of strides in multiply function
         // so result can be wrong if input array has non-standard (c-contiguous) strides
-        dpnp_multiply_c<_DataType_output, _DataType_input1, _DataType_input2>(result,                                                                                    \
+        dpnp_multiply_c<_DataType_output, _DataType_input1, _DataType_input2>(result,
                                                                               input1_in,
                                                                               input1_size,
                                                                               input1_shape,
@@ -207,7 +211,8 @@ void dpnp_dot_c(void* result_out,
     if ((input1_ndim == 1) && (input2_ndim == 1))
     {
         assert(input1_size == input2_size);
-        cl::sycl::event event = dot(DPNP_QUEUE, result, input1, input2, input1_strides[0], input2_strides[0], input1_size);
+        cl::sycl::event event =
+            dot(DPNP_QUEUE, result, input1, input2, input1_strides[0], input2_strides[0], input1_size);
         event.wait();
         return;
     }
@@ -225,7 +230,7 @@ void dpnp_dot_c(void* result_out,
     }
     else
     {
-        for(size_t i = 0; i < ext_input1_ndim; ++i)
+        for (size_t i = 0; i < ext_input1_ndim; ++i)
         {
             ext_input1_shape[i] = input1_shape[i];
             ext_input1_strides[i] = input1_strides[i];
@@ -243,7 +248,7 @@ void dpnp_dot_c(void* result_out,
     }
     else
     {
-        for(size_t i = 0; i < ext_input2_ndim; ++i)
+        for (size_t i = 0; i < ext_input2_ndim; ++i)
         {
             ext_input2_shape[i] = input2_shape[i];
             ext_input2_strides[i] = input2_strides[i];
@@ -258,7 +263,7 @@ void dpnp_dot_c(void* result_out,
     }
     else
     {
-        for(size_t i = 0; i < ext_result_ndim; ++i)
+        for (size_t i = 0; i < ext_result_ndim; ++i)
         {
             ext_result_shape[i] = result_shape[i];
         }
@@ -274,21 +279,25 @@ void dpnp_dot_c(void* result_out,
         // (looks like there are such another cases)
         if ((ext_input1_ndim == 2 && ext_input2_ndim == 2) &&
             (ext_input1_strides[0] == 1 || ext_input1_strides[1] == 1) &&
-            (ext_input2_strides[0] == 1 || ext_input2_strides[1] == 1)
-            )
+            (ext_input2_strides[0] == 1 || ext_input2_strides[1] == 1))
         {
 // there is a difference of behavior with trans and sizes params in previous version of GEMM
 // only new version is supported, in case of old version computation goes in common way
 #if INTEL_MKL_VERSION >= 20210004
-            oneapi::mkl::transpose trans1 = ext_input1_strides[0] == 1 ? oneapi::mkl::transpose::trans : oneapi::mkl::transpose::nontrans;
-            oneapi::mkl::transpose trans2 = ext_input2_strides[0] == 1 ? oneapi::mkl::transpose::trans : oneapi::mkl::transpose::nontrans;
+            oneapi::mkl::transpose trans1 =
+                ext_input1_strides[0] == 1 ? oneapi::mkl::transpose::trans : oneapi::mkl::transpose::nontrans;
+            oneapi::mkl::transpose trans2 =
+                ext_input2_strides[0] == 1 ? oneapi::mkl::transpose::trans : oneapi::mkl::transpose::nontrans;
 
             const size_t size_m = ext_input1_shape[0];
             const size_t size_n = ext_input2_shape[1];
             const size_t size_k = ext_input1_shape[1];
 
-            const std::int64_t lda = trans1 == oneapi::mkl::transpose::nontrans ? ext_input1_strides[0] : ext_input1_strides[1];
-            const std::int64_t ldb = trans2 == oneapi::mkl::transpose::nontrans ? ext_input2_strides[0] : ext_input2_strides[1];;
+            const std::int64_t lda =
+                trans1 == oneapi::mkl::transpose::nontrans ? ext_input1_strides[0] : ext_input1_strides[1];
+            const std::int64_t ldb =
+                trans2 == oneapi::mkl::transpose::nontrans ? ext_input2_strides[0] : ext_input2_strides[1];
+            ;
             // defenition of ldc will be another for result with non-standard (c-contiguous) strides
             // const std::int64_t ldc = result_strides[0] == 1 ? result_strides[1] : result_strides[0];
             const std::int64_t ldc = size_n;
@@ -326,20 +335,20 @@ void dpnp_dot_c(void* result_out,
     size_t* result_offsets = new size_t[ext_result_ndim];
     get_shape_offsets_inkernel(ext_result_shape, ext_result_ndim, result_offsets);
 
-    for(size_t i = 0; i < result_size; ++i)
+    for (size_t i = 0; i < result_size; ++i)
     {
         get_xyz_by_id(i, ext_result_ndim, result_offsets, res_coords);
 
         _DataType_output* dot_res = result + i;
 
         _DataType_input1* dot_in1 = input1;
-        for(size_t j = 0; j < ext_input1_ndim - 1; ++j)
+        for (size_t j = 0; j < ext_input1_ndim - 1; ++j)
         {
             dot_in1 = dot_in1 + res_coords[j] * ext_input1_strides[j];
         }
 
         _DataType_input2* dot_in2 = input2;
-        for(size_t j = 0; j < ext_input2_ndim - 2; ++j)
+        for (size_t j = 0; j < ext_input2_ndim - 2; ++j)
         {
             dot_in2 = dot_in2 + res_coords[ext_input1_ndim - 1 + j] * ext_input2_strides[j];
         }
@@ -357,7 +366,6 @@ void dpnp_dot_c(void* result_out,
     delete[] ext_input2_shape;
     delete[] ext_input2_strides;
     delete[] ext_result_shape;
-
 }
 
 template <typename _DataType, typename _ResultType>
 
@@ -163,7 +163,6 @@ void dpnp_count_nonzero_c(void* array1_in, void* result1_out, size_t size)
     _DataType_input* array1 = input1_ptr.get_ptr();
     _DataType_output* result1 = result_ptr.get_ptr();
 
-
     result1[0] = 0;
 
     for (size_t i = 0; i < size; ++i)
 
@@ -34,10 +34,9 @@
 
 #include <dpnp_iface_fptr.hpp>
 
-#define LIBSYCL_VERSION_GREATER(major, minor, patch)                                                                \
-    (__LIBSYCL_MAJOR_VERSION > major)                                                                               \
-    || (__LIBSYCL_MAJOR_VERSION == major and __LIBSYCL_MINOR_VERSION > minor)                                       \
-    || (__LIBSYCL_MAJOR_VERSION == major and __LIBSYCL_MINOR_VERSION == minor and __LIBSYCL_PATCH_VERSION >= patch)
+#define LIBSYCL_VERSION_GREATER(major, minor, patch)                                                                   \
+    (__LIBSYCL_MAJOR_VERSION > major) || (__LIBSYCL_MAJOR_VERSION == major and __LIBSYCL_MINOR_VERSION > minor) ||     \
+        (__LIBSYCL_MAJOR_VERSION == major and __LIBSYCL_MINOR_VERSION == minor and __LIBSYCL_PATCH_VERSION >= patch)
 
 /**
  * @defgroup BACKEND_UTILS Backend C++ library utilities
@@ -93,7 +92,7 @@ void get_xyz_by_id(size_t idx, size_t ndim, const _DataType* offsets, _DataType*
     size_t quotient;
     size_t remainder = idx;
 
-    for(size_t i = 0; i < ndim; ++i)
+    for (size_t i = 0; i < ndim; ++i)
     {
         quotient = remainder / offsets[i];
         remainder = remainder - quotient * offsets[i];
 
@@ -221,7 +221,7 @@ cdef extern from "dpnp_iface.hpp" namespace "QueueOptions":  # need this namespa
         AUTO_SELECTOR
 
 cdef extern from "constants.hpp":
-    void dpnp_python_constants_initialize_c(void* py_none, void* py_nan)
+    void dpnp_python_constants_initialize_c(void * py_none, void * py_nan)
 
 cdef extern from "dpnp_iface.hpp":
     void dpnp_queue_initialize_c(QueueOptions selector)
 
@@ -73,10 +73,10 @@ include "dpnp_algo_statistics.pyx"
 include "dpnp_algo_trigonometric.pyx"
 
 
-ctypedef void(*fptr_dpnp_arange_t)(size_t, size_t, void * , size_t)
-ctypedef void(*fptr_dpnp_astype_t)(const void * , void * , const size_t)
-ctypedef void(*fptr_dpnp_flatten_t)(const void * , void * , const size_t)
-ctypedef void(*fptr_dpnp_initval_t)(void * , void * , size_t)
+ctypedef void(*fptr_dpnp_arange_t)(size_t, size_t, void *, size_t)
+ctypedef void(*fptr_dpnp_astype_t)(const void *, void * , const size_t)
+ctypedef void(*fptr_dpnp_flatten_t)(const void *, void * , const size_t)
+ctypedef void(*fptr_dpnp_initval_t)(void *, void * , size_t)
 
 
 cpdef utils.dpnp_descriptor dpnp_arange(start, stop, step, dtype):
@@ -190,8 +190,8 @@ cpdef dpnp_queue_initialize():
         queue_type = GPU_SELECTOR
 
     dpnp_queue_initialize_c(queue_type)
-    dpnp_python_constants_initialize_c(<void*> None,
-                                       <void*> dpnp.nan)
+    dpnp_python_constants_initialize_c(< void*> None,
+                                        < void * > dpnp.nan)
 
     # TODO:
     # choose seed number as is in numpy
@@ -283,7 +283,7 @@ cdef utils.dpnp_descriptor call_fptr_1in_1out(DPNPFuncName fptr_name,
     """ get the FPTR data structure """
     cdef DPNPFuncData kernel_data = get_dpnp_function_ptr(fptr_name, param1_type, param1_type)
 
-    result_type = dpnp_DPNPFuncType_to_dtype(< size_t > kernel_data.return_type)
+    result_type = dpnp_DPNPFuncType_to_dtype( < size_t > kernel_data.return_type)
 
     cdef utils.dpnp_descriptor result
 
@@ -320,7 +320,7 @@ cdef utils.dpnp_descriptor call_fptr_2in_1out(DPNPFuncName fptr_name,
     # get the FPTR data structure
     cdef DPNPFuncData kernel_data = get_dpnp_function_ptr(fptr_name, x1_c_type, x2_c_type)
 
-    result_type = dpnp_DPNPFuncType_to_dtype(< size_t > kernel_data.return_type)
+    result_type = dpnp_DPNPFuncType_to_dtype( < size_t > kernel_data.return_type)
 
     # Create result array
     cdef shape_type_c x1_shape = x1_obj.shape
 
@@ -54,28 +54,28 @@ __all__ += [
     "dpnp_triu_indices_from"
 ]
 
-ctypedef void(*fptr_dpnp_choose_t)(void * , void * , void **, size_t, size_t, size_t)
-ctypedef void(*fptr_dpnp_diag_indices)(void*, size_t)
-ctypedef void(*custom_indexing_2in_1out_func_ptr_t)(void *, const size_t, void * , void * , size_t)
-ctypedef void(*custom_indexing_2in_1out_func_ptr_t_)(void * , const size_t, void * , const size_t, size_t * , size_t * , const size_t)
-ctypedef void(*custom_indexing_2in_func_ptr_t)(void *, void * , size_t * , const size_t)
-ctypedef void(*custom_indexing_3in_func_ptr_t)(void * , void * , void * , const size_t, const size_t)
-ctypedef void(*custom_indexing_3in_with_axis_func_ptr_t)(void * , void * , void * , const size_t, size_t * , const size_t,
+ctypedef void(*fptr_dpnp_choose_t)(void * , void * , void ** , size_t, size_t, size_t)
+ctypedef void(*fptr_dpnp_diag_indices)(void *, size_t)
+ctypedef void(*custom_indexing_2in_1out_func_ptr_t)(void * , const size_t, void * , void * , size_t)
+ctypedef void(*custom_indexing_2in_1out_func_ptr_t_)(void *, const size_t, void * , const size_t, size_t * , size_t * , const size_t)
+ctypedef void(*custom_indexing_2in_func_ptr_t)(void * , void * , size_t * , const size_t)
+ctypedef void(*custom_indexing_3in_func_ptr_t)(void *, void * , void * , const size_t, const size_t)
+ctypedef void(*custom_indexing_3in_with_axis_func_ptr_t)(void *, void * , void * , const size_t, size_t * , const size_t,
                                                          const size_t, const size_t,)
-ctypedef void(*custom_indexing_6in_func_ptr_t)(void *, void * , void * , const size_t, const size_t, const size_t)
-ctypedef void(*fptr_dpnp_nonzero_t)(const void * , void * , const size_t, const size_t * , const size_t , const size_t)
+ctypedef void(*custom_indexing_6in_func_ptr_t)(void * , void * , void * , const size_t, const size_t, const size_t)
+ctypedef void(*fptr_dpnp_nonzero_t)(const void *, void * , const size_t, const size_t * , const size_t , const size_t)
 
 
 cpdef utils.dpnp_descriptor dpnp_choose(utils.dpnp_descriptor input, list choices1):
-    cdef vector[void * ] choices
+    cdef vector[void *] choices
     cdef utils.dpnp_descriptor choice
     for desc in choices1:
         choice = desc
         choices.push_back(choice.get_data())
 
     cdef shape_type_c input_shape = input.shape
     cdef size_t choice_size = choices1[0].size
-        
+
     cdef DPNPFuncType param1_type = dpnp_dtype_to_DPNPFuncType(input.dtype)
 
     cdef DPNPFuncType param2_type = dpnp_dtype_to_DPNPFuncType(choices1[0].dtype)
@@ -84,7 +84,7 @@ cpdef utils.dpnp_descriptor dpnp_choose(utils.dpnp_descriptor input, list choice
 
     cdef utils.dpnp_descriptor res_array = utils.create_output_descriptor(input_shape, kernel_data.return_type, None)
 
-    cdef fptr_dpnp_choose_t func = <fptr_dpnp_choose_t> kernel_data.ptr
+    cdef fptr_dpnp_choose_t func = <fptr_dpnp_choose_t > kernel_data.ptr
 
     func(res_array.get_data(),
          input.get_data(),
@@ -102,9 +102,9 @@ cpdef tuple dpnp_diag_indices(n, ndim):
     cdef DPNPFuncType param1_type = dpnp_dtype_to_DPNPFuncType(dpnp.int64)
 
     cdef DPNPFuncData kernel_data = get_dpnp_function_ptr(DPNP_FN_DIAG_INDICES, param1_type, param1_type)
-    
-    cdef fptr_dpnp_diag_indices func = <fptr_dpnp_diag_indices> kernel_data.ptr
-    
+
+    cdef fptr_dpnp_diag_indices func = <fptr_dpnp_diag_indices > kernel_data.ptr
+
     res_list = []
     cdef utils.dpnp_descriptor res_arr
     cdef shape_type_c result_shape = utils._object_to_tuple(res_size)
@@ -114,7 +114,7 @@ cpdef tuple dpnp_diag_indices(n, ndim):
         func(res_arr.get_data(), res_size)
 
         res_list.append(res_arr.get_pyobj())
- 
+
     return tuple(res_list)
 
 cpdef utils.dpnp_descriptor dpnp_diagonal(dpnp_descriptor input, offset=0):
@@ -321,7 +321,7 @@ cpdef utils.dpnp_descriptor dpnp_select(list condlist, list choicelist, default)
 
 cpdef utils.dpnp_descriptor dpnp_take(utils.dpnp_descriptor input, utils.dpnp_descriptor indices):
     cdef DPNPFuncType param1_type = dpnp_dtype_to_DPNPFuncType(input.dtype)
-    
+
     cdef DPNPFuncData kernel_data = get_dpnp_function_ptr(DPNP_FN_TAKE, param1_type, param1_type)
 
     cdef utils.dpnp_descriptor result = utils.create_output_descriptor(indices.shape, kernel_data.return_type, None)
 
@@ -44,10 +44,10 @@ __all__ += [
 
 
 # C function pointer to the C library template functions
-ctypedef void(*fptr_2in_1out_shapes_t)(void *, void * , void * , size_t * , size_t * , size_t * , size_t)
-ctypedef void(*fptr_2in_1out_dot_t)(void * , const size_t, const size_t, const long * , const long * ,
-                                    void * , const size_t, const size_t, const long * , const long * ,
-                                    void * , const size_t, const size_t, const long * , const long * )
+ctypedef void(*fptr_2in_1out_shapes_t)(void * , void * , void * , size_t * , size_t * , size_t * , size_t)
+ctypedef void(*fptr_2in_1out_dot_t)(void *, const size_t, const size_t, const long * , const long * ,
+                                    void *, const size_t, const size_t, const long * , const long * ,
+                                    void *, const size_t, const size_t, const long * , const long * )
 
 cdef shape_type_c strides_to_vector(strides, shape) except *:
     cdef shape_type_c res
@@ -80,9 +80,9 @@ cpdef utils.dpnp_descriptor dpnp_dot(utils.dpnp_descriptor in_array1, utils.dpnp
         result_shape = shape1
     elif ndim1 == 1 and ndim2 == 1:
         result_shape = ()
-    elif ndim1 == 1: # ndim2 > 1
+    elif ndim1 == 1:  # ndim2 > 1
         result_shape = shape2[:-1]
-    elif ndim2 == 1: # ndim1 > 1
+    elif ndim2 == 1:  # ndim1 > 1
         result_shape = shape1[:-1]
     else:
         if ndim1 == 1:
@@ -177,7 +177,8 @@ cpdef utils.dpnp_descriptor dpnp_inner(dpnp_descriptor array1, dpnp_descriptor a
         # do inner product
         result.get_pyobj()[numpy.unravel_index(idx1, result.shape)] = 0
         for idx2 in range(array1.shape[-1]):
-            result.get_pyobj()[numpy.unravel_index(idx1, result.shape)] += array1.get_pyobj()[numpy.unravel_index(array1_lin_index_base + idx2, array1.shape)] * array2.get_pyobj()[numpy.unravel_index(array2_lin_index_base + idx2, array2.shape)]
+            result.get_pyobj()[numpy.unravel_index(idx1, result.shape)] += array1.get_pyobj()[numpy.unravel_index(
+                array1_lin_index_base + idx2, array1.shape)] * array2.get_pyobj()[numpy.unravel_index(array2_lin_index_base + idx2, array2.shape)]
 
     return result
 
@@ -280,18 +281,18 @@ cpdef utils.dpnp_descriptor dpnp_matmul(utils.dpnp_descriptor in_array1, utils.d
     func(result.get_data(),
          result.size,
          result.ndim,
-         NULL, # result_shape
-         NULL, # result_strides
+         NULL,  # result_shape
+         NULL,  # result_strides
          in_array1.get_data(),
          in_array1.size,
          in_array1.ndim,
          shape1.data(),
-         NULL, # in_array1_strides
+         NULL,  # in_array1_strides
          in_array2.get_data(),
          in_array2.size,
          in_array2.ndim,
          shape2.data(),
-         NULL) # in_array2_strides
+         NULL)  # in_array2_strides
 
     return result
 
 
@@ -81,10 +81,10 @@ def create_output_container(shape, type):
         """ Create DPNP array """
         result = dparray(shape, dtype=type)
 
-    return result    
+    return result
 
 
-def container_copy(dst_obj, src_obj, dst_idx = 0):
+def container_copy(dst_obj, src_obj, dst_idx=0):
     """
     Copy values to `dst` by iterating element by element in `input_obj`
     """
 
@@ -169,6 +169,7 @@ def astype(x1, dtype, order='K', casting='unsafe', subok=True, copy=True):
 
     return call_origin(numpy.ndarray.astype, x1, dtype, order=order, casting=casting, subok=subok, copy=copy)
 
+
 def convert_single_elem_array_to_scalar(obj, keepdims=False):
     """
     Convert array with single element to scalar