lamppp/kernels_8hpp_source.html

#pragma once


#include <cmath>

#include "lamppp/tensor/device_type.hpp"

#include "lamppp/tensor/dispatch_stub.hpp"

#include "lamppp/tensor/native/unary_ops.hpp"

#include "lamppp/tensor/native/matrix_ops.hpp"

#include "lamppp/tensor/tensor_impl.hpp"


namespace lmp::tensor::detail::cpu {


template <typename T>


struct AddFunctor {

  T operator()(T arg1, T arg2) { return arg1 + arg2; }

};


template <typename T>


struct SubFunctor {

  T operator()(T arg1, T arg2) { return arg1 - arg2; }

};


template <typename T>


struct MulFunctor {

  T operator()(T arg1, T arg2) { return arg1 * arg2; }

};


template <typename T>


struct DivFunctor {

  T operator()(T arg1, T arg2) { return arg1 / arg2; }

};


template <typename T>


struct PowFunctor {

  T operator()(T arg1, T arg2) { return ::std::pow(arg1, arg2); }

};


template <typename T>


struct EqFunctor {

  T operator()(T arg1, T arg2) { return arg1 == arg2; }

};


template <typename T>


struct NeFunctor {

  T operator()(T arg1, T arg2) { return arg1 != arg2; }

};


template <typename T>


struct LeFunctor {

  T operator()(T arg1, T arg2) { return arg1 <= arg2; }

};


template <typename T>


struct LtFunctor {

  T operator()(T arg1, T arg2) { return arg1 < arg2; }

};


template <typename T>


struct GtFunctor {

  T operator()(T arg1, T arg2) { return arg1 > arg2; }

};


template <typename T>


struct GeFunctor {

  T operator()(T arg1, T arg2) { return arg1 >= arg2; }

};


template <typename T>


struct NegFunctor {

  T operator()(T arg) { return (-arg); }

};


template <typename T>


struct LogFunctor {

  T operator()(T arg) {

    return static_cast<T>(::log(static_cast<double>(arg)));

  }

};


template <typename T>


struct ExpFunctor {

  T operator()(T arg) {

    return static_cast<T>(::exp(static_cast<double>(arg)));

  }

};


template <typename T>


struct SqrtFunctor {

  T operator()(T arg) {

    return static_cast<T>(::sqrt(static_cast<double>(arg)));

  }

};


template <typename T>


struct AbsFunctor {

  T operator()(T arg) {

    return static_cast<T>(::std::abs(static_cast<double>(arg)));

  }

};


template <typename T>


struct SinFunctor {

  T operator()(T arg) {

    return static_cast<T>(::sin(static_cast<double>(arg)));

  }

};


template <typename T>


struct CosFunctor {

  T operator()(T arg) {

    return static_cast<T>(::cos(static_cast<double>(arg)));

  }

};


template <typename T>


struct TanFunctor {

  T operator()(T arg) {

    return static_cast<T>(::tan(static_cast<double>(arg)));

  }

};


template <typename T>


struct ClampFunctor {

  explicit ClampFunctor(Scalar min_val, Scalar max_val)

      : min_val_(min_val), max_val_(max_val) {}

  T operator()(T arg) {

    return arg < min_val_ ? min_val_ : (arg > max_val_ ? max_val_ : arg);

  }


 private:

  Scalar min_val_, max_val_;

};


template <typename T>


struct SumFunctor {

  static constexpr T kIdentity = 0;

  T operator()(T arg1, T arg2) { return arg1 + arg2; }

};


template <typename T>


struct MaxFunctor {

  static constexpr T kIdentity = std::numeric_limits<T>::lowest();

  T operator()(T arg1, T arg2) { return ::std::max(arg1, arg2); }

};


template <typename T>


struct MinFunctor {

  static constexpr T kIdentity = std::numeric_limits<T>::max();

  T operator()(T arg1, T arg2) { return ::std::min(arg1, arg2); }

};


template <typename T>


struct ProdFunctor {

  static constexpr T kIdentity = 1;

  T operator()(T arg1, T arg2) { return arg1 * arg2; }

};


TensorImpl add_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl sub_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl mul_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl div_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl pow_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl eq_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl ne_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl le_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl lt_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl ge_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl gt_cpu(const TensorImpl& a, const TensorImpl& b);


TensorImpl neg_cpu(const TensorImpl& a);

TensorImpl log_cpu(const TensorImpl& a);

TensorImpl exp_cpu(const TensorImpl& a);

TensorImpl sqrt_cpu(const TensorImpl& a);

TensorImpl abs_cpu(const TensorImpl& a);

TensorImpl sin_cpu(const TensorImpl& a);

TensorImpl cos_cpu(const TensorImpl& a);

TensorImpl tan_cpu(const TensorImpl& a);

TensorImpl clamp_cpu(const TensorImpl& a, Scalar min_val, Scalar max_val);


TensorImpl matmul_cpu(const TensorImpl& a, const TensorImpl& b);

TensorImpl transpose_cpu(const TensorImpl& a);


TensorImpl sum_cpu(const TensorImpl& a, size_t axis);

TensorImpl max_cpu(const TensorImpl& a, size_t axis);

TensorImpl min_cpu(const TensorImpl& a, size_t axis);

TensorImpl prod_cpu(const TensorImpl& a, size_t axis);


}  // namespace lmp::tensor::detail::cpu

lmp::tensor::TensorImpl
Main implementation class for Tensor object.
Definition tensor_impl.hpp:28

lmp::tensor::detail::cpu
Definition binary.cpp:4

lmp::tensor::detail::cpu::add_cpu
TensorImpl add_cpu(const TensorImpl &a, const TensorImpl &b)

lmp::tensor::detail::cpu::AbsFunctor
Definition kernels.hpp:80

lmp::tensor::detail::cpu::AddFunctor
Definition kernels.hpp:14

lmp::tensor::detail::cpu::ClampFunctor
Definition kernels.hpp:104

lmp::tensor::detail::cpu::CosFunctor
Definition kernels.hpp:92

lmp::tensor::detail::cpu::DivFunctor
Definition kernels.hpp:26

lmp::tensor::detail::cpu::EqFunctor
Definition kernels.hpp:34

lmp::tensor::detail::cpu::ExpFunctor
Definition kernels.hpp:68

lmp::tensor::detail::cpu::GeFunctor
Definition kernels.hpp:54

lmp::tensor::detail::cpu::GtFunctor
Definition kernels.hpp:50

lmp::tensor::detail::cpu::LeFunctor
Definition kernels.hpp:42

lmp::tensor::detail::cpu::LogFunctor
Definition kernels.hpp:62

lmp::tensor::detail::cpu::LtFunctor
Definition kernels.hpp:46

lmp::tensor::detail::cpu::MaxFunctor
Definition kernels.hpp:120

lmp::tensor::detail::cpu::MinFunctor
Definition kernels.hpp:125

lmp::tensor::detail::cpu::MulFunctor
Definition kernels.hpp:22

lmp::tensor::detail::cpu::NeFunctor
Definition kernels.hpp:38

lmp::tensor::detail::cpu::NegFunctor
Definition kernels.hpp:58

lmp::tensor::detail::cpu::PowFunctor
Definition kernels.hpp:30

lmp::tensor::detail::cpu::ProdFunctor
Definition kernels.hpp:130

lmp::tensor::detail::cpu::SinFunctor
Definition kernels.hpp:86

lmp::tensor::detail::cpu::SqrtFunctor
Definition kernels.hpp:74

lmp::tensor::detail::cpu::SubFunctor
Definition kernels.hpp:18

lmp::tensor::detail::cpu::SumFunctor
Definition kernels.hpp:115

lmp::tensor::detail::cpu::TanFunctor
Definition kernels.hpp:98