Tensorium_lib/Vector_8hpp_source.html

#pragma once


#include "../MathUtils/MathsUtils.hpp"

#include "../SIMD/Allocator.hpp"

#include "../SIMD/CPU_id.hpp"

#include "../SIMD/SIMD.hpp"

#include <cassert>

#include <cmath>

#include <iostream>

#include <vector>


namespace tensorium {


template <typename K> class Vector {

  public:

    aligned_vector<K> data;


    Vector(const std::vector<K> &vec) : data(vec.begin(), vec.end()) {}


    K       &operator[](size_t i) { return data[i]; }

    const K &operator[](size_t i) const { return data[i]; }

    const K &operator()(size_t i) const { return data[i]; }

    K       &operator()(size_t i) { return data[i]; }

    Vector(size_t n) : data(n, K()) {}

    Vector(std::initializer_list<K> init) : data(init) {}

    Vector(size_t n, K value) : data(n, value) {}


    auto begin() { return data.begin(); }

    auto end() { return data.end(); }

    auto begin() const { return data.begin(); }

    auto end() const { return data.end(); }


    size_t size() const { return data.size(); }

    void   resize(size_t n) { data.resize(n); }


    void print() const {

        std::cout << "Vector size: " << size() << "\n";

        for (float f : data)

            std::cout << "[" << f << "]\n";

    }


    static Vector<K> canonical(int index, K dx, K dy, K dz) {

        Vector<K> out(3, K(0));

        if (index == 0)

            out(0) = dx;

        else if (index == 1)

            out(1) = dy;

        else if (index == 2)

            out(2) = dz;

        else

            throw std::invalid_argument("Index must be 0, 1, or 2");

        return out;

    }


    __attribute__((always_inline, hot, flatten)) Vector<K> operator-(const Vector<K> &other) const {

        Vector<K> result(data.size());

        size_t    m = std::min(data.size(), other.data.size());

        for (size_t i = 0; i < m; ++i)

            result[i] = data[i] - other[i];

        for (size_t i = m; i < data.size(); ++i)

            result[i] = data[i];

        return result;

    }


    __attribute__((always_inline, hot, flatten)) inline void add(const Vector &v) {

        if (v.size() != size())

            throw std::invalid_argument("Vector sizes do not match");

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        size_t       n = size();

        size_t       i = 0;


        _mm_prefetch((const char *)&v.data[0], _MM_HINT_T0);


        for (; i + 15 < n; i += 16) {

            reg a0 = Simd::load(&data[i]);

            reg b0 = Simd::load(&v.data[i]);

            a0 = Simd::add(a0, b0);

            Simd::store(&data[i], a0);


            reg a1 = Simd::load(&data[i + simd_width]);

            reg b1 = Simd::load(&v.data[i + simd_width]);

            a1 = Simd::add(a1, b1);

            Simd::store(&data[i + simd_width], a1);

        }


        for (; i < n; ++i)

            data[i] += v.data[i];

    }


    __attribute__((always_inline, hot, flatten)) inline void sub(const Vector &v) {

        if (v.size() != size())

            throw std::invalid_argument("Vector sizes do not match");

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        size_t       n = size();

        size_t       i = 0;


        _mm_prefetch((const char *)&v.data[0], _MM_HINT_T0);

        for (; i + 15 < n; i += 16) {

            reg a0 = Simd::load(&data[i]);

            reg b0 = Simd::load(&v.data[i]);

            a0 = Simd::sub(a0, b0);

            Simd::store(&data[i], a0);


            reg a1 = Simd::load(&data[i + simd_width]);

            reg b1 = Simd::load(&v.data[i + simd_width]);

            a1 = Simd::sub(a1, b1);

            Simd::store(&data[i + simd_width], a1);

        }


        for (; i < n; ++i)

            data[i] -= v.data[i];

    }


    __attribute__((always_inline, hot, flatten)) inline void scl(float a) {

        size_t n = size();

        size_t i = 0;

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        _mm_prefetch((const char *)&data[0], _MM_HINT_T0);

        reg scalar = Simd::set1(a);

        float *__restrict out = &data[0];


        for (; i + 15 < n; i += 16) {

            reg v0 = Simd::load(out + i);

            v0 = Simd::mul(v0, scalar);

            Simd::store(out + i, v0);


            reg v1 = Simd::load(out + i + simd_width);

            v1 = Simd::mul(v1, scalar);

            Simd::store(out + i + simd_width, v1);

        }


        for (; i < n; ++i)

            out[i] *= a;

    }


    __attribute__((always_inline, hot, flatten)) static inline Vector<float>

    linear_combination(const std::vector<Vector<float>> &u, const std::vector<float> &coefs) {

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;


        if (u.size() != coefs.size())

            throw std::invalid_argument("Mismatched number of vectors and coefficients");

        if (u.empty())

            return Vector<float>(0);


        const size_t n = u[0].size();

        for (const auto &v : u)

            if (v.size() != n)

                throw std::invalid_argument("Vector sizes do not match");


        Vector<float> result(n);


        size_t           i = 0;

        constexpr size_t W = simd_width;

        for (; i + W - 1 < n; i += W) {

            reg acc = Simd::zero();

            for (size_t j = 0; j < u.size(); ++j) {

                reg v = Simd::load(&u[j].data[i]);

                reg c = Simd::set1(coefs[j]);

                acc = Simd::fmadd(v, c, acc);

            }

            Simd::store(&result.data[i], acc);

        }


        for (; i < n; ++i) {

            float acc = 0.f;

            for (size_t j = 0; j < u.size(); ++j)

                acc += coefs[j] * u[j].data[i];

            result.data[i] = acc;

        }


        return result;

    }


    __attribute__((always_inline, hot, flatten)) static inline Vector<float>

    lerp(const Vector<float> &a, const Vector<float> &b, float t) {

        if (a.size() != b.size())

            throw std::invalid_argument("Vector sizes do not match");

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;


        const size_t  n = a.size();

        Vector<float> result(n);


        const reg vt = Simd::set1(t);

        const reg vt1 = Simd::sub(Simd::set1(1.0f), vt);


        size_t i = 0;

        _mm_prefetch((const char *)&a.data[0], _MM_HINT_T0);


        for (; i + 7 < n; i += simd_width) {

            reg va = Simd::load(&a.data[i]);

            reg vb = Simd::load(&b.data[i]);


            reg r = Simd::fmadd(vb, vt, Simd::mul(va, vt1));


            Simd::store_stream(&result.data[i], r);

        }


        for (; i < n; ++i)

            result.data[i] = (1.0f - t) * a.data[i] + t * b.data[i];


        return result;

    }


    __attribute__((always_inline, hot, flatten)) inline float dot(const Vector<float> &v) const {

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        if (v.size() != size())

            throw std::invalid_argument("Vector sizes do not match");

        const size_t n = size();

        size_t       i = 0;

        reg          acc = Simd::zero();


        const float *__restrict a_ptr = &data[0];

        const float *__restrict b_ptr = &v.data[0];

        _mm_prefetch((const char *)&v.data[0], _MM_HINT_T0);

        for (; i + 7 < n; i += simd_width) {

            reg a = Simd::load(a_ptr + i);

            reg b = Simd::load(b_ptr + i);

            acc = Simd::fmadd(a, b, acc);

        }


        float result = detail::reduce_sum(acc);


        for (; i < n; ++i)

            result += a_ptr[i] * b_ptr[i];


        return result;

    }


    __attribute__((always_inline, hot, flatten)) inline float norm_1() const {

        size_t n = size();

        size_t i = 0;

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        reg          acc = Simd::zero();

        reg          sign_mask = Simd::set1(-0.0f);

        const float *__restrict v_ptr = &data[0];

        _mm_prefetch((const char *)&data[0], _MM_HINT_T0);

        for (; i + 7 < n; i += simd_width) {

            reg v = Simd::load(v_ptr + i);

            reg abs_v = Simd::andnot(sign_mask, v);

            acc = Simd::add(acc, abs_v);

        }


        float result = detail::reduce_sum(acc);


        for (; i < n; ++i)

            result += MathsUtils::_fabs(v_ptr[i]);


        return result;

    }


    __attribute__((always_inline, hot, flatten)) inline float norm_2() const {

        size_t n = size();

        size_t i = 0;

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        reg          acc = Simd::zero();

        const float *__restrict v_ptr = &data[0];

        _mm_prefetch((const char *)&data[0], _MM_HINT_T0);

        for (; i + 7 < n; i += simd_width) {

            reg v = Simd::load(v_ptr + i);

            acc = Simd::fmadd(v, v, acc);

        }


        float result = detail::reduce_sum(acc);


        for (; i < n; ++i)

            result += v_ptr[i] * v_ptr[i];


        return std::pow(result, 0.5f);

    }


    __attribute__((always_inline, hot, flatten)) inline float norm_inf() const {

        size_t n = size();

        size_t i = 0;

        using Simd = simd::SimdTraits<K, DefaultISA>;

        using reg = typename Simd::reg;

        const size_t simd_width = Simd::width;

        reg          max_v = Simd::zero();

        reg          sign_mask = Simd::set1(-0.0f);

        const float *__restrict v_ptr = &data[0];

        _mm_prefetch((const char *)&data[0], _MM_HINT_T0);

        for (; i + 7 < n; i += simd_width) {

            reg v = Simd::load(v_ptr + i);

            reg abs_v = Simd::andnot(sign_mask, v);

            max_v = Simd::max(max_v, abs_v);

        }


        float result = detail::reduce_sum(max_v);


        for (; i < n; ++i)

            result = MathsUtils::_max(result, MathsUtils::_fabs(v_ptr[i]));


        return result;

    }


    __attribute__((always_inline, hot, flatten)) static inline float

    angle_cos(const Vector<float> &u, const Vector<float> &v) {

        if (u.size() != v.size())

            throw std::invalid_argument("Vector sizes do not match");


        const float dot = u.dot(v);

        const float norm_u = u.norm_2();

        const float norm_v = v.norm_2();


        return dot / (norm_u * norm_v);

    }


    __attribute__((always_inline, hot, flatten)) static inline Vector<float>

    cross_product(const Vector<float> &u, const Vector<float> &v) {

        if (u.size() != 3 || v.size() != 3)

            throw std::invalid_argument("Cross product is only defined for 3D vectors.");


        Vector<float> r(3);


        __m128 uxy = _mm_set_ps(0.0f, u.data[0], u.data[2], u.data[1]);

        __m128 vxy = _mm_set_ps(0.0f, v.data[0], v.data[2], v.data[1]);


        r.data[0] = std::fma(u.data[1], v.data[2], -u.data[2] * v.data[1]);

        r.data[1] = std::fma(u.data[2], v.data[0], -u.data[0] * v.data[2]);

        r.data[2] = std::fma(u.data[0], v.data[1], -u.data[1] * v.data[0]);


        return r;

    }

};


template <typename K> inline Vector<K> operator+(const Vector<K> &a, const Vector<K> &b) {

    size_t    n = a.size();

    Vector<K> result(n);

    size_t    m = std::min(n, b.size());

    for (size_t i = 0; i < m; ++i)

        result[i] = a[i] + b[i];

    for (size_t i = m; i < n; ++i)

        result[i] = a[i];

    return result;

}


template <typename K> inline Vector<K> operator-(const Vector<K> &a, const Vector<K> &b) {

    assert(a.size() == b.size());

    Vector<K> result(a.size());

    for (size_t i = 0; i < a.size(); ++i)

        result[i] = a[i] - b[i];

    return result;

}


} // namespace tensorium

Allocator.hpp

CPU_id.hpp

MathsUtils.hpp

SIMD.hpp

MathsUtils::_max
static double _max(double a, double b)
Definition MathsUtils.hpp:21

MathsUtils::_fabs
static float _fabs(float a)
Definition MathsUtils.hpp:13

tensorium::Tensor
Multi-dimensional tensor class with fixed rank and SIMD support.
Definition Tensor.hpp:25

tensorium::Tensor::resize
void resize(const std::array< size_t, Rank > &dims)
Resize 2D tensor.
Definition Tensor.hpp:70

tensorium::Tensor::data
aligned_vector< K > data
Definition Tensor.hpp:31

tensorium::Vector
Aligned, SIMD-optimized mathematical vector class for scientific computing.
Definition Vector.hpp:26

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline float dot(const Vector< float > &v) const
Compute the dot product with another vector.
Definition Vector.hpp:303

tensorium::Vector::Vector
Vector(size_t n, K value)
Construct a constant vector.
Definition Vector.hpp:62

tensorium::Vector::i
size_t i
Definition Vector.hpp:277

tensorium::Vector::r
Vector< float > r(3)

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) static inline Vector< float > cross_product(const Vector< float > &u
Compute the cross product between two 3D vectors.

tensorium::Vector::operator()
const K & operator()(size_t i) const
Definition Vector.hpp:45

tensorium::Vector::uxy
__m128 uxy
Definition Vector.hpp:441

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) Vector< K > operator-(const Vector< K > &other) const
Subtract two vectors.
Definition Vector.hpp:112

tensorium::Vector::simd_width
const size_t simd_width
Definition Vector.hpp:269

tensorium::Vector::result
Vector< float > result(n)

tensorium::Vector::norm_v
const float norm_v
Definition Vector.hpp:423

tensorium::Vector::_mm_prefetch
_mm_prefetch((const char *)&a.data[0], _MM_HINT_T0)

tensorium::Vector::operator[]
const K & operator[](size_t i) const
Definition Vector.hpp:44

tensorium::Vector::Vector
Vector(std::initializer_list< K > init)
Construct from an initializer list.
Definition Vector.hpp:56

tensorium::Vector::end
auto end()
Definition Vector.hpp:68

tensorium::Vector::vt
const reg vt
Definition Vector.hpp:274

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline void scl(float a)
Scale this vector by a scalar (in-place).
Definition Vector.hpp:185

tensorium::Vector::end
auto end() const
Definition Vector.hpp:70

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) static inline Vector< float > lerp(const Vector< float > &a
Linearly interpolate between two vectors.

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline void sub(const Vector &v)
Subtract another vector from this one (in-place).
Definition Vector.hpp:156

tensorium::Vector::resize
void resize(size_t n)
Definition Vector.hpp:77

tensorium::Vector::r
return r
Definition Vector.hpp:448

tensorium::Vector::reg
typename Simd::reg reg
Definition Vector.hpp:268

tensorium::Vector::Vector
Vector(const std::vector< K > &vec)
Construct from a standard vector.
Definition Vector.hpp:37

tensorium::Vector::n
const size_t n
Definition Vector.hpp:271

tensorium::Vector::dot
const float dot
Definition Vector.hpp:421

tensorium::Vector::print
void print() const
Print the vector to stdout.
Definition Vector.hpp:87

tensorium::Vector::Vector
Vector(size_t n)
Construct an empty vector of size n.
Definition Vector.hpp:51

tensorium::Vector::begin
auto begin() const
Definition Vector.hpp:69

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline float norm_2() const
Compute the 2-norm (Euclidean norm).
Definition Vector.hpp:361

tensorium::Vector::b
const Vector< float > & b
Definition Vector.hpp:264

tensorium::Vector::v
const Vector< float > & v
Definition Vector.hpp:417

tensorium::Vector::data
aligned_vector< K > data
Underlying aligned data storage (SIMD-friendly).
Definition Vector.hpp:29

tensorium::Vector::size
size_t size() const
Definition Vector.hpp:76

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) static inline float angle_cos(const Vector< float > &u
Compute the cosine of the angle between two vectors.

tensorium::Vector::result
return result
Definition Vector.hpp:291

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline float norm_inf() const
Compute the infinity norm (maximum absolute value).
Definition Vector.hpp:386

tensorium::Vector::begin
auto begin()
Definition Vector.hpp:67

tensorium::Vector::operator()
K & operator()(size_t i)
Definition Vector.hpp:46

tensorium::Vector::vt1
const reg vt1
Definition Vector.hpp:275

tensorium::Vector::operator[]
K & operator[](size_t i)
Definition Vector.hpp:43

tensorium::Vector::vxy
__m128 vxy
Definition Vector.hpp:442

tensorium::Vector::norm_u
const float norm_u
Definition Vector.hpp:422

tensorium::Vector::canonical
static Vector< K > canonical(int index, K dx, K dy, K dz)
Definition Vector.hpp:95

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) static inline Vector< float > linear_combination(const std
Compute the linear combination of vectors with coefficients.
Definition Vector.hpp:216

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline void add(const Vector &v)
Add another vector to this one (in-place).
Definition Vector.hpp:126

tensorium::Vector::t
const Vector< float > float t
Definition Vector.hpp:264

tensorium::Vector::__attribute__
__attribute__((always_inline, hot, flatten)) inline float norm_1() const
Compute the 1-norm (sum of absolute values).
Definition Vector.hpp:334

tensorium
Definition Derivate.hpp:24

tensorium::operator-
Vector< K > operator-(const Vector< K > &a, const Vector< K > &b)
Definition Vector.hpp:463

tensorium::operator+
Vector< K > operator+(const Vector< K > &a, const Vector< K > &b)
Definition Vector.hpp:452

simd::SimdTraits
Definition SIMD.hpp:177