Go to the documentation of this file. 1 #ifndef L1Algo_F32vec4P4_H
2 #define L1Algo_F32vec4P4_H
29 static_cast<int>(0x80000000),
30 static_cast<int>(0x80000000),
31 static_cast<int>(0x80000000)}},
35 static_cast<int>(0xFFFFFFFF),
36 static_cast<int>(0xFFFFFFFF),
37 static_cast<int>(0xFFFFFFFF)}},
40 #define _f32vec4_abs_mask (static_cast<F32vec4>(__f32vec4_abs_mask_cheat.m))
41 #define _f32vec4_sgn_mask (static_cast<F32vec4>(__f32vec4_sgn_mask_cheat.m))
42 #define _f32vec4_zero (static_cast<F32vec4>(__f32vec4_zero_cheat.m))
43 #define _f32vec4_one (static_cast<F32vec4>(__f32vec4_one_cheat.m))
44 #define _f32vec4_true (static_cast<F32vec4>(__f32vec4_true_cheat.m))
45 #define _f32vec4_false (static_cast<F32vec4>(__f32vec4_false_cheat.m))
53 return (
reinterpret_cast<const float*
>(&
v))[
i];
60 F32vec4(
const float& f0,
const float& f1,
const float& f2,
const float& f3)
61 :
v(_mm_set_ps(f3, f2, f1, f0)) {}
64 operator __m128()
const {
return v; }
68 return _mm_add_ps(a, b);
71 return _mm_sub_ps(a, b);
74 return _mm_mul_ps(a, b);
77 return _mm_div_ps(a, b);
82 return _mm_min_ps(a, b);
85 return _mm_max_ps(a, b);
102 return _mm_sub_ps(_mm_add_ps(Ra0, Ra0),
103 _mm_mul_ps(_mm_mul_ps(Ra0, a), Ra0));
124 return _mm_and_ps(a, b);
128 return _mm_or_ps(a, b);
132 return _mm_xor_ps(a, b);
145 return _mm_cmplt_ps(a, b);
149 return _mm_cmple_ps(a, b);
153 return _mm_cmpgt_ps(a, b);
157 return _mm_cmpge_ps(a, b);
161 return _mm_cmpeq_ps(a, b);
164 #define if3(a, b, c) ((a) & (b)) | ((!(a)) & (c)) // analog (a) ? b : c
166 #define NotEmpty(a) bool((a)[0]) | bool((a)[1]) | bool((a)[2]) | bool((a)[3])
167 #define Empty(a) !(bool((a)[0]) | bool((a)[1]) | bool((a)[2]) | bool((a)[3]))
180 #define _f1(A, F) F32vec4(F(A[0]), F(A[1]), F(A[2]), F(A[3]))
210 b = (pi_2 & gt_tan_3pi_8) + (
F32vec4(!gt_tan_3pi_8) & b);
211 b = (pi_4 & gt_tan_pi_8) + (
F32vec4(!gt_tan_pi_8) & b);
212 a = (gt_tan_3pi_8 & (minusOne / a)) + (
F32vec4(!gt_tan_3pi_8) & a);
213 a = (gt_tan_pi_8 & ((absY - absX) / (absY + absX)))
217 (((8.05374449538e-2 * a2 - 1.38776856032E-1) * a2 + 1.99777106478E-1) * a2
222 b = (xyNeg & (-b)) + (
F32vec4(!xyNeg) & b);
224 b = (xyNeg & (b + pi)) + (
F32vec4(!xyNeg) & b);
226 b = (xyNeg & (b - pi)) + (
F32vec4(!xyNeg) & b);
227 xyNeg =
F32vec4(xZero & yZero);
228 b = (xyNeg & zero) + (
F32vec4(!xyNeg) & b);
230 b = (xyNeg & (-pi_2)) + (
F32vec4(!xyNeg) & b);
235 strm <<
"[" << a[0] <<
" " << a[1] <<
" " << a[2] <<
" " << a[3] <<
"]";
254 #define _fvecalignment __attribute__((aligned(16)))
friend F32vec4 exp(const F32vec4 &a)
friend F32vec4 max(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 rsqrt(const F32vec4 &a)
friend F32vec4 fabs(const F32vec4 &a)
friend F32vec4 atan2(const F32vec4 &y, const F32vec4 &x)
friend F32vec4 operator/(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 log(const F32vec4 &a)
friend F32vec4 operator^(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 operator!(const F32vec4 &a)
const union @12 __f32vec4_true_cheat
friend F32vec4 operator|(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 operator>=(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 sqrt(const F32vec4 &a)
#define _f32vec4_abs_mask
friend std::istream & operator>>(std::istream &strm, F32vec4 &a)
const union @12 __f32vec4_sgn_mask_cheat
friend F32vec4 operator<(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 cos(const F32vec4 &a)
class F32vec4 __attribute__((aligned(16)))
const union @12 __f32vec4_zero_cheat
friend F32vec4 operator+(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 operator-(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 asgnb(const F32vec4 &a, const F32vec4 &b)
float & operator[](int i)
friend F32vec4 operator==(const F32vec4 &a, const F32vec4 &b)
const union @12 __f32vec4_false_cheat
const union @12 __f32vec4_abs_mask_cheat
friend F32vec4 rcp(const F32vec4 &a)
friend std::ostream & operator<<(std::ostream &strm, const F32vec4 &a)
friend F32vec4 operator&(const F32vec4 &a, const F32vec4 &b)
friend F32vec4 sgn(const F32vec4 &a)
friend F32vec4 min(const F32vec4 &a, const F32vec4 &b)
#define _f32vec4_sgn_mask
friend F32vec4 bool2int(const F32vec4 &a)
friend F32vec4 acos(const F32vec4 &a)
friend F32vec4 if3(const F32vec4 &a, const F32vec4 &b, const F32vec4 &c)
friend F32vec4 sin(const F32vec4 &a)
friend F32vec4 operator<=(const F32vec4 &a, const F32vec4 &b)
vec_arithmetic(F32vec4, float)
friend F32vec4 operator>(const F32vec4 &a, const F32vec4 &b)
const union @12 __f32vec4_one_cheat
friend F32vec4 operator*(const F32vec4 &a, const F32vec4 &b)