This documentation is automatically generated by online-judge-tools/verification-helper
#include "src/data_structure/fenwick_tree_on_wavelet_matrix.hpp"
矩形和クエリに高速に答えるデータ構造です.
更新クエリがある場合,クエリが先読みできる必要があります.
FenwickTreeonWaveletMatrix<S, T> wm;
点がない状態の $2$ 次元平面を作ります.
S
は点の座標の型で, T
は点の重みの型です.
計算量
void wm.add_point(S x, S y)
平面上に点 $(x, y)$ を追加します.
重なりがあっても構いません.
制約
build
をした後に呼び出してはいけない計算量
void wm.build()
wm
の初期化を行います.
計算量
点の数を $n$ 個として
void wm.add(S x, S y, T w)
点 $(x, y)$ の重みを $w$ 増加させます.
add_point
で登録していない点を呼び出した場合の動作は未定義です. (assertなどはないので要注意!)
制約
add_point
で登録していない点を呼ばない計算量
T wm.sum(S l, S d, S r, S u)
$l \leq x < r, d \leq y < u$ を満たす点について,重みの総和を求めます.
制約
計算量
#pragma once
#include "../template/template.hpp"
#include <immintrin.h>
struct BitVector {
using u32 = uint32_t;
using i64 = int64_t;
using u64 = uint64_t;
static constexpr u32 w = 64;
vector<u64> block;
vector<u32> count;
u32 n, zeros;
inline u32 get(const u32 i) const {
return u32(block[i / w] >> (i % w)) & 1u;
}
inline void set(const u32 i) {
block[i / w] |= 1LL << (i % w);
}
BitVector() {}
BitVector(const int _n) {
init(_n);
}
__attribute__((optimize("O3,unroll-loops"))) void init(const int _n) {
n = zeros = _n;
block.resize(n / w + 1, 0);
count.resize(block.size(), 0);
}
__attribute__((target("popcnt"))) void build() {
for(u32 i = 1; i < block.size(); ++i) {
count[i] = count[i - 1] + _mm_popcnt_u64(block[i - 1]);
}
zeros = rank0(n);
}
inline u32 rank0(const u32 i) const {
return i - rank1(i);
}
__attribute__((target("bmi2,popcnt"))) inline u32 rank1(const u32 i) const {
return count[i / w] + _mm_popcnt_u64(_bzhi_u64(block[i / w], i % w));
}
};
template <typename S, typename T>
struct FenwickTreeonWaveletMatrix {
private:
using u32 = uint32_t;
using i64 = int64_t;
using u64 = uint64_t;
struct FenwickTree {
u32 N;
vector<T> data;
FenwickTree() = default;
FenwickTree(const int size) {
init(size);
}
void init(const int size) {
N = size;
data.assign(N + 1, 0);
}
__attribute__((target("bmi"))) void add(u32 k, const T& x) {
for(++k; k <= N; k += _blsi_u32(k)) data[k] += x;
}
__attribute__((target("bmi"))) T sum(u32 k) const {
T ret = T();
for(; k; k = _blsr_u32(k)) ret += data[k];
return ret;
}
__attribute__((target("bmi"))) T sum(int l, int r) const {
T ret = T();
while(l != r) {
if(l < r) {
ret += data[r];
r = _blsr_u32(r);
} else {
ret -= data[l];
l = _blsr_u32(l);
}
}
return ret;
}
};
using P = pair<S, S>;
int n, lg;
vector<BitVector> bv;
vector<FenwickTree> bit;
vector<P> ps;
vector<S> ys;
inline int xid(const S& x) const {
return lower_bound(begin(ps), end(ps), make_pair(x, S()), [](const P& a, const P& b) { return a.first < b.first; }) - begin(ps);
}
inline int yid(const S& y) const {
return lower_bound(begin(ys), end(ys), y) - begin(ys);
}
T sum(int l, int r, const u32 upper) const {
T res = 0;
for(int h = lg; h--;) {
const int l0 = bv[h].rank0(l), r0 = bv[h].rank0(r);
if((upper >> h) & 1) {
res += bit[h].sum(l0, r0);
l += bv[h].zeros - l0;
r += bv[h].zeros - r0;
} else {
l = l0, r = r0;
}
}
return res;
}
public:
FenwickTreeonWaveletMatrix() {}
void add_point(const S& x, const S& y) {
ps.emplace_back(x, y);
ys.emplace_back(y);
}
__attribute__((optimize("O3"))) void build() {
sort(begin(ps), end(ps));
ps.erase(unique(begin(ps), end(ps)), end(ps));
n = ps.size();
sort(begin(ys), end(ys));
ys.erase(unique(begin(ys), end(ys)), end(ys));
vector<u32> cur(n), nxt(n);
for(int i = 0; i < n; ++i) cur[i] = yid(ps[i].second);
lg = __lg(max(n, 1)) + 1;
bv.assign(lg, n);
bit.assign(lg, n);
for(int h = lg - 1; h >= 0; --h) {
for(int i = 0; i < n; ++i) {
if((cur[i] >> h) & 1) bv[h].set(i);
}
bv[h].build();
array<decltype(begin(nxt)), 2> it{begin(nxt), begin(nxt) + bv[h].zeros};
for(int i = 0; i < n; ++i) *it[bv[h].get(i)]++ = cur[i];
swap(cur, nxt);
}
}
void add(const S& x, const S& y, const T& val) {
int i = lower_bound(begin(ps), end(ps), P{x, y}) - begin(ps);
for(int h = lg - 1; h >= 0; --h) {
const int i0 = bv[h].rank0(i);
if(bv[h].get(i)) i += bv[h].zeros - i0;
else i = i0;
bit[h].add(i, val);
}
}
T sum(const S& l, const S& d, const S& r, const S& u) const {
assert(l <= r and d <= u);
const int left = xid(l), right = xid(r);
return sum(left, right, yid(u)) - sum(left, right, yid(d));
}
};
#line 2 "src/template/template.hpp"
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
using P = pair<long long, long long>;
#define rep(i, a, b) for(long long i = (a); i < (b); ++i)
#define rrep(i, a, b) for(long long i = (a); i >= (b); --i)
constexpr long long inf = 4e18;
struct SetupIO {
SetupIO() {
ios::sync_with_stdio(0);
cin.tie(0);
cout << fixed << setprecision(30);
}
} setup_io;
#line 3 "src/data_structure/fenwick_tree_on_wavelet_matrix.hpp"
#include <immintrin.h>
struct BitVector {
using u32 = uint32_t;
using i64 = int64_t;
using u64 = uint64_t;
static constexpr u32 w = 64;
vector<u64> block;
vector<u32> count;
u32 n, zeros;
inline u32 get(const u32 i) const {
return u32(block[i / w] >> (i % w)) & 1u;
}
inline void set(const u32 i) {
block[i / w] |= 1LL << (i % w);
}
BitVector() {}
BitVector(const int _n) {
init(_n);
}
__attribute__((optimize("O3,unroll-loops"))) void init(const int _n) {
n = zeros = _n;
block.resize(n / w + 1, 0);
count.resize(block.size(), 0);
}
__attribute__((target("popcnt"))) void build() {
for(u32 i = 1; i < block.size(); ++i) {
count[i] = count[i - 1] + _mm_popcnt_u64(block[i - 1]);
}
zeros = rank0(n);
}
inline u32 rank0(const u32 i) const {
return i - rank1(i);
}
__attribute__((target("bmi2,popcnt"))) inline u32 rank1(const u32 i) const {
return count[i / w] + _mm_popcnt_u64(_bzhi_u64(block[i / w], i % w));
}
};
template <typename S, typename T>
struct FenwickTreeonWaveletMatrix {
private:
using u32 = uint32_t;
using i64 = int64_t;
using u64 = uint64_t;
struct FenwickTree {
u32 N;
vector<T> data;
FenwickTree() = default;
FenwickTree(const int size) {
init(size);
}
void init(const int size) {
N = size;
data.assign(N + 1, 0);
}
__attribute__((target("bmi"))) void add(u32 k, const T& x) {
for(++k; k <= N; k += _blsi_u32(k)) data[k] += x;
}
__attribute__((target("bmi"))) T sum(u32 k) const {
T ret = T();
for(; k; k = _blsr_u32(k)) ret += data[k];
return ret;
}
__attribute__((target("bmi"))) T sum(int l, int r) const {
T ret = T();
while(l != r) {
if(l < r) {
ret += data[r];
r = _blsr_u32(r);
} else {
ret -= data[l];
l = _blsr_u32(l);
}
}
return ret;
}
};
using P = pair<S, S>;
int n, lg;
vector<BitVector> bv;
vector<FenwickTree> bit;
vector<P> ps;
vector<S> ys;
inline int xid(const S& x) const {
return lower_bound(begin(ps), end(ps), make_pair(x, S()), [](const P& a, const P& b) { return a.first < b.first; }) - begin(ps);
}
inline int yid(const S& y) const {
return lower_bound(begin(ys), end(ys), y) - begin(ys);
}
T sum(int l, int r, const u32 upper) const {
T res = 0;
for(int h = lg; h--;) {
const int l0 = bv[h].rank0(l), r0 = bv[h].rank0(r);
if((upper >> h) & 1) {
res += bit[h].sum(l0, r0);
l += bv[h].zeros - l0;
r += bv[h].zeros - r0;
} else {
l = l0, r = r0;
}
}
return res;
}
public:
FenwickTreeonWaveletMatrix() {}
void add_point(const S& x, const S& y) {
ps.emplace_back(x, y);
ys.emplace_back(y);
}
__attribute__((optimize("O3"))) void build() {
sort(begin(ps), end(ps));
ps.erase(unique(begin(ps), end(ps)), end(ps));
n = ps.size();
sort(begin(ys), end(ys));
ys.erase(unique(begin(ys), end(ys)), end(ys));
vector<u32> cur(n), nxt(n);
for(int i = 0; i < n; ++i) cur[i] = yid(ps[i].second);
lg = __lg(max(n, 1)) + 1;
bv.assign(lg, n);
bit.assign(lg, n);
for(int h = lg - 1; h >= 0; --h) {
for(int i = 0; i < n; ++i) {
if((cur[i] >> h) & 1) bv[h].set(i);
}
bv[h].build();
array<decltype(begin(nxt)), 2> it{begin(nxt), begin(nxt) + bv[h].zeros};
for(int i = 0; i < n; ++i) *it[bv[h].get(i)]++ = cur[i];
swap(cur, nxt);
}
}
void add(const S& x, const S& y, const T& val) {
int i = lower_bound(begin(ps), end(ps), P{x, y}) - begin(ps);
for(int h = lg - 1; h >= 0; --h) {
const int i0 = bv[h].rank0(i);
if(bv[h].get(i)) i += bv[h].zeros - i0;
else i = i0;
bit[h].add(i, val);
}
}
T sum(const S& l, const S& d, const S& r, const S& u) const {
assert(l <= r and d <= u);
const int left = xid(l), right = xid(r);
return sum(left, right, yid(u)) - sum(left, right, yid(d));
}
};