競プロ復習 ABC174 F問題

https://atcoder.jp/contests/abc174/tasks/abc174_f
クオリ区間ごとの個数を求める問題。

・累積和を使う
この手の問題は、クオリをソートした順にみて行くといいです。
(前のクオリの結果が再利用できるため、高速化に繋がる)

今回はrを昇順ソートしました。

struct QUARR{
   int l;
   int r;
   int index;
   int type;
   int ans;
   bool operator<(QUARR q) const{
       if(type==1){
           if(q.r==r) return q.l>l;
           return q.r>r;
       }
       else{
           return q.index>index;
       }
   }
};

答えはソート前で出力しないといけないため、戻す用のソートも定義しています。

rが小さい順に見ていき、玉の色の一番右を記録しておきます。


1 2 3 1 3 1
というc[i]に対してrをどんどん広げて、玉の色の一番右を記録
r=1 1->1
r=2 1->1 2->2
r=3 1->1 2->2 3->3
r=4 1->4 2->2 3->3
r=5 1->4 2->2 3->5
r=6 1->6 2->2 3->5

また、右端の玉の色が記録されている場所を1にするようなBIT列を考えます。

※1 2 3 1 3 1
r=1 100000
r=2 110000
r=3 111000
r=4 011100
r=5 010110
r=6 010011

このbit列に対して、[l,r]区間の答えを求める際、1の数を数えることで答えが求まるようになります。
(0の場所にある玉の色は、それより右にある1のどれかと同じになっているため)

また、累積和を用いることでO(1)で区間の和が求めそうです。

※1 2 3 1 3 1
r=1 111111
r=2 122222
r=3 123333
r=4 012333
r=5 011233
r=6 011123

[3,5]の場合、r=5の累積和を用いて3-1=2と答えが求まります。

・フェニック木で累積和を高速化
累積和の更新にオーダーがかかるため、まだTLE解です。
ただ、こういった累積和の更新を高速に行えるデータ構造があります。

https://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A7%E3%83%8B%E3%83%83%E3%82%AF%E6%9C%A8

フェニック木(fenwick tree)です。(BITって呼ばれてるものと同じ?)
C++の標準ライブラリにないデータ構造なので、自前で準備する必要がありますが、実装は簡単にできます。

int ft_bit[NMAX];
void ft_add(int a,int w,int N){
   for(int x=a;x<=N;x+=x&-x){
       ft_bit[x]+=w;
   }
}
int ft_sum(int a){
   int ret=0;
   for(int x=a;x>0;x-=x&-x){
       ret+=ft_bit[x];
   }
   return ret;
}

参考(http://hos.ac/slides/20140319_bit.pdf)

ft_addが累積和の更新です。[a,N]区間にwを加えます。
x&-xは、xを二進で見たときに一番下にある1が取れます。
ft_sumは累積和の算出です。[1,N]区間の累積和を求めます。

二進の一番下の1に1を足したり、引いたりしているためループは長くてもO(logN)で終わりそうです。

・提出コード
という訳で、以下提出コードです。


//#include<bits/stdc++.h>
#include<iostream>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<set>
/*
#include<boost/multiprecision/cpp_int.hpp>
#include <boost/multiprecision/cpp_dec_float.hpp>
#include <boost/rational.hpp>
namespace mp = boost::multiprecision;
using Real = mp::number<mp::cpp_dec_float<1024>>;
using Bint = mp::cpp_int;
*/
using namespace std;
#define int long long
#define REP(i,s,e) for((i)=(s);(i)<(e);(i)++)
#define RREP(i,s,e) for((i)=((s)-1);(i)>=(e);(i)--)
#define FOR(i,n) for((i)=(0);(i)<(n);(i)++)
#define RFOR(i,n) for((i)=((n)-1);(i)>=(0);(i)--)
#define MOD 1000000007
#define NMAX 500010
struct QUARR{
   int l;
   int r;
   int index;
   int type;
   int ans;
   bool operator<(QUARR q) const{
       if(type==1){
           if(q.r==r) return q.l>l;
           return q.r>r;
       }
       else{
           return q.index>index;
       }
   }
};
int ft_bit[NMAX];
void ft_add(int a,int w,int N){
   for(int x=a;x<=N;x+=x&-x){
       ft_bit[x]+=w;
   }
}
int ft_sum(int a){
   int ret=0;
   for(int x=a;x>0;x-=x&-x){
       ret+=ft_bit[x];
   }
   return ret;
}
signed main(){
   QUARR qu[NMAX];
   int last[NMAX];
   int c[NMAX];
   int N,Q;
   cin>>N>>Q;
   for(int i=1;i<=N;i++){
       cin>>c[i];
       last[i]=-1;
   }
   for(int i=1;i<=Q;i++){
       int l,r;
       cin>>l>>r;
       qu[i].l=l;
       qu[i].r=r;
       qu[i].index=i;
       qu[i].type=1;
       qu[i].ans=0;
   }
   sort(qu+1,qu+Q+1);
   for(int i=1;i<=qu[1].r;i++){
       if(last[c[i]]==-1){
           ft_add(i,1,N);
           last[c[i]]=i;
       }
       else{
           ft_add(last[c[i]],-1,N);
           ft_add(i,1,N);
           last[c[i]]=i;
       }
   }
   qu[1].ans=ft_sum(qu[1].r)-ft_sum(qu[1].l-1);
   qu[1].type=2;
   for(int i=2;i<=Q;i++){
       for(int j=qu[i-1].r+1;j<=qu[i].r;j++){
           if(last[c[j]]==-1){
               ft_add(j,1,N);
               last[c[j]]=j;
           }
           else{
               ft_add(last[c[j]],-1,N);
               ft_add(j,1,N);
               last[c[j]]=j;
           }
       }
       qu[i].ans=ft_sum(qu[i].r)-ft_sum(qu[i].l-1);
       qu[i].type=2;
   }
   sort(qu+1,qu+Q+1);
   for(int i=1;i<=Q;i++){
       cout<<qu[i].ans<<endl;
   }
}


各クオリごとにft_sumしているためO(QlogN)、rを[1,N]区間で伸ばす際にft_addするためO(NlogN)なので、合計でO((Q+N)logN)です。
※Qmax+Nmax=10^6,logNmax≒5.7、ft_sunやft_addは二回していることを考えると、10^7の計算量で落ち着きそうです。
 なのですが、1.7sほど実行時間がかかっているため、書き方がかなり悪い...。(ソートとかを加味しても、10^7なら500msくらいで落ち着いてほしい)

・8/3 20:00追記 遅いわけ
https://xuzijian629.hatenablog.com/entry/2019/03/31/130708
どうもendlはは遅いようで、
    cout<<qu[i].ans<<endl;
->cout<<qu[i].ans<<"\n";
とするだけで、700ms縮まって1000msになりました。

cin.tie(nullptr); を追加、#define int long longを削除(これは意味ないかも)
で50ms縮まって950msになりました。

cinとcoutをscanfとprintfに書き換えると、500msほど縮まって480msになりました。(早い!!)
これで想定通りの早さになりました。I/Oの多い問題でcin,coutは避けた方がよさそうです。

・最後に
https://kenkoooo.com/atcoder/#/table/
atcoder problemで見た感じ、このF問題は水色上位らしいです...。
なかなか青色への道は遠そうですね。

いいなと思ったら応援しよう!