見出し画像

データの重複をなくすExcel技

 ExcelやLibreOffice, Google スプレッドシートで重複を削除するテクニックです。

Excelの場合(テーブル化 → 重複を削除)

 Excelの場合、テーブル化といった作業をすれば重複を簡単に削除できる機能が利用できます。
 ただし、Excel独自の機能であるためGoogle スプレッドシートなどでは利用できず、Vlookup関数を用いて実現します。

  1. セルの上で Ctrl + T を押す

  2. テーブル化する範囲を選択

  3. 画面上部の「テーブルデザイン」→「重複を削除」

 重複の削除を最も手間なく実現できるため、Excelが使える環境であれば第一選択肢になります。

LibreOfficeの場合(Vlookup関数)

 Vlookup関数を使えば、容易に重複を判定でき、行の削除と組み合わせればすぐにユニーク(一意な)行を取り出すことができる。

  1. 重複を削除したい列を新しいシートへコピー

  2. (複数列の場合)CONCAT関数などで連結して、ひとまとめにする

  3. 先頭行にフィルタをかけ、重複をなくす列をソートする
    (今回はA列を仮定)

  4. 新しい列へ以下の関数を入力する
    =vlookup(a1, a2:a9999, 1, false)

  5. エラー以外の行をすべて削除する

 関数内の "a9999" は行全てを網羅できるよう調整してください。

Googleスプレッドシートの場合(データ クリーンアップ)

 ツールバーの「データ」→「データ クリーンアップ」→「重複を削除」とすれば重複の削除が可能。
 ただ、データの保管について特別な注意を払う必要があり個人的には避けています。
 スプレッドシートの共有範囲の設定であったり、そもそもログインしているGoogleアカウントを意識する必要があるなど注意を払うポイントが多すぎると感じています。


いいなと思ったら応援しよう!