マガジンのカバー画像

データ処理技術まとめ

8
分析基盤に関わるデータ処理技術をまとめるマガジン。
運営しているクリエイター

記事一覧

ストリーミングジョブ変更リリースの注意点

はじめにリアルタイムデータ処理では、データパイプラインの継続的な運用が求められます。しか…

zono
13日前
3

安全なデータ活用のための匿名加工例

最近では、データ基盤が整備されてデータ利活用が進む企業が増えてきています。企業が抱える膨…

zono
2か月前

データ関係者が行うべき匿名化の基本

はじめに個人情報保護が求められる現代において、データの匿名化は非常に重要なプロセスです。…

zono
7か月前
18

分析基盤のテーブルと連携方式

分析基盤においては様々な連携手法があります。 これは、データ量が多いか少ないか、データソ…

zono
10か月前
17

ストリーム処理とバッチ処理の比較と運用における注意点

1. ストリーム処理とバッチ処理の基本概念1.1 バッチ処理とは バッチ処理は、一定期間に蓄積…

zono
5か月前
9

多段ビューのテーブル化によるクエリの効率化とコスト削減

はじめにデータ分析基盤の設計は非常に重要な役割を果たしており、データエンジニアは、初期設…

zono
8か月前
10

データ修正の注意点

はじめに データエンジニアにとって、データの修正は避けて通れない課題です。特に、顧客に直接影響を与えるデータにおいては、データの整合性と正確性が極めて重要です。データベース、データウェアハウス(DWH)、データマートに保存される情報が最新かつ正確であることが求められます。 本記事では、データの修正を行う過程や修正プロセスにおけるデータ管理の重要性、その手法について紹介します。 1. 修正前後のデータの比較画像に示されたローン契約データの修正前後の比較を基に、データソース

分析基盤の誤ったデータの対処法

誤ったデータが混入する主な原因データ入力プロセスで発生する問題 皆さんもご存知の通り、入…

zono
8か月前
7