ITシステムは、次の5つの要素で成り立っています。
①ハードウェア(コンピュータ、周辺機器)
②データ
③ソフトウェア
④ネットワーク
⑤オペレーション
1960年代から70年代にかけて、「コンピュータはデータがなければただの箱」と言われ、1980年代から90年代にかけては「ソフトウェアがなければただの箱」と言われました。2000年代に入って以後は、インターネットやWebなど「ネットワーク」が欠くべからざるものになっています。
おおむね20年のスパンで、データ>ソフトウェア>ネットワークと高度化してきたのですが、2020年代に入って再び「データ」が注目されるようになりました。「サイバー・フィジカル・システム(CPS)」「データドリブン」「デジタルツイン」といった言葉が飛び交っています。
データ・エンジニアリングはそのような高度化されたシステムを円滑に、かつ効果を最大限に引き出すために、工学的アプローチでデータを整備する作業(その手法と手順、方法論)を意味します。
※「工学的アプローチ」というと難しく思えるかもしれません。じつは算数の「1+1=2」「1×1=1」のように、一定の決まりに従って作業をすれば、誰でも同じ水準の成果を出すことができるようにする方程式(のようなもの)です。料理のレシピ、接客のマニュアルなどを想定してください。
※データについては「正規化」「構造化」「標準化」といった、一般の社会生活では使わない専門用語(っぽい)表現が多用されます。いずれもデータの形や中身を整えることを意味しています。