JDEA Forum

「データ」についてのあれこれをレポートしつつ、ワイガヤ(ハイブリッド・ミーティング)や勉強会/セミナーなどを通じて日本データ・エンジニアリング協会(JDEA https://www.jdea.gr.jp/)を側面支援していきます。

「データ」についてのあれこれをレポートしつつ、ワイガヤ(ハイブリッド・ミーティング)や勉強会/セミナーなどを通じて日本データ・エンジニアリング協会(JDEA)を側面支援していきます

デジタル社会・経済に向けた Trusted Dataのための指針ver2.0 = Trusted Dataの価値評価手法(2024年度β版)=(1)

はじめに

 社会・経済のデジタル化に伴って、データの重要性が強く認識されています。

 当協会は1972年の発足以来、データ生成のプロ集団として、最高精度ペンタ9(99.999X)の「クリーンデータ」(※1)を追究してきました。その上に立って、デジタル社会・経済に必須となる「トラストデータ」の実現に取り組んでいます。

 本指針は、当協会「健全なデータドリブン社会に向けたデータトラストの確保」小委員会(座長=桶山雄平:株式会社うるるBPO社長)の議論をもとに2022年5月に取りまとめた「デジタル社会・経済に向けたTrusted Dataのための指針」(ver1.1)の続編に当たり、かつ本総会用のβ版(たたき台)として策定しました。

 今回はデータCRUDの観点から「Trusted Data」の生成とその価値評価に焦点を当てています。あくまでもβ版ですので、これを契機に活発な議論が展開すれば一定の役割を果たすことができます。

 

※1 一般的なデータ生成プロセスの精度は97%(誤謬率100分の3)~99.7(誤謬率1000分の3)程度とされています。当協会は、最高精度99.9997(誤謬率10万分の3)を「クリーンデータ」と定義しています。

1.確認のために

■ 2022年版(指針ver1.1)の社会的背景

 「デジタル社会・経済に向けたTrusted Dataのための指針」(ver1.1)は、以下のような社会的課題を背景に、その解決策を探ることを目的としていました。

 

  1.多発するデータ関連の不祥事

  2.多発するシステムトラブル

  3.生成AIの利用拡大

  4.DX(デジタルトランスフォーメーション)の推進

  5.DFFTへの体制整備

  6.データ社会における安心・安全の担保

 

 データ関連不祥事のうち最も顕著なのは個人情報の漏洩です。ネットワーク経由のハッキングやコンピュータ・ウイルスによる事案より、データを取り扱う現場からの流出が目立って増えています。またデータ突合プロセスにおける誤りや原データの誤りが、システムの誤動作やサービスの停止につながったケースも少なくありません(※2)。

 その経済的負荷は、2023年のネット詐欺被害額約772億円(警察庁調べ)ばかりではありません。システムの改修やデータの修正、サービス停止に伴う対応に要した費用のほか、サービスや制度の信頼喪失やデジタル社会・経済への不安感までを考慮に入れると、そのマイナス効果は計り知れません(※3)。

 

※2 東京商工リサーチによると、2023年に判明した個人情報流出事案は175件、流出件数は4090.9万件でした。これが偽メールやネット詐欺の誘発要因の1つと推測されています。

※3 マイナンバー誤情報紐付け事案は、年金、健康保険、住民税課税、労災、児童手当、障碍者支援、生活保護、医療費助成など多岐にわたっています。

 

 一方、DXの進展はデータの標準化、正確さ、信頼性を必須とします。

 DXは老朽システムの抜本的な改訂と業務プロセスの見直しにとどまらず、最終的には個別業務・業界を超えたデータ・サプライチェーンに展開すると予測されています。データスペース(※4)もしくはDFFT(Data Free Flow with Trust:信頼性あるデータの自由な流通)のコンセプトがそれに相当します。

 さらに生成AIが大きな関心を集めています。ITがヒトの知識処理能力を超えるシンギュラリティの是非もそうですが、当面懸念されるのは生成AIの利用拡大に伴う誤情報の拡散、偽情報に起因する誤判断です。それを回避するには、生成AIの原資となるデータの信憑性、無謬性が求められます。

 

※4 データスペースは単一事業体の内の生産部門/事業部門の間、取引先との間で効果的にデータを共有する仕組みとしても注目されています。

 

■ データ関連不祥事の分析とインシデントの類型化

 以上を背景として、指針ver1.1(2022年版)では、2007年から2021年の間に発生した公共調達における電子データ生成/デジタライゼーションに関連する不祥事案を調査しました。そのなかで、どのプロセスにどのようなインシデント(※5)があったかを分析しています。

 業務内容や対象データは案件ごとに異なりますが、

  • 多くはデータに対する発注元の認識に起因している
  • 電子データ生成/デジタライゼーションは単純作業という誤認
  • 発注元の現状把握(As-Is分析)不足
  • 目的・用途(要件定義)があいまい
  • 発注先事業者の体制、技能の評価不足
  • リスク対策の軽視

 等の共通項があることを発見しました。

 結果としてそれが適正水準を大きく下回る価額・納期での発注となり、

  • 杜撰な管理体制
  • 最低賃金の下回る時給での在宅バイトや海外事業者への再発注
  • 誤謬率が不定(ミスがあって当たり前)な低品質な成果物

 等々、「安かろう・悪かろう」に結びつき、情報漏洩やシステム誤動作のリスクを高めています。

 また、指針ver1.1(2022年版)では、データ生成実務の体験則から「電子データ生成プロセスの正しい理解が重要」と結論づけています。次いで、インシデントの発生起因を考察することにより(※6)、「インシデント未然防止のためのあるべきフロー」を示しました(図1)。

 

※5 インシデント:いわゆる「ヒヤリハット」。事故(アクシデント)誘発因子を明らかにすることで適切な対策を講じることができます。

※6 指針ver1.1 第2章第3節「インシデント発生の原因カテゴリ」(P.6~9)

図2 インシデント未然防止のための調達フロー(*は新設プロセス)

 

■ インシデント未然防止のためのあるべきフロー

 調査・分析した対象が公共調達案件だった関係から、データ生成プロセスを調達プロセスと表現しています。また実施主体を「官公庁・自治体」としていますが、電子データ生成/デジタライゼーション作業を受注するデータ関連事業者に置き換えることも可能です。