アーカイブ

  • その86:  データマネジメントの成熟度フレームワーク・・・外部的見方(客観的)と内部的見方(主観的)について

    Dama Japan(データマネジメント協会日本支部)第11分科会の、令和2年最初のミーティングが先日開催されました。議論の主題は、データマネジメント成熟度の枠組みをベースにして、どのようにテーラリング(またはカスタマイズとも)していったら良いかということでした。その議論の中のフレームワークに関して、筆者の一つの見方を披露したので、今回はその話題について簡単に紹介します。

    データマネジメントの成熟度評価というのは、今そこで運営されているデータを管理し利用する状態に関して、ある評価の基準を用意した上で、この見方を利用して現状の状態を評価しようとする試みです。このために整理し定義する評価の枠組みがフレームワークということになります。そしてこのフレームワークに基づいて、具体的な評価内容と視点を用意するという流れになっています。分科会として着目しているフレームワークには複数ありますが、ここではそれらの中での代表格として、CMMI/DMM(最新版はV1.1)とDMBOK第2版(DMBOK2)を上げることができます。これらのフレームワークを比べると、今ここにあるデータ運用・利用環境を見る立場に次のような違いがあるというのが、筆者の考え方でした。

    第一のCMMI/DMMというのは、CMMI成熟度シリーズとして前もって検討された複数の成熟度評価アプローチの適用分野について、「データマネジメント」分野にも適用するというスタンスで組立てられています。そしてその評価項目の内容は、外部から客観的な見方で評価しようという立場を取っている。いってみれば企業の会計監査のように、エビデンスベースでの証拠に基づいた現状評価をしようという見方ということができます。従って、この見方を推し進めれば、評価された(企業内の)仕組みの正しい在り方や改善方法の具体策は、その対象者の中で取決めるべきものだという見方になるといえるでしょう。自分たちで解決策のための仕組みを構築し、その約束の下で運営を行うという形になるということです。この解決策のお手本として、例えば他社のケースや業界のベストプラクティスを活用するということはあるでしょう。しかし、繰り返しになりますが成熟度の評価は、活動の証拠を元に第三者の立場から行うというスタンスです。

    これに対して、DMBOK2そのものは所謂「知識体系」、BoK本ですから、データマネジメントのプラクティスに関する実践領域に関して技術的な内容を含めた手本集という見方をすることができます。この知識領域が11個の分野として組立てられているということです。それらの領域に関して、プロセスやツール等の外延的情報を説明している(或いはその解決のためにとのような情報を参照すれば良いかを示している)という訳です。従って、この枠組みを元に成熟度評価という見方をしようとすると、提供された分類の各領域についてどのような組み立てをするのかという点を「内部的に」検討する必要があるという点に注意する必要があるのではないかというのが筆者の見方でした。つまり環境の内側の視点として自分たちの実践の仕組みを眺める必要があるという意味です。従ってこの枠組みに沿った成熟度評価は、具体的なプロセスの在り方や利用ツールの環境などを調べるという方向になるだろうという意味です。

    以上のように、利用するフレームワークによって、成熟度評価を行う評価者の立場に違いが現れます。そもそも何のために成熟度評価を行うかという「目的の確認」が事前に必要であることは言うまでも無く、評価のために利用するフレームワークの選択にも注意が必要であるということです。筆者の考え方としては、成熟度評価を実施する理由は、対象分野についての(1)現在の状況と、(2)将来の在りたい姿を描き、そのギャップ認識の下に具体的なステップを決める材料とするという点だと考えています。そしてこの具体化のための動機付けと予算化を推し進めるということです。
  • いずれのフレームワークを利用するか(或いはそれらをミックスした第三の枠組みを利用)はさておき、企業のデータメネジメントの在り方と、より良いデータ活用環境の構築達成を目指して、成熟度評価というツールを活用したいものです。こういった話題と具体的な進め方に興味のある方は、是非「お問い合せ」ページを通じて筆者にご相談下さい。
  •    (先頭へ戻る)
  • その85:  データベースの新たな形:グラフデータベース・・・関係を直接表現する技術

    業務系に使用するデータベースシステムとしてリレーショナル型データベースが出現して、ほぼ30年を越える期間が過ぎています。現在はそのようなシステム利用形体においてRDBMSを選択することが当たり前のように行われています。一方でRDBMSのデータ表現形態では開発者として不便(あるいは限界性)を感じる場面が出て来ている。正確にいうならば、元々制約として現れていた箇所が、これまでは何らかの方法で(言葉は良くないが)何とかゴマカシテきたものが、取り扱うデータの種類や量が非常な速さで拡大してきた環境において、扱い難い点が目立つようになってきたともいえます。また、技術や物理環境/装置の進展で、他の方法として費用的にも導入しやすくなってきたといえます。(例えばSSD装置の広がりであったり、今や1TB(テラバイト)のメモリを搭載する計算機も比較的リーズナブルな費用で手に入れることが可能になってきたことなど。)

    このような中で、グラフデータベース技術に脚光が浴びせられるようになってきています。これはデータ同士の関係性を直接構造として表現する方式です。例えば、人と人、人と物(またはコト)、イベント事象と状況などを論理的な関係性として直接構造に取込み、表現できるようにすることで、容易大量データの検索や処理を行えるようにする。計算機メモリ容量が飛躍的に拡大可能になったことで、そういう構造を取りやすくなったという背景もあります。また理論的には、グラフ理論」という数学的背景が根拠として後押しをしている形になります。そして技術的にその構造を扱う言語の発展や、利用事例の広がりも見ることが出来ます。このようなツール環境として「Neo4j」が代表的で人気を集めるようになっています。また、集積されたデータを利用する側の立場で理解しやすくするデータ表現(プレゼンテーション)手法も広まってきています。

    こういった形で取り扱えるデータ資産が増えると、これを効果的に、また継承可能な形で管理して行きたいという要求が出て来ます。それを実現する一つの手段として「データモデリング」の技術が必要です。それは、グラフデータベースでのデータ表現は(専門的な言葉になりますが)インスタンス同士の関係性の集合という形が基本になるため、欲求に任せて無制限にデータを増やしてゆくと、一体どのようなデータ種類や構成がデータベース内に表現されているかを把握しきれなくなってしまう危険性を持っているという意味です。従って、リレーショナル型データベースの設計でも使われていた「論理データモデリング」の考え方を取入れて基本的なグラフデータベース上のデータ構造を表現することが大切ということになります。その上でインスタンス同士の関係性(リンク)の表現を付加的に、また網羅的に設計情報として取り扱う設計習慣を早くから導入することが、将来の混乱度を軽減するための方法として必要だと、筆者は考えています。

    また、グラフデータベース利用の範囲を検討しておくことも必要になるでしょう。元来データ同士の関係性を直接表現してデータを増やして行くという性質上、データの全体量が拡大した場合、現状の管理方式ではデータの終着点が判別できない世界ということになります。それは、インターネット上の世界では終着点が見つからないということと同様です。これは、データ表現する値の集合を正確に知ろうとすると、何が結果(例えば合計値)として正確なものなのかを、利用者が保証できないという問題に繋がる可能性を含んでいるということです。利用者がどこかで限界を設定する(例えば、最大の探索距離を設定して、その先には進まず諦める)という形での利用になる可能性があるということです。そのような制約を考慮して利用範囲や形式を設定するという意味です。

    グラフデータベースの持つ特性を活かしながら、適切な利用形体を図って行くというのが、この新しい技術をうまく取り扱う秘訣になるものといえるでしょう。先に上げたNeo4jなどは、無料でも利用できる形で製品ダウンロードもできますし、またその利用に関する資料の提供も積極的に行われています。このコラムを参照した方で興味があれば、是非この製品の使い方を理解する上で早めに利用してみることをお勧めします。
  • 今回は、新しいデータ活用の形として着目され初めてているグラフデータベースについて触れてみました。最後に遅ればせのご挨拶ながら、関係各位には本年も宜しくお願い致します。   (先頭に戻る)