アーカイブ2021年

    • その116: 「孫子」を参考にした「データマネジメント」への取組みの勧め

      近頃ネットで配信されたドラマ仕立ての「孫子」を面白く見ていました。孫子といえば中国春秋時代に呉国の将軍として活躍した孫武により書かれたといわれる有名な兵法書の1つです。ドラマ自体は愛憎渦巻く人間模様と戦いの繰返しというものでしたが、それを見ているうちにデータマネジメントの在り方として考えた幾つかを今回の話題とします。ここでは、現代の「大量に押し寄せてくるデータ群」を敵と例えて、その戦いに勝利するために、如何に自分たちの「データマネジメント」群が取組むべきかという視点で捉えようとしたものです。

      孫子の書は全十三篇から成り、冒頭に上げられるのは「計篇」です。 独断的な解釈を記します。 (1)五事七計 総合的な (戦)力に関する客観的な比較計量の5つの基本要素(五事)。「道」「天」「地」「将」「法」。 「道」を完全に実行し、「天」「地」を正しく把握し、「将」に適任者を得、「法」が適格に運用することが勝利への要素である。 そのための比較計量要素として七つの項目が上げられる。 これらを通した客観判断を行うことにより、実戦の結果を確実なものとすることができる。いわば「勝算は時の運ではない」。取組みへの評価・計画をしっかり行うことが、勝算への確実な結果を得るための必要要素であることを述べる。

      (2)戦と経済的見通し(作戦篇) 戦の損害を十分認識し、戦うことの有効性を考える。また、巧久を目指して時間を長引かせるよりも拙速を尊ぶ。好機を掴んで戦に臨み即刻収束を図る。これにより消耗を防ぎ、疲弊をも防ぐ。

      (3)戦わずして勝つ。彼を知らず己を知らざれば戦うごとに殆うし(謀攻篇) 力尽くで戦うよりも、勝利を得るためのあらゆる手段を枠組みの中で捉え考慮し、損失・消耗を可能な限り少なくする形での戦いを企図すること。また、戦力の正確な認識を持った上で、それに応じた戦い方を考える。この意味で、いわゆる(ベンダーが声高にしがちな)ベストプラクティスに拘り過ぎないことが必要。

      (4)どのような形を取り、タイミングを計り、取組むか(形篇、勢篇、虚実篇) ここで述べられる内容は当然ながら戦をイメージしているが、それをデータマネジメントに重ねて考えると面白いところがある。

      軍争篇以下7篇は、戦うための考慮点を例を交えて述べているが、応用として取捨選択しながら、取組み方をイメージすると面白いと思う。以上、大部データマネジメントと趣の異なる分野を題材に、今後の取組みへの身の丈に応じたヒントとして取上げてみました。
    • 備考: 今回は以下の書籍を参考にしました。    
           ・図解雑学  孫子の兵法 ナツメ社(2006年4月発行) 水野実(著)
    • (先頭へ戻る)
    • その115: 改めて考える「DX時代のデータモデル」像について

      アマゾンの書籍販売サイトで提供される書評を読んでいると、評価点数の低いものの中にも時折考え方のヒントになるコメントが含まれていることがあります。今回は、あるデータモデルの説明本に関する低評価(★1つ)コメント話題を参考に記述します(2020年10月記載。ここでは敢えて書名、コメント者Idを省く)。そのコメント指摘ポイントを筆者なりに要約整理した主要項目を以下に示します(尚、この評価者は「フリーデータサイエンティスト」の立場で活動中と自己紹介されています)。 (1)評価者の期待するDX業務を理解したデータモエル視点で書籍が書かれていない。サブタイトルに「DX」という語が使われているのは不適切。 (2)RDB(リレーショナル・データベース)だけを対象としたデータモデル解説は時代遅れである。 (3)自分たちの扱っている高度な業務では、様々形態のDB技術要素の混在環境を相手にしており、これにマッチした業務プロセス、データモデルの土台作りに役立つモデル化技術の解説・プロトタイプを期待している。

      (1)については、最近の流行に乗った書籍販売手法として「DX」という語が適切に使用されていないという点にあるということでしょう。書籍で取り扱う内容と、書名から受ける読者の期待との間に大きな隔たりやミスマッチがあったという点。他の評価者で★5点を付けている方もあるので、読者の立場や期待の違いによっては、必ずしもコンテンツの不足とは言えず、誤解を与えるような書籍ラベルに問題があったものと想像します。一応内容を確認しながら購入できる実店舗購買と、宣伝文句やラベルから購買決定を行うオンライン店舗との違いを際立たせた事象ということもできます。このミスマッチ可能性を軽減する方法の1つとして、他者の書籍評価を参考にできる環境が便利だということもあります。また、流行語の使い方に関しては、筆者としては素材提供者に利用者視点からの誤解を生まない形での考慮を促したいものです。

      (2)は、評価に対してデータモデルの位置付けを擁護する説明が必要に思われます。それは、リレーショナル・データモデルの技術は、RDBのためのモデル化技術とは異なるという点です。考え方 の形式や実装上の親和性、リレーショナル・データモデル手法が発表されてからそれを実現するDB環境としてRDBが開発され利用されてきたという背景から誤解を生んでいる点があると思われます。この点については、この欄でも紹介している「データマネジメント知識体系ガイド(第2版)」(DMBoK2)第5章1.3.4のデータモデリング・スキーム等が参考になります。実装技術と分離した論理レベル階層と、実装技術(RDB)依存の物理レベル階層という考え方があることを評価者にも理解してもらえると評価者コメントも少し異なっていたかも知れません。ビジネス視点での論理レベル階層で、あるべきデータを整理するという考え方があるということです。尚、念のためですが筆者は、当該書籍がこのデータモデリングにおける論理/物理階層という考え方を説明しているかどうかの確認は行っていないことを断っておきます。

      (3)については、リレーショナル・データモデル(論理レベル)の考え方があれば、全て評価者の期待に沿う「高度なデータのあり方」を満たすことができるかどうかという議論に係わります。筆者としては、リレーショナル・データモデル手法だけでは満足できるデータ利用環境表現は難しいと考えています。また「データ・アーキテクチャ」の考え方を取入れる必要もあると考えています。非構造化データの管理、グラフデータベースの活用といった話題も視野に入ることになります。その考え方のヒントに関して、筆者はデータマネジメント協会日本支部(Dama-Japan)の月例分科会、勉強会の中で投げ掛けたことがあります。そういう意味では、この課題領域にはまだ方法論の確立には至っていないと言えるでしょう。
    • 今回は、データモデリング手法に関する書籍への読者評価 をきっかけにして 、 リレーショナル・データモデル技法のカバー範囲、データ・アーキテクチャ思考の必要性等について簡単に触れました。
    • (先頭に戻る)
    • その114: 「データの民主化」という表現が流行っていることへの思い

      オープンデータの提供が増加し、そういったデータを比較的容易に見ることを支援する数多くのハードウェアおよびソフトウェア・ツールが提供されてきていることは、筆者にとっても大変喜ばしいことです。それにつれ「データの民主化」という言葉も少なからずネット上の記事で散見されるようになりました。こうしたデータ利用の機会が増えるにつれ、今後益々重要になってくるのは所謂データ/情報リテラシー、つまり提供されるデータ/情報の読み解き方、解釈の仕方といった方面の話題でしょう(ここで「データ」は一次的なものとして提供されるもの、「情報」はデータを元に何らかの付加的解釈や説明を加えて二次的に提供されたものとして区別しています)。

      「データの民主化」というのは、様々な一次データに利用者が容易にアクセスできる環境が提供実現される状態と筆者は捉えています。ここで大切なのは、一次データの提供というのは、単なる収集結果データを生の形で提供することではなく、次の配慮が必要とされるということでしょう。①データの不整合性(空値データを含む)を提供者の責任として解決した形で提供すること。②提供データへの意図的な歪みを加えていないこと。③データの取得条件や基本属性等の環境情報と共に提供されること。①は、データの収集者でなければ解決できない課題であり、利用者が銘々勝手に対応してしまうとデータ活用時点で意図しない結論のバラツキを生む可能性を生む内容です(データ信頼性)。②は、提供者倫理に関わる問題であり、何らかの結論や意図を持った形でデータを生み出すと、データ解釈結果そのものが信頼性のないものになるという点です(データ信憑性)。③は、利用者として得られたデータをどのように扱えば良いかを説明する材料になるという点で大切なことです(データ明確性)。 これに加えて十分なデータ(量、種類)が利用できれば、活用性は更に増すことになるでしょう(データ充足性)。

      このようにして入手できたデータを元に解釈を加えて加工・編集・解説した情報作りというのは、利用者のリテラシーという課題に係わるものです。ここではデータを解釈する基本能力は踏まえた上で、この段階の情報制作者としての基本的取組み方を議論できます。(1)情報作成の元になったデータの出典を明らかにすること(情報信頼性)。(2)データを利用・加工する上で結果への余念を含んでいないこと(情報信憑性)。(3)提供する情報に関する説明、理由付け、制約など情報利用者への参照材料と共に提供すること(情報明確性)。また、利用者の解釈深掘りに寄与できる関連参照情報を更に提供していれば有意義さを上げることができるでしょう(情報充足性) 。ここでは、重要度の高いと考えられる項目を上げましたが、実際には他の要素も加わると考えられます。

      こういった議論を敢えてここで取上げた理由は、昨今のマスメディア(テレビ、ラジオ、新聞)や一部の大手電子メディア(SNS、Web情報、ブラウザ検索)の中には、特にこの後者の情報提供に関する意図的な歪みを生む活動が行われていると筆者には受け取られるためです。商業的な(つまりコマーシャルメッセージ上の)動機だけでなく、何らかの利益誘導を意図して、「様々なメディアの上での情報『発信』および『遮断』が行われている」と感じることが筆者だけでなく、筆者の周りでも増えています。つまり本当に受け取りたいデータ/情報に辿り着く機会を奪われているということです。「データの民主化」を唱えている時代に、これに逆行する改竄が行われているとすれば、それは民主化とは大きく異なる専制主義化といえるものでしょう。

      また、意図的とは言えないにしても、昨今の感染症に関する数字の取上げ方にも、情報不足や、データ/情報の扱い方の歪みといったものが大きく感じられます。根拠や説明性が薄い形で数値の大小だけを議論する態度は、情報を受け取る側に不信感や猜疑心を生む結果につながるといえます。納得感を持った上で行動に移ることと、効果に大きな結果の差異を生むように筆者には受け取れます(本当は、この期待に数値を上げて説明できれば良いのですが、現時点では推測です)。間違った情報でも、繰返し触れることでその内容に慣れてしまうという人間の性質を研究した心理学の結果もある(所謂マインド制御に関する話題)ため、筆者として取上げておきたい話題となりました。
    • 様々なセンサー機器の活用向上により、データ入手の容易性が高まることが期待される世の中において、データや情報への取組みについて、改めて着目しておきたい内容を今回は取上げました。
    • (先頭に戻る
    その113: 経産省DXレポート(中間)(2020年12月)を読み返しての所感

    ここのところ何度か「DX」というキーワードを交えた話題を、この欄では続けています。近頃DXを対象にした非官団体レベルでの検定等実施話も増えてきており、その関係で経産省DXレポート(2020年12月概要編および中間レポート)資料を読み返してみることにしました。今回はこれを題材にしての所感を書いてみます。まずこの資料で上げられているDXの定義を確認します。「企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用し て、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革する とともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争 上の優位性を確立すること」(「DX推進指標とそのガイダンス」より)。この定義だけを読む限りではどのような企業を想定したものか定かではないというのが、正直な筆者の受ける印象です。一方でその前年の報告資料を眺めると、所謂「2025年の崖」をキーワードにしてレガシーシステムを近年の技術に置換えることに力を入れた政府主導キャンペーンメッセージと受け取ることもできました(この点に関しては、2020年レポートではイメージ訂正の文言が追加されたものになっています)。

    IPAによってDXに関して補足的に提供される、およそ300件の回答内容を元にして調査収集・分析では、2020年末時点の産業界でのDX取組み状況を要約しています。ここでは企業規模毎の結果整理などを記載していますが、その視点は企業規模毎の事情は余り重点を置かず、一律に結果比較を並べてみたという印象を受けます。これらをざっと眺めた結果として、筆者には正直のところ、一体何をDXの目標としているか残念ながら良く読み取ることができませんでした。ただ、DXへの企業向け取組み雰囲気の盛り上げを図る政府キャンペーンということだけは分かります。しかし、更に2020年レポート検討に向けた開催WG2参加者の顔ぶれを見ると、正直、誰のための検討実施なのかを疑うようなものでした(あくまでも筆者の感想です)。

    結局のところ、DXへの企業取組みというのは、各企業の事情に応じて自分たち(企業自身)で計画・実践を続けて行くものという点が重要なのだと考えます。例えば、予算・人等の資源に余裕があるように見える大企業の多くは、過去に導入し使い続けるシステムの維持に悩んでいるでしょう。規模の小さなものであっても最近立ち上げた企業の方が、気軽で技術的に効率の良いDX化を進めている所も有り得ます。先のIPA分析結果報告で奇妙に思えたのは、どの企業についてもDX成熟度「レベル5」を目指すことが前提となっていると受け取られた点でした。各企業の現状評価とその後の目標レベル設定を組合わせ、自社目標達成に向けてのロードマップ作りとこのための具体的流れを組立てて行くことが本来の成熟度利用手法の考え方であるはずなのに対し、企業事情に関わらず目標設定が共通であると仮定してしまうことには違和感が生まれるという意味です(恐らく上意下達的な発想が報告書・結果分析者の頭にあるからではないか)。

    実際、余り過去のシステム資源(ハードウェア、ソフトウェア)に囚われずに動くことのできる新興企業は、規模に関わらず足回り良く立ち回れる機会が十分あるというのが実情だと想定できます。 そのために利用するシステム環境選択をどうするかという点が中長期的な課題となります。ここでは所謂G・A・F・A・M等(ここで筆者は敢えて区切って表現する)に代表される海外資本超大企業の存在を無視できませんが、何時までもそれに頼り続けることを前提とすべきかという大きな選択課題があります。謂わば、長いものに巻かれ続けるかどうかの選択です。基盤環境として企業内に浸透すればするほど、選択肢が狭いものとなります。それはこれまでの物理的システム基盤に塩漬けになっている大企業の姿が重なって映ります。

    そういった環境に頼り続けることを避ける流れとしてオープンソースといった別の基盤利用発想があります。それを活用するには、その技術を知ったある程度の数の技術者を抱える必要がある。こういった流れを制約条件として見極めようとして必要なのが、広い意味でのアーキテクチャ発想です。特定企業の技術に偏り過ぎずに、自社ビジネスを支える環境を長い目での方向性として持つことの重要性視点です。その中にはライフサイクルの存在前提イメージしておく必要性が含まれます。一方で冒頭で確認したDX定義の中に「変革」という言葉が含まれていますが、余りこの言葉の持つ雰囲気に惑わされないことが大切でしょう。それは「変革」を意識し過ぎると、何か常に新しいことで置換えないといけないという錯覚に陥る可能性が大きくなるからです。また良く記事に取上げられるDX成功事例というのも、殆どはあるベンダー製品を使った一部業務の利用見本(事例)紹介のようなものであり、それは企業内での動機付けを支える材料であるとしても、それを持って自社のDX推進の成功だなどという勘違いを避けることが経営的視点だといえるのではないでしょうか。

    余り流行語に惑うことなく、変わるモノと変えるべきでないモノをしっかりと押さえる発想を大事にした上で、雰囲気に飲み込まれない形で淡々として自社のDX推進に取組む必要性を強調することが、今回の筆者のメッセージです。
  • (先頭に戻る)
  • その112: DX、ディーエックス、データ・トランスフォーメーションと唱えているが、、、

    今回は、いつものDX推奨寄りの口調を替え、少々辛口なコメントを述べたいと思います。そのきっかけは、8月17日付けの「日本の製粉大手に「前例ない」大規模攻撃 大量データ暗号化 起動不能、バックアップもダメで「復旧困難」」(ITmedia)記事でした。詳細は当該記事を参照頂くとして、概要は国内の大手製粉会社の殆どのシステムが大規模サイバー攻撃を受けファイル等暗号化され、システムが立ち上がらず、関連会社20数社へも大きな影響が出ており、復旧に相当の時間を要するとの内容です(問題の詳細は調査中)。DXといえば、システム化(デジタル化)の推進、それらシステムのネットワーク連携を通じた業務 推進 効率化といった点が真っ先に話題となります。しかしそこには業務運営に直結する落し穴があることも忘れてはいけないという例になっているといえるでしょう。

    この事例は一般的には「セキュリティ対策」に関する第一の話題として捉えられますが、実際にはデータマネジメント全般に関わる話で有り、データアーキテクチャ構想全般に渡る内容だということです。ネットワーク接続をすること自体に業務的リスクが存在することを忘れてはいけないという点に繋がります。様々なシステムがネットワークで連携を行いリアルタイムに近い形で業務の仮想形態が動くということは効率化の面で大きなメリットですが、無防備さを生む可能性を含んでいる点を忘れてはいけないということです。 本当にビジネス上、基幹となるデータに関わるシステムは、安易にネットワークに接続しないという考え方が必要かもしれません。今流行の「ノートラスト」という言葉を使うなら、ネットワーク機器やソフトウェア環境そのものを疑ってかかる必要性があるということです。特に現在の殆どのネットワークやセキュリティに関わる技術・機器は海外に依存している(米国/イスラエル/中国)という点を思い起こしましょう。実際のサイバー攻撃者が誰であり、その意図が何であったにせよ、どこにネットワーク構築環境上の陥穽が潜んでいるとも限りません。

    これらのリスク発想を踏まえたシステムやデータマネジメントに関わる構想段階を辿るのがエンタープライズアーキテクチャ(EA)設計取組みの役割であり、その活動の重要性を大きく認識する機会と捉えたいところです。特に今回の事例によるビジネス上の重大さが経営者に理解されれば、対策を立て、実行する立場にとっての機会として捉え活用したいものです。このEA構想をしっかりと実効のあるものとするためには、現在の業務やシステムの関係、およびこれからDX化推進しようとしている機能構成の明確化等を行う必要があります。そしてそれを文書化を行い、変更点があれば漏れなく更新維持し続けるという、地味で忍耐力を要する継続活動に繋げて行く仕組み作りをする必要があります。
  • 企業内でDXやシステムの監視を役目とする人々は、こういった社会的な事例を単なる他社の被害として見逃すことなく、自社のDX化を安全に進めるための材料としたいものです。そして、先に触れたように、何もかもネットワーク連携をすれば良いということではないことも、改めてDXの一要素として肝に銘じておきたいところです。
  • (先頭に戻る)
  • その111: DX活用を目指すために、関係者目線を整えるための肝は何だろうか?

    企業がビジネス推進をするためのツールとして「デジタル化」を活用するというメッセージが”DX(デジタルトランスフォーメーション)”という言葉で話題になっているというのがここ数年の流れです。これまでは大手企業中心で導入されてきたデジタル技術が、中小の企業でも積極的に利用できる環境として整っていることがその後押し材料となっているといえます。但しこの活用のためには単にモノ(いわゆるPC等のハードウェア機器、これを操るソフトウェア群)を導入しただけでは大きな成果達成につながりにくい、という点に予め気付いている人々(特に経営者レベル)は、それ程多くはないといえるのではないでしょうか?それは導入したモノの中で実際に流通している「データ」がどういうものであるかを、利用者(関係者)が共通認識を持たないために生じる滞りを生じることが一つの要因だといえるでしょう。これは例えていえば、人体構造とその中を流れる血液等に当て嵌めると分かり易いでしょう。ヒトの身体中をどのような状態で血液等が本来流れるかを把握することが、健康維持の必須条件と同様なものです。

    しかし、この「あるべき状態を知り、関係者間で共有化すること」は言葉だけで伝えることは難しいものです。そこで「データモデル」の必要性が生まれている訳です(ここでは個別的記述法には触れません)。これはデータの状況を表す地図としての役割です。往々にしてDX化或いはシステム開発というのは、短期的なものとして実施することは、それ程難しくないと考える人は少なくないかもしれません。特に期限的制約に縛られる開発者目線(或いはマネージャ目線)からすると(期限厳守を優先させて何とか動くようにしたいという考え方に従うと)そうなるようです。この場合、開発に関するドキュメントの整合性維持、特に肝ともいえる「データの地図」部分の「全体整合性」が軽視されてしまいがちです。ここでの整合性というのは、現在開発中のシステムに閉じた狭い整合性のことではなく、企業で取り扱う全体的「データ地図」との整合性を指しています。中長期的目線から作られたデータ地図との整合性です。

    地図を利用する際に、様々な尺度で描かれた複数の地図を用いているという経験は良くあることだと思います。しかしこの尺度の違った地図の間に整合性がないとどうなるでしょうか?仮に1000分の1の地図Aで目的地の配置を想定して、その場所を詳細化する5万分の1の地図Bを使って見ようとしたら、その場所に目的地がなかったというようなこと。或いは、A地図での描き方とB地図の描き方が全く異なっていたことを想像すると良いかもしれません。このような大小間の整合性が取れていないということが、個別の開発プロジェクト内の整合性だけで作られたシステム開発では起きがちという点が問題になります。つまり既に動いている他の開発システムとは大きく異なる作り方が行われてしまった、というようなことです。その集積の結果、個別システム毎に維持のための要員が必要となる結果に行き着いてしまうということに成りかねない。

  • こういった問題発生を避けるために、全体の開発システム(特にデータ)間の整合性確保を図る試みがデータマネジメントの役割であり、データについてはデータモデルを活用するということです。単に個別毎にデータモデルというツールを利用していれば良いということではなく、「全体の整合性を維持した形」でのデータモデルを横断的に利用・運用するということです。この点を忘れると、個別のバラバラな地図の集まりという結果になり、それに気付いても後の祭りということに陥ります。そういった視点から考えると、この全体整合性を確保するための試みの鍵を握るのは、開発者側でなく利用者(利用企業)側 にあるべきだということが分かります。少なくともこういった整合性を確保する機能を「利用者側の目線で動かす仕掛け」を必要とするということです。
  • (先頭に戻る)
  • その110: 「専門家がデータだけを単に見ていても根本的対策にはならない」という話

    今回は、少しばかり視点を変えて最近の身近な体験から始めます。昨年末頃から自分の部屋を対象に大規模な断捨離作業を行いました。その際、結構重い荷物の相当量の片付け作業を続けたせいもあり、本年1月後半から右肩から腕を中心に痺れた状態が現れ、どう対処したら良いかを思案する状態となり正直困った状態となりました。その状況から普通の病院を訪ねてみても余り抜本的効果は期待できないと思えたため、敢えて視点を変えて整体師探しを始めることにしました。そこで心当たりの知人に相談し、予約の上訪問し背中と腕回りを中心にした調整をする形を取りました。結果として、そこでは50%程度の回復度合となり、暫くの様子見モードとしました。

    その後1ケ月ほど経ち、調子が上がらない状態が続いたため、次の対策として人生初めての鍼灸治療を試みようと思い立ち、次にその候補探しに入りました。この探索経緯の詳細はここでは省きますが、その後の約1ケ月半位を身体メンテナンスと位置付け施療を続けた後の健康状態として、ほぼ完治状態に至ったことを書いておきます。更に期待以上の効果要素として、それまでの健康診断で血圧が高いと判定され、掛かりつけの医師からの対処策として一般的に処方される血圧降下剤の適用を受ける状態がしばらく続いていましたが、その症状が大きく改善し、当該の薬剤を服用しなくとも良くなってしまったことが驚きとなりました。つまり、過去数年間、根本的な対処策を見いだせなかった身体状況が、1.5ケ月程度での鍼灸処置で抜本的に改善してしまったという結果になった訳です。

    ここで話題にしておきたいポイントは、通常の病院での対応(主に内科)パターンというのは、医師が簡単な症状を患者に聞きつつ様々な検査(血液等)を取入れ、その結果から得られた数値を頼りにした症状への対処策として、薬を処方し症状変化を(長期的に)様子見を続けるという形態が多いということです。基本的には重傷状態でない限り、薬剤処方後の状況の様子見と、3~6ケ月位の間隔での再検査から得られる数値結果を頼りにすることを繰り返すという方法が取られているといえます(経験的に)。つまり患者側からすれば、本人の症状そのものよりも検査から得られた数値データを最重要視する方法論といえます。これに対して、当方の経験した鍼灸治験の方法では訪問者との対話を通じて得られる状況を把握しながら、身体に対しての具体的直接対処法を取るという方法によります。言ってみれば医師という専門家視点からの数値データ依存主義か、個別的に人を観察した上での対処策実行主義かという違いであったと筆者には捉えられます(実際にはこれに加えて、筆者本人の飲食や習慣の改善努力が加わりますが)。
  • この経験を、筆者が常々この欄で取上げているデータとの関係として敢えて経験的に関連付けるならば、ある課題現象に対する抜本的な対処策を検討するためには、単に得られたデータを中心に見ているだけでは対処上の考慮不足に繋がってしまうと改めて考えられた事です。つまり、周辺環境や個別状況を把握しながら対処に向けて注意深く捉える必要があるということといえます。話が飛んでいると思われてしまうかもしれませんが、筆者の経験を通じた類推として敢えて取上げると、DXという話題を中心にした昨今の混乱あるいは粗製濫造といえなくもない産業界の動きへの警鐘として、一石を投じておきたいという、今回の筆者の体験物語であったという次第です。
  • (先頭に戻る)
  • その109: 設計対象を「論理」と「物理」で截然と分けて見ることの意味付け

    今回は、システム化の計画あるいは上流設計/分析のタイミングにおいて、対象を検討する上で「論理的」な捉え方と「物理的」な捉え方を意識的に分けて考えることの意味および重要性について考えることにします。このきっかけは、あるシステム的なテーマ検討をグループで行うに際し、中々咬み合わない議論の原因がどこから来ているのかを見直したことからでした。こういった見方にヒントを与えているのはエンタープライズ・アーキテクチャ(EA)で有名なザックマン・フレームワークが貢献していると思えます。

    対象を検討する際に、技術的にその対象領域に詳しい人間であればあるほど、その技術的な実現方法(仕掛け)やどのように取り扱えば良いか、そのためにはどの技術を利用するか等という点に目が向きやすいものです。十分な要件が揃ってきた後や、その実現の仕組みを一段深く掘り下げる場合には、その技術的視点が大変役立ちますが、その前段階で細かい技術要素を混在させてしまうことは、往々にしてアイディア発想に水を差してしまうことがあります。この細かな技術要素(例えば、具体的なソリューション)を考慮した設計段階を「物理的」な設計段階とここでは捉えることにします。その前の実現したい機能/プロセス段階で対象を捉えることを「論理的」な設計段階とします。

    この論理的と物理的を截然と分けて捉えることのメリットは、(1)特定の(技術的)制約に囚われる可能性を低減する、(2)ある技術(またはベンダー)製品に縛られない発想を可能にする、といった点にあるものと考えられます。特定の技術要素から目を離せなくなると、発想の本筋から外れてゆくこともありえます。また、アイディアを他者と共有するに当たっても、複雑度が混じり込んでスムースなやり取りの機会を逃すという可能性も高まることになります。ある特定の技術的ソリューションやツールを取り扱うベンダーやSI会社(或いはコンサルティング企業)と構想の早い段階から付き合い出すと、時に混乱が生じたり、方向性への偏りが生まれることがあるのは、こういった点が背景にあるものと考えられます。

    しかし、技術的に大きな飛躍がうまれた場合や、特定の技術を生かした設計を行いたい場合には、上記の議論は必ずしも当て嵌まらないことがある点を考慮に入れておくことも必要なことがあります。この辺りの見極めに対して明確な区分点はないといえますが、そこが発想を練ることの面白さだということができます。多くの場合は、一旦必要な論理的方向性が決まれば、次にはそれを実現するための技術要素と利用可能な資源を深掘りし、徹底的に邁進して行くというのが成功への秘訣だということができるでしょう。発想・設計の早期の段階では余り技術面に拘らず検討を重ね、段階が進んで実現性を練る段階では利用する技術要素に徹底的に関わって行くというのが、ここでのポイントでしょうか。

  • 最後に繰返しの言い回しになりますが重要な考え方として書き留めておくことにします。(1)論理要素と物理要素を混在させて考えてしまうと、対象の物事を複雑化させる可能性を高める。(2)それがアイディアの交換に支障をきたすことがある。これは筆者の個人的経験から来る考え方である点も付け加えておきます。
  • (先頭に戻る)
  • その108: データ管理をライフサイクル発想で考えることの重要性

    5月18日オンライン形式でのDama Japan(データマネジメント協会日本支部)第10分科会月例勉強会が開かれました。DMBoK2第5章「データモデリングとデザイン」ベースの話題提供に始まり、改めてデータモデリングの位置付けの議論が主な話題となりました。この分科会はデータモデリングに興味を抱くメンバの集まりで、活発な意見が交換され一応の盛り上がる時間となっています。そこでは、企業で利用するデータをモデル化することが、企業活動でどういうメリットを生むのかが一つの焦点になり、参加者の経験を共有する場面があり、筆者も議論に参加しながら考えた以下の点を、今回の意見として記述します。

    共通の内容として出た意見で目立ったのが、仕事で関わるビジネス関係者との間で「互いの目に見える形で(つまり言葉の雰囲気だけでなく)今回実現したいことを共有する」ことが重要だという点でした。言葉だけでは見過ごされがちな様々な制約事項や要件が、参加者の間で共有するための「地図」としてデータモデルが経験として役に立つということです。但し、最初は地図の読み方・書き方に関する簡単な学習時間が必要です。このデータモデルを共有することで、関係者のコミュニケーション環境が飛躍的に向上する。これが一番のメリットだということでした。しかし、同時に筆者には、単なるビジネスおよび技術的な地図表現に加えて、そこで利用する地図表現の粒度にも気を配る必要があると思えました。つまり、ビジネス寄りの立場で考える人達との間では「主要な対象表現レベルでのデータ表現」、技術的に実現(システム化)する人達との間では「具体的で詳細なレベルでのデータ表現」で共有する必要があるという点です。そしてその根本に加える必要性があるのものとして「ライフサイクル」の考え方であると思えました。

    例えば「単一のプロジェクト」という比較的短いスパンの時間軸でデータ取り扱いを捉える立場では、当面「うまくプロジェクト成果に結びつけばそれでよし」という考え方になりがち。一方、中長期的に複数のプロジェクトやビジネス活動に携わる立場では「それらの間の整合性を維持する必要性に気付いている」という点です。この2面性に加えて、第三のコスト(予算化)と利用資源という制約事項が加わります。この第三の面で重要な役割を果たすのがスポンサーであり、基本は経営者がその立場に置かれることになります。これらの関係者の合意に役立てるツールとしてデータモデルという地図が必要となり、その粒度を決定する要素として、「データライフサイクル視点」が強く関係するということになります。

    ここではデータライフサイクルに関する考え方の基本はDMBoK2の参照に任せますが、システム化された環境を中長期的に維持し続けるためには、特に合計の蓄積された費用面で欠かすことのできない視点です。プロジェクトのような短期的視点だけで考え出されたデータモデルXという地図は利用上の寿命が短い。作成する手間を掛けた割には長く利用し続けることが困難である、或いは時間が経つと陳腐なものになるという訳です。時間的スパンが長く、複数のプロジェクトを見据え、できるだけ普遍的なスパンで描かれた地図としてのデータモデルは長期的に信頼度の高いものとして利用できるものになる。そして結果としての総合費用や資源の削減に寄与するという訳です。実現性を考える上で、この関係を気付く経営者こそ貴重なものといえるのでしょう。なぜなら現場に近い関係者ほど「長いものに巻かれる」立場におかれ、時間制約に依存せざるを得ないからです。
  • 企業における「データモデル」という地図作りが、以下にそれを取り巻く環境に影響されるのかという理由を考えてきました。しかし、この点にいち早く気付いて活動することが重要性を増すことも事実です。寿命が短く、繰返し費用を支出し続けることを許容できる経営者の場合は、特別な例ということになるでしょうが。筆者の立場としては、そうでないことを期待したいですが。
  • (先頭に戻る)
  • その107: 組織的データマネジメントの目標とは --- 視野とスパンの共有を目指す仕組み作り

    データマネジメントに取組もうという人たちと話題を交換していると、自分のところで中々うまく行かないという声を聞くことが、この言葉が広まってきたといえる今でも大変多いです。今回は、何故そのような状況になっているのかという点を考察します。良く耳にするその中の代表的理由を3点上げるとすると、(1)経営者に理解されない、(2)費用対効果がうまく説明できない(納得してもらえない)、(3)組織的活動に結びついていない、といったことが筆者の経験から来るものといえます。恐らく百人に尋ねても、90人以上の方々が賛同するのではないかと思えるほどです。

    第一および第二の理由は、似た側面を持っています。つまり経営者の重要な視点の一つにROI判断があり、その見方から言って効果が見えないというのが上からの考え方。そして、こういうことが実現できれば効果に結びつくと説明できないというのが下からの立場だという関係といえます。これは一見相反しているように捉えられますが、実際には同じ根っ子からきているというのが筆者の見方です。それは一言で表すならば、誰のためのデータマネジメントなのかが本当には理解されていないということでしょう。

    DXやRPA,AIといった新しそうな流行語には容易に飛びつくことが多いにも関わらず、そういった活動を支え、また経営判断の根本ともなり得る「事実データ」をしっかりとマネジメントしてゆくという発想が理解されないというのは大変不思議なことといえます。どのような仕掛け、手続きから目の前のデータ/情報/報告書が出来上がっているのかをきちんと説明できないとしたら、経緯者の判断は、一体何を元に行っていることになるでしょうか。そして、中間マネージャ層の人々は、どのようにして日々の活動を行っていると納得できる説明をするのでしょうか。このような見方に立つことができれば、(1)、(2)の理由付けは簡単、つまりデータマネジメントにしっかり取組むというのは、技術的な見方ではなく、経営の根本を支えているということが理解できるはずです。

    第三の理由付けの根本にあるのは、データマネジメントは個人プレーではないということが関係者の総意として理解できていないところから来ているモノだと筆者は考えています。それ故に、データをしっかりと管理してゆくための責任体制が曖昧になってしまうということに繋がります。これは組織が大きくなればなるほど顕著なものになると言っても言い過ぎではないと見えます。データマネジメントの成熟度評価という考え方がありますが、そこでは組織の成熟/拡大に応じた評価が段階的に高まるという視点を取入れていることが多いです。つまり個人あるいは小組織から始まったデータマネジメントは、組織的成長に従い変化を取入れ、共同的活動として展開する必要があるものだという見方があるということを示しています。

    そしてこのような見方に辿り着けないのは、組織内でデータの取り扱いに関わる関係者の見ている方向性、および長期・短期の時間軸といったものがバラバラになってしまっていることを上げられると考えます。短期的成果を上げることに益々捕らわれること、目の前の形作りに追われる活動、狭い視野でしか見えない業務、といったことの集合体からは、しっかりとした中・長期的データマネジメントの組織作りは生まれないのではないかと見えます。 それに対して、経営者の胆力、継続的に地道とも見える活動を続ける意思、そしてそれを推進する土台作りと技術の活用、これらを抜きにはデータマネジメント活動の成功はおぼつかない物と筆者は考えます。
  • 筆者も参加している データマネジメント協会日本支部(Dama Japan)では、データマネジメント理解の促進を目標に掲げ、定期的な勉強会開催(分科会)などを通じてデータマネジメント実践の理解・促進を図ろうとしています。このような活動に興味のある方は、是非参加検討下さい。
  • (先頭に戻る)
  • その106: 取組み対象課題・問題の定式化が重要性を持つということ

    前回は様々な自分メディア利用に当たっての注意点を考えました。今回は、業務利用におけるDX自動化の話題取組み検討の際に、改めて考えておく必要がある話題を取上げます。それは表題の通り「取組み対象課題・問題の定式化」の重要性です。

    技術面ではハードウェア、ソフトウェアの様々な仕組みが揃ってきて、しかもそれらを以前とは比べものにならない位の費用で利用できる時代になっている事は明らかです。しかし、それらを利用する上で単なる「人が行う作業を置き換える姿勢」で取組むというのは大変残念であり、しかも時間と費用の無駄使いに繋がってしまうことになりかねません。 幾らでも人を投入し費用を掛けることができる一部の大企業はさておき、その他の企業にとっては選択を誤ることは、死活問題に繋がるといっても言い過ぎではないといえます。しかも先に書いたように、技術的には十分、人余りの大企業もできない環境を構築することが容易にできるようになっていることが重要です。工夫次第で幾らでも時間を節約できる環境を利用しないことは、大変「もったいない」ことです。

    ただ、その技術を利用する上で 、 対象課題に闇雲に取組むという姿勢では効果半減以上であることも忘れることができません。つまり、対象課題をうまく定式化し、利用技術を効果的に利用する方向性を誤らないことが 「成功への 道」に繋がっているということです。一例を挙げると、「ソルバー」という仕組み・ツールを利用することは今や誰にでもできる環境にあります。しかし誰でも使える環境であっても、それをどう使えば課題に効果的に取り組めるかという知識がなければ「ソルバー」という言葉は、何の役にも立っていません。実はこのソルバーというのは「生産計画」「輸送問題」「「様々な資源(人・モノ・金)の配分最適化」「スケジューリング」といった様々な日常的課題の多くの解決策を「数値的に」導くことができる魔法の箱といえるものです。しかし、それを利用する上で、対象課題をどのように整理し定式化することができなければ利用もできないということです。

    少々技術的な話題から入りましたが、このように技術が既にあっても、その存在や利用方法に気付かないということは、案外多いという点が重要です。取組む課題の要点をうまく引き出し、定義し、利用技術に合うような形に定式化できれば、それをかなりの確率で解決に近づけることができるようになっていることに気付く必要があります(しかもそれほど多くの費用をかけずに、取り組める環境ができてきている)。この時代、その気づきに近づくことは、本当の経営者・リーダーの大きな責務であると言って間違いないでしょう。そのための勉強時間も少しは必要です。時間が足りなければ、そういったことに適した人材を登用し、日々相談するという方法もあるでしょう。 課題の定式化とそのための技術選択の部分は、信頼のおける専門家に任せることも一案です。信頼がおけるかどうかの目利き力も経営者の資質です。
  • ここまで読んで頂いた方々は多くはないと想像しますが、もしこの具体的な内容に興味を抱く方があれば「お問い合わせ」欄からご連絡下さい(全てのご縁のある 方々へ)。
  • (先頭に戻る)
  • その105: さまざまな自分メデイアの光と影

    今回は少しいつもとは趣を変え、昨今の自分(オウンド)メディアの流行に関連した、筆者の思いを記します。ここでは所謂SNSという分類に属することの多い、facebook、twitter、Instagram、youtubeや最近では音声を扱えるClubhouseやradiotalkなどを想定しています。

    こういったメディアの光の部分は、ネットワーク環境の拡大とスマートフォン、タブレット、PCといった受発信の媒体が、その上で動作するアプリケーション増大と共にもたらした、一般の人たちが自分の日常的思いをやりとりすることが容易になったという点です。これにより様々な世代間のコミュニケーションが広がることを可能としています。共有できるテーマに関連して人々が集まりサークルを作りやすくなったとも言えます。文字は勿論、画像、動画、音声など多くのデータ形式を混ぜて取り扱えるというのも技術発展の要素です。恐らく、こういった多様なデータを発信者の属性情報付きで収集するための格好な入出力源になっていうことでしょう。背景には、そのような大規模の時系列情報をメタデータ付きで保管できる環境を備えた企業・団体があるということです。

    そのような自分メディアの利用者が増大するに連れ、その環境を自社CMの提供の場にしようというビジネス発想が紛れ込んできます。この方面からのアプローチが増えるに従い、利用するパーソナル・コミュニケーション或いは情報共有関係が乱れてきます。雑音の増大といったら分かり易いでしょうか。また、利用可能メディアが増えるに沿って、利用者の興味環境も移り変わり薄まってゆくともいえます。こういう移り変わりを生むことが利用面での影(陰)の第一点です。特に大きくなった自分メディアでの雑音の大きさは日々増大している実感があります。それを報酬を提供して増大させているというメディア提供側の思惑も絡んでいることがややこしさを生んでいる。

    次に、様々な利用者が混在し、開かれたメッセージ公開環境では他者の発信に対して意見を出すことが容易になった結果、背景を無視した批判や中傷の類いが増えてきているとも考えられます。割り込みをしやすくなったともいえるでしょう。これは文化の乱れや混乱を助長する要素になっている、と考えられると筆者は考えています。ある意味では、そのような乱れを嫌がるサークルのクローズ化という方向を生むといえるかもしれません。この辺りは、当該参加型メディア 利用者の動機とも関係しているでしょう。どのようにフィルタを懸けるかという選択要素になり得ます。そういったフィルタ技術を安心して使えるオプションを提供する自分メディアが受け入れられ易くなるということがいえそうです。

    更に、様々な形式のデータが属性や関連性情報を含めて大規模に収集・利用できる環境が整った結果、解析技術の向上と共に影の部分を生んできていると見ることができます。これを短くいうとAI技術と呼んでしまえるでしょう。表に出て喧伝される利用可能技術も多くあり、それは社会的に役立つものが少なくありません。今後の社会に取って必要な技術要素が膨大なデータ収集により進展していることは事実でしょう。一方で表立ってきてはいませんが、そういった大規模なインフラ技術を提供する側の、情報統制、一方的メッセージ発信、電子的情報焚書現象を生み、それを可能にする環境となってきているということができます。実際それが技術的に可能になっており、行われていることが目に見える形で現れています。これが最も大きな影の部分といえるかもしれません。利用する側の、大きな意識・文化的リテラシー力が要求されるといえるでしょう。 古くから、公にされている歴史は、事実の集合ではなくその時の為政者の考え方の集まりだと言われてきました。それが電子的環境の中で、容易に大規模に実現できるようになったといえます。
  • いつもながら、この欄に結論はありません。今後は益々、自分メディアを代表にする電子的環境との触れ合い方、情報の選別・探索方法を磨くことに時間の重点が置かれてゆくことになりそうだと日々考えているところです。
  • (先頭に戻る)
  • その104:  データを共有できるようにし、再利用化を実現する方法

    コロナウィルス話題の収束道筋はまだ見えてきておらず、政治、マスコミといった機能は相変わらず本来の役割を果たしていると考えられない状況が続いています。こういった中で、本ページを訪れた方々は如何お過ごしでしょうか。それでも世の中は動き続けるという意味で、ここでは多様な視点からの意見、情報の提供などを続けて行こうというのが筆者の立場です。データの蓄積とその活用が一般社会の話題として取り上げられるようになって数年経っています。今回は、これまでにも当欄で何度か繰り返してきた点の中から、蓄積されたデータの共有と再利用化実現を目標とする人々に向けての重要ポイントを説明します。

    第1は、蓄積した/するデータが分かるようにすること。これは、データの名称、取込時期、意味内容、出典、使い方の基本形、責任部署(データオーナー)、利用可能期間といった点を明らかにするということです。これらの情報は「メタデータ」という呼び名で表されることが一般的です。それを可能にするのが、データの流れを整理し、効率性を考えてシステム的に管理可能とする技術です(単純に「ツール導入」という意味ではありません)。そして、これらのメタデータをデータ利用者が参照できるようにすることが大切です。そのための技術的環境は、整ってきているというというのが現時点の状況といえます。そしてそれらデータの構造・構成を整理し管理しやすくするのがデータモデリングという考え方です。

    第2は、不用になった、あるいは正味期限の切れたデータは思い切って捨て去ること(データ断捨離)。不整理なデータほどデータの管理という点で厄介なことはありません。管理上の手間を要するだけでなく、データの利用者が誤った利用をすることによりビジネス上での悪影響・誤った結果を引き起こす原因となり得るからです。こういった点を確実にするために、データのライフサイクル管理という見方が必要です。このデータの要・不要を確認できるようにするためにも「データオーナー」設定が必要ということになります。もし利用継続が必要と判断される場合、データ項目構成や利用規則が時間経過の中で変わる時点を明示する工夫が必要となります。

    第3は、いわゆる「マスタデータ」の正確性を確保することです。マスタデータは、2種類の役割に分けられるという見方があります。一つは1件1件のデータの使い方が重要視されるもの。これに該当するのが、顧客データ、取引先データ、商品データといった分類に当たるものです。これらはデータに含まれる項目の種類、利用方法、項目中内容の正確性維持が特に大切です。二つ目は、ビジネスシステム上でのデータの整理視点を定義し利用者へ提供するデータです。これには外部で標準化されたデータ(例えば郵便番号とそれに紐付く住所)も含まれます。この種類のデータは参照性を決めるという意味で、特に「リファレンスデータ」として呼ばれています。このリファレンスデータは利用者のデータ扱いの視点を決定付けるという役割があるため、特にデータ品質が重要視されます。この種のデータの内容決定に当たっては、コードそのもの(意味、値)への利用者との突き合わせが大切です。

    最後に必要とされるのは、これまでに書いてきたデータ取り扱いの仕組み作りと、維持管理を可能にする体制を準備することです。これは形式的に呼称を持つ人を作れば良いということではなく、実質的な役割を果たせる人材が必要とされます。そのための権限割り当てと人的資源を用意するという意味です。そのための意思と動機付けが大切でしょう。このコロナ騒ぎの中で人的流動性が高まる中、こういった人材を用意することは企業にとって、今後益々難しくなる可能性が高まることが危惧されます。
  • 今回は、データ共有と再利用化を図る上での基本的で重要な要素を振り返ってみました。
  • (先頭に戻る)
  • その103:  データマネジメント・アンソロジー(Part2)の報告

    引き続き、前号で予告したデータマネジメント協会日本支部(Dama Japan)の第10分科会、月例ミーティング実施結果の報告です。今回の参加者数は、過去最高タイ記録に1名足らずの18名という状況でしたが、この種類のオンライン会議分科会としては、それなりの人気企画になったのではないでしょうか。Part1のレビュー(前回ディスカッションされた内容の更新)から始まり、追加の第5、第6話プラスアルファ版を実施しました。題目は 「データモデリング・アンソロジー Part2 データモデルの応用への道筋探訪」としました。今回の資料抜粋版を、Part1の抜粋版を游悠レポートのページに掲載していますので、興味に応じてそちらも参考にして下さい。

    前回にも触れましたが、Part2の話題概要は以下のような内容です。 第5話 「データモデリングの更なる適用範囲を考える」 ・論理データモデル発想の活用場面の視点 ・コミュニケーション、視覚化のためのモデル利用性 利用可能なデータの種類や分量が増大するにつれ、DX、IoT、AI等の新しい用語・技術分野が注目を集めています。これらのデータ利活用に向けて、データモデリングをどのような場面で活用可能か、着目する分野に目を向けた今後に向けた再確認の議論をしたものです。

    第6話 「先の分科会で出たメンバ疑問を深堀り議論する」 ・ 「発注」は独立エンティティ名の選択肢として妥当だろうか? この議論に先立ち、日本語と英語の違いの議論を追加することにしました。概念/論理データモデリングに当たって、しばしばエンティティの検討には名詞を切り出すのが着目点であると時々いわれるからです。欧米発のデータモデリングを取り入れる際に、「日本語と英語それぞれの持つ『言語感覚』に大きな相違点があるという点を再認識する」という筆者の趣旨です。これを「猫」と「Cat」単語発想の違いを例に、参加者に問い掛けました。

    多様なデータ種類、そしてセンサー等を含んだ発生源の拡大という環境の広がりの割には、そのデータに関わる人々には、データをしっかり見つめるという意識がそれほど高くはないのではないか、というのが筆者の視点です。 何となしにデータが粗製濫造され、それを入門したての技術者(それをデータサイエンティストと称して)が扱ってみているという例が少なくないのではと筆者は見ています(それを暴言といわれるようなら甘んじて受けることにしましょう(笑))。勿論言うまでもなく一部の例外はあるということも認識しています。そのような状態に、データモデリング発想とデータモデルという技術、表現力が役立つものと筆者が考える点を第5話で強調する所以です。

    データモデル図は、基本的に言語によるルール表現を図で表したモノというのがER図(エンティティ-リレーションシップ図)であるというのが欧米的発想です。従って日本語表現との発想の違いを合わせて見直したらどうかという視点で第6話を取り上げました。これを簡単なクイズ形式で参加者とのやり取りを行ってみました。この問答は、コメントから見るに、それなりに楽しむ時間となったようです(筆者憶測)。日本語単語と英語単語により、少なくとも使用者の使用感覚の違いを再認識する良い機会になったことは確かだと思います。これをデータモデリング視点で捉えると、基本的な独立エンティティ(リソースおよびイベント)にどのような語を据えたら良いかを考慮する一助になるものです。

    また、データモデリングにおけるオントロジー発想の取り入れに関しても議論の話題としました。海外のデータモデルで取り上げられる(例:パーティモデル)、所謂「クラス」や「ロール」のような見方は、工学的オントロジーと密接な関係があるということができます。更に他の話題として、グラフデータベースは、「インスタンス、属性指向」、ER図は「エンティティ、クラス指向」であることも参加者に理解されたものと考えます。

    上記の工学的オントロジーに関しては、今後別途のDamaJ第12分科会で話題の一つになってくる予定です。この第12分科会次回開催予定は、2021年3月4日(木)19時~20時30分です。興味ある会員は参加して下さい(ZOOMオンライン会議)。
  • (先頭に戻る)
  • その102:  データマネジメント・アンソロジー(Part1)の報告と次回予定

    前号で予告したデータマネジメント協会日本支部(Dama Japan)の第10分科会、月例ミーティングの件の報告です。FBも利用した事前案内も幾分か効果があったためか、第10分科会としては過去最高タイの参加者がオンライン会議に訪れ、Q&Aを含めた2時間がアットいう間に過ぎる形になりました。提供話題に花が咲き、多くの議論が交わされアンソロジー第4話までを熟すのがやっとという状態になりました。好評を博した結果、第5、第6話プラスアルファ版を、引き続き2月26日(金)に実施予定となりました。題目は「データモデリング・アンソロジー:『マスタ=リソース』発想だけでは無理を産む?!・・・などなど 」を受け継ぎ 「データモデリング・アンソロジー Part2」となります。第1回の説明資料抜粋を游悠レポートのページに掲載するので、興味ある方はそちらも参考にして下さい。

    引き続きとなったPart2の話題概要を、以下に紹介しておきます。Jama Japan会員ならどなたでも参加申込できますが、分科会主催担当理事宛に事前参加申請が必要です。

    第5話 「データモデリングの更なる適用範囲を考える」 ・論理データモデル発想の活用場面の視点 ・コミュニケーション、視覚化のためのモデル利用性 利用可能なデータの種類や分量が増大するにつれ、DX、IoT、AI等の新しい用語・技術分野が注目を集めています。これらのデータ利活用に向けて、データモデリングの考え方がどのような役割を果たすべきかについて議論する予定です。着目する分野に目を向けた将来への議論といえます。

    第6話 「先の分科会で出たメンバ疑問を深堀り議論する」 ・某分科会メンバX氏からの疑問  -「発注」は独立エンティティ名として妥当でしょうか?? 告知時点で予定していたこの答えの検討を始める前に、日本語と英語の違いの議論を追加することにしました。それは論理データモデリングに当たって、しばしばエンティティの検討には名詞を切り出すのがポイントであると言われることがある点です。欧米発のデータモデリングを考えるに当たって、「日本語と英語という言語の持つ『言語感覚』には根本的な違いがあるという点を認識しておくことが重要なのではないか」と筆者が考えているからです。この点を、「猫」と「Cat」の違いを事例にして一緒に考えることにしました。これもきっと議論噴出の場となることは間違いないでしょう。

    データモデリングを検討する際には、前回の第4話、および今回取り上げる第6話が関係するオントロジー領域の話題が重要になってきます。 元となる哲学的発想までは行かなくとも、データモデリングで対象となるモノの概念、抽象化ということの意味を理解しておくことが、工学的なオントロジーの内容です。今回の第10分科会議論とは別になりますが、金融業界ビジネスオントロジー(FIBO)をベースにした内容を検討する第12分科会も本格的に立ち上がりました。そこではグラフデータベース利用の実践も考えています。
  • 次回分科会開催日時は、2021年2月26日(金)19時~21時の予定です。オンライン会議システムZOOMを利用します。Dama Japanの参加メンバであれば、誰でも幹事への事前申込を行うことで 参加できます。興味のある方はこちらを参照ください。 [データマネジメント協会日本支部ページ] この様子も本欄でレポートしたいと考えています。引き続きご期待ください。
  • (先頭に戻る)
  • その101:  データマネジメント・アンソロジー(Part1)
  • 筆者が所属しているデータマネジメント協会日本支部(Dama Japan)の第10分科会、月例ミーティングの2021年最初の議論話題提供として、当方が以下の題目で1時間ほどオンライン形式でプレゼンを行います。その後1時間ほどの参加メンバディスカッションを実施する予定です。題目は「データモデリング・アンソロジー:『マスタ=リソース』発想だけでは無理を産む?!・・・などなど 」。 ここで「アンソロジー」という語を敢えて表題に付加したのは、筆者がこれまで課題事項として考えていた内容を、それぞれエッセンスを要約気味に整理した形で理解を促し、当日の参加者から様々な形での議論を引き出そうという考えからです。そこで話題にしようとしている項目を、本欄で手短に紹介しようというのが今号の趣旨です。

    第1話 「今からながらのデータモデリング必要性を議論する 」。 ・データモデリングの目的/必要性/意義 ・6つの大きな誤解とは・・・ データモデリング はDXが声高に叫ばれている中で その重要性に関わらず、 ややもすると専門家だけが語る小難しくて理屈先行のとりとめ無い分野と一般には捉えられているというのが現状です。一方専門家側にも 誤解が生まれていると筆者は考えています。 データモデリングが果たす役割を再確認し、誤解を認識した上で、今後どのように活用すべきかの議論を深めたいところです。

    第2話 「データモデリング・アプローチを議論する」 ・トップダウン・アプローチとボトムアップ・アプローチの溝 ・レガシーに含まれる発想の罠 データモデリングを実施する方法としては、対象とするデータを題材に上流から攻めるトップダウン・アプローチと、下流から攻めるボトムアップ・アプローチがあります(最終的には強弱の差はあれ、これらをミックスして仕上げる形ですが)。これらのアプローチはビジネス指向およびIT指向とも関わりがありますが、それぞれの特性を踏まえた考慮が必要です。そういった考慮点を議論します。

    第3話 「マスタデータ=リソースデータ発想を見直す」 ・マスタデータの「狭義」と「広義」の区別を再認識する ・データ資産とは何だろう?? データモデリングの対象とする「データ」は、どのように分類され、どういった取り扱いが必要かを簡単に議論したいと考えています。共有するデータを検討する上で大切な考え方が話題です。

    第4話  「リレーショナルスキーマ以外の論理データモデリング」 ・オントロジー発想から ・グラフデータのための論理モデル表現に目を向ける 現在はそれまで主流とされてきたリレーショナル・データベース以外にもさまざまな形式のデータベース基盤が存在します。これらのデータベース基盤を利用して物理的なデータベースを作り上げる上で、リレーショナル設計の考えを元にした論理データモデルを行うことの重要性を例を交えて議論します。また、物事を見る上での概念化を図るオントロジーについても若干の検討を行います。

    第5話 「データモデリングの更なる適用範囲を考える」 ・論理データモデルの活用場面の視点 ・コミュニケーション、視覚化のためのモデル利用性 利用可能なデータの種類や分量が増大するにつれ、DX、IoT、AI等の新しい用語・技術分野が注目を集めています。これらのデータ利活用に向けて、データモデリングの考え方がどのような役割を果たすべきかについて考えることにします。将来に向けての議論といえそうです。

    第6話 「先の分科会で出たメンバ疑問を深堀り議論する」 ・某メンバX氏からの疑問   -「受注」は独立エンティティ名として妥当でしょうか?? ・さて、この答えは如何に?!?! これは分科会の議論に特化した内容ですが、先に実施した分科会議論の中で出た疑問について、筆者なりの考え方を披露し、意見交換を行います。メンバ間の激論必至が期待されます。

    この分科会開催日時は、2021年1月29日(金)19時~21時を予定しており、オンライン会議システムZOOMを利用して実施します。Dama Japanへの参加メンバであれば、誰でも幹事への事前申込を行うことで 参加できます。興味のある方はこちらを参照ください。 [データマネジメント協会日本支部ページ] 分科会終了後、当日の様子をレポートしたいと考えています。ご期待ください。
  • (先頭に戻る)
  • その100:  データマネジメント的断捨離考

    筆者にとって2020年の最後の数週間は、それまでに溜まっていた様々な器物・紙類を整理・廃棄をする集中期間となりました。これを世間で使用されている簡約的な語で言えば「断捨離」と表現すると通じ易いようです。この断捨離という後をウィキペディアで参照すると、元はヨーガの実践者であった沖正弘先生(故人)の1976年著書で使用されているとのこと。その後、山下英子さんの著書が2009年にヒットし一般に知られる語となったと説明があります。因みにこの山下さんは、この「断捨離」という語を幾つかの区分を対象に商標登録を行っています(2003年に最初の出願。その後区分範囲を段階的に拡大、一部は現在も出願審査の対象となっている。詳しく知りたい方は特許庁Webサイトの商標検索で確認可能)。ここではそのような役務登録権利の話はさておき、その元の考え方として一般に理解される「意志的にモノ(等を)片付ける」という内容そのものを取り上げます。

    ビッグデータ、DX、AIという業界用語で理解されるデータ活用領域の話題として、実は大量のデータを貯め込むという点が強調されがちですが、実は反面の考え方として「データを捨て去る」ことも、データマネジメント視点からの重要性として指摘できるというのが今回の指摘ポイントです。データマネジメントとデータの断捨離(意志的なデータの整理/片付け)の関連はどこで特徴付けられるかといえば、「データライフサイクル」の視点です。DMBoKを参照する際には、主に第9章「文書とコンテンツ管理」で語られる内容といえます。データを取り扱うには、その発生から利用という面だけで無く「廃棄」に至る時間的スパンとして、可能な限り最初から計画すべきであるということです。限りなくデータを蓄積するという考え方は、当該データの利用品質に大きく影響を与えるという反面もあります。データの発生・蓄積・加工・流通、そして廃棄という一連の流れを把握・管理できてこその「データ」活用である、ということです。

    このライフサイクル発想に従ったデータ管理をするためには、標語として「CRUD」(Create:作成、Refer:参照、Update:更新、Delete:削除)の関係として表現することが基本的な考え方です。但し、実際にはデータの流通(複製/枝分かれ)という現象が頻繁に発生するため、単純に管理できるということにはなりません。この辺りが、目に見えるモノと、電子的に表現・蓄積される「データ」との決定的な違いになります。従って、データの流れとしての連結性(リネージ)として可能な限り見える形での管理方法を実現することが必要です。更に複雑さを拡大するのが意味の正確性を維持管理する必要があるということになります。これがメタデータ管理の大切さが声高に語られる要因でもあります。

    データを利用・加工・参照する関係者が増大するに連れ、ライフサイクル管理の複雑度は将にネズミ算で示されるいわば幾何級数的に拡大するため、対処は早い内に行うというのが要点となります。可能な限りデータの流れを簡略化する意志的努力が必要であるということです。これにより管理に必要とされるリソース(関係者・コスト)にも大きな影響が出ます。こういった視点で整理するという意味で、データアーキテクチャ発想も必要となります。

    既に存在するシステムから生まれるデータを取り扱うためには、データ棚卸しの実施と優先度視点からの交通整理、或いは思い切った意思決定を通じての廃棄決断ということが必要です。そういったことを中長期立場から継続的な活動として見ていくことのできるリーダーが企業において必要とされる理由となります。このようなリーダー抜きでは、最終的なデータの断捨離の成功に繋げることは困難であるといえます。しかもこの活動は一時的なものではなく企業の持続的なものとしなければなりません。このようなデータマネジメントを実現できない企業というのは、長期的に見れば、リソース(人・組織・金・時間)を大きく無駄な使い方をすることになり、関係者の業務への満足度を低下させることになるといって過言ではありません。

    新年早々の話題として大分思いきった題材となりましたが、年頭であるからこそ、今一度改めて活動を見直す視点と捉える方があれば、筆者の期待するところです。各位、2021年を是非とも良い年にいたしましょう。
  • (先頭に戻る)