アーカイブ

ここでは、これまでの【所長の視点】を案内しています。
（2025年分は、<こちら>　）　　　　<トップページへ戻る>

2025年12月21日　その158 ：　データサイエンティスト協会発行のスキルチェック・リストについて
2025年11月 25日　その157 ：　オントロジー談義の話題
2025年7月31日　その156 ：　「セマンティック」モデルの流行について
2025年6月28日　その155 ：　「今、どうしてグラフ、オントロジーなのか？」考
2025年5月26日　その154 ：　生成AIブームの課題考
2025年4月27日　その153 ：　知識グラフ(Knowledge Graph:KG)利用例について
2025年2月25日　その152：　モノの数え方四方山話
2025年1月25日　その151 ：　グラフ・データベース利用を考察する（5）
2025年1月2日　その150 ：　グラフ・データベース利用を考察する（4）

その158 ：　データサイエンティスト協会発行のスキルチェック・リストについて

この欄で以前内容について触れたことのあるデータサイエンス協会発行の「データサイエンスティスト・スキルチェックリスト」のVersion 6.00の初版が、2025年12月1日に発表されました。今回の特徴として筆者が捉えたのが、昨今のAI技術利用の広がりを見据えて、AIの運用・応用に当たる領域として1段立体的にスキルセットを位置づけた「融合」分野が加わった点でした。この融合分野の中に、この欄でもここのところ集中して検討・説明している「オントロジー」というスキルカテゴリが明示的に設けられた点に、特に着目しました。今回は、このオントロジー分類カテゴリに記述された13項目を中心に、筆者の観点からの検討意見を記述しておきたいと考えています。

その「オントロジー」分類カテゴリは「融合」分野の中で「AI実装・運用」分類の中の8種類のスキルカテゴリの中の1つとして整理されています。習得要求程度は全て「選択」項目扱いです。更に「オントロジー」カテゴリの中の13項目は、「オントロジー設計」（5項目）、「ナレッジグラフ構築」（5項目）、「セマンティック解析・推論」（3項目）の3つのサブカテゴリに分けられています。以下の説明では、スキル項目の内容は記載せず、項目番号だけで参照します。具体的項目内容について興味のある方は、データサイエンティスト協会のWebページからダウンロードして確認下さい (注1）。

前述のように分類「AI実装・運用」のスキルカテゴリ「オントロジー」でのスキル項目は13個あります。そのサブカテゴリ「オントロジー設計」では5項目記述があります。項目Sub No.1、2では、オントロジー体系設計について構造化設計を挙げていますが、筆者としてはこれらの内容は、これまでの関係性モデル作成で行っていた内容に該当する内容であり、ER図やUML/クラス図表現としての関係性データモデル化のスキル領域に分類する方が適切であると考えます。関係性データモデルと最近のセマンティックWeb系統から来るオントロジー設計と呼ぶ方法はアプローチに違いがあり、設計への視点の差異があります。この意味でオントロジー設計項目分類とは切り離す方が、広い意味で技術者に分かり易いだろうと考えます。ここで筆者の云う両者のアプローチの違いについては、別途の機会で説明したいと考えます。Sub No.3は、AI推論に関する具体的内容が示される必要があるでしょう。何故ならここでのオントロジー設計は集合論理に基づく推論支援として考えられるものだからです。Sub No.4は、「文化的・価値観的バイアスを特定した緩和策」の具体的イメージを語ることが必要でしょう。Sub No.5は、グラフRAGアプローチの内容の応用を語っているように見えます。そのような表現の方が理解しやすいのではないでしょうか。

次に「ナレッジグラフ構築」サブカテゴリにある5項目です。Sub No.6は、No.5と同様グラフRAGに関係している（こちらは構築に関するスキル）。No.7は、セマンティック解析・推論の初歩のスキルに相当する。No.8は、やはりRAGに関係する内容。No.9は、「オントロジーを含めて動的に更新する」という意味であれば、オントロジーが動的に変化してしまうことは足下の構造が常に変わる可能性を示し、生み出される回答の不確定性を高めるという点で、もっと説明が必要でしょう。No.10は、セマンティック解析・推論に関わる実装スキルに見えます。その点で詳細化・具体化が必要でしょう。

「サブカテゴリ／セマンティック解析・推論」のSub No.11～13の項目の項目記述を見ると、必ずしも「オントロジーというスキルカテゴリの中に含めるべき項目とは合致している訳ではないのでは？」と筆者は感じました。「セマンティック解析・推論」というカテゴリ名は、例えばスキルカテゴリに「セマンテック」を加えた上で、その中の「スキルカテゴリ「（セマンティック）解析・推論」というサブカテゴリ以上の上位カテゴリとして表現する方が妥当なのではないかと考えます。

このスキルチェックリスト Ver.6 は、12月始めに発行されたばかりであり、今後改訂や記述される説明を具体化、詳細化する内容が追加されるものと期待されます。現時点の筆者の意見が何らかの形で意味考察につながり、より分かり易い期待スキル共有を生むことがあればと考えます。
(注)　1.　データサイエンス協会の発行する「データサイエンティスト・スキルチェック・リスト」Ver.6　初版は、
　　　　以下のWebページから、Excelファイル形式でダウンロードできます。（2025年12月20日現在）　　　　　
　　　　　DSスキルチェック・リスト　Ver.6
（先頭に戻る）

その157 ：　オントロジー談義の話題

筆者の参加する（社）日本データマネジメント協会（Dama-Japan）の第10分科会（2025年11月18日開催）で、セマンティックWebから始まるオントロジーを題材に話題提供し、短いながらディスカッションを行いました（題目「ひと味加えるオントロジー談義－基本から活用まで」この資料の抜粋版は、游悠レポートサイトから入手可能）。ここでは、昨今、AI／LLM／RAGといったキーワードで着目されるトピックの中で、改めて「オントロジー」の考え方の必要性が話題を高めているという社会状況が背景としてあります。

この議論で、実務に関わる方々の中で最も課題として語られたのは、必要性を他者に説明するのに苦労するという点でした。「オントロジー」という語や概念はかなり専門技術性が高いと受け取られる分野であり、その点も壁があると云えます。筆者の考えでは、オントロジーの必要性を受け取れる人々は、AI関連用語を技術的に理解する方々が中心だと捉えています。この点、業務中心の人々や経営者層には伝えられ難い分野だと云えるでしょう。その分、組織の中での予算化、プロジェクト化を実現するには、一工夫以上の仕掛けと時間が必要とならざるを得ません。

更にもう一つの壁として、同じ技術者でも、アプリケーション作成に関わる人々でも、オントロジーの必要性概念を素直に理解するとは限らない点があります。データのモデル化とオントロジー作成と何が違うのかということが分かり難いということでしょう。それは、ネットワークグラフ技術が実用化され一般化してきたのは比較的最近であることにも関係すると考えられます。これらの課題意識に対応する関係者の間での議論／理解を深めるのが、今回の筆者の分科会での説明の骨子でした（関連資料参照）。

ここでポイントとなるのは、ともすれば「オントロジーモデル」か「リレーショナルモデル（ER図／UMLクラス図）かといった対立的議論ではなく、要件の必要性に付随した両モデル化技術の共用であると筆者は考えています。先の游悠レポート資料で比較したように、両者のモデル作成動機には明らかな違いがあると云えます。この点を関係者が理解した上で、両モデル化手法を場面により使い分け、適用・応用するのが大切だと考えます。現時点では、この点を腹落ちさせているデータ専門家・技術者の数はそう多くないと筆者は捉えています。
この分野は、新しいビジネス領域として出現し、まだ基盤技術環境のアピール合戦の段階であり、GPUやデータセンターといった環境構築支援に注目の重点が置かれている段階と云えます。この分野での海外からの強い情報圧力を受ける中で、予算と人員確保に根付いた国内の関連者知見拡大、応用技術知識蓄積のためには、今後ますますの努力が求められる状態でｓるというのが、筆者の現在の認識です。その認識拡大のために役に立てるような情報発信をしてゆきたいと考えています。
（先頭に戻る）

その156 ：　「セマンティック」モデルの流行について

ここのところ「セマンティックｘｘ/Semantic xyz」という用語表現をあちこちで見るように思います。この語は筆者の手元にある「A.S.Hornby他の新英英大辞典(販売：発行、開拓社）」を参照すると、「名詞／semantics：the branch of the study of language concerned with meanings」の形容詞形と説明されています。簡単に解釈すると「意味に関する言語学の一分野」とでも云えるでしょうか。インターネットが広く浸透し出した1990年代頃からは、主に「Semantic web」と云う使い方が目立っていましたが、最近は、オントロジーに始まり、LLMやRAGなどのいわゆるAI領域の話題に関連して利用され、また「セマンティック・データモデル」などといった使い方にも広がってきているようです。

しかし筆者としては、近頃使用されているこの語の意味付けはそれほど確定されたものではない状態と見えています。いわゆるバズワードの段階であり、語を使用するそれぞれの人の立場から、耳障りの良い形で都合良く使われているのではということです。人間の発想は、「思念」という個人的な着想に始まり、次に意識的な形式としての「観念」として固定化され、ある程度人々の共通認識として定義化した「概念」に整理されたものとなるというのが筆者の見解です。つまり、語を使用する場面や出現箇所が余り一定していない段階であるという意味です。逆に捉えると「セマンティック」という語は余りに広く利用できる形式表現語であり、利用者に取っては使い勝手の良い語であり過ぎるとも考えられるということでしょう。

そこで筆者としては、この形容語が余りに使途用途を広げ過ぎない形での領域にまとめられることを期待しています。その方策としては、セマンティック・モデリングを通じて整理され、説明・定義されたデータとはどのようなものであり、その記述形式、記述に必要な技術要素が何であるのかといったことが、関係者の間で共通化される必要性があるということです。これは、ビジネスを指向する利用者にとっては、何故そのような手続きや作業が必要なのかを理解し、そのために要求される資源（人、環境、資金、時間）がどれだけ投資すべきかの正当的な判断材料となりえます。そして技術者に取っては、どのような形で、意味定義を行い、他者へのコミニュケーション／引継ぎを行うことが要求されるかを理解し、自分の行う仕事の価値の正当性をアピールする機会を生むということになるという訳です。
筆者がこれまで、データ・モデリングを着実に行うことの重要性、オントロジーやデータモデル図（ER図、UML図等）の位置付けといった内容について再三、当欄で繰り返しています。それは、先に記述した点を具体的なイメージとして読者に理解してもらうと共に、その発想が「関係者に広く浸透すること」を期待してもらうための流れであるという点を強調したいと考えています。余り中途半端な形で用語が広まってしまうことを避け、価値の高い道筋と方向付けに向けて、引き続き活動したいと願っています。
（先頭に戻る）

その155 ：　「今、どうしてグラフ、オントロジーなのか？」考

筆者の参加しているDama-J分科会において先日、製造業オントロジーR2.0の調査報告を簡単に行いました(その時の説明資料は、游悠レポート2025-4で紹介しているので、興味ある方は参照下さい)。その際にグラフ・データベースへのオントロジー登録・検索デモを合わせて行いましたが、「今、どうしてグラフとオントロジーなのか？」を整理する機会となりましたので、今回はその考察の要約を紹介したいと考えます。

グラフ・データベースへのデータの取込というのは、遡るとインターネット上に広がる情報／データを把握するために「リンクト・オープンデータ」技術を応用して生み出された「三つ組み表現」が一つの契機となったものと筆者は捉えています。その「主語(S)－述語(P)－目的語（O)」トリプル表現を一つの「ファクト(事実)」として表し、そのファクト同士の関係を更に連結して、情報の意味付けや傾向を見ようという流れです。これは現場からの「ボトムアップ・アプローチ」と考えられますが、その三つ組みデータが拡大・蓄積されるに連れ、関係性のグループを同様の性質をもった集合の集まり(及び関連性)として表現したいという要求が生まれたものと考えることができ、これが「クラス」として捉えようという契機となっています。

既に、大量のデータを取り扱う「データベース」の世界では「データモデリング」という考え方があり、ER図やUMLクラス図表現として流行したものですが、こちらはエンティティ(実体)、その関係性(リレーション)、そして実体の特徴を表す属性、という3要素を整理しようという考え方です。先の見方と対比して、云わば「トップダウン・アプローチ」といえるでしょう。ネットワークの世界観とデータベースの世界観のそれぞれで育った人たちの根底にある情報／データ理解の相違というのはこの辺りに存すると見ることができるでしょう。この双方の世界観の間では、使用用語の意味付けに、少々混同があるように筆者には捉えられます。同じ語を使っていても概念の意味に大きな違いがあるという視点です。

グラフによるデータの表現は前者から来たものといえ、大量のファクトから意味付けをもった世界観を表すには「オントロジー」の表現を持ち込む必要が出てきたことは当然の流れだと云えるでしょう。これが今回の「なぜ」という問い掛けへの解答です。オントロジーという用語は、既に昔から哲学的に世界を捉え、表現する中で存在していました。これを工学的、技術的な意味合いで延長として持ち込んだという訳です。グラフ・データとリレーショナル・データの世界を支える技術は、それぞれ独自の歴史を経て開発されて来ており、一本化がされる可能性は今後も低いといえます。両者の背景と用語の違いを、技術者として理解しておく必要性は引き続き高いでしょう。昨今、データマネジメントの必要性が様々な業務階層に認識されてきていますが、本当の意味で、責任と技術知識を備えた人材が必要な時代であるといえるでしょう。
（元にもどる）
リスト３

その154 ：　生成AIブームの課題考

ここのところ生成AIに関する記事及び話題が引きも切らず生まれる状況となっています。新しい技術の進展とその利用ケースが増えるにつれ、爆発的に増大するデータ(量だけでなく種類も含む)を取り扱う人側の丁寧な対応・処理実施に間に合わなくなってきていることが、第一のきっかけとなっているでしょう。更に、製品提供側からの誇大ともいえるようなマーケティング、及び経営的・経済的な効率性要求、技術者側の導入アピールといったものもブームに拍車を掛ける動機となっているように筆者には考えられます。また技術の応用・適用範囲の拡大の期待も上げられるでしょう。

AI 技術適用の範囲は、旧来のような計画・構成化されたデータを越え、画像(動画を含む)、文章データといったものを取り込むに連れ一方で、世の中に出回る「データもどき」の信頼性はますます低下していると筆者には捉えられています。ここには、実用化達成のための効率性(How Many/How Long)、とにかく技術を導入して経済的利益を生み出したいという欲求(How Much)、技術利用性の容易化(How to)という要素が大きな影を落としているでしょう。それが闇雲に導入され、安易に利用されうるという面(結果の提供側／受け手側)に起き得る結果について、必ずしも目が届いているとは考え難いと言えるのが実情ではないでしょうか。

利用の元になるデータの信頼性に誰が責任を持っているのかという点にも不安が残ります。筆者が経験した技術提供者側の説明を元にすれば、提供内容の権利・責任は技術利用者の責任で行って欲しいと投げています。利用元データ収集については、必ずしも収集者が全責任を負っているという訳ではありません(実際筆者の認知している中で、官公庁において、意図的であるかどうかは不明ですが、正しい情報収集を放棄している例が存在します)。AI出力結果の利用者は、それが正しいものと仮定して使用せざるを得ないというのが実状です。最低限、結果出力のための出所を説明する出典情報を付加することは必須でしょうが、この出典を明確に答えることができるかというと、現状では難しいという返答が想定されます。ただ、これを改善するための試みが進められているのも確かで、LLMやRAG技術と連携しデータの背景にある意味(セマンティクス)をどう取り入れるかという研究・開発もあります。

結局のところ、マーケティングや営業活動から生まれる過度なメッセージに惑わされることなく、情報発信・活用に携わる責任ある利用者として、或いは適切な智慧を巡らす情報賢者としての視点が本来的に求められる時代が迫ってきているということでしょう。以前の回で本欄に記述したように、デジタル・サニハ(審神者)の研究・工夫が必須のものとなっている訳です。AI環境から出力される結果を闇雲に左から右へと手渡すだけでなく、間に入る仕掛け(智慧)を、今後考えてゆきたいというのが筆者の立場です。
（先頭に戻る）

その153 ：　知識グラフ(Knowledge Graph:KG)利用例について

知識グラフ(KG)として作成され、その活用事例として游悠レポート2025-002で海外での発表資料を元にして構成した内容を先に紹介しました(游悠レポートページ参照)。そこではイタリアの大学機関によるKG構築と、そのデータを用いた分析・活用例を説明しました。本資料を用いて、財)日本データマネジメント協会の第15分科会で概要説明を行いました。

この資料を筆者が準備しようとした背景には、知識グラフ及びそのデータベースという言葉を良く目にする機会が増えたものの、その実際について、案外国内で理解している方は多くないのではないかと感じたことに始まります。つまり、グラフデータベース(GDB)を利用した環境を作成することがKGの完成ではなく、その構築と活用における必要要素を紹介する必要があると考えた点です。GDB構築の第一歩は、インスタンス群を事実(ファクト)として取込み表現することから始まりますが、そこではどのような概念が表されているかを利用者(あるいは機械)が認識できる必要があります。そのためには、その概念情報をGDB内で表す必要があり、これが今までこの欄で議論してきた「オントロジー(Ontology)」です。それは、簡単に言えば、物事の「概念クラス」を表現することから始まります。

しかし概念クラスを記述しただけでは活用上では不十分であり、それに加えて概念同士の関係性を加える必要があり、それがプロパティまたはリレーションと呼ばれるものです。この関係性は、第一に概念クラス同士での表現と、第二に概念クラスに含まれる個別インスタンス間の関係の両方で記述される必要があります。それで活用に先立ったデータベースとしての前準備が整いますが、KG活用としては、更にネットワークデータの分析手法(サブグラフ作成、グラフデータ指標化、分析アルゴリズム適用)が必要になります。ここまで含めた一連の流れ全体を含めて、やっとKGの分析・活用という方法論の理解につながるというのが重要な点です。
こういった全体像を理解する上で、先の資料が役立つはずですので、興味ある方は是非当該資料を参照下さい。また、本格的なKG活用のためには、オントロジーまたはデータモデル表現とその記述ツール、GDB環境、グラフ／ネットワークデータ分析技法の知識などが必要になる点にも留意下さい。
（先頭に戻る）

その152 ：　モノの数え方四方山話

以前この覧で「数の概念と四則演算モデル化の一つの物語り」(第139回)として数を使った表現とデータモデル化との関連を記述したことがあります。今回は日本語でモノを数えるというのはどういう思考であるのかについて、近頃の筆者の頭の中を少々書いてみようと考えます。ご笑覧頂きたく。

モノを数え上げる際に、まず「イチ（一）」から初め、次に「ニ（二）」、順々と「キュウ（九）」、そして「ジュウ（十）」と（日本語で普通は）数えています。これは、ある一纏まりと見える対象（例えばリンゴ）を概念的に捉え、概念的に数字と対応付けを行って量化したものと考えられます。この数え方を十進法と呼び表し、次の数として「ジュウイチ（十一）」として取り上げ、「十の一纏まりに一が増えた」こととして数えるのです。面白いことにここではゼロ（零）から数えることが始まるのではなく一が開始となります。つまり自然数の始まりということです。因みに自然数の中にゼロを含めるかどうかは議論の立場に依存し、初等数学ではゼロという数字を外しているとのことです(参考1)。

また、歴史学等では、紀元0年は外して扱われるが、天文学者等は、計算上での不都合を避けるために暦に紀元0年を含めて考えているという話題もあります。何れにしても、数えの原点であるゼロを含める必要があるかどうかが議論の元にあるらしい。四則演算では引き算の必要性ができた時に、負の数と正の数との間に「何もない/数の原点」としてのゼロを考える必要性が出たということでしょう。漢数字で百一と書きますが、ここでは十の桁が省略され、アラビア数字の記述法では１０１として空の桁が表現される方法を用いています。

また日本語での別な数え上げ法として「ひ・とつ」、「ふ・たつ」、「み・っつ」、「･･･」、「ここ・のつ」、「と・お」というものもあります。筆者の持つイメージでは、この数え上げは流れを意識したものと捉えていますが、例えば人の生まれの順序を表現する際には「イチロウ」、「ジロウ」、「サブロウ」、「シロウ」、「･･･」といった表現も存在します。数え上げの対象が異なるモノが混在している場合には、例えばリンゴを１個、バナナを１本として単位を付加して数え分け、それらのグループを考える場合には、籠という枠を用いて一籠（の中にあるモノ）として数える工夫が行われます。高度に抽象化された「２」という数字で表すモノは、例えば１足す１の結果としても、「リンゴ２(個)」と「リンゴ１個にバナナ１本をセットにした１籠内の２」とは物理的に違いが生じているという有様です。

こうして、子供たちでも日常的に行っている単純な「数え上げ動作と言語化」でさえ概念表現と意味合いの多様性が存在していることが理解されます。つまり、前回までの稿でオントロジーやデータモデル表現を議論した中でも共通した話題として、対象とするモデル表現を正しくしておくことの重要性認識が再燃化できるといえるのではないでしょうか。ましてや多くの文化が交差しえる多言語世界においては、その重要性が一層高まるものといえるでしょう。こういった基底にある認識の多様性を前提にすることは非常に大切であり、AIチックな出力を無批判に受けいれてしまう文化は是非とも避けたいというコメントを付記して、今回の四方山話を終了することにします。
(参考) 　1．日本語Wikiペディア　「数としての0」　（2025年2月25日時点）。
（先頭に戻る）

その151 ：　グラフ・データベース利用を考察する（5）

前回本欄で紹介した、1月22日のDama-Japanでの第15分科会での勉強会説明資料を、早速「游悠レポート2025-01として掲載しました。気になる方はこのページからリンクしている游悠レポートサイトも訪れて下さい。資料題目は「Wine Ontology活用の探求(5)」となっています。これまで先の分科会では5回に渡って、ワイン評価を含むオントロジーの作成、評価データのモデル表現、グラフデータベースへのデータ取込とデータ検索実践という内容を実施し、参加者とのディスカッションを交わしました。ここではその議論を通じて、筆者が改めて認識・整理した内容の幾つかを概略説明します。

まず、オントロジーのような概念を整理するモデルを作ることの必要性についてです。グラフまたはネットワークデータが着目されているのは、インターネット社会が広まるにつれて、LOD（リンクト・オープンデータ）のような企業や公共機関の持つデータが開示され、それを視覚的に表現・管理し易い方法の一つとして現れた工夫/技術と関係があります。データ利用を人間が話す言葉の延長として表現し、かつコンピュータ社会での通信上、および機械システムとのやり取り性向上の分野として着目し、発展した流れがあるということです。ここではモノやヒトといった個物（専門的には「インスタンス」と呼ぶ）存在物の集合を表現し、またそれらの動きや関係性を記述したいという動機があります。そしてこれをすることがビジネス上メリットを生むことも認識されてきたという背景です。この中で、歴史的には哲学分野で考察されてきたオントロジー分野が情報学と結びついたと考えると、分かり易いかと思います。

インターネット世界が本格的に認識される以前から、コンピュータを利用する分野では、その中で扱うデータの有用性が認識され、それを管理するデータベース技術が発展していました。その過程でデータモデリングという表現技術も進んでいました。ここでは余りオントロジーという言葉とは直接結び着けて広く理解説明されてはいませんでしたが、ここでのデータモデリングの考え方と、オントロジーという概念整理手段が似ていると認識され出しているというのが現在の状況であると見えます。但し、グラフデータを扱う分野は「個物とそれらの関係」を集合的に集め、表現するという方向から入ってきていました。一方でデータベース設計という考え方を先行して開発し育ててきたデータモデリング分野では、エンティティ(存在物)とそれらの関係(リレーション)で表現するという、取扱いの発生視点レベルの違いがあったという点に注意しておきたいと筆者は考えます。

つまり、グラフデータでのオントロジーとインスタンス表現を統合したモデル表現技術の発展が、まだ(リレーショナル)データベースで必要と考えられているデータモデリング技術と連携不足なままでいるという状態が生まれている要因だということです。但し、一部ではオントロジー表現をUMLのモデル図で表現すると説明している研究者もあります。筆者は、百パーセント互換ではありませんが、ER図ツールを用いてオントロジーを表現するという試みを続けています。その意味で、グラフデータベース(インスタンス・データモデル)とリレーショナルモデル(エンティティ・データモデル)との技術的関係性でのモデル化統合が可能ということです。筆者は、グラフデータでの「プロパティ」による関係表現と、リレーショナルモデルでのリレーションシップ表現とは少々違いが生まれそうだという点には注意しておきたいと考えており、それが先に「百パーセント互換でない」と記述した理由です。

また二つ目の話題としては、リレーショナル・データベースのようなデータ管理技術があるのに、何故あえてグラフ・データベース技術に着目する必要性があるのかという議論についてです。現時点の筆者の考えでは、これは先に述べたグラフデータ表現はインスタンス・データモデル表現指向で、一方のリレーショナルモデルはエンティティ・データモデル表現指向だという視点と関係します。簡単に言えば、技術の実現と利用についての「目の付け方と利用方法」違いが生まれるということです。それぞれの特徴を生かして利用するという混合活用という意味ですが、これについては紙面の都合上、次回以降に議論を回したいと考えます。
(備考) 　グラフ技術に関連する話題は、これまでの游悠レポート資料の中で扱っているため、興味ある方は参照下さい。
（先頭に戻る）

その150 ：　グラフ・データベース利用を考察する（4）

2025年最初の明るい話題として、京都橘高校グリーンバンドの1月1日午後カリフォルニア／パサデナでのローズパレード演奏行進の話題が入ってきました。2018年以来の参加ですが、いつ見ても素晴らしい演奏更新風景です。こちらを参照下さい(直角に折れる行進路での隊列変更の様子入り)。

さて本題です。2回ほど間に異なる話題を挟みましたが、今回は先のグラフ・データベース関連内容を続けます。(社)日本データマネジメント協会(Damaジャパン)第15分科会の月次定例会が1月22日(水)に予定されています。この回では、これまで話題にしていたオントロジーの具体的題材に、ネット経由で入手可能なワイン・オントロジーを利用し、これに別途手に入れることのできるワイン評価データを組み合わせた形でのモデル化を取り上げています。その検討過程をこれまで４回に渡り説明してきましたが、22日はそのまとめとしての最終回となります。興味ある方は是非参加下さいDamaジャパン会員であれば、分科会リーダに事前申込みをすれば誰でも参加できます(詳細はDamaジャパンWebの分科会活動ページを参照)。

この回では、第一に、構築したオントロジーモデルとそれに基づくグラフ・データベースの実装、第二にOWL/RDF記述形式でのオントロジーに基づくグラフ・データベース実装の幾つかの要点を図解入りで説明します。第三として、構築したグラフ・データベースに対してのSPARQL言語による幾つかの検索と結果の事例を紹介します。更に第四番目に、グラフ表現による視覚化図を加えて説明します。第五番目に、これまでの実装活動を通じて得ることができた知見に基づく構築プロセスの要点と、最後に第六番目として、構築環境説明とオントロジー構築の目的と実施上の注意点について簡単に説明をする予定です。この回の説明資料は、これまでの通り、游悠レポートページ上でダウンロード可能な資料として掲載する予定です。

デジタル庁のWebページでも、ここ数年で様々な行政組織等で、オープンデータの形でのデータを開示されている状況を検索可能となっています。他にも、検索ページ開設もあります。こういった形でのデータはExcelの表形式やリンクトデータという形で入手できることが多くなっています。但しこれらのデータをグラフ・データベースの中に取り込んで意味のある形で論理的に検索可能な状態にするためには、全体のデータ構造や構成、整合性を持った意味付けの情報を準備することが大切です。そのためには、これまで紹介してきたオントロジーモデルを背景に踏まえたハイレベルのメタデータを準備し、その内容にアクセスすることができる環境を用意しておく必要があります。
昨今LLMやRAGのようなAI技術と組み合わせて半自動的に意味付けを行うことも試みられてきていますが、高い信頼性を持ったハイレベルのメタデータとして利用できると本格的な保証をするには、現時点ではまだ力不足ではないかというのが筆者の意見です。

ワイン・オントロジーを題材とした試みの分科会での発表はこの回迄として、筆者は、次の研究素材を検討中です。その話題が決まりましたら、引き続きこの欄でも紹介予定です。ご期待下さい。

(備考) 　グラフ技術に関連する話題は、これまでの游悠レポート資料の中で扱っているため、興味ある方は参照下さい。
（先頭に戻る）

インフオラボ(Information Lab.)游悠、活動ご案内

「情報の活用力」と「人間力の拡大」、これを実行目標として、インフオラボ游悠は活動しています

アーカイブ