オントロジーって何ですか?哲学の用語のように聞こえますが...
もともとは哲学用語ですが、AI分野では概念や関係を体系的に定義した「知識の辞書・設計図」のことです。異なるシステム間で同じ言葉=同じ意味を保証するために使います。
知識を表現する方法って、具体的にはどうやるんですか?
代表的な方法が意味ネットワークです。概念をノード(丸)、概念同士の関係をリンク(矢印)で表す方法で、人間が知識を整理するときの考え方に近い表現方法です。
概念(ノード)と関係(リンク)で知識をグラフ構造として表現する手法。
リンクにはis-a(〜の一種)、has-a(〜を持つ)、part-of(〜の一部)などの種類がある。上位概念の性質を下位概念が継承できるのが特徴。
「カナリア is-a 鳥」「鳥 has 飛べる」→ カナリアも「飛べる」と推論できる。
ただしペンギンのような例外もあるため、すべての知識をこの方法だけで表現するのは難しい。
この意味ネットワークの考え方をより体系的・厳密に発展させたものがオントロジーです。
概念や関係を体系的に定義した「知識の辞書・設計図」。異なるシステム間で同じ言葉=同じ意味を保証する仕組み。
| 項目 | 軽量(Lightweight) | 重量(Heavyweight) |
|---|---|---|
| 定義の厳密さ | 緩やか | 厳密・形式的 |
| 構築コスト | 低い | 高い |
| 柔軟性 | 高い | 低い |
| 推論能力 | 限定的 | 高度な推論が可能 |
| 用途 | 情報整理・検索 | 厳密な知識処理 |
| 例 | Webカテゴリ、タグ分類 | 医療用語規格、法律定義 |
軽量と重量の違い、具体的にイメージが湧きません...
果物を例にしましょう。軽量オントロジーは「果物にはりんご、みかん、バナナがある」というシンプルな階層分類。重量オントロジーは「りんごは果物の一種で、色は赤・緑・黄、産地は寒冷地域のみ、収穫時期は9月〜11月、必ず種子を持つ」という厳密な定義です。
「だいたいこんな分類」というゆるい辞書
[果物]
├ りんご
├ みかん
└ バナナ
「これはこう定義する」という厳密な仕様書
りんご:
is-a: 果物
色: {赤, 緑, 黄}
産地: 寒冷地域のみ
収穫時期: 9月〜11月
Webページに意味(セマンティクス)を付与し、コンピュータが内容を理解できるようにする構想。
提唱者:ティム・バーナーズ=リー(WWWの発明者)
| 項目 | 従来のWeb | Semantic Web |
|---|---|---|
| 対象 | 人間が読む | コンピュータも理解 |
| 検索 | キーワード一致 | 意味を理解して検索 |
| データ | バラバラ | 関連付けられている |
Semantic Webを実現するためのデータ公開・連携の仕組み。
| 用語 | 意味 |
|---|---|
| Linked | データ同士がリンクで繋がっている |
| Open | 誰でも自由に使える |
| Data | 機械が読める形式のデータ |
DBpedia、Wikidata ── Wikipediaの情報を機械可読なデータとして公開したもの。
Watsonって聞いたことがあります。どういうAIなんですか?
IBMが開発した質問応答AIです。2011年にクイズ番組「Jeopardy!」で人間のチャンピオンに勝利して話題になりました。軽量オントロジーと大量テキスト解析を組み合わせた技術が特徴です。
| 項目 | 内容 |
|---|---|
| 開発 | IBM |
| 話題 | 2011年クイズ番組「Jeopardy!」で人間に勝利 |
| 技術 | 軽量オントロジー + 大量テキスト解析 |
データにラベルを付けて整理してから使う
例え:整理された図書館
ラベルなしの文章をそのまま読んで理解する
例え:本を読んで理解するAI
Semantic Webの理想:「みんながラベル付きデータを公開すれば便利」
現実の問題:みんながラベルを付けてくれない(手間がかかる)
Watsonの解決策:「ラベルなしでも理解できるAIを作ろう」
ラベルがなくても文章から意味を抽出できたのが画期的だった。
普通の文章:「東京は日本の首都で、人口は約1400万人です」
↓
Watson:文章を解析して「東京」「首都」「1400万人」の関係を理解
↓
質問「東京の人口は?」 → 「1400万人」と回答