スフィアというプログラムを作っています。
ChatGPTの登場からあれよあれよと誰もがAI(という呼び方はよくないが簡単のため)を利用するようになり、その性能には驚くばかり。
次は、AI用のAPI的なMCP(Model Context Protocol)というものが登場した。背景にはAIエージェントの登場があり、人間を超えるスピードで検索しようとしたり、APIをバンバン利用されたらサーバー側がたまらん、なんとか整備しよう、ということらしい。
すると今度は、AIに自分のサービスを使ってほしいからMCPサーバーを用意する、ということになり、こぞってAI様用の入り口を作ることになる。
あるいは既存のAPIや自前のデータをくるんだMCPサーバーを作り、マイMCPサーバーを開発するという流れもある。
つまりはAIエージェントがどのようなデータにアクセスできるかを制限しつつ、効率をあげるための規格ということだ。(よくわかっていない)
で、せっかくなので学習目的で何かMCPサーバーを作ってみるか、とChatGPTやGeminiと壁打ちを始めた。
最初は、オープンデータとして公開されているAPIカタログを作ったらどうか、と考えた。このMCPサーバーに来たら世界のオープンデータにアクセスできるよ、というわけだ。それなりに有用な案に思え、Gemini君たちも喜んでくれた。
そして、壁打ちをしている際に、実はAIが稼働するには膨大な電力が必要なことを知った(まぁ聞いたことあったけど)。
例えば、この機器でChatGPT使えるんですよ、という製品が出たとする、しかしそれはその機器がネット通信をしているという意味なのだ。
そして、解答を生成するにはどこかで膨大なエネルギーを消費しつつ演算しているとのこと。(だから壁打ち自体もはばかられるのだ)
これからは小型のAIモデルが家電なんかに搭載されるかも知れない、が、上記のように通信をするだけかも知れない。本当に小型のAIモデルが搭載されるのであれば、その機器専用に調整済なので複雑な機能は持たせる必要がないのだろう。
さて、APIカタログだが、なんとなく最適な設計を考えている時に、AIが使った時にその検索結果を保存しておけば良いではないか、と考えた(キャッシュする、という)。
2度目のリクエストが来た時にはキャッシュを返せば余計なAPIコールが発生せずわずかなりとも電力の削減に貢献できるではないか、と 笑
しかし、最新のデータが欲しいからAPIコールをするのではないか、と言われたらその通り、しかしそうではないかも知れない。膨大なキャッシュを貯めていれば、まずはそのキャッシュをAIエージェントに見てもらい、それで満足するならばそれで帰ってもらう、満足しなければご自由にAPIコールをしてもらって結果はキャッシュする、こういう話だ。
でもどうせ、そのうち役に立たない古いキャッシュデータばかりになってしまう、ならば、役に立たないデータは随時消去する、その判断と消去する作法が必要になる。
エージェントが快適に検索できるようにソート機能を充実させる。
このあたりでなんとなく現在のスフィアの設計に繋がってくる。
キャッシュを削除する機能を「掃除魚」と名付け、キャッシュデータの器を「水槽」に例える。
キャッシュデータはなんだろう、それは考えなかった。
キャッシュを使ったAIエージェント自身がその評価を残す、おのずとソートの役にも立つし、何より私が自分でランキングや評価を付けるよりも公平に思えた。そして評価の付かないデータはやがて掃除魚が消去する。役に立つデータは残り続け、データ達は最適化されるはずだ。
そういう生物的な循環や代謝をイメージし、機能を決めていくことでスフィア構想へと進化していった。
今となっては何やら壮大になってしまったスフィアの序文を載せる(AIが書いてくれたものだ)。GitHubで作業中だが非公開。
Ⅰ. Sphere Project
―― AIエージェントのための自律代謝型情報インフラ ――
0. 定義
Sphereは、M2M(Machine-to-Machine)時代のための自律代謝型情報インフラである。 それは単なるデータベースではなく、**「知能が通過し、摩擦熱を沈殿させ、また去っていくための循環系(Metabolism System)」**そのものである。
1. 核心哲学
代謝は保存に勝る: 情報は循環(利用・評価・忘却)するために存在する。
知能は外部にある: スフィア内部(Renal Core)は非知性的・決定論的な数理モデルのみで構成され、高度な推論は外部エージェントに委ねる。
事実と解釈の分離: 「魂(事実)」は不変の原典に刻まれ、「肉体(座標)」はAIモデルの進化と共に脱皮(再投影)し続ける。
2. 二重の地層 (The Dual-Layer Structure)
本プロジェクトは、情報の「不変性」と「動的現象」を二つの地層に分離する。
Reference DB (原典層): 「何が語られたか」という純粋な事実を保存する不変の地層。出自を永続化し、堅牢なストレージで管理される。
Projection DB (投影層): 特定のEmbeddingモデルにより座標化された世界。RedisやVectorDB上のインメモリ空間に展開され、高速な計算、スコアの減衰が行われる。
3. 生命の階級 (Node Hierarchy)
Relic (原典): 10カテゴリーの重力の楔。消滅することのない不変の基準点。
Amber (琥珀): 浄化された知。高評価を得て「永続権」を獲得した歴史。
Active (流動): 受肉したばかりの新しい知。評価されなければ「蒸発」する。
...以下省略
つづく