自己改善型エージェントループ

hermes-agent の中核設計思想。通常の LLM エージェントがセッションごとに知識をリセットするのに対し、学習ループを持つことでセッションを跨いで知識・能力が蓄積・改善される。

構成要素

1. 永続メモリ(Memory)

エージェントが管理する永続記憶。定期的なナッジ(nudge)によって、新たに学んだことを記憶に保存するよう促される。memory ツールで操作。

2. 自律的スキル作成(Skill Creation)

複雑なタスク(5回以上のツール呼び出し)が成功すると、エージェントが自動的にそれをスキルとして保存。後で同じ種類のタスクに出会ったときにそのスキルを読み込んで再利用する。

3. スキル自己改善(Skill Self-Improvement)

スキルが古くなったり不正確になったりした場合、使用中に自動的にパッチされる。skill_manage(action='patch') によって穴や不足ステップを補完する。

FTS5 全文検索 + LLM 要約により、過去の会話をまたいで情報を検索可能。session_search ツールで操作。

5. ユーザーモデリング

Honcho 弁証法的ユーザーモデリングを搭載。ユーザーの好みや傾向をモデル化し、インタラクションが進むごとに洗練される。

関連項目

  • agentskills.io — スキルのオープンスタンダード形式