Comp with Agent: 自律的なコンペデータ分析エージェント

このプロジェクトは、Predict Droughts using Weather & Soil Dataを題材に、MCPを活用して自律的なデータ分析エージェントの構築を試みたものです。

クイックスタート

リポジトリのクローン

git clone https://github.com/jintonic3561/comp_with_agent
cd comp-with-agent

VSCode Devcontainerで環境起動
- VSCodeでプロジェクトフォルダを開く
- Ctrl+Shift+P → "Dev Containers: Reopen in Container" を選択
- コンテナが自動的に構築され、必要な依存関係がインストールされます
データをダウンロード
- Predict Droughts using Weather & Soil Dataからデータをダウンロード
- data/ ディレクトリに展開
CLIエージェントを起動
```
claude
```
または
```
gemini
```
自然言語で分析を依頼！

概要

MCPサーバとしてPython関数の実行環境をLLMに提供することで、エージェントがデータを眺めながら分析を深められるようにすることを目指します。

渡される関数の仕様を工夫することで、その出力もエージェントに自律的に利用してもらえるようにします。

詳細はカレーちゃんのAI道場LT資料をご覧ください。

カレーちゃんのAI道場についての詳細はこちらです。

プロジェクト構成

`agent/`

MCPサーバーとツールのコンポーネント群

agent/
├── mcp/
│   ├── config.json              # MCPサーバー設定
│   ├── servers/                 # MCPサーバー実装
│   │   ├── data_information.py  # データ情報提供サーバー
│   │   ├── analysis_executor.py # 分析実行サーバー
│   │   └── notebook_writer.py   # ノートブック作成サーバー
│   └── components/              # ツール実装
│       ├── data_information/    # データ情報関連ツール
│       ├── analysis_executor/   # 分析実行ツール
│       └── notebook_writer/     # ノートブック操作ツール

MCPサーバー

data_information: データセットの構造と内容に関するメタデータを提供
- list_available_data(): 利用可能なデータ一覧
- get_data_description(): データ詳細説明
- get_join_keys_info(): データ結合キー情報
- get_problem_formulation(): 問題設定
analysis_executor: データ分析関数の実行環境
- execute_soil_analysis(): 土壌データ分析
- execute_timeseries_analysis(): 時系列データ分析
- execute_all_data_analysis(): 全データ統合分析
notebook_writer: Jupyter Notebookの作成と管理
- add_cell_to_notebook(): ノートブックへのセル追加

`data/`

分析対象データセット

`examples/`

サンプル分析の実行結果

異なるデータセットでの利用方法

それほど多くない変更で、異なるデータセットをこのプロジェクトで使用することができます。以下の手順で改修を行ってください：

1. データ情報ツールの更新

agent/mcp/components/data_information/tools.pyを編集します。

ご自身が取り組みたい問題設計やデータの説明をmd形式で返すようにすればOKです。

def list_available_data() -> List[str]:
    # 新しいデータファイル名に更新
    available_data = ["your_data1", "your_data2", "your_data3"]
    return available_data

def get_data_description(data_type: str) -> str:
    # 新しいデータセットの説明を追加
    if data_type == "your_data_type":
        return """
        # あなたのデータセット
        
        ## データ概要
        データの概要説明...
        
        ## 列の説明
        | 列名 | データ型 | 説明 |
        |------|---------|------|
        | column1 | type | 説明 |
        """
...

2. 分析実行ツールの更新

agent/mcp/components/analysis_executor/tools.pyを編集します。

ご自身のそれぞれのデータを読み込んで分析を行えるよう、各関数を修正します。
心臓部となる _execute_function 関数はこのまま利用できるはずです。

3. サーバスクリプトの更新

/work/agent/mcp/servers 配下のpythonスクリプトのうち、前段で編集したツールが含まれるサーバスクリプトを編集します。

mcp.tool(your_tool_name) の部分を、ご自身のツールに合わせて変更してください。

4. データファイルの配置

新しいデータセットをdata/ディレクトリに配置します。

5. 動作確認

この時点で、Claude CodeやGemini CLIがツールを認識してくれるはずです。彼らに話しかけて、実装したツールを読み込めているか確認してください。

ライセンス

このプロジェクトは GNU Affero General Public License v3.0 (AGPL-3.0) のもとで公開されています。
AGPLの条件に従う限り、自由に利用・改変・再配布が可能です。

Name		Name	Last commit message	Last commit date
Latest commit History 37 Commits
.claude		.claude
.devcontainer		.devcontainer
.gemini		.gemini
agent		agent
assets		assets
document		document
examples		examples
prompts		prompts
slidev		slidev
tests		tests
.gitignore		.gitignore
.python-version		.python-version
CLAUDE.md		CLAUDE.md
GEMINI.md		GEMINI.md
README.md		README.md
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Comp with Agent: 自律的なコンペデータ分析エージェント

クイックスタート

概要

プロジェクト構成

`agent/`

MCPサーバー

`data/`

`examples/`

異なるデータセットでの利用方法

1. データ情報ツールの更新

2. 分析実行ツールの更新

3. サーバスクリプトの更新

4. データファイルの配置

5. 動作確認

ライセンス

About

Uh oh!

Releases

Packages

Languages

jintonic3561/comp_with_agent

Folders and files

Latest commit

History

Repository files navigation

Comp with Agent: 自律的なコンペデータ分析エージェント

クイックスタート

概要

プロジェクト構成

agent/

MCPサーバー

data/

examples/

異なるデータセットでの利用方法

1. データ情報ツールの更新

2. 分析実行ツールの更新

3. サーバスクリプトの更新

4. データファイルの配置

5. 動作確認

ライセンス

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

`agent/`

`data/`

`examples/`

Packages