跳到主要内容
跳到主要内容

如何使用 ClickHouse MCP Server 构建 OpenAI Agent

在本指南中,你将学习如何构建一个 OpenAI agent,使其可以通过 ClickHouse 的 MCP ServerClickHouse 的 SQL playground 交互。

示例笔记本

该示例可以在 示例仓库 中找到对应的笔记本。

前置条件

  • 系统需已安装 Python。
  • 系统需已安装 pip
  • 需要一个 OpenAI API 密钥

您可以通过 Python REPL 或脚本执行以下步骤。

安装库

运行以下命令安装所需库:

pip install -q --upgrade pip
pip install -q openai-agents

设置凭据

接下来,您需要提供 OpenAI API 密钥:

import os, getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass("输入 OpenAI API 密钥:")
输入 OpenAI API 密钥:········

初始化 MCP Server 和 OpenAI 代理

现在将 ClickHouse MCP Server 配置为连接到 ClickHouse SQL playground, 初始化你的 OpenAI 代理并向它提问:

from agents.mcp import MCPServer, MCPServerStdio
from agents import Agent, Runner, trace
import json

def simple_render_chunk(chunk):
    """简化版本,仅过滤重要事件"""

    # 工具调用
    if (hasattr(chunk, 'type') and
            chunk.type == 'run_item_stream_event'):

        if chunk.name == 'tool_called':
            tool_name = chunk.item.raw_item.name
            args = chunk.item.raw_item.arguments
            print(f"🔧 Tool: {tool_name}({args})")

        elif chunk.name == 'tool_output':
            try:
                # 处理字符串和已解析输出
                if isinstance(chunk.item.output, str):
                    output = json.loads(chunk.item.output)
                else:
                    output = chunk.item.output

                # 处理字典和列表格式
                if isinstance(output, dict):
                    if output.get('type') == 'text':
                        text = output['text']
                        if 'Error' in text:
                            print(f"❌ Error: {text}")
                        else:
                            print(f"✅ Result: {text[:100]}...")
                elif isinstance(output, list) and len(output) > 0:
                    # 处理列表格式
                    first_item = output[0]
                    if isinstance(first_item, dict) and first_item.get('type') == 'text':
                        text = first_item['text']
                        if 'Error' in text:
                            print(f"❌ Error: {text}")
                        else:
                            print(f"✅ Result: {text[:100]}...")
                else:
                    # 回退处理 - 直接打印原始输出
                    print(f"✅ Result: {str(output)[:100]}...")

            except (json.JSONDecodeError, AttributeError, KeyError) as e:
                # 解析失败时回退到原始输出
                print(f"✅ Result: {str(chunk.item.output)[:100]}...")

        elif chunk.name == 'message_output_created':
            try:
                content = chunk.item.raw_item.content
                if content and len(content) > 0:
                    print(f"💬 Response: {content[0].text}")
            except (AttributeError, IndexError):
                print(f"💬 Response: {str(chunk.item)[:100]}...")

    # 流式传输的文本增量
    elif (hasattr(chunk, 'type') and
          chunk.type == 'raw_response_event' and
          hasattr(chunk, 'data') and
          hasattr(chunk.data, 'type') and
          chunk.data.type == 'response.output_text.delta'):
        print(chunk.data.delta, end='', flush=True)

async with MCPServerStdio(
        name="ClickHouse SQL 演练场",
        params={
            "command": "uv",
            "args": [
                'run',
                '--with', 'mcp-clickhouse',
                '--python', '3.13',
                'mcp-clickhouse'
            ],
            "env": env
        }, client_session_timeout_seconds = 60
) as server:
    agent = Agent(
        name="助手",
        instructions="使用工具查询 ClickHouse 并根据这些文件回答问题。",
        mcp_servers=[server],
    )

    message = "2025 年迄今为止最大的 GitHub 项目是什么?"
    print(f"\n\nRunning: {message}")
    with trace("最大项目工作流"):
        result = Runner.run_streamed(starting_agent=agent, input=message, max_turns=20)
        async for chunk in result.stream_events():
            simple_render_chunk(chunk)
运行中:2025 年迄今为止最大的 GitHub 项目是什么?
🔧 工具:list_databases({})
✅ 结果:amazon
bluesky
country
covid
default
dns
environmental
food
forex
geo
git
github
hackernews
imdb
log...
🔧 工具:list_tables({"database":"github"})
✅ 结果:{
  "database": "github",
  "name": "actors_per_repo",
  "comment": "",
  "columns": [
    {
      "...
🔧 工具:run_select_query({"query":"SELECT repo_name, MAX(stars) FROM github.top_repos_mv"})
✅ 结果:{
  "status": "error",
  "message": "查询失败:HTTPDriver for https://sql-clickhouse.clickhouse....
🔧 工具:run_select_query({"query":"SELECT repo_name, stars FROM github.top_repos ORDER BY stars DESC LIMIT 1"})
✅ 结果:{
  "repo_name": "sindresorhus/awesome",
  "stars": 402893
}...
基于星标数,2025 年最大的 GitHub 项目是"[sindresorhus/awesome](https://github.com/sindresorhus/awesome)",拥有 402,893 个星标。💬 响应:基于星标数,2025 年最大的 GitHub 项目是"[sindresorhus/awesome](https://github.com/sindresorhus/awesome)",拥有 402,893 个星标。