이미지 생성

개요

image_generate 도구를 통해 에이전트가 텍스트 프롬프트로 이미지를 생성하거나 기존 이미지를 편집할 수 있다. 여러 프로바이더를 지원하며, 프로바이더 장애 시 자동 폴백을 제공한다.

지원 프로바이더

프로바이더	모델	이미지 편집
OpenAI	gpt-image-1	지원
Google	gemini	지원
fal	flux	미지원
MiniMax	minimax	미지원

편집 지원 여부는 프로바이더에 따라 다르다. OpenAI와 Google은 기존 이미지를 입력받아 편집할 수 있지만, fal과 MiniMax는 텍스트-투-이미지만 지원한다.

파라미터

파라미터	타입	설명	기본값
`prompt`	string	이미지 생성 프롬프트	(필수)
`action`	string	`generate` 또는 `edit`	`generate`
`model`	string	사용할 모델	프로바이더 기본값
`size`	string	이미지 크기 (`1024x1024` 등)	`1024x1024`
`aspectRatio`	string	종횡비 (`16:9`, `1:1` 등)	`1:1`
`count`	number	생성할 이미지 수	1

size vs aspectRatio

size: 정확한 픽셀 크기 지정 (예: 1024x1024, 1792x1024)
aspectRatio: 비율만 지정하고 크기는 프로바이더가 결정 (예: 16:9)
둘 다 지정하면 size가 우선

자동 폴백

프로바이더 장애 시 자동으로 다음 프로바이더로 전환한다.

[이미지 생성 요청]
       │
  OpenAI 시도 → 실패
       │
  Google 시도 → 실패
       │
  fal 시도 → 성공 → 이미지 반환

폴백 순서는 설정 파일에서 커스터마이즈할 수 있다.

설정

API 키 설정

{
  "tools": {
    "imageGenerate": {
      "provider": "openai",
      "apiKey": "${OPENAI_API_KEY}",
      "model": "gpt-image-1"
    }
  }
}

멀티 프로바이더 설정

{
  "tools": {
    "imageGenerate": {
      "providers": {
        "openai": { "apiKey": "${OPENAI_API_KEY}" },
        "google": { "apiKey": "${GOOGLE_API_KEY}" },
        "fal": { "apiKey": "${FAL_API_KEY}" }
      },
      "fallbackOrder": ["openai", "google", "fal"]
    }
  }
}

사용 예시

이미지 생성

image_generate({
  prompt: "서울 야경이 보이는 카페, 수채화 스타일",
  size: "1792x1024",
  count: 1
})

이미지 편집

image_generate({
  action: "edit",
  prompt: "배경을 해질녘으로 변경",
  image: "<base64 또는 파일 경로>",
  model: "gpt-image-1"
})