개요

image_generate 도구를 통해 에이전트가 텍스트 프롬프트로 이미지를 생성하거나 기존 이미지를 편집할 수 있다. 여러 프로바이더를 지원하며, 프로바이더 장애 시 자동 폴백을 제공한다.


지원 프로바이더

프로바이더모델이미지 편집
OpenAIgpt-image-1지원
Googlegemini지원
falflux미지원
MiniMaxminimax미지원

편집 지원 여부는 프로바이더에 따라 다르다. OpenAI와 Google은 기존 이미지를 입력받아 편집할 수 있지만, fal과 MiniMax는 텍스트-투-이미지만 지원한다.


파라미터

파라미터타입설명기본값
promptstring이미지 생성 프롬프트(필수)
actionstringgenerate 또는 editgenerate
modelstring사용할 모델프로바이더 기본값
sizestring이미지 크기 (1024x1024 등)1024x1024
aspectRatiostring종횡비 (16:9, 1:1 등)1:1
countnumber생성할 이미지 수1

size vs aspectRatio

  • size: 정확한 픽셀 크기 지정 (예: 1024x1024, 1792x1024)
  • aspectRatio: 비율만 지정하고 크기는 프로바이더가 결정 (예: 16:9)
  • 둘 다 지정하면 size가 우선

자동 폴백

프로바이더 장애 시 자동으로 다음 프로바이더로 전환한다.

[이미지 생성 요청]
       │
  OpenAI 시도 → 실패
       │
  Google 시도 → 실패
       │
  fal 시도 → 성공 → 이미지 반환

폴백 순서는 설정 파일에서 커스터마이즈할 수 있다.


설정

API 키 설정

{
  "tools": {
    "imageGenerate": {
      "provider": "openai",
      "apiKey": "${OPENAI_API_KEY}",
      "model": "gpt-image-1"
    }
  }
}

멀티 프로바이더 설정

{
  "tools": {
    "imageGenerate": {
      "providers": {
        "openai": { "apiKey": "${OPENAI_API_KEY}" },
        "google": { "apiKey": "${GOOGLE_API_KEY}" },
        "fal": { "apiKey": "${FAL_API_KEY}" }
      },
      "fallbackOrder": ["openai", "google", "fal"]
    }
  }
}

사용 예시

이미지 생성

image_generate({
  prompt: "서울 야경이 보이는 카페, 수채화 스타일",
  size: "1792x1024",
  count: 1
})

이미지 편집

image_generate({
  action: "edit",
  prompt: "배경을 해질녘으로 변경",
  image: "<base64 또는 파일 경로>",
  model: "gpt-image-1"
})