개요
image_generate 도구를 통해 에이전트가 텍스트 프롬프트로 이미지를 생성하거나 기존 이미지를 편집할 수 있다. 여러 프로바이더를 지원하며, 프로바이더 장애 시 자동 폴백을 제공한다.
지원 프로바이더
| 프로바이더 | 모델 | 이미지 편집 |
|---|---|---|
| OpenAI | gpt-image-1 | 지원 |
| gemini | 지원 | |
| fal | flux | 미지원 |
| MiniMax | minimax | 미지원 |
편집 지원 여부는 프로바이더에 따라 다르다. OpenAI와 Google은 기존 이미지를 입력받아 편집할 수 있지만, fal과 MiniMax는 텍스트-투-이미지만 지원한다.
파라미터
| 파라미터 | 타입 | 설명 | 기본값 |
|---|---|---|---|
prompt | string | 이미지 생성 프롬프트 | (필수) |
action | string | generate 또는 edit | generate |
model | string | 사용할 모델 | 프로바이더 기본값 |
size | string | 이미지 크기 (1024x1024 등) | 1024x1024 |
aspectRatio | string | 종횡비 (16:9, 1:1 등) | 1:1 |
count | number | 생성할 이미지 수 | 1 |
size vs aspectRatio
size: 정확한 픽셀 크기 지정 (예:1024x1024,1792x1024)aspectRatio: 비율만 지정하고 크기는 프로바이더가 결정 (예:16:9)- 둘 다 지정하면
size가 우선
자동 폴백
프로바이더 장애 시 자동으로 다음 프로바이더로 전환한다.
[이미지 생성 요청]
│
OpenAI 시도 → 실패
│
Google 시도 → 실패
│
fal 시도 → 성공 → 이미지 반환
폴백 순서는 설정 파일에서 커스터마이즈할 수 있다.
설정
API 키 설정
{
"tools": {
"imageGenerate": {
"provider": "openai",
"apiKey": "${OPENAI_API_KEY}",
"model": "gpt-image-1"
}
}
}
멀티 프로바이더 설정
{
"tools": {
"imageGenerate": {
"providers": {
"openai": { "apiKey": "${OPENAI_API_KEY}" },
"google": { "apiKey": "${GOOGLE_API_KEY}" },
"fal": { "apiKey": "${FAL_API_KEY}" }
},
"fallbackOrder": ["openai", "google", "fal"]
}
}
}
사용 예시
이미지 생성
image_generate({
prompt: "서울 야경이 보이는 카페, 수채화 스타일",
size: "1792x1024",
count: 1
})
이미지 편집
image_generate({
action: "edit",
prompt: "배경을 해질녘으로 변경",
image: "<base64 또는 파일 경로>",
model: "gpt-image-1"
})