スキル一覧に戻る

openai-image-gen

swarmclawai
更新日 6 days ago
560
113
560
GitHubで表示
メタaiapi

について

このClaudeスキルは、OpenAIのDALL-E 2、DALL-E 3、およびGPT ImageモデルをAPI経由で使用して画像を生成します。ランダムなプロンプトサンプリングによるバッチ生成をサポートし、閲覧しやすいHTMLギャラリーを出力します。OpenAIを通じて画像を作成する必要があり、OPENAI_API_KEYが利用可能な場合にご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add swarmclawai/swarmclaw -a claude-code
プラグインコマンド代替
/plugin add https://github.com/swarmclawai/swarmclaw
Git クローン代替
git clone https://github.com/swarmclawai/swarmclaw.git ~/.claude/skills/openai-image-gen

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

ドキュメント

OpenAI Image Gen

Generate images via the OpenAI Images API with an HTML gallery viewer.

Run

Note: Image generation can take longer than typical timeouts. Set a higher timeout when running via shell (e.g., 300 seconds).

python3 {baseDir}/scripts/gen.py

Useful Flags

# GPT image models with various options
python3 {baseDir}/scripts/gen.py --count 16 --model gpt-image-1
python3 {baseDir}/scripts/gen.py --prompt "ultra-detailed studio photo of a lobster astronaut" --count 4
python3 {baseDir}/scripts/gen.py --size 1536x1024 --quality high --out-dir ./out/images
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp

# DALL-E 3 (note: count is automatically limited to 1)
python3 {baseDir}/scripts/gen.py --model dall-e-3 --quality hd --size 1792x1024 --style vivid
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "serene mountain landscape"

# DALL-E 2
python3 {baseDir}/scripts/gen.py --model dall-e-2 --size 512x512 --count 4

Model-Specific Parameters

Size

  • GPT image models (gpt-image-1, gpt-image-1-mini, gpt-image-1.5): 1024x1024, 1536x1024 (landscape), 1024x1536 (portrait), or auto. Default: 1024x1024
  • dall-e-3: 1024x1024, 1792x1024, or 1024x1792. Default: 1024x1024
  • dall-e-2: 256x256, 512x512, or 1024x1024. Default: 1024x1024

Quality

  • GPT image models: auto, high, medium, or low. Default: high
  • dall-e-3: hd or standard. Default: standard
  • dall-e-2: standard only

Other Parameters

  • GPT image models support --background (transparent, opaque, auto) and --output-format (png, jpeg, webp)
  • dall-e-3 supports --style (vivid for hyper-real, natural for more natural looking)
  • dall-e-3 only supports n=1; the script automatically limits count to 1

Output

  • Image files (*.png, *.jpeg, or *.webp depending on model and format)
  • prompts.json (prompt-to-file mapping)
  • index.html (thumbnail gallery — open in browser to review)

GitHub リポジトリ

swarmclawai/swarmclaw
パス: skills/openai-image-gen
0
agent-frameworkagent-memoryagent-runtimeagent-swarmagentsai

関連スキル

content-collections

メタ

このスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。

スキルを見る

polymarket

メタ

このスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。

スキルを見る

creating-opencode-plugins

メタ

このスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。

スキルを見る

sglang

メタ

SGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。

スキルを見る