openai-image-gen
について
このClaudeスキルは、OpenAIのDALL-E 2、DALL-E 3、およびGPT ImageモデルをAPI経由で使用して画像を生成します。ランダムなプロンプトサンプリングによるバッチ生成をサポートし、閲覧しやすいHTMLギャラリーを出力します。OpenAIを通じて画像を作成する必要があり、OPENAI_API_KEYが利用可能な場合にご利用ください。
クイックインストール
Claude Code
推奨npx skills add swarmclawai/swarmclaw -a claude-code/plugin add https://github.com/swarmclawai/swarmclawgit clone https://github.com/swarmclawai/swarmclaw.git ~/.claude/skills/openai-image-genこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします
ドキュメント
OpenAI Image Gen
Generate images via the OpenAI Images API with an HTML gallery viewer.
Run
Note: Image generation can take longer than typical timeouts. Set a higher timeout when running via shell (e.g., 300 seconds).
python3 {baseDir}/scripts/gen.py
Useful Flags
# GPT image models with various options
python3 {baseDir}/scripts/gen.py --count 16 --model gpt-image-1
python3 {baseDir}/scripts/gen.py --prompt "ultra-detailed studio photo of a lobster astronaut" --count 4
python3 {baseDir}/scripts/gen.py --size 1536x1024 --quality high --out-dir ./out/images
python3 {baseDir}/scripts/gen.py --model gpt-image-1.5 --background transparent --output-format webp
# DALL-E 3 (note: count is automatically limited to 1)
python3 {baseDir}/scripts/gen.py --model dall-e-3 --quality hd --size 1792x1024 --style vivid
python3 {baseDir}/scripts/gen.py --model dall-e-3 --style natural --prompt "serene mountain landscape"
# DALL-E 2
python3 {baseDir}/scripts/gen.py --model dall-e-2 --size 512x512 --count 4
Model-Specific Parameters
Size
- GPT image models (
gpt-image-1,gpt-image-1-mini,gpt-image-1.5):1024x1024,1536x1024(landscape),1024x1536(portrait), orauto. Default:1024x1024 - dall-e-3:
1024x1024,1792x1024, or1024x1792. Default:1024x1024 - dall-e-2:
256x256,512x512, or1024x1024. Default:1024x1024
Quality
- GPT image models:
auto,high,medium, orlow. Default:high - dall-e-3:
hdorstandard. Default:standard - dall-e-2:
standardonly
Other Parameters
- GPT image models support
--background(transparent,opaque,auto) and--output-format(png,jpeg,webp) - dall-e-3 supports
--style(vividfor hyper-real,naturalfor more natural looking) - dall-e-3 only supports
n=1; the script automatically limits count to 1
Output
- Image files (
*.png,*.jpeg, or*.webpdepending on model and format) prompts.json(prompt-to-file mapping)index.html(thumbnail gallery — open in browser to review)
GitHub リポジトリ
関連スキル
content-collections
メタこのスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。
polymarket
メタこのスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。
creating-opencode-plugins
メタこのスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。
sglang
メタSGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。
