MCP HubMCP Hub
Вернуться к навыкам

qwen-image

agentbay-ai
Обновлено 2 days ago
2 просмотров
40
2
40
Посмотреть на GitHub
Метаaiapi

О программе

Этот навык создает изображения с помощью API Qwen Image от Alibaba Cloud, идеально подходит для китайских запросов или генерации высококачественных AI-изображений. Он поддерживает несколько версий моделей и выводит изображения в виде URL-адресов или сохраняет их локально. Используйте его, когда разработчикам необходимо интегрировать функцию преобразования текста в изображение в свои приложения.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add agentbay-ai/agentbay-skills -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/agentbay-ai/agentbay-skills
Git клонированиеАльтернативный
git clone https://github.com/agentbay-ai/agentbay-skills.git ~/.claude/skills/qwen-image

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

Qwen Image

Generate high-quality images using Alibaba Cloud's Qwen Image API (通义万相).

Usage

Generate an image (returns URL only):

uv run {baseDir}/scripts/generate_image.py --prompt "一副典雅庄重的对联悬挂于厅堂之中" --size "1664*928" --api-key sk-xxx

Generate and save locally:

uv run {baseDir}/scripts/generate_image.py --prompt "一副典雅庄重的对联悬挂于厅堂之中" --size "1664*928" --api-key sk-xxx

With custom model: Support qwen-image-max-2025-12-30 qwen-image-plus-2026-01-09 qwen-image-plus

uv run {baseDir}/scripts/generate_image.py --prompt "a beautiful sunset over mountains" --model qwen-image-plus-2026-01-09 --api-key sk-xxx

API Key

You can obtain the API key and run the image generation command in the following order.

  • Get apiKey from models.providers.bailian.apiKey in ~/.openclaw/openclaw.json
  • Or get from skills."qwen-image".apiKey in ~/.openclaw/openclaw.json
  • Or get from DASHSCOPE_API_KEY environment variable
  • Or Get your API key from: https://dashscope.console.aliyun.com/

Options

Sizes:

  • 1664*928 (default) - 16:9 landscape
  • 1024*1024 - Square format
  • 720*1280 - 9:16 portrait
  • 1280*720 - 16:9 landscape (smaller)

Additional flags:

  • --negative-prompt "unwanted elements" - Specify what to avoid
  • --no-prompt-extend - Disable automatic prompt enhancement
  • --watermark - Add watermark to generated image
  • --no-verify-ssl - Disable SSL certificate verification (use when behind corporate proxy)

Workflow

  1. Execute the generate_image.py script with the user's prompt
  2. Parse the script output and find the line starting with MEDIA_URL:
  3. Extract the image URL from that line (format: MEDIA_URL: https://...)
  4. Display the image to the user using markdown syntax: ![Generated Image](URL)
  5. Do NOT download or save the image unless the user specifically requests it

Notes

  • Supports both Chinese and English prompts
  • By default, returns image URL directly without downloading
  • The script prints MEDIA_URL: in the output - extract this URL and display it using markdown image syntax: ![generated image](URL)
  • Always look for the line starting with MEDIA_URL: in the script output and render the image for the user
  • Default negative prompt helps avoid common AI artifacts
  • Images are hosted on Alibaba Cloud OSS with temporary access URLs

GitHub репозиторий

agentbay-ai/agentbay-skills
Путь: qwen-image
0

Похожие навыки

content-collections

Мета

Этот навык предоставляет проверенную в продакшене настройку для Content Collections — TypeScript-ориентированного инструмента, который преобразует файлы Markdown/MDX в типобезопасные коллекции данных с валидацией Zod. Используйте его при создании блогов, сайтов документации или контентных приложений на Vite + React для обеспечения типобезопасности и автоматической проверки содержимого. Он охватывает всё: от настройки плагина Vite и компиляции MDX до оптимизации развертывания и валидации схем.

Просмотреть навык

polymarket

Мета

Этот навык позволяет разработчикам создавать приложения на платформе прогнозных рынков Polymarket, включая интеграцию с API для торговли и получения рыночных данных. Он также обеспечивает потоковую передачу данных в реальном времени через WebSocket для отслеживания текущих сделок и рыночной активности. Используйте его для реализации торговых стратегий или создания инструментов, обрабатывающих обновления рынка в реальном времени.

Просмотреть навык

creating-opencode-plugins

Мета

Этот навык помогает разработчикам создавать плагины OpenCode, которые подключаются к более чем 25 типам событий, таким как команды, файлы и операции LSP. Он предоставляет структуру плагина, спецификации API событий и шаблоны реализации для модулей на JavaScript/TypeScript. Используйте его, когда вам нужно перехватывать, отслеживать или расширять жизненный цикл ассистента OpenCode AI с помощью пользовательской событийно-ориентированной логики.

Просмотреть навык

sglang

Мета

SGLang — это высокопроизводительный фреймворк для обслуживания больших языковых моделей (LLM), специализирующийся на быстрой структурированной генерации JSON, regex и рабочих процессов агентов с использованием кэширования префиксов RadixAttention. Он обеспечивает значительно более высокую скорость вывода, особенно для задач с повторяющимися префиксами, что делает его идеальным для сложных структурированных результатов и многократных диалогов. Выбирайте SGLang вместо альтернатив, таких как vLLM, когда вам требуется ограниченное декодирование или вы создаете приложения с интенсивным совместным использованием префиксов.

Просмотреть навык