返回技能列表

vision

mattnigh
更新于 4 days ago
7 次查看
22
1
22
在 GitHub 上查看
文档处理pdf

关于

The vision skill processes images and PDFs to perform tasks like description, summarization, and analysis based on user prompts. A key feature is its ability to precisely recreate UI elements from screenshots or documents using CSS, HTML, and JavaScript. Developers can use it by executing a local Python script that takes a file path and a text request as inputs.

快速安装

Claude Code

推荐
主要方式
npx skills add mattnigh/skills_collection -a claude-code
插件命令备选方式
/plugin add https://github.com/mattnigh/skills_collection
Git 克隆备选方式
git clone https://github.com/mattnigh/skills_collection.git ~/.claude/skills/vision

在 Claude Code 中复制并粘贴此命令以安装该技能

GitHub 仓库

mattnigh/skills_collection
路径: collection/flyingtimes__podcast-using-skill__claude__skills__vision__SKILL.md
0

相关推荐技能

release-standards

文档处理

这个Skill为开发者提供了语义化版本规范和变更日志格式标准。它能在准备软件发布时快速指导版本号更新和变更日志撰写,包含版本号递增规则、预发布标识符等关键信息。适用于需要遵循规范发布流程的开发场景。

查看技能

commit-standards

文档处理

这个Skill帮助开发者遵循Conventional Commits规范格式化Git提交信息。它提供了标准格式模板和常用提交类型的中英文对照表(如feat/新增、fix/修正等),适用于编写提交、执行git commit或审查提交历史的场景。通过确保提交信息的规范性和一致性,它能提升团队协作效率和版本历史可读性。

查看技能

huggingface-tokenizers

文档处理

HuggingFace Tokenizers 提供了基于 Rust 的高性能分词工具,支持 BPE、WordPiece 和 Unigram 算法,能在一分钟内处理 1GB 文本。它适用于需要快速分词或训练自定义词汇表的场景,并能无缝集成到 transformers 库中。开发者可以借助它进行对齐跟踪、填充截断等操作,满足从研究到生产的全流程需求。

查看技能

nano-pdf

文档处理

nano-pdf 让开发者能用自然语言指令直接编辑PDF文件,无需手动操作复杂工具。它通过命令行快速修改指定页面内容,如修正拼写错误或更新标题,适合处理日常文档微调。使用前请注意核对页码和输出结果,确保修改准确无误。

查看技能