SKILL·290A4F

serialize-data-formats

Name: serialize-data-formats
Author: pjt222

pjt222

Mis à jour 1 month ago

26 vues

Documentationapidata

À propos

Cette compétence permet la sérialisation et la désérialisation à travers des formats tels que JSON, XML, YAML, Protobuf et MessagePack. Elle aide les développeurs à choisir le format adapté en fonction des besoins de performance, de taille et d'interopérabilité pour les API, le stockage ou la communication système. Utilisez-la lors du choix d'un format de transmission, de l'optimisation du transfert de données ou de la migration entre systèmes de sérialisation.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add pjt222/agent-almanac -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/pjt222/agent-almanac

Git CloneAlternatif

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/serialize-data-formats

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

序資式

選與行正資序式於用例、含正編解與性意。

用

擇 API 通線式→用
持結構資於盤或物儲→用
異語系間交資→用
優傳大或解速→用
自一序式遷他→用

入

必：所序資結構（譜或例）
必：用例（API、儲、流、析）
可：性需（大、速、譜強）
可：標語/運限
可：人讀需

行

一：擇正式

Format	Human Readable	Schema	Size	Speed	Best For
JSON	Yes	Optional (JSON Schema)	Medium	Medium	REST APIs, config
XML	Yes	XSD, DTD	Large	Slow	Enterprise/legacy, SOAP
YAML	Yes	Optional	Medium	Slow	Config, CI/CD, k8s
Protocol Buffers	No	Required	Small	Fast	gRPC, microservices
MessagePack	No	None	Small	Fast	Real-time, embedded
Arrow/Parquet	No	Built-in	Very Small	Very Fast	Analytics, columnar

決樹：

需人改？ → YAML（配）或 JSON（資）
需嚴譜 + 速 RPC？ → Protocol Buffers
需最小線大？ → MessagePack 或 Protobuf
需列析？ → Apache Parquet
需內存交？ → Apache Arrow
舊企接？ → XML

得：式選附文錄理合用例需。

敗：需衝（如人讀且速）→重主用例、註衡。

二：行 JSON 序

import json
from datetime import datetime, date
from dataclasses import dataclass, asdict

@dataclass
class Measurement:
    sensor_id: str
    value: float
    unit: str
    timestamp: datetime

class CustomEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, datetime):
            return obj.isoformat()
        if isinstance(obj, date):
            return obj.isoformat()
        if isinstance(obj, bytes):
            import base64
            return base64.b64encode(obj).decode('ascii')
        return super().default(obj)

measurement = Measurement("sensor-01", 23.5, "celsius", datetime.now())
json_str = json.dumps(asdict(measurement), cls=CustomEncoder, indent=2)

data = json.loads(json_str)

library(jsonlite)

df <- data.frame(sensor_id = "sensor-01", value = 23.5, unit = "celsius")
json_str <- jsonlite::toJSON(df, auto_unbox = TRUE, pretty = TRUE)

df_back <- jsonlite::fromJSON(json_str)

得：往返序保諸型準。

敗：型失（如日成串）→解步加顯型轉。

三：行 Protocol Buffers

定譜（.proto 檔）：

syntax = "proto3";
package sensors;

message Measurement {
  string sensor_id = 1;
  double value = 2;
  string unit = 3;
  int64 timestamp_ms = 4;
}

message MeasurementBatch {
  repeated Measurement measurements = 1;
}

生並用：

protoc --python_out=. sensors.proto
protoc --go_out=. sensors.proto

from sensors_pb2 import Measurement, MeasurementBatch
import time

m = Measurement(
    sensor_id="sensor-01",
    value=23.5,
    unit="celsius",
    timestamp_ms=int(time.time() * 1000)
)
binary = m.SerializeToString()

m2 = Measurement()
m2.ParseFromString(binary)

得：二制出較等 JSON 小 3-10 倍。

敗：protoc 無→用語原 protobuf 庫（如 Python betterproto）。

四：行 MessagePack

import msgpack
from datetime import datetime

def encode_datetime(obj):
    if isinstance(obj, datetime):
        return {"__datetime__": True, "s": obj.isoformat()}
    return obj

def decode_datetime(obj):
    if "__datetime__" in obj:
        return datetime.fromisoformat(obj["s"])
    return obj

data = {"sensor_id": "sensor-01", "value": 23.5, "ts": datetime.now()}

packed = msgpack.packb(data, default=encode_datetime)

unpacked = msgpack.unpackb(packed, object_hook=decode_datetime, raw=False)

得：MessagePack 出於典載較 JSON 小 15-30%。

敗：語缺 MessagePack 支→退 JSON 加壓（gzip）。

五：行 Apache Parquet（列）

import pyarrow as pa
import pyarrow.parquet as pq
import pandas as pd

df = pd.DataFrame({
    "sensor_id": ["s-01", "s-02", "s-01", "s-03"] * 1000,
    "value": [23.5, 18.2, 24.1, 19.8] * 1000,
    "unit": ["celsius"] * 4000,
    "timestamp": pd.date_range("2025-01-01", periods=4000, freq="min")
})

table = pa.Table.from_pandas(df)
pq.write_table(table, "measurements.parquet", compression="snappy")

table_back = pq.read_table("measurements.parquet", columns=["sensor_id", "value"])
df_subset = table_back.to_pandas()

library(arrow)

df <- data.frame(sensor_id = rep("s-01", 1000), value = rnorm(1000))
arrow::write_parquet(df, "measurements.parquet")

df_back <- arrow::read_parquet("measurements.parquet", col_select = c("value"))

得：Parquet 檔較 CSV 小 5-20 倍於典表資。

敗：Arrow 無→用 fastparquet（Python）或 CSV + gzip 退。

六：較性

行基準於汝特資與用例：

import json, msgpack, time
import pyarrow as pa, pyarrow.parquet as pq

data = [{"id": i, "value": i * 0.1, "label": f"item-{i}"} for i in range(10000)]

start = time.perf_counter()
json_bytes = json.dumps(data).encode()
json_time = time.perf_counter() - start

start = time.perf_counter()
msgpack_bytes = msgpack.packb(data)
msgpack_time = time.perf_counter() - start

print(f"JSON:    {len(json_bytes):>8} bytes, {json_time*1000:.1f} ms")
print(f"MsgPack: {len(msgpack_bytes):>8} bytes, {msgpack_time*1000:.1f} ms")

得：基準果導產用式選。

敗：諸式性不足→考壓（zstd、snappy）為正交優。

驗

所選式合用例需（文錄理）
往返序保諸資型
邊例理：空集、null/None、Unicode、大數
性基於代表載大基準
誤理為畸入（雅敗非崩）
譜文錄（JSON Schema、.proto 等）

忌

浮精：JSON 諸數為 IEEE 754 雙。財/十進精用串編
日時理：JSON 無原日型。恆文錄式（ISO 8601）與時區理
譜演：加除欄可破消費。Protobuf 善理；JSON 需慎本
JSON 內二：Base64 編脹二 ~33%。二重載用二式
YAML 安：YAML 解器可執任碼經 !!python/object。恆用安載

參

design-serialization-schema
implement-pharma-serialisation
create-quarto-report

Dépôt GitHub

pjt222/agent-almanac

Chemin: i18n/wenyan-ultra/skills/serialize-data-formats

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the serialize-data-formats skill?

serialize-data-formats is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform serialize-data-formats-related tasks without extra prompting.

How do I install serialize-data-formats?

Use the install commands on this page: add serialize-data-formats to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does serialize-data-formats belong to?

serialize-data-formats is in the Documentation category, tagged api and data.

Is serialize-data-formats free to use?

Yes. serialize-data-formats is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Compétences associées

railway-docs

Documentation

Cette compétence récupère la documentation actuelle de Railway pour répondre aux questions sur les fonctionnalités, le fonctionnement ou des URL spécifiques de la documentation. Elle garantit que les développeurs reçoivent des informations précises et à jour directement depuis les sources officielles de Railway. Utilisez-la lorsque les utilisateurs demandent comment fonctionne Railway ou font référence à la documentation de Railway.

Voir la compétence

n8n-code-python

Documentation

Cette compétence Claude offre un accompagnement expert pour écrire du code Python dans les nœuds Code de n8n, en particulier pour utiliser la bibliothèque standard de Python et travailler avec la syntaxe spéciale de n8n comme `_input`, `_json` et `_node`. Elle aide les développeurs à comprendre les limites de Python dans n8n et recommande d'utiliser JavaScript pour la plupart des workflows, tout en proposant des solutions Python pour des besoins spécifiques de transformation de données.

Voir la compétence

archon

Documentation

La compétence Archon offre une recherche sémantique alimentée par RAG et une gestion de projet via une API REST. Utilisez-la pour interroger la documentation, gérer des projets/tâches hiérarchiques et effectuer de la recherche de connaissances avec des capacités de téléchargement de documents. Priorisez toujours Archon en premier lors de la recherche dans une documentation externe avant d'utiliser d'autres sources.

Voir la compétence

n8n-code-javascript

Documentation

Cette compétence Claude fournit des conseils d'expert pour écrire du code JavaScript dans les nœuds Code d'n8n. Elle couvre la syntaxe essentielle spécifique à n8n comme les variables `$input`/`$json`, les assistants HTTP et la gestion des DateTime, tout en résolvant les erreurs courantes. Utilisez-la lors du développement de workflows n8n nécessitant un traitement JavaScript personnalisé dans les nœuds Code.

Voir la compétence