SKILL·290A4F

serialize-data-formats

Name: serialize-data-formats
Author: pjt222

pjt222

更新日 1 month ago

26 閲覧

ドキュメントapidata

について

このスキルは、JSON、XML、YAML、Protobuf、MessagePackなどの形式間での直列化と逆直列化を可能にします。API、ストレージ、またはシステム間通信において、パフォーマンス、サイズ、相互運用性のニーズに基づいて適切な形式を選択するのに役立ちます。ワイヤフォーマットの選択、データ転送の最適化、または直列化システム間の移行時にご利用ください。

クイックインストール

Claude Code

推奨

メイン

npx skills add pjt222/agent-almanac -a claude-code

プラグインコマンド代替

/plugin add https://github.com/pjt222/agent-almanac

Git クローン代替

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/serialize-data-formats

このコマンドをClaude Codeにコピー＆ペーストしてスキルをインストールします

ドキュメント

序資式

選與行正資序式於用例、含正編解與性意。

用

擇 API 通線式→用
持結構資於盤或物儲→用
異語系間交資→用
優傳大或解速→用
自一序式遷他→用

入

必：所序資結構（譜或例）
必：用例（API、儲、流、析）
可：性需（大、速、譜強）
可：標語/運限
可：人讀需

行

一：擇正式

Format	Human Readable	Schema	Size	Speed	Best For
JSON	Yes	Optional (JSON Schema)	Medium	Medium	REST APIs, config
XML	Yes	XSD, DTD	Large	Slow	Enterprise/legacy, SOAP
YAML	Yes	Optional	Medium	Slow	Config, CI/CD, k8s
Protocol Buffers	No	Required	Small	Fast	gRPC, microservices
MessagePack	No	None	Small	Fast	Real-time, embedded
Arrow/Parquet	No	Built-in	Very Small	Very Fast	Analytics, columnar

決樹：

需人改？ → YAML（配）或 JSON（資）
需嚴譜 + 速 RPC？ → Protocol Buffers
需最小線大？ → MessagePack 或 Protobuf
需列析？ → Apache Parquet
需內存交？ → Apache Arrow
舊企接？ → XML

得：式選附文錄理合用例需。

敗：需衝（如人讀且速）→重主用例、註衡。

二：行 JSON 序

import json
from datetime import datetime, date
from dataclasses import dataclass, asdict

@dataclass
class Measurement:
    sensor_id: str
    value: float
    unit: str
    timestamp: datetime

class CustomEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, datetime):
            return obj.isoformat()
        if isinstance(obj, date):
            return obj.isoformat()
        if isinstance(obj, bytes):
            import base64
            return base64.b64encode(obj).decode('ascii')
        return super().default(obj)

measurement = Measurement("sensor-01", 23.5, "celsius", datetime.now())
json_str = json.dumps(asdict(measurement), cls=CustomEncoder, indent=2)

data = json.loads(json_str)

library(jsonlite)

df <- data.frame(sensor_id = "sensor-01", value = 23.5, unit = "celsius")
json_str <- jsonlite::toJSON(df, auto_unbox = TRUE, pretty = TRUE)

df_back <- jsonlite::fromJSON(json_str)

得：往返序保諸型準。

敗：型失（如日成串）→解步加顯型轉。

三：行 Protocol Buffers

定譜（.proto 檔）：

syntax = "proto3";
package sensors;

message Measurement {
  string sensor_id = 1;
  double value = 2;
  string unit = 3;
  int64 timestamp_ms = 4;
}

message MeasurementBatch {
  repeated Measurement measurements = 1;
}

生並用：

protoc --python_out=. sensors.proto
protoc --go_out=. sensors.proto

from sensors_pb2 import Measurement, MeasurementBatch
import time

m = Measurement(
    sensor_id="sensor-01",
    value=23.5,
    unit="celsius",
    timestamp_ms=int(time.time() * 1000)
)
binary = m.SerializeToString()

m2 = Measurement()
m2.ParseFromString(binary)

得：二制出較等 JSON 小 3-10 倍。

敗：protoc 無→用語原 protobuf 庫（如 Python betterproto）。

四：行 MessagePack

import msgpack
from datetime import datetime

def encode_datetime(obj):
    if isinstance(obj, datetime):
        return {"__datetime__": True, "s": obj.isoformat()}
    return obj

def decode_datetime(obj):
    if "__datetime__" in obj:
        return datetime.fromisoformat(obj["s"])
    return obj

data = {"sensor_id": "sensor-01", "value": 23.5, "ts": datetime.now()}

packed = msgpack.packb(data, default=encode_datetime)

unpacked = msgpack.unpackb(packed, object_hook=decode_datetime, raw=False)

得：MessagePack 出於典載較 JSON 小 15-30%。

敗：語缺 MessagePack 支→退 JSON 加壓（gzip）。

五：行 Apache Parquet（列）

import pyarrow as pa
import pyarrow.parquet as pq
import pandas as pd

df = pd.DataFrame({
    "sensor_id": ["s-01", "s-02", "s-01", "s-03"] * 1000,
    "value": [23.5, 18.2, 24.1, 19.8] * 1000,
    "unit": ["celsius"] * 4000,
    "timestamp": pd.date_range("2025-01-01", periods=4000, freq="min")
})

table = pa.Table.from_pandas(df)
pq.write_table(table, "measurements.parquet", compression="snappy")

table_back = pq.read_table("measurements.parquet", columns=["sensor_id", "value"])
df_subset = table_back.to_pandas()

library(arrow)

df <- data.frame(sensor_id = rep("s-01", 1000), value = rnorm(1000))
arrow::write_parquet(df, "measurements.parquet")

df_back <- arrow::read_parquet("measurements.parquet", col_select = c("value"))

得：Parquet 檔較 CSV 小 5-20 倍於典表資。

敗：Arrow 無→用 fastparquet（Python）或 CSV + gzip 退。

六：較性

行基準於汝特資與用例：

import json, msgpack, time
import pyarrow as pa, pyarrow.parquet as pq

data = [{"id": i, "value": i * 0.1, "label": f"item-{i}"} for i in range(10000)]

start = time.perf_counter()
json_bytes = json.dumps(data).encode()
json_time = time.perf_counter() - start

start = time.perf_counter()
msgpack_bytes = msgpack.packb(data)
msgpack_time = time.perf_counter() - start

print(f"JSON:    {len(json_bytes):>8} bytes, {json_time*1000:.1f} ms")
print(f"MsgPack: {len(msgpack_bytes):>8} bytes, {msgpack_time*1000:.1f} ms")

得：基準果導產用式選。

敗：諸式性不足→考壓（zstd、snappy）為正交優。

驗

所選式合用例需（文錄理）
往返序保諸資型
邊例理：空集、null/None、Unicode、大數
性基於代表載大基準
誤理為畸入（雅敗非崩）
譜文錄（JSON Schema、.proto 等）

忌

浮精：JSON 諸數為 IEEE 754 雙。財/十進精用串編
日時理：JSON 無原日型。恆文錄式（ISO 8601）與時區理
譜演：加除欄可破消費。Protobuf 善理；JSON 需慎本
JSON 內二：Base64 編脹二 ~33%。二重載用二式
YAML 安：YAML 解器可執任碼經 !!python/object。恆用安載

參

design-serialization-schema
implement-pharma-serialisation
create-quarto-report

GitHub リポジトリ

pjt222/agent-almanac

パス: i18n/wenyan-ultra/skills/serialize-data-formats

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the serialize-data-formats skill?

serialize-data-formats is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform serialize-data-formats-related tasks without extra prompting.

How do I install serialize-data-formats?

Use the install commands on this page: add serialize-data-formats to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does serialize-data-formats belong to?

serialize-data-formats is in the Documentation category, tagged api and data.

Is serialize-data-formats free to use?

Yes. serialize-data-formats is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.