【Skill创作】全自动脱敏个人敏感信息数据

文和戟剑 · 2026 年5 月 12 日 05:17

1.skill简介

pii-detector + pii-masker

全自动高效率识别脱敏个人敏感信息。

为防止数据违反《个人信息保护法》，异构数据人工判别效率不高，使用大模型进行个人信息敏感数据识别有成本低效率高的优势。同时可以让大模型进行模糊化脱敏策略，根据配置的脱敏策略进行全流程自动化处理。

2.使用场景

数据合规，医疗机构处理医疗账单，金融机构处理客户数据。互联网工作者，在网络上发布信息时，防止发布内容违反个人信息保护法。

3.创作实践

我的个人心得是，skill一定也要说明结束调用的标准。同时要拆分业务流程，保证单个skill只处理一种数据流，才能通过schema限制确保输入输出的稳定性。

4.使用步骤

输入数据，调用pii-detector，让大模型识别出全部个人敏感信息，输出了全部个人敏感信息markers。

将原本数据和个人信息markers一同输入，调用pii-masker，让大模型进行个人信息模糊化处理。

5.效果展示

准备约80行测试数据

输入并调用pii-detector

获得所有个人敏感信息

将所有个人敏感信息和原始数据输入并调用pii-masker

获得全部脱敏数据

6.作品github链接

skills/pii-detector at main · howlingapple/skills

7.可拓展性

通过其他skill或者mcp，拓展处理pdf，markdown，doc，excel文件的敏感信息，也可以拓展处理各种数据库的内容。

迟迟 · 2026 年5 月 12 日 05:45

你这个也厉害啊，确实有用

文和戟剑 · 2026 年5 月 12 日 06:08

谢谢，有用就好

迟迟 · 2026 年5 月 12 日 09:35

投票投票哦！

文和戟剑 · 2026 年5 月 12 日 11:52

谢谢迟迟，期待一起参与活动