1.skill简介
pii-detector + pii-masker
全自动高效率识别脱敏个人敏感信息。
为防止数据违反《个人信息保护法》,异构数据人工判别效率不高,使用大模型进行个人信息敏感数据识别有成本低效率高的优势。同时可以让大模型进行模糊化脱敏策略,根据配置的脱敏策略进行全流程自动化处理。
2.使用场景
数据合规,医疗机构处理医疗账单,金融机构处理客户数据。互联网工作者,在网络上发布信息时,防止发布内容违反个人信息保护法。
3.创作实践
我的个人心得是,skill一定也要说明结束调用的标准。同时要拆分业务流程,保证单个skill只处理一种数据流,才能通过schema限制确保输入输出的稳定性。
4.使用步骤
输入数据,调用pii-detector,让大模型识别出全部个人敏感信息,输出了全部个人敏感信息markers。
将原本数据和个人信息markers一同输入,调用pii-masker,让大模型进行个人信息模糊化处理。
5.效果展示
准备约80行测试数据
输入并调用pii-detector
获得所有个人敏感信息
将所有个人敏感信息和原始数据输入并调用pii-masker
获得全部脱敏数据
6.作品github链接
skills/pii-detector at main · howlingapple/skills
skills/pii-masker at main · howlingapple/skills
7.可拓展性
通过其他skill或者mcp,拓展处理pdf,markdown,doc,excel文件的敏感信息,也可以拓展处理各种数据库的内容。




