【Skill创作】全自动脱敏个人敏感信息数据

1.skill简介

pii-detector + pii-masker

全自动高效率识别脱敏个人敏感信息。

为防止数据违反《个人信息保护法》,异构数据人工判别效率不高,使用大模型进行个人信息敏感数据识别有成本低效率高的优势。同时可以让大模型进行模糊化脱敏策略,根据配置的脱敏策略进行全流程自动化处理。

2.使用场景

数据合规,医疗机构处理医疗账单,金融机构处理客户数据。互联网工作者,在网络上发布信息时,防止发布内容违反个人信息保护法。

3.创作实践

我的个人心得是,skill一定也要说明结束调用的标准。同时要拆分业务流程,保证单个skill只处理一种数据流,才能通过schema限制确保输入输出的稳定性。

4.使用步骤

输入数据,调用pii-detector,让大模型识别出全部个人敏感信息,输出了全部个人敏感信息markers。

将原本数据和个人信息markers一同输入,调用pii-masker,让大模型进行个人信息模糊化处理。

5.效果展示

准备约80行测试数据

输入并调用pii-detector

获得所有个人敏感信息

将所有个人敏感信息和原始数据输入并调用pii-masker

获得全部脱敏数据

6.作品github链接

skills/pii-detector at main · howlingapple/skills

skills/pii-masker at main · howlingapple/skills

7.可拓展性

通过其他skill或者mcp,拓展处理pdf,markdown,doc,excel文件的敏感信息,也可以拓展处理各种数据库的内容。

你这个也厉害啊,确实有用

1 个赞

谢谢,有用就好

2 个赞

投票投票哦!

1 个赞

谢谢迟迟,期待一起参与活动

1 个赞