【Code With SOLO】用SOLO打造智能反欺诈网站检测系统——识别色情、诈骗网站一步到位
摘要
使用TRAE SOLO开发了一套完整的智能反欺诈网站检测系统,实现了:
- 动态内容抓取:基于Playwright技术获取JavaScript动态加载的页面内容
- 多维度检测:同时支持色情网站和诈骗网站检测
- 资源级分析:对页面中每张图片、每个视频进行单独风险评分(0-100分)
- 可视化界面:直观展示检测结果和风险评估
背景
我是一名公安民警,随着电信网络诈骗愈发猖獗,反诈形势也越来越严峻。基层派出所以及网安部门都需要处理大量网站风险评估任务。传统的静态检测方法无法应对现代动态网站,经常出现漏检和误判问题。通过AI辅助工具可以提升检测效率和准确性。
实践过程
1. 需求拆解
- 需要获取动态加载的网页内容
- 需要分析页面中的图片、视频资源
- 需要区分色情和诈骗两种风险类型
- 需要给出量化的风险评分
2. SOLO能力应用
- 代码生成:生成Playwright爬虫代码获取动态内容
- 问题分析:分析正则表达式模式匹配图片和视频URL
- 代码优化:优化资源分析和风险评分算法
3. 关键过程
# 核心技术点:Playwright动态抓取
with sync_playwright() as p:
browser = p.chromium.launch(headless=True)
page = browser.new_page()
page.goto(url, wait_until='networkidle')
html = page.content() # 获取完整渲染后的HTML
4. 踩坑经历
- 初期使用requests只能获取空壳HTML,无法提取资源
- 通过SOLO建议引入Playwright解决动态内容问题
- 关键词匹配误判问题,通过白名单机制优化
成果展示
系统功能:
- 1、色情网站检测(识别"爱爱"、“AV”、"色情"等关键词)
- 2、诈骗网站检测(识别登录表单、钓鱼特征)
- 3、动态内容提取(Playwright爬虫)
- 4、资源级风险评分(每张图片/视频单独评分)
- 5、可视化Web界面
测试结果:
在色情网站检测系统和诈骗网站检测系统同时输入“爱爱网”链接,其中色情网站检测系统风险置信分为100分,诈骗网站检测风险置信分数为60分,均为高风险。实际上色情与电信网络诈骗同属灰黑产业,色情网站上面也会有虚假约炮诈骗、赌博等涉诈黑产内容,因此可以判定为检测成功。
检测结果如下图。(为避免造成非法链接的传播,真实链接、敏感图片已隐去)
生成的文件:
完整代码仓详见网盘链接:
我用夸克网盘给你分享了「anti-fraud-analysis.rar」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~ef283YMvYT~:/
链接: 夸克网盘分享
提取码:Yc1H
检测效果:
- 成功识别"爱爱网"等高风险色情网站(风险评分100/100)
- 正确提取96张图片并标记为可疑
- 识别登录表单并评估风险等级
效果与总结
提效成果:
- 传统人工检测:单个网站平均5分钟
- SOLO辅助系统:单个网站平均30秒
- 效率提升10倍!
SOLO的价值:
- 快速生成代码框架
- 解决技术难点(如Playwright配置)
- 提供优化建议和最佳实践
可复用方法:
- Playwright动态内容抓取模板
- 资源分析和风险评分算法
- 可视化结果展示界面
运行方式
- 双击
启动最终版.bat启动色情检测(端口9002) - 双击
启动诈骗检测.bat启动诈骗检测(端口9003) - 访问 http://127.0.0.1:9002 或 http://127.0.0.1:9003
感谢TRAE SOLO让复杂的安全检测系统开发变得高效!


