用SOLO打造智能反欺诈网站检测系统——识别色情、诈骗网站一步到位

【Code With SOLO】用SOLO打造智能反欺诈网站检测系统——识别色情、诈骗网站一步到位


摘要

使用TRAE SOLO开发了一套完整的智能反欺诈网站检测系统,实现了:

  • 动态内容抓取:基于Playwright技术获取JavaScript动态加载的页面内容
  • 多维度检测:同时支持色情网站和诈骗网站检测
  • 资源级分析:对页面中每张图片、每个视频进行单独风险评分(0-100分)
  • 可视化界面:直观展示检测结果和风险评估

背景

我是一名公安民警,随着电信网络诈骗愈发猖獗,反诈形势也越来越严峻。基层派出所以及网安部门都需要处理大量网站风险评估任务。传统的静态检测方法无法应对现代动态网站,经常出现漏检和误判问题。通过AI辅助工具可以提升检测效率和准确性。


实践过程

1. 需求拆解

  • 需要获取动态加载的网页内容
  • 需要分析页面中的图片、视频资源
  • 需要区分色情和诈骗两种风险类型
  • 需要给出量化的风险评分

2. SOLO能力应用

  • 代码生成:生成Playwright爬虫代码获取动态内容
  • 问题分析:分析正则表达式模式匹配图片和视频URL
  • 代码优化:优化资源分析和风险评分算法

3. 关键过程

# 核心技术点:Playwright动态抓取
with sync_playwright() as p:
    browser = p.chromium.launch(headless=True)
    page = browser.new_page()
    page.goto(url, wait_until='networkidle')
    html = page.content()  # 获取完整渲染后的HTML

4. 踩坑经历

  • 初期使用requests只能获取空壳HTML,无法提取资源
  • 通过SOLO建议引入Playwright解决动态内容问题
  • 关键词匹配误判问题,通过白名单机制优化

成果展示

系统功能:

  • 1、色情网站检测(识别"爱爱"、“AV”、"色情"等关键词)
  • 2、诈骗网站检测(识别登录表单、钓鱼特征)
  • 3、动态内容提取(Playwright爬虫)
  • 4、资源级风险评分(每张图片/视频单独评分)
  • 5、可视化Web界面

测试结果:

在色情网站检测系统和诈骗网站检测系统同时输入“爱爱网”链接,其中色情网站检测系统风险置信分为100分,诈骗网站检测风险置信分数为60分,均为高风险。实际上色情与电信网络诈骗同属灰黑产业,色情网站上面也会有虚假约炮诈骗、赌博等涉诈黑产内容,因此可以判定为检测成功。

检测结果如下图。(为避免造成非法链接的传播,真实链接、敏感图片已隐去)

生成的文件:

完整代码仓详见网盘链接:

我用夸克网盘给你分享了「anti-fraud-analysis.rar」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~ef283YMvYT~:/
链接: 夸克网盘分享
提取码:Yc1H

检测效果:

  • 成功识别"爱爱网"等高风险色情网站(风险评分100/100)
  • 正确提取96张图片并标记为可疑
  • 识别登录表单并评估风险等级

效果与总结

提效成果:

  • 传统人工检测:单个网站平均5分钟
  • SOLO辅助系统:单个网站平均30秒
  • 效率提升10倍

SOLO的价值:

  • 快速生成代码框架
  • 解决技术难点(如Playwright配置)
  • 提供优化建议和最佳实践

可复用方法:

  • Playwright动态内容抓取模板
  • 资源分析和风险评分算法
  • 可视化结果展示界面

运行方式

  1. 双击 启动最终版.bat 启动色情检测(端口9002)
  2. 双击 启动诈骗检测.bat 启动诈骗检测(端口9003)
  3. 访问 http://127.0.0.1:9002http://127.0.0.1:9003

感谢TRAE SOLO让复杂的安全检测系统开发变得高效!