(ps:实习突发奇想,结合 gpt 分析大致检测模型,有前人类似技术文章,可行性比较大,熵值和行为画像分析可深化实现,仅供阅读参考图一乐。)
# 核心概念
将传统黑名单过滤升级为「输入行为画像 + 风险可视化」,让防御机制与用户产生交互,同时融入代码语义分析
# 前端创新方案(Vue3 实现)
风险输入实时热力图
1 | <template> |
# 后端创新方案(Spring Boot 实现)
语义语法双分析器
1 | // 创新点:SQL词法分析+HTML标记树验证 |
# 创新防御策略
智能混淆策略
1 | // 创新点:对可疑输入自动混淆 |
攻击者画像系统
1 | // 创新点:记录攻击者输入习惯 |
# 输入熵值与行为分析的攻防原理详解
# 一、输入熵值(Input Entropy)—— 衡量输入的「混乱度」
通俗解释:
就像用温度计测量发烧一样,输入熵值用于量化用户输入的「异常热度」。通过数学方法计算输入内容的随机性程度,识别不符合正常用户习惯的异常输入。
技术原理:
香农熵计算公式
1
H(X) = -Σ (P(x_i) * log2(P(x_i)))
- 其中 P (x_i) 表示字符 x_i 在输入中出现的概率
- 示例:普通英文文本的熵值约 4.7,而随机字符串可达 8
# 创新测试方案
攻击模拟沙盒
1 | // 创新点:在测试环境自动模拟攻击 |
# 创新成果展示
防御效果可视化看板
1 | <template> |
方案亮点:
将安全防御从 "被动拦截" 变为 "主动示警"
通过输入熵值和行为分析识别高级攻击
检测维度 传统正则匹配 熵值 + 行为分析 检测原理 基于已知攻击特征的模式匹配 基于输入本质特性的异常识别 绕过难度 低(变形攻击可绕过) 高(需同时伪造内容和行为) 误报率 高(例如允许特殊字符的密码) 低(结合多维度分析) 适应能力 需人工维护规则库 自动学习用户行为基线 资源消耗 低(正则引擎高效) 中(需计算熵值和行为模型) 防御效果可视化提升用户安全意识
词法分析替代简单正则匹配,降低误判率
