（ps：实习突发奇想，结合 gpt 分析大致检测模型，有前人类似技术文章，可行性比较大，熵值和行为画像分析可深化实现，仅供阅读参考图一乐。）

# 核心概念

将传统黑名单过滤升级为「输入行为画像 + 风险可视化」，让防御机制与用户产生交互，同时融入代码语义分析

# 前端创新方案（Vue3 实现）

风险输入实时热力图

<template>
  <div class="input-container">
    <input 
      v-model="inputText"
      @input="analyzeInput"
      :style="{ 'background-position': riskPosition }"
      class="risk-gradient"
    >
    <div class="risk-tag" :style="{ left: riskTagLeft }">
      {{ currentRiskLevel }}
    </div>
  </div>
</template>

<script setup>
import { ref } from 'vue'

const inputText = ref('')
const riskPosition = ref('0%')
const riskTagLeft = ref('0px')

const analyzeInput = () => {
  // 创新点：通过光标位置映射风险值
  const riskMap = detectRiskPattern(inputText.value)
  const currentRisk = riskMap[inputText.value.length - 1] || 0
  
  // 动态背景渐变
  riskPosition.value = `${(currentRisk * 100)}%`
  riskTagLeft.value = `${inputText.value.length * 12}px`
}

// 创新检测算法
const detectRiskPattern = (text) => {
  return text.split('').map((char, index) => {
    const subStr = text.slice(0, index+1)
    return Math.min(
      sqlInjectionScore(subStr),
      xssScore(subStr),
      sensitiveDataScore(subStr)
    )
  })
}

// 基于语义的评分模型
const sqlInjectionScore = (str) => {
  const keywords = ['select', 'union', 'drop']
  const score = keywords.some(kw => str.toLowerCase().includes(kw)) ? 0.8 : 0
  return /(['";]|--\s)/.test(str) ? Math.min(1, score + 0.3) : score
}
</script>

<style>
.risk-gradient {
  background: linear-gradient(to right, 
    rgba(0,255,0,0.1) 0%, 
    rgba(255,165,0,0.3) 50%,
    rgba(255,0,0,0.5) 100%);
  transition: background-position 0.3s;
}
</style>

# 后端创新方案（Spring Boot 实现）

语义语法双分析器

// 创新点：SQL词法分析+HTML标记树验证
public class InputGuardian {
    private static final Pattern SQL_LEXEME = Pattern.compile(
        "([\\w]+)|('[^']*')|(\"[^\"]*\")|(;)|(--)|(/\\*[\\s\\S]*?\\*/)"
    );

    public void validateInput(String input) throws DangerousInputException {
        // 创新点：生成Token流分析
        List<String> tokens = tokenizeSQL(input);
        if (detectSQLInjection(tokens)) {
            throw new DangerousInputException("检测到潜在SQL注入特征");
        }
        
        if (parseHTML(input).hasDangerousTags()) {
            throw new DangerousInputException("检测到XSS攻击向量");
        }
    }

    // SQL词法分析（创新点：不依赖简单正则）
    private List<String> tokenizeSQL(String input) {
        Matcher matcher = SQL_LEXEME.matcher(input);
        return matcher.results()
            .map(MatchResult::group)
            .collect(Collectors.toList());
    }

    // HTML标记树解析
    private HTMLNode parseHTML(String input) {
        // 实现简化版HTML解析器
        // 创新点：检测未闭合标签和事件处理器
    }
}

# 创新防御策略

智能混淆策略

// 创新点：对可疑输入自动混淆
public String applyObfuscation(String input) {
    if (detectSQLInjectionPattern(input)) {
        return "⚠️检测到异常输入：" + 
            input.replaceAll("['\";]", "_");
    }
    return input;
}

// 创新检测算法：上下文敏感分析
private boolean detectSQLInjectionPattern(String input) {
    return input.matches(".*\\b(select|insert|update|delete|drop)\\b.*") 
        && input.contains("'")
        && !isExpectedPattern(input); // 白名单校验
}

攻击者画像系统

// 创新点：记录攻击者输入习惯
@Aspect
@Component
public class AttackProfiler {
    @AfterThrowing(pointcut="execution(* com..controller.*.*(..))", 
                  throwing="ex")
    public void logAttackAttempt(DangerousInputException ex) {
        HttpServletRequest request = ((ServletRequestAttributes)
            RequestContextHolder.getRequestAttributes()).getRequest();
        
        AttackPattern pattern = new AttackPattern(
            request.getRemoteAddr(),
            ex.getInputType(),
            calculateEntropy(ex.getInput()),
            getTypingSpeed(request.getParameterMap())
        );
        
        attackPatternRepository.save(pattern);
    }

    // 创新点：通过输入熵值判断攻击复杂度
    private double calculateEntropy(String input) {
        // 实现香农熵算法
    }
}

# 输入熵值与行为分析的攻防原理详解

# 一、输入熵值（Input Entropy）—— 衡量输入的「混乱度」

通俗解释：
就像用温度计测量发烧一样，输入熵值用于量化用户输入的「异常热度」。通过数学方法计算输入内容的随机性程度，识别不符合正常用户习惯的异常输入。

技术原理：

香农熵计算公式
1
H(X) = -Σ (P(x_i) * log2(P(x_i)))
- 其中 P (x_i) 表示字符 x_i 在输入中出现的概率
- 示例：普通英文文本的熵值约 4.7，而随机字符串可达 8

# 创新测试方案

攻击模拟沙盒

// 创新点：在测试环境自动模拟攻击
describe('智能防御测试', () => {
  const attackVectors = [
    { input: "' OR 1=1--", type: 'SQLI' },
    { input: "<img src=x onerror=alert(1)>", type: 'XSS' }
  ];

  attackVectors.forEach((vector) => {
    it(`应拦截${vector.type}攻击`, async () => {
      const response = await submitForm({ input: vector.input });
      expect(response).toHaveValidationError();
      expect(response).toHaveDefenseLog(vector.type);
    });
  });

  // 创新点：验证防御可视化效果
  it('应在前端显示风险提示', async () => {
    await page.type('#inputField', "' UNION SELECT");
    await expect(page).toMatchElement('.risk-tag', { text: '高风险' });
  });
});

# 创新成果展示

防御效果可视化看板

<template>
  <div class="dashboard">
    <div class="attack-map">
      <div v-for="(attack, index) in liveAttacks" 
           :key="index"
           :style="attackStyle(attack)">
        {{ attack.type }}攻击
      </div>
    </div>
    <div class="defense-stats">
      <div class="shield-animation" :style="shieldStrength" />
    </div>
  </div>
</template>

<script>
// 创新点：实时展示防御状态
export default {
  data() {
    return {
      liveAttacks: [],
      defenseLevel: 0
    }
  },
  mounted() {
    this.connectAttackStream();
  },
  methods: {
    connectAttackStream() {
      const eventSource = new EventSource('/api/attack-stream');
      eventSource.onmessage = (event) => {
        const attack = JSON.parse(event.data);
        this.liveAttacks.push(attack);
        this.defenseLevel = Math.min(100, this.defenseLevel + 5);
      };
    },
    attackStyle(attack) {
      return {
        left: `${Math.random() * 90}%`,
        animation: `attackFlow ${attack.type === 'SQLI' ? 8 : 5}s linear`,
        backgroundColor: attack.type === 'XSS' ? '#ff4444' : '#44aaff'
      }
    }
  }
}
</script>

方案亮点：

将安全防御从 "被动拦截" 变为 "主动示警"

通过输入熵值和行为分析识别高级攻击

检测维度	传统正则匹配	熵值 + 行为分析
检测原理	基于已知攻击特征的模式匹配	基于输入本质特性的异常识别
绕过难度	低（变形攻击可绕过）	高（需同时伪造内容和行为）
误报率	高（例如允许特殊字符的密码）	低（结合多维度分析）
适应能力	需人工维护规则库	自动学习用户行为基线
资源消耗	低（正则引擎高效）	中（需计算熵值和行为模型）

防御效果可视化提升用户安全意识
词法分析替代简单正则匹配，降低误判率