[Erlang]AC自动机过滤屏蔽词

本文介绍了如何使用Erlang实现AC自动机,以接近O(n)的时间复杂度完成屏蔽词的检查、匹配和替换。目前提供了代码,并计划后续详细讲解Aho-Corasick算法。在Windows环境下运行时,需要注意命令行编码设置为Unicode以正确执行Erlang程序。

Erlang实现的AC自动机,通过预处理屏蔽词能够实现接近O(n)的时间复杂度
实现了屏蔽词的检查、匹配、替换功能
先挖个坑,贴个代码,后续有时间再讲讲aho_corasick算法的原理
在文件根目录运行命令行程序,由于模块统一使用了utf8编码,windows命令行默认使用的是gbk,需要使用chcp 65001切换到unicode编码,然后使用命令erl打开erlang程序
c(aho_corasick)函数进行编译
在这里插入图片描述

aho_corasick:test()运行测试用例,可以看到成功的屏蔽了题目和作者名
在这里插入图片描述

%%%-------------------------------------------------------------------
%%% @author Huangcanxin cx2298545090@outlook.com
%%% @copyright (C) 2022
%%% @doc
%%% AC自动机
%%% @end
%%% Created : 23. 6月 2022 10:22
%%%-------------------------------------------------------------------
-module(aho_corasick).

-define(AC_TRIE_ROOT, 0).
-record(ac_trie, {
   
   
    mod,
    success,      % 成功跳转表
    failure,      % 回溯表
    output,       % 输出表
    child,
    next_node = 1
}).


%% API
-export([build/2, rebuild/2, rebuild/3]). % 生成树
-export([add_word/2, check/2, match/2, replace/3, replace/4, make_child/1, append_word/2]).
-export([init_trie/0, get/3, set/3, clean/1, foldl/3, erase/2]). % maps 结构的ac_trie
-export([merge/1, sub/2]).
-export([test/0]).


%%%% -----------------------------------
%%%% 添加关键词创建前缀树
%%%% -----------------------------------
% output 为了节省空间和加速替换存的是关键词长度
add_word(Word, AcTrie) ->
    add_word(Word, bit_size(Word), ?AC_TRIE_ROOT, AcTrie).
add_word(<<>>, OutputWord, Node, AcTrie) ->
    if
        OutputWord == 0 orelse OutputWord == <<>> ->
            AcTrie;
        true ->
            #ac_trie{
   
   output = Output, mod = Mod} = AcTrie,
            NOutput = Mod:set(Node, OutputWord, Output),
            AcTrie#ac_trie{
   
   output = NOutput}
    end;
add_word(<<Char/utf8, Left/binary>>, OutputWord, Node, AcTrie = #ac_trie{
   
   next_node = NextNode, child = Child, success = Success, mod = Mod}) ->
    case Mod:get({
   
   Node, Char}, Success, ?AC_TRIE_ROOT) of
        ?AC_TRIE_ROOT ->
            NSuccess = Mod:set({
   
   Node, Char}, NextNode, Success),
            ChildChar = Mod:get(Node, Child, []),
            NChild = Mod:set(Node, [Char | ChildChar], Child),
            NewAcTrie = AcTrie#ac_trie{
   
   next_node = NextNode + 1, child = NChild, success = NSuccess},
            add_word(Left, OutputWord, NextNode, NewAcTrie);
        GoNode ->
            add_word(Left, OutputWord, GoNode, AcTrie)
    end.

%%%% -----------------------------------
%%%% 通过success生成child
%%%% -----------------------------------
make_child(AcTrie) ->
    #ac_trie{
   
   success = Success, mod = Mod, child = Child} = AcTrie,
    NChild = Mod:foldl(
        fun({
   
   {
   
   Node, Char}, _V}, C) ->
            ChildChar = Mod:get(Node, C, []),
            Mod:set(Node, [Char | ChildChar], C)
        end,
        Child,
        Success
    ),
    AcTrie#ac_trie{
   
   child = NChild}.


%%%% -----------------------------------
%%%% 需要确保child存在
%%%% 追加关键词 会重新建立failure 需要添加多个词的话最好一次性插入
%%%% -----------------------------------
append_word([], AcTrie) ->
    #ac_trie{
   
   failure = Failure, mod = Mod} = AcTrie,
    NFailure 
【顶级EI复现】计及连锁故障传播路径的电力系统 N-k 多阶段双层优化及故障场景筛选模型(Matlab代码实现)内容概要:本文介绍了名为《【顶级EI复现】计及连锁故障传播路径的电力系统 N-k 多阶段双层优化及故障场景筛选模型(Matlab代码实现)》的研究资源,重点围绕电力系统中连锁故障的传播机制,提出了一种N-k多阶段双层优化模型,并结合故障场景筛选方法提升系统安全性与鲁棒性。该模型通过Matlab代码实现,可用于模拟复杂电力系统在多重故障下的响应特性,支持对关键故障路径的识别与优化决策,适用于高水平科研复现与工程仿真分析。文中还列举了大量相关技术方向的配套资源,涵盖智能优化算法、电力系统管理、机器学习、路径规划等多个领域,并提供了网盘链接以便获取完整代码与资料。; 适合人群:具备电力系统、优化理论及Matlab编程基础的研究生、科研人员及从事能源系统安全分析的工程技术人员,尤其适合致力于高水平论文(如EI/SCI)复现与创新的研究者。; 使用场景及目标:①复现顶级期刊关于N-k故障与连锁传播的优化模型;②开展电力系统韧性评估、故障传播分析与多阶段防御策略设计;③结合YALMIP等工具进行双层优化建模与场景筛选算法开发;④支撑科研项目、学位论文或学术成果转化。; 阅读建议:建议读者按照文档提供的目录顺序系统学习,优先掌握双层优化与场景筛选的核心思想,结合网盘中的Matlab代码进行调试与实验,同时参考文中提及的智能算法与电力系统建模范例,深化对复杂电力系统建模与优化的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值