使用Geatpy实现句子匹配

本文通过实例介绍了如何利用Geatpy的差分进化算法DE/rand/1/L模板来搜索特定句子,展示了遗传算法在解决此类问题上的效率。通过自定义问题类和执行脚本,成功找到了目标句子。

我们都听过“无限猴子定理”,说的是有无限只猴子用无限的时间会产生特定的文章。在无限猴子定理中,我们“假定”猴子们是没有像人类那样“智能”的,而且“假定”猴子不会自我学习。因此,这些猴子需要“无限的时间"。

而在遗传算法中,由于采用的是启发式的进化搜索,因此不需要”无限的时间“就可以完成类似的工作。当然,需要产生的文章篇幅越长,那么就需要越久的时间才能完成。

下面以产生"Tom is a little boy, isn’t he? Yes he is, he is a good and smart child and he is always ready to help others, all in all we all like him very much."的句子为例,讲述如何利用Geatpy实现句子的搜索。之前的文章中我们已经讲述过如何使用Geatpy的进化算法框架实现遗传算法编程。这里就直接用框架。

把自定义问题类和执行脚本编写在下面的"main.py”文件中:


# -*- coding: utf-8 -*-
import numpy as np
import geatpy as ea
 
"""
问题类
"""
class MyProblem(ea.Problem): # 继承Problem父类
    def __init__(self):
        name = 'MyProblem' # 初始化name(函数名称,可以随意设置)
        # 定义需要匹配的句子
        strs = 'Tom is a little boy, isn\'t he? Yes he is, he is a good and smart child and he is always ready to help others, all in all we all like him very much.'
        self.words = []
        for c in strs:
            self.words.append(ord(c)) # 把字符串转成ASCII码
        M = 1 # 初始化M(目标维数)
        maxormins = [1] # 初始化maxormins(目标最小最大化标记列表,1:最小化该目标;-1:最大化该目标)
        Dim = len(self.words) # 初始化Dim(决策变量维数)
        varTypes = [1] * Dim # 初始化varTypes(决策变量的类型,元素为0表示对应的变量是连续的;1表示是离散的)
        lb = [32] * Dim # 决策变量下界
        ub = [122] * Dim # 决策变量上界
        lbin = [1] * Dim # 决策变量下边界
        ubin = [1] * Dim # 决策变量上边界
        # 调用父类构造方法完成实例化
        ea.Problem.__init__(self, name, M, maxormins, Dim, varTypes, lb, ub, lbin, ubin)
        
    def aimFunc(self, pop): # 目标函数
        Vars = pop.Phen # 得到决策变量矩阵
        diff = np.sum((Vars - self.words)**2, 1)
        pop.ObjV = np.array([diff]).T # 把求得的目标函数值赋值给种群pop的ObjV
 
"""
执行脚本
"""
if __name__ == "__main__":
    """================================实例化问题对象============================="""
    problem = MyProblem() # 生成问题对象
    """==================================种群设置================================"""
    Encoding = 'RI'       # 编码方式
    NIND = 50             # 种群规模
    Field = ea.crtfld(Encoding, problem.varTypes, problem.ranges, problem.borders) # 创建区域描述器
    population = ea.Population(Encoding, Field, NIND) # 实例化种群对象(此时种群还没被初始化,仅仅是完成种群对象的实例化)
    """================================算法参数设置=============================="""
    myAlgorithm = ea.soea_DE_rand_1_L_templet(problem, population) # 实例化一个算法模板对象
    myAlgorithm.MAXGEN = 2000  # 最大进化代数
    """===========================调用算法模板进行种群进化========================="""
    [population, obj_trace, var_trace] = myAlgorithm.run() # 执行算法模板
    population.save() # 把最后一代种群的信息保存到文件中
    # 输出结果
    best_gen = np.argmin(obj_trace[:, 1]) # 记录最优种群是在哪一代
    best_ObjV = obj_trace[best_gen, 1]
    print('最优的目标函数值为:%s'%(best_ObjV))
    print('有效进化代数:%s'%(obj_trace.shape[0]))
    print('最优的一代是第 %s 代'%(best_gen + 1))
    print('评价次数:%s'%(myAlgorithm.evalsNum))
    print('时间已过 %s 秒'%(myAlgorithm.passTime))
    for num in var_trace[best_gen, :]:
        print(chr(int(num)), end = '')

上述代码中首先定义了一个问题类MyProblem,然后调用Geatpy内置的soea_DE_rand_1_L_templet算法模板,它实现的是差分进化算法DE/rand/1/L,详见源码:

https://github.com/geatpy-dev/geatpy/blob/master/geatpy/templates/soeas/DE/DE_rand_1_L/soea_DE_rand_1_L_templet.py

运行结果如下:

在这里插入图片描述
种群信息导出完毕。
最优的目标函数值为:0.0
有效进化代数:2000
最优的一代是第 1748 代
评价次数:100000
时间已过 4.798132419586182 秒
Tom is a little boy, isn’t he? Yes he is, he is a good and smart child and he is always ready to help others, all in all we all like him very much.

可见采用差分进化算法DE/rand/1/L能够准确无误地找到上面的句子。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值