Python-求First、Follow、select集合以及预测分析表和表驱动程序；

最新推荐文章于 2021-05-09 23:15:14 发布

原创最新推荐文章于 2021-05-09 23:15:14 发布 · 1.7k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#python #编译原理

Python 专栏收录该内容

2 篇文章

订阅专栏

本文档详细介绍了LL(1)文法的First集合、Follow集合、Select集合的计算方法，并给出了预测分析表的构造过程。通过Python代码实现了输入文法规则并自动生成分析表的功能，同时演示了如何根据分析表进行语法分析，判断输入字符串是否符合文法。

VT代表终结符集合
VN代表非终结符集合

一、求First集合：

求first集很简单

求解FIRST(X)
1）若X ∈ VT，则FIRST(X) = {X}。【终结符自己就是自己的FIRST集合】
2）若X ∈ VN，且有产生式X → a……， a ∈ VT，则a ∈ FIRST(X) 【非终结符，选第一个终结符加入】
3）若X ∈ VN，X → ε，则 ε ∈ FIRST(X) 【能直接推出ε，ε加入FIRST】
4）若X,Y1,Y2,……,Yn ∈ VN，而有产生式X → Y1,Y2,……,Yn。
当Y1,Y2,……,Y(i-1) 直接推出ε时，则FIRST(Y1) - ε, FIRST(Y2) - ε, …… , FIRST(Y(i-1) - ε) ,FIRST(Yi) 都包含在FIRST(X)中【中间的ε是不会加入进去的】
5）当4）中所有Yi 都推出 ε时，则最后的FIRST(X) = FIRST(Y1) ∪ FIRST(Y2) ∪ …… ∪ FIRST(Yn) ∪ {ε}

二、求Follow集合：

求follo集合比较麻烦，遇到很多坑点。
奈何老师东哥很严，再麻烦也得弄…

1)S是文法开始符号，初始化follow(S)= {  #  }
2)	D --+--> BAC        follow(A)+=first（C）/ @
3)如果上述产生式D--+-->BAC 中，存在C->@，即  D--+-->BA  ，那么还要进行follow(A)+=  follow(B)
坑点1：注意S --+-->BAC ，如果C能为空，那么要将其看成S --+-->BA ，S --+-->BAC两种情况
坑点2：
如果出现循环引用：follow(A)=follow(B) +…  而follow(B) = follow(A)这种情况：
原则上是要继续使用上述规则，直到每个Vn的follow集合不再变化为止，
然后让循环调用的follow集赋值为空，但具体很难办，就直接用下面的的做法：
如果遇到：S ---> BA,且S是开始符 ,
那么follow（A）={ # } 而不是 follow(A)=follow(S)

三、求Select集合：

A->B，A属于Vn，
若B不能推导出空，那么select(A->B) = first(B)
如果B经过有限次推导能推出空，那么那么select(A->B) = first(B) - 空  ∪ Follow(A)

四、预测分析表：

根据select集合来求

五、表驱动分析程序：

整体代码：

input.txt文件内容
E -> TA
A -> +TA
A -> @
T -> FB
B -> *FB
B -> @
F -> i
F -> (E)

```python
# !/usr/bin/env python
# -*- coding: utf-8 -*-
# @Author : WangRay
# @Software: PyCharm
def getOriginData():
    tranformFunctionData = {}
    Vn = []
    Vt = []
    with open("input.txt", 'r+', encoding="utf-8") as f:
        temp = f.readlines()
    for ind,i  in enumerate(temp):
        t = i[:-1].split(" ") #去掉换行 E -> TA
        if ind == 0: # 默认第一个Vn是开始符
            S =  i[0]
        x = tranformFunctionData.get(t[0],None)
        if x :
            x.append(t[2])
            tranformFunctionData.update( { t[0] : x } )
        else:
            tranformFunctionData[ t[0] ] = [ t[2] ]  #加入 {E : [TA,]}
        if( 'A'<=t[0] <='Z'):
            Vn.append(t[0])
        else:
            Vt.append(t[0])
        for tx in t[2]:
            if( 'A'<= tx <='Z'):
                Vn.append(tx)
            else:
                Vt.append(tx)
    Vn = getOnly(Vn)
    Vt = getOnly(Vt)
    return (Vn,Vt,tranformFunctionData,S)
def getOnly(l):
    n = []
    for x in l:
        if x not in n :
            n.append(x)
    return n
class MyChart():
    def __init__(self, mystr):
        self.mstr = mystr  # 输入的句子
        self.Vn = []  # 非终结符
        self.Vt = []  # 终结符
        tranformFunctionData = {}
        self.S = None  # 开始符
        self.first = {}  # first集合，是一个map对象，元素是"V":{ }
        self.follow = {}  # follow集合，也是一个map对象
        self.select = {}  # select集合，也是一个map对象,每个对象key是Vn;Value是一个map={"产生式","Vt集合"},{ F : { "->i" : "i" , "->(E)":"(" }  }
        self.analysisTable = []
        self.initFirstAndFollow()
        self.getFollow(self.S)
        self.getselect()
        self.row = []
        self.column = []
        self.initAnalysisTableData()
        print("预测分析表：")
        for i in self.analysisTable:
            print(i)
        print()

    def doAnaysis(self):
        myStack = ["#", self.S]
        X = myStack[-1]
        ind = 0
        a = self.mstr[ind]
        ind += 1
        while myStack:
            if X in self.Vt:
                if X == a:
                    a = self.mstr[ind]
                    ind += 1
                    myStack.pop()
                    X = myStack[-1]
                else:
                    return "error,经判断" + self.mstr + "不是符合该文法的句子"
            else:
                if X == "#":
                    if X == a:
                        return "success，经判断" + self.mstr + "是符合该文法的句子"
                    else:
                        return "error,经判断" + self.mstr + "不是符合该文法的句子"
                else:
                    prod = self.getProd(X, a)
                    if prod == "#":  # 没有对应产生式
                        return "error,经判断" + self.mstr + "不是符合该文法的句子"
                    else:  # 存在对应产生式
                        myStack.pop()
                        temp = prod[:1:-1]
                        if temp != "@":
                            myStack.extend(temp)  #
                        X = myStack[-1]

    def getselect(self):
        for k in self.tranformFunctionData.keys():  # k是Vn，E A T B F
            for prod in self.tranformFunctionData.get(k):  # prod 是Vn k=F 对应的产生式["i","(E)"]
                # 对于一个k->prod,检查prod的组成元素Vn集合，能不能同时都变成@，
                if self.checkIfTranfToKong(prod) == 1:  # 等于1表示全都能变成@
                    # 若能：tempS = prod[0]的first集合除去空∪follow(k)
                    temps = self.first.get(prod[0]).replace("@", "") + self.follow.get(k)
                else:
                    # 否则：tempS = prod[0]的first集合
                    temps = self.first.get(prod[0])
                prodToTemps = self.select.get(k, None)
                if prodToTemps is None:
                    self.select.update({k: {"->" + prod: temps}})
                else:
                    self.select.get(k).update({"->" + prod: temps})

    def checkIfTranfToKong(self, prod):
        for i in prod:  # 遍历 (E) 的每一个Vn/Vt,但凡有一个是Vt(不是空)或者有一个Vn的first不包含@，那么返回-1
            if i == "@":
                continue
            if i in self.Vt:
                return -1
            elif "@" not in self.first.get(i):
                return -1
        return 1

    def initAnalysisTableData(self):
        self.row = self.Vn.copy()
        self.column = self.Vt.copy()
        self.column.remove("@")
        self.column.append("#")
        for tempVn in self.row:  # 拿到行标
            T = self.getRowColumnPrdo(tempVn)
            self.analysisTable.append(T)

    def getRowColumnPrdo(self, tempVn):
        T = []
        for tempVt in self.column:
            mp = self.select.get(tempVn)  # {'->+TA': '+', '->@': '#)'}
            flag = 0
            for tk in mp.keys():
                if tempVt in mp.get(tk):
                    T.append(tk)
                    flag = 1
            if flag == 0:
                T.append("#")
        return T

    def getProd(self, X, a):
        x = self.row.index(X)
        y = self.column.index(a)
        return self.analysisTable[x][y]

    def initFirstAndFollow(self):
        (self.Vn, self.Vt, self.tranformFunctionData, self.S) = getOriginData()
        for t in self.Vn + self.Vt:
            if t in self.Vt:
                self.first.update({t: t})
            else:
                self.first.update({t: None})
                self.follow.update({t: ""})
        for t in self.Vn + self.Vt:
            self.getFisrt(t)
        for t in self.Vn:
            self.follow.update({t: self.getFollow(t)})

    def getFollow(self, T):
        x = self.follow.get(T)
        if x != "": return x
        if T == self.S:
            tempFollow = "#"
        else:
            tempFollow = ""
        for prodFromLeft in self.tranformFunctionData.keys():  # 遍历所有的左部 "A","P"  。 tranformFunctionData为  { "A":["+E" , "@"]  ,"P": [ "(E)","a","b","^" ]  }
            for prodFromRight in self.tranformFunctionData.get(
                    prodFromLeft):  # 遍历每个左部能够产生的右部"aTCA","TE","ABT","a","@"   ===>>> ["+E" , "@"]  [ "(E)","a","b","^" ]
                ind = prodFromRight.find(T)
                mylen = len(prodFromRight)
                if ind != -1 and mylen >= 2:  # 产生式右部满足T -> ABC的形式
                    if (ind == mylen - 1):
                        tempFollow = self.restart(tempFollow, prodFromLeft, T)
                    else:
                        tempFollow += self.first.get(prodFromRight[ind + 1]).replace("@", "")  # 除去 @ 符号

                        if (ind == mylen - 2 and prodFromRight[mylen - 1] in self.Vn and "@" in
                                self.tranformFunctionData[prodFromRight[mylen - 1]]):
                            tempFollow = self.restart(tempFollow, prodFromLeft, T)  # 进行反复传送
        return "".join(sorted(list(set(tempFollow))))

    # 求follow的反复传送函数
    def restart(self, tempFollow, prodFromLeft, T):
        if T == prodFromLeft: return tempFollow  # 有些产生式可能是 T -> aT ,这个时候不要再follow(T) = follow(T)了，会死循环
        if self.follow.get(prodFromLeft) == "" and prodFromLeft == self.S:
            tempFollow += "#"
        else:
            tempFollow += self.getFollow(prodFromLeft)
        return tempFollow

    # 求first集合
    def getFisrt(self, T):
        '''
        # 注意如果 T -> AB , A如果能产生@，那么firstB也属于First（T）
        :param T: 终结符或者非终结符
        :return String :  T的first集，
        '''
        x = self.first.get(T, None)
        if x:
            return x
        else:  # 为空，求了First,更新了self.first，再返回其first集
            tempFirst = ""
            for prodForm in self.tranformFunctionData[T]:  # 遍历所有它的产生式右部 T -> ["F" , "Ta" , "(E)" , "a" , @ ]
                tempFirst += self.getFisrt(prodForm[0])
                if len(prodForm) >= 2 and prodForm[1] in self.Vn and prodForm[0] in self.Vn and '@' in \
                        self.tranformFunctionData[prodForm[0]]:
                    tempFirst += self.getFisrt(prodForm[1])
            self.first.update({T: tempFirst})
            return tempFirst


if __name__ == "__main__":
    mstr = "i+i*i#"
    print("待判断的句子为：", mstr)
    mc = MyChart(mstr)
    print(mc.doAnaysis())