传说中的有限状态自动机
今日打卡一题是leetcode 8. 字符串转换整数 (atoi)。但从题目看来,感觉挺简单呀,这不就是语言里面会自带的atoi函数吗?跟传说中编译原理中的自动机有什么关系,做题要不要这么博学。
其实由于将字符串转换成整数的时候限制条件有很多个,流程复杂。所以使用有限状态自动机可以梳理开始和结束,中间各种条件转换和状态变化,进行流程控制,覆盖整个功能。
题目
请你来实现一个 atoi 函数,使其能将字符串转换成整数。
首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:
如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。
在任何情况下,若函数不能进行有效的转换时,请返回 0 。
提示:
本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231, 231 − 1]。
如果数值超过这个范围,请返回 INT_MAX (231 − 1) 或 INT_MIN (−231) 。
示例 1:
输入: "42"
输出: 42
示例 2:
输入: " -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:
输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:
输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
因此无法执行有效的转换。
示例 5:
输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。
因此返回 INT_MIN (−231) 。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路:有限状态自动机DFA
图片转自leetcode官方题解。题解的下一句话就是:
接下来编程部分就非常简单了:我们只需要把上面这个状态转换表抄进代码即可。
作者:LeetCode-Solution
链接:https://leetcode-cn.com/problems/string-to-integer-atoi/solution/zi-fu-chuan-zhuan-huan-zheng-shu-atoi-by-leetcode-/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
所以看到这里你懂了吗?我可是一脸问号。这就完了?
结果看了官方实现的代码,这不是跟我自己梳理的差不多吗。所以我们不要畏惧自动机这个概念,而是使用它为我们服务。以下为梳理过程。
1 确定自动机中需要考虑的数据分类
答:数据有4类:数字,正负符号,空格和其他
2 确定自动机中数据的状态
答:自动机最后返回的结果为数字*正负符号,若是遇到其他则返回0,空格不影响结果。
3 确定自动机的开始和结束
答:当遇到数字,或者正负符号的时候,自动机开始。
当数字溢出,或者遇到其他,或者得到最后的结果,自动机结束。
4 确定自动机开始后的流程
- 遇到数字,[自动机开始],进行计算,[溢出返回或计算结束返回,自动机结束]
- 遇到正负符号,[自动机开始],符号保留
- 遇到不是数字,不是空格的,直接返回0
- 自动机开始]的状态下,遇到非数字,[自动机结束]
show me the code -- Golang
时间复杂度:O(n)
空间复杂度:O(1)
func myAtoi(str string) int {
flag := 1 //正负
res := 0 //结果
begin := false //未开始
for _,v := range str {
if (v>='0' && v<='9'){
if res > 214748364 || res == 214748364 && int(v-'0')>7 {
return 2147483647
}
if res < -214748364 || res == -214748364 && int(v-'0')>8 {
return -2147483648
}
res = res*10 + flag*int(v-'0')
begin = true
} else {
if begin {
break //开始转换后遇到非数字停止
} else if v == '-' {
flag = -1
begin = true
} else if v == '+' {
begin = true
} else if v != ' '{
return 0 //开始就遇到不是数字不是空格的,直接返回0
}
}
}
return res
}
总结
- 其实代码的实现部分没有抽象一个自动机出来,所以只能说代码实现使用了自动机的思想。具体的抽象自动机的形式推荐查看leetcode官方题解。
- 再次被算法在各种高深如编译原理般的领域无处不在而感动。说好的算法只有在面试的时候会用到呢?哈哈,程序员需内外兼修。高手需要知识渊博呦。加油!