Redy词法识别--状态机的合并算法

本文通过实例介绍了如何使用状态机合并算法,以Redy词法识别为例,详细阐述了合并过程,包括状态机的分析、合并步骤及合并后状态机的特点。合并算法分为几个步骤,包括分析输入类型、建立新状态、处理标记状态等,这种方法有利于模块化设计和词文类型的扩展。

返回文档首页


(一)简介

代码下载: git clone git://git.code.sf.net/p/redy/code redy-code


这一章的内容有:
  1. 通过一个实例来说明状态机合并的方法
  2. 状态机合并算法
  3. 状态链在合并中的优点


(二)状态机的合并

  在这一章里面,你会看到两个简单的状态机:

  一个为状态机用于识别正则式   [0-7]+abf 所表于的语言,[0-7] 表于数字0-7中的任意一个,'+'表示重复一次或多次。

  别一个状态机用于识别正则式 [4-9]+acd所表于的语言。同样[4-9]表示数字4-7中的任意一个。'+'表示重复一次或多次。

(1)状态机1

根据正则式[0-7]+abf,绘出的状态图如下:


  我们使用状态链的算法来用程序来构造该状态机,从状态中可以看出,该状态机总共有5个状态,其中Abegin为开始状态,A4为终态,由于每个状态,都只在一个输入类型下发生状态转移,所以每一个状态,这里采用函数指钍的方法来判断输入类型。
在程序开头,我们对于每一个状态都进行申明,以使后面引用:
extern struct state Abegin;
extern struct state A1;
extern struct state A2;
extern struct state A3;
extern struct state A4;


状态Abegin在数据输入字符0-7的情况下转移到状态A1,在其它输入情况下让状态Abegin转移到错误状态lex_state_err。
int input_map_abegin(char c)
{
	if(c>='0'&&c<='7') return 1;
	else return 0;
}
struct state* Abegin_targets[]= {&lex_state_err,&A1};
struct state Abegin= { "Abegin",2,1,0, input_map_abegin, Abegin_targets, 0, };


状态A1begin在输入入字符0-7的情况下转移到自身,当输入为字符‘a’时转移到A2,其它则转移到状态lex_state_err。
int input_map_a1(char c)
{
	if(c=='a')return 1;
	if(c>='0'&&c<='7') return 2;
	else return 0;
}
struct state* A1_targets[]= {&lex_state_err,&A2,&A1};
struct state A1= { "A1",2,1,0, input_map_a1, A1_targets, 0, };


状态A2,A3,A4构造方法和前面一样,所以我就全部贴出。

int input_map_a2(char c)
{
	if(c=='b')return 1;
	else return 0;
}
struct state* A2_targets[]= {&lex_state_err,&A3};
struct state A2= { "A2",2,1,0, input_map_a2, A2_targets, 0, };

int input_map_a3(char c)
{
	if(c=='f')return 1;
	else return 0;
}
struct state* A3_targets[]= {&lex_state_err,&A4};
struct state A3= { "A3",2,1,0, input_map_a3, A3_targets, 0, };

int input_map_a4(char c)
{
	return 0;
}
struct state* A4_targets[]= {&lex_state_err};
struct state A4= { "[0-7]+abf",2,1,0, input_map_a4, A4_targets, 1, };



这样我们已经用状态链的方法构造出了整个状态机1的模型。把该模型带入驱动程序,就可能对类似于011444abf ,2122abf,4abf,的字符串进行识别了。
状态机1的程序可以在下载的文件夹下面的tutorial/lexical/merge1中找到,对程序进行编译,运行可执行文件a1。`
下面我们来构造状态机2

(2)状态机2

根据正则式[4-9]+acd,绘出状态图:

同样我们也使用状态链的方法来构造状态机2,状态机2总共有5个状态,开始状态为Bbegin,终态为B4,同构造状态机1的方法一样。我这里就直接贴出程序,不进行说明。

状态申明:

extern struct state Bbegin;
extern struct state B1;
extern struct state B2;
extern struct state B3;
extern struct state B4;


状态机2的5个状态:
int input_map_bbegin(char c)
{
	if(c>='4'&&c<='9')return 1;
	else return 0;
}

struct state* Bbegin_targets[]= {&lex_state_err,&B1};
struct state Bbegin= { "Bbegin",2,1,0, input_map_bbegin, Bbegin_targets, 0, };


int input_map_b1(char c)
{
	if(c=='a')return 1;
	if(c>='4'&&c<='9') return 2;
	else return 0;
}
struct state* B1_targets[]= {&lex_state_err,&B2,&B1};
struct state B1= { "B1",2,1,0, input_map_b1, B1_targets, 0, };

int input_map_b2(char c)
{
	if(c=='c')return 1;
	else return 0;
}
struct state* B2_targets[]= {&lex_state_err,&B3};
struct state B2= { "B2",2,1,0, input_map_b2, B2_targets, 0, };

int input_map_b3(char c)
{
	if(c=='d')return 1;
	else return 0;
}
struct state* B3_targets[]= {&lex_state_err,&B4};
struct state B3= { "B3",2,1,0, input_map_b3, B3_targets, 0, };

int input_map_b4(char c)
{
	return 0;
}
struct state* B4_targets[]= {&lex_state_err};
struct state B4= { "[4-9]+acd",2,1,0, input_map_b4, B4_targets, 1, };


现在我们就用状态链的方法构造出状态机2模型,同样把该模型带入驱动程序,这样我们就可以识别例如:4578589acd , 87acd , 9978acd , 等类似的字符串。
状态机2的程序可以在下载的文件夹下面的tutorial/lexical/merge1中找到,对程序进行编译,运行可执行文件b1。

(3)状态机的合并

  现在我们要把两个状态机合并在一起,以便我们的程序同时能够识别正则式[0-7]+abc所表示的语言和[4-9]+acd所表示的语言,合并状态机的方法与自动机ENFA转化为NFA的算法理论基本一样。总共分为下面几步:

a)输入类型分析
对于状态机1来说,输入类型有这么5种
  1. 数字0到7  (D0_7)
  2. 字符'a'   (S_a)
  3. 字符'b'    (S_b)
  4. 字符'f'   (S_f)
  5. 除以上以外的所有字符  (Other)
对于状态机2来说,输入类型有么5种
  1. 数字4到9   (D4_9)
  2. 字符'a'   (S_a)
  3. 字符'c'    (S_c)
  4. 字符'd'   (S_d)
  5. 除以上以外的所有字符  (Other)

把两个状态机的输入类型进行合并得到下面9种输入类型
  1. 数字0到3  (D0_3)
  2. 数字4到7  (D4_7)
  3. 数字8到9  (D8_9)
  4. 字符'a'   (D_a)
  5. 字符‘b‘   (D_b)
  6. 字符‘f’   (D_f)
  7. 字符‘c’   (D_c)
  8. 字符‘d‘   (D_d)
  9. 除以上以外的所有字符   (other)
  其中类型D0_7包括:D0_3,D4_7;类型D4_9包括:D4_7,D8_9。

b)合并第一步

状态机1的开始状态为Abegin,状态机2的开始状态为Bbegin,把两个状态合成一个状态Cbegin,Abegin和Bbegin两个状态能发生的状态转移,Cbegin同样能发生。

这时状态图为:

private void pictureBox1_Paint(object sender, PaintEventArgs e) { if (currentTransform != null) { e.Graphics.Transform = currentTransform; // 直接应用预计算矩阵 } e.Graphics.SmoothingMode = SmoothingMode.AntiAlias; // 计算实际绘制区域 var clientRect = pictureBox1.ClientRectangle; // 自动计算数据边界(需要预先获取points的实际范围) float dataMinX = points.Min(p => p.fiveX); float dataMaxX = points.Max(p => p.fiveX); float dataMinY = points.Min(p => p.sexY); float dataMaxY = points.Max(p => p.sexY); // 计算缩放比例 float scaleX = clientRect.Width / (dataMaxX - dataMinX); float scaleY = clientRect.Height / (dataMaxY - dataMinY); float zoomLevel = Math.Min(scaleX, scaleY) * 0.9f; // 保留10%边距 // 计算偏移量 float offsetX = -dataMinX * zoomLevel + (clientRect.Width - (dataMaxX - dataMinX) * zoomLevel) / 2; float offsetY = -dataMinY * zoomLevel + (clientRect.Height - (dataMaxY - dataMinY) * zoomLevel) / 2; e.Graphics.TranslateTransform(offsetX, offsetY); e.Graphics.ScaleTransform(zoomLevel, zoomLevel); currentTransform = e.Graphics.Transform; foreach (var point in points) { // 限制缩放级别最小值 float safeZoom = Math.Max(zoomLevel, 0.001f); float pointSize = Math.Min(4f / safeZoom, 100f); // 限制点尺寸最大值 // 计算坐标(确保用 float 运算) float blueX = point.fiveX - pointSize / 2; float blueY = point.sexY - pointSize / 2; // 检查坐标有效性 if (float.IsInfinity(blueX) || float.IsInfinity(blueY) || float.IsNaN(blueX) || float.IsNaN(blueY)) { continue; } // 绘制蓝色点 e.Graphics.FillEllipse(Brushes.Blue, blueX, blueY, pointSize, pointSize); // 同理处理红色点 float redX = point.eightX - pointSize / 2; float redY = point.nineY - pointSize / 2; if (float.IsInfinity(redX) || float.IsInfinity(redY) || float.IsNaN(redX) || float.IsNaN(redY)) { continue; } e.Graphics.FillEllipse(Brushes.Red, redX, redY, pointSize, pointSize); } if (currentTransform != null) { // 应用相同的变换矩阵 e.Graphics.Transform = currentTransform; // 在此绘制内容,坐标会自动适配 e.Graphics.DrawLine(Pens.Black, dataMinX, dataMinY, dataMaxX, dataMaxY); } }// 绘制蓝色点 e.Graphics.FillEllipse(Brushes.Blue, blueX, blueY, pointSize, pointSize); e.Graphics.FillEllipse(Brushes.Red, redX, redY, pointSize, pointSize);OverflowException 怎么解决
最新发布
03-26
<think>嗯,用户遇到了在C#的pictureBox1_Paint方法中绘制点时出现的OverflowException异常。我需要先理解代码的具体情况,然后分析可能的原因,最后给出解决方案。 首先,用户提供的代码中,主要是在绘制蓝色和红色的椭圆点。OverflowException通常发生在算术运算结果超出变量类型所能表示的范围时。在这里,可能涉及到浮点数的计算,比如blueX、blueY、redX、redY以及pointSize这些变量。 让我仔细看一下代码。在计算blueX和blueY时,用到了point.fiveX减去pointSize的一半,pointSize的计算是基于zoomLevel的。zoomLevel是通过数据范围和客户区尺寸计算出来的缩放比例。如果zoomLevel非常小,比如接近零,那么pointSize可能会变得非常大,比如当safeZoom是0.001时,4f / safeZoom就是4000,这会导致pointSize可能超过绘图时坐标的有效范围,比如负数或者非常大的数值,从而导致FillEllipse的参数超出可接受的范围,引发溢出异常。 另外,检查pointSize的计算:Math.Min(4f / safeZoom, 100f)。这里safeZoom是Math.Max(zoomLevel, 0.001f),所以当zoomLevel很小时,safeZoom被限制为0.001,导致4f / 0.001 = 4000,但Math.Min会取100f作为pointSize。这样,pointSize被限制在100f以内。那为什么还会溢出呢? 可能的问题在于,虽然pointSize被限制为100,但在计算blueX和blueY时,point.fiveX可能非常大,导致blueX = point.fiveX - 50(因为pointSize/2是50)。如果point.fiveX是一个很大的数值,比如接近float.MaxValue,那么减去50后可能超出float的范围,导致OverflowException。 不过,这种情况在实际应用中可能不太常见,除非数据点本身的坐标就非常大。另一种可能性是zoomLevel的计算有问题,导致scaleX或scaleY为负数,进而使得zoomLevel为负,从而在计算offsetX或offsetY时出现负的缩放,导致坐标计算错误。 例如,当dataMaxX - dataMinX为零时,scaleX就会变成无穷大,导致zoomLevel的计算出现问题。如果数据范围的最小值和最大值相同,比如所有点的fiveX都一样,那么dataMaxX - dataMinX为零,此时scaleX = clientRect.Width / 0,这会得到正无穷大,而zoomLevel会取正无穷大和scaleY中的较小者。如果此时scaleY也是正无穷大,那么zoomLevel就会是正无穷大,导致后续计算中的问题,比如offsetX和offsetY的计算可能产生无效值,进而导致坐标计算时出现溢出。 所以,数据范围的一致性可能是问题所在。如果dataMaxX等于dataMinX,或者dataMaxY等于dataMinY,就会导致scaleX或scaleY为无穷大,从而引发zoomLevel的计算错误,进而导致后续的坐标计算出现异常。 此外,在计算offsetX和offsetY时,如果zoomLevel为无穷大,那么乘以无穷大会导致结果无效,例如offsetX可能变为NaN或无穷大,这可能在应用TranslateTransform时导致异常。 另外,在绘制点的时候,如果pointSize是100,而坐标blueX或blueY加上pointSize后的值超过了float的最大或最小值,也会导致溢出。例如,如果point.fiveX是一个接近float.MaxValue的值,减去50会导致blueX变成一个负数,或者超过float的表示范围,从而引发异常。 解决方案方面,首先需要确保数据范围的有效性,即dataMaxX - dataMinX不能为零,dataMaxY - dataMinY也不能为零。可以在计算scaleX和scaleY之前,检查数据范围是否有效,如果无效,则设置一个默认的缩放比例或跳过绘制。 其次,在计算zoomLevel时,需要处理除零的情况。例如,当dataMaxX == dataMinX时,可以设置一个默认的scaleX,比如1,或者调整数据范围,人为添加一个小的增量,避免分母为零。 此外,在计算pointSize时,虽然已经限制了最大值100,但如果zoomLevel非常小,safeZoom可能被限制为0.001,导致pointSize为100,这时候如果数据点本身的坐标很大,比如1e30,那么blueX = 1e30 - 50,这可能在转换为float时溢出,因为float的范围大约是±3.4e38,所以1e30还在范围内,但如果是接近3.4e38的话,减去50可能导致超出范围。不过这种情况比较少见,但需要确保数据点的坐标不会过大。 另一个可能的解决方案是,在计算坐标之前,对数据点进行归一化处理,确保它们的范围在合理的区间内,或者在应用变换时,确保变换矩阵的有效性,避免缩放因子为零或无穷大。 此外,检查在应用变换时是否有可能出现无效的矩阵,比如缩放因子为零或负值,这可能导致坐标计算错误。例如,如果zoomLevel为负数,那么缩放后的坐标可能反向,导致计算错误。 总结可能的解决步骤: 1. 检查数据范围是否有效,避免dataMaxX - dataMinX为零或负值。 2. 在计算scaleX和scaleY时,处理分母为零的情况,设置默认值或调整数据范围。 3. 确保zoomLevel为正数,并且不为零或无穷大。 4. 在计算坐标时,添加范围检查,确保坐标值在float的有效范围内。 5. 使用checked关键字或异常处理来捕获溢出,但这可能会影响性能,所以更好的方法是预防溢出。 例如,可以在计算dataMinX和dataMaxX时,如果所有点的fiveX相同,就手动扩展范围: if (dataMaxX == dataMinX) { dataMinX -= 1; dataMaxX += 1; } 同样处理Y轴的数据范围,确保分母不为零。 另外,在计算scaleX和scaleY时,可以添加判断: float scaleX = (dataMaxX != dataMinX) ? clientRect.Width / (dataMaxX - dataMinX) : 1f; float scaleY = (dataMaxY != dataMinY) ? clientRect.Height / (dataMaxY - dataMinY) : 1f; 这样可以避免除零错误,保证scaleX和scaleY的有效性。 此外,在计算offsetX和offsetY时,可能需要确保zoomLevel的有效性,如果zoomLevel为零或无穷大,设置一个合理的默认值。 最后,在绘制点时,可以添加对坐标的检查,如果超出合理范围,则跳过绘制,避免触发异常。 综上,主要的解决方案是确保数据范围的有效性,处理除零的情况,限制缩放因子的有效性,并在计算坐标时进行范围检查,避免溢出。</think>在绘制过程中出现 `OverflowException` 通常是由于坐标计算超出浮点数范围或无效的变换参数导致的。以下是分步解决方案: --- ### **1. 数据范围有效性检查** **问题原因**:当所有数据点的 `fiveX` 或 `sexY` 值完全相同时,计算 `scaleX` 或 `scaleY` 时会出现除零操作,导致 `zoomLevel` 为无穷大(`Infinity`),最终坐标计算溢出。 **修复方法**:强制设置最小数据范围: ```csharp // 自动计算数据边界时添加容差 float epsilon = 1e-5f; // 微小容差值 float dataMinX = points.Min(p => p.fiveX); float dataMaxX = points.Max(p => p.fiveX); float dataMinY = points.Min(p => p.sexY); float dataMaxY = points.Max(p => p.sexY); // 如果数据范围为零,手动扩展范围 if (Math.Abs(dataMaxX - dataMinX) < epsilon) { dataMinX -= 1f; dataMaxX += 1f; } if (Math.Abs(dataMaxY - dataMinY) < epsilon) { dataMinY -= 1f; dataMaxY += 1f; } ``` --- ### **2. 安全计算缩放比例** **问题原因**:当 `dataMaxX - dataMinX` 或 `dataMaxY - dataMinY` 为零时,`scaleX` 或 `scaleY` 会变成 `Infinity`,导致后续计算错误。 **修复方法**:确保分母不为零: ```csharp // 计算缩放比例(避免除零) float scaleX = (dataMaxX - dataMinX) != 0 ? clientRect.Width / (dataMaxX - dataMinX) : 1f; float scaleY = (dataMaxY - dataMinY) != 0 ? clientRect.Height / (dataMaxY - dataMinY) : 1f; float zoomLevel = Math.Min(scaleX, scaleY) * 0.9f; ``` --- ### **3. 坐标计算溢出保护** **问题原因**:`pointSize` 过大或 `zoomLevel` 过小会导致 `blueX`、`blueY` 等坐标值超出 `float` 范围。 **修复方法**:限制 `zoomLevel` 最小值和 `pointSize` 最大值: ```csharp // 限制缩放级别最小值(避免除零) float safeZoom = Math.Max(zoomLevel, 0.001f); // 限制点尺寸最大值 float pointSize = Math.Min(4f / safeZoom, 100f); // 检查坐标有效性 bool IsValidCoordinate(float x, float y) { return !float.IsInfinity(x) && !float.IsInfinity(y) && !float.IsNaN(x) && !float.IsNaN(y) && Math.Abs(x) < float.MaxValue && Math.Abs(y) < float.MaxValue; } // 在绘制前检查坐标 if (IsValidCoordinate(blueX, blueY)) { e.Graphics.FillEllipse(Brushes.Blue, blueX, blueY, pointSize, pointSize); } ``` --- ### **4. 变换矩阵有效性验证** **问题原因**:`currentTransform` 可能包含无效值(如 `NaN` 或 `Infinity`)。 **修复方法**:重置无效变换矩阵: ```csharp if (currentTransform != null && currentTransform.Elements.All(x => !float.IsInfinity(x) && !float.IsNaN(x))) { e.Graphics.Transform = currentTransform; } else { e.Graphics.ResetTransform(); } ``` --- ### **完整修复代码示例** ```csharp private void pictureBox1_Paint(object sender, PaintEventArgs e) { e.Graphics.SmoothingMode = SmoothingMode.AntiAlias; // 计算实际绘制区域 var clientRect = pictureBox1.ClientRectangle; // 1. 数据范围检查(添加容差) float epsilon = 1e-5f; float dataMinX = points.Min(p => p.fiveX); float dataMaxX = points.Max(p => p.fiveX); float dataMinY = points.Min(p => p.sexY); float dataMaxY = points.Max(p => p.sexY); if (Math.Abs(dataMaxX - dataMinX) < epsilon) { dataMinX -= 1f; dataMaxX += 1f; } if (Math.Abs(dataMaxY - dataMinY) < epsilon) { dataMinY -= 1f; dataMaxY += 1f; } // 2. 安全计算缩放比例 float scaleX = (dataMaxX - dataMinX) != 0 ? clientRect.Width / (dataMaxX - dataMinX) : 1f; float scaleY = (dataMaxY - dataMinY) != 0 ? clientRect.Height / (dataMaxY - dataMinY) : 1f; float zoomLevel = Math.Min(scaleX, scaleY) * 0.9f; // 3. 计算偏移量 float offsetX = -dataMinX * zoomLevel + (clientRect.Width - (dataMaxX - dataMinX) * zoomLevel) / 2; float offsetY = -dataMinY * zoomLevel + (clientRect.Height - (dataMaxY - dataMinY) * zoomLevel) / 2; // 应用变换前检查有效性 if (!float.IsInfinity(offsetX) && !float.IsInfinity(offsetY) && !float.IsNaN(offsetX) && !float.IsNaN(offsetY)) { e.Graphics.TranslateTransform(offsetX, offsetY); e.Graphics.ScaleTransform(zoomLevel, zoomLevel); currentTransform = e.Graphics.Transform; } else { e.Graphics.ResetTransform(); currentTransform = null; } // 4. 绘制点(添加坐标检查) foreach (var point in points) { float safeZoom = Math.Max(zoomLevel, 0.001f); float pointSize = Math.Min(4f / safeZoom, 100f); // 计算坐标并检查有效性 float blueX = point.fiveX - pointSize / 2; float blueY = point.sexY - pointSize / 2; if (IsValidCoordinate(blueX, blueY)) { e.Graphics.FillEllipse(Brushes.Blue, blueX, blueY, pointSize, pointSize); } float redX = point.eightX - pointSize / 2; float redY = point.nineY - pointSize / 2; if (IsValidCoordinate(redX, redY)) { e.Graphics.FillEllipse(Brushes.Red, redX, redY, pointSize, pointSize); } } } private bool IsValidCoordinate(float x, float y) { const float maxValid = 1e20f; // 根据实际需求调整 return !float.IsInfinity(x) && !float.IsInfinity(y) && !float.IsNaN(x) && !float.IsNaN(y) && Math.Abs(x) < maxValid && Math.Abs(y) < maxValid; } ``` --- ### **关键改进总结** 1. **数据范围容差**:避免除零操作。 2. **缩放比例保护**:确保分母不为零。 3. **坐标有效性检查**:通过 `IsValidCoordinate` 过滤无效值。 4. **变换矩阵重置**:当矩阵包含 `Infinity` 或 `NaN` 时重置变换。 这些修改将显著降低 `OverflowException` 的发生概率。如果问题仍然存在,建议检查原始数据点 (`points`) 中是否存在极端值(如接近 `float.MaxValue` 的值)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值