paip.输入法编程--词频调整原则--发音长度优先

在输入法编程中,作者Attilax探讨了词频调整原则,强调了应按照发音长度优先进行排序。文章通过举例说明了在编码过程中遇到的问题,并提出了解决方案,即增加一个`len_fain`列来记录发音长度,并通过触发器确保新插入或更新的数据保持这一排序原则。最后,提供了修改后的导出SQL查询以遵循发音长度优先的排序规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

paip.输入法编程--词频调整原则--发音长度优先


作者Attilax ,  EMAIL:1466519819@qq.com 
来源:attilax的专栏
地址:http://blog.youkuaiyun.com/attilax




准备打个 "提升" ,编码是 "tishen   sp"..


江打的个"tishen" ,出来个"听审,提升"...


听审的编码是"tinshen kb"...发音是 tinshen


按发音还是按编码, 听审都到个"提升"的前头了...


要不个"提升"提的个前头了...应该是按发音长度优先排序才对..


增加一个列len_fain.  fault=0  ,not null


 update  gaopinzi  set len_fain=LENGTH(py)  where  LENGTH(py)>0




[SQL]  update  gaopinzi  set len_fain=LENGTH(py)  where  LENGTH(py)>0


受影响的行: 266638
时间: 38.609s






增加in up 触发器
-------------------------


CREATE TRIGGER `swe_len_fain4insert` BEFORE INSERT ON `gaopinzi` FOR EACH ROW begin
 update  gaopinzi  set len_fain=LENGTH(py)  where id=new.id;
#insert  logx(idop,eventx,timex,demo,hezi,pyold,pynew)values( old.id,'update rec',now(),'',old.hezi,old.atian,new.atian);
end;


CREATE TRIGGER `swe_len_fain4up` BEFORE UPDATE ON `gaopinzi` FOR EACH ROW begin
  set    new.len_fain=LENGTH(new.py)  ;
#insert  logx(idop,eventx,timex,demo,hezi,pyold,pynew)values( old.id,'update rec',now(),'',old.hezi,old.atian,new.atian);
end;


修改导出sql
------------
SELECT SQL_NO_CACHE *,
py,
hezi,
id,


IF (
gudin = 1,
CONCAT(ATIAN, '#固'),
ATIAN
) AS nyefa
, lan_ord  lanOrd,lang
FROM
gaopinzi   
 force index(i_export)
WHERE LENGTH(atian) >0 
and ( del=0 or del is null)
  
ORDER BY 
lanOrd, atipydiff,len_fain,py,atian,
gudinfejwe ,
ord,
iD 
 









评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值