paip.输入法编程--词频调整原则--发音长度优先

在输入法编程中,作者Attilax探讨了词频调整原则,强调了应按照发音长度优先进行排序。文章通过举例说明了在编码过程中遇到的问题,并提出了解决方案,即增加一个`len_fain`列来记录发音长度,并通过触发器确保新插入或更新的数据保持这一排序原则。最后,提供了修改后的导出SQL查询以遵循发音长度优先的排序规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

paip.输入法编程--词频调整原则--发音长度优先


作者Attilax ,  EMAIL:1466519819@qq.com 
来源:attilax的专栏
地址:http://blog.youkuaiyun.com/attilax




准备打个 "提升" ,编码是 "tishen   sp"..


江打的个"tishen" ,出来个"听审,提升"...


听审的编码是"tinshen kb"...发音是 tinshen


按发音还是按编码, 听审都到个"提升"的前头了...


要不个"提升"提的个前头了...应该是按发音长度优先排序才对..


增加一个列len_fain.  fault=0  ,not null


 update  gaopinzi  set len_fain=LENGTH(py)  where  LENGTH(py)>0




[SQL]  update  gaopinzi  set len_fain=LENGTH(py)  where  LENGTH(py)>0


受影响的行: 266638
时间: 38.609s






增加in up 触发器
-------------------------


CREATE TRIGGER `swe_len_fain4insert` BEFORE INSERT ON `gaopinzi` FOR EACH ROW begin
 update  gaopinzi  set len_fain=LENGTH(py)  where id=new.id;
#insert  logx(idop,eventx,timex,demo,hezi,pyold,pynew)values( old.id,'update rec',now(),'',old.hezi,old.atian,new.atian);
end;


CREATE TRIGGER `swe_len_fain4up` BEFORE UPDATE ON `gaopinzi` FOR EACH ROW begin
  set    new.len_fain=LENGTH(new.py)  ;
#insert  logx(idop,eventx,timex,demo,hezi,pyold,pynew)values( old.id,'update rec',now(),'',old.hezi,old.atian,new.atian);
end;


修改导出sql
------------
SELECT SQL_NO_CACHE *,
py,
hezi,
id,


IF (
gudin = 1,
CONCAT(ATIAN, '#固'),
ATIAN
) AS nyefa
, lan_ord  lanOrd,lang
FROM
gaopinzi   
 force index(i_export)
WHERE LENGTH(atian) >0 
and ( del=0 or del is null)
  
ORDER BY 
lanOrd, atipydiff,len_fain,py,atian,
gudinfejwe ,
ord,
iD 
 









### PAIP编程珠玑中的示例代码解释 PAIP(Paradigms of Artificial Intelligence Programming)是一本深入探讨人工智能编程范式的书籍,其中包含了大量 Lisp 编写的程序实例。这些例子不仅展示了如何实现特定的人工智能算法,还提供了关于良好软件工程实践的重要见解。 #### 示例:通用求解器框架 书中介绍了一个名为 `defun` 的宏来定义函数,在构建通用问题解决器时非常有用[^1]: ```lisp (defun solve (problem) "Find a solution to the given problem." (let ((solution nil)) ;; Attempt to find a solution using backtracking. (labels ((try-next-option () (when (not solution) (if (no-more-options-p ()) (return-from try-next-option nil) (let* ((option (next-option))) (cond ((goal-reached-p option) (setf solution option)) (t (push-state option) (solve problem) (pop-state)))))))) (try-next-option) solution))) ``` 这段代码实现了回溯法解决问题的一般模式。通过递归调用自身并尝试不同的选项直到找到解决方案为止。如果当前路径无法通向目标,则会恢复之前的状态继续探索其他可能性。 此方法能够有效地处理许多复杂的组合优化类问题,并且由于其灵活性可以很容易地适应各种具体应用场景下的需求变化。 #### 示例:自然语言理解模块 另一个重要的部分涉及到了自然语言处理技术的应用案例——基于语法分析树结构来进行语义解析: ```lisp (defun parse-sentence (sentence) "Parse SENTENCE into its constituent parts and build an interpretation tree." (multiple-value-bind (subject verb-object) (split sentence 'verb) `(sentence :subject ,(parse-noun-phrase subject) :action ,verb-object))) (defun parse-noun-phrase (np-string) "Interpret NP-STRING as either a simple noun or compound phrase." ...) ``` 上述片段演示了如何将输入字符串分割成主谓宾成分,并进一步解析名词短语的具体含义。这种层次化的表示方式有助于后续更高级别的推理操作以及对话管理等功能的设计与实现。 #### 示例:专家系统规则引擎 最后值得一提的是书中对于专家系统的讨论,特别是有关于事实库管理和匹配机制的部分: ```lisp (defstruct fact id pattern bindings) (defun match-patterns (pattern facts) "Return all FACTS that unify with PATTERN, along with their BINDINGS." ...) (defun add-fact (kb new-fact) "Add NEW-FACT to knowledge base KB after checking consistency against existing rules." ...) ``` 这里展示了一种简单而有效的知识表达形式及其相应的查询接口设计思路。通过对模式进行统一化计算从而快速定位符合条件的事实条目;而在更新数据库前则需确保新加入的信息不会引起逻辑矛盾等问题的发生。 以上仅是从《Programming Pearls》一书摘取的一些精彩片段,实际上该著作涵盖了更为广泛的内容领域和技术细节等待读者去发掘学习。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值