Oracle存储过程例子:运用了正则表达式、数组等

本文介绍了一个Oracle存储过程,用于从文章内容中提取URL、电子邮件地址、电话号码和银行账号等敏感信息,并将其存储到数据库中。
ExpandedBlockStart.gif代码
CREATE OR REPLACE PROCEDURE "SP_GET_ARTICLE_DATA"
(article_detail_id_$ 
number,
 Record_Md5_ID_$ 
varchar2,
 content_text_$ clob,
 ReturnValue out 
number
is
begin
   
declare
   
--自定义数组
    TYPE StringArray IS table OF VARCHAR2(1000);
   
    Offset_URL 
number;
    Offset_Email 
number;
    Offset_Phone 
number;
    Offset_Account 
number;
    
    
--数据下标
    URL_V_Num number:=1;
    Email_V_Num 
number:=1;
    Phone_V_Num 
number:=1;
    Account_V_Num 
number:=1;
    
    
--数据元素存在标志
    Is_Exsit_Flag number;
    
    URL 
varchar2(3000);
    Email 
varchar2(200);
    Phone 
varchar2(100);
    Bank_Account 
varchar2(100);
    
    URL_Array StringArray:
=StringArray();
    Email_Array StringArray:
=StringArray();
    Phone_Array StringArray:
=StringArray();
    Account_Array StringArray:
=StringArray();

    
--常量
    URL_RegExp constant varchar2(300):='(((file|gopher|news|nntp|telnet|http|ftp|https|ftps|sftp)://)|(www\.))+(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(/[a-zA-Z0-9\&'||'%_\./-~-]*)?';
    Email_RegExp constant 
varchar2(200):='[A-Za-z0-9_]+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*';
    Phone_RegExp constant 
varchar2(300):='[+[:digit:]]{1,2}[-\.,[:blank:]]*\d{3}[-\.,[:blank:]]*\d{3}[-\.,[:blank:]]*\d{4}|[+[:digit:]]?[-\.,[:blank:]]*\d{1,2}[-\.,[:blank:]]*\d{3}[-\.,[:blank:]]+\d{4}|\d{3}[-\.,[:blank:]]+\d{4}';
    Bank_Account_RegExp constant 
varchar2(200):='(SA)?[[:digit:]]{22}|(SA)?[[:blank:]]*([[:digit:]]{4}|\d{2})[-\.,[:blank:]]*[[:digit:]]{4}[-\.,[:blank:]]*[[:digit:]]{4}[-\.,[:blank:]]*[[:digit:]]{4}[-\.,[:blank:]]*[[:digit:]]{4}[-\.,[:blank:]]*(\d{4}|\d{2})';
    URL_Escape constant 
varchar2(100):='\.jpg|\.rar|\.zip|\.png|\.gif|\.pdf|\.doc|\.excel|\.swf|\.mpg|\.\.|\.rmvb';
    
    DUP_VAL_INDEX exception;
    pragma exception_init(DUP_VAL_INDEX,
-0001);
    
  
begin
   
if article_detail_id_$ is not null and article_detail_id_$<>0 then
    Offset_URL:
=1;
    Offset_Email:
=1;
    Offset_Phone:
=1;
    Offset_Account:
=1;

    
while Offset_URL<>0 or Offset_Email<>0 or Offset_Phone<>0 or Offset_Account<>0
    loop
       
--获取URL
       if Offset_URL<>0 then
          
select trim(to_char(REGEXP_SUBSTR(content_text_$,URL_RegExp, Offset_URL, 1,'i')))
          
into URL from dual;
          
--获取从offset位置开始的第一个符合URL表达式的字符串位置,并赋给offset
          select REGEXP_INSTR(content_text_$, URL_RegExp, Offset_URL, 11,'i')
          
into Offset_URL from dual;
       
end if;
       
--获取Email
       if Offset_Email<>0 then
          
select trim(to_char(REGEXP_SUBSTR(content_text_$,Email_RegExp, Offset_Email, 1,'i')))
          
into Email from dual;
          
--获取从offset位置开始的第一个符合Email表达式的字符串位置,并赋给offset
          select REGEXP_INSTR(content_text_$, Email_RegExp, Offset_Email, 11,'i')
          
into Offset_Email from dual;
       
end if;
       
--获取Phone
       if Offset_Phone<>0 then
          
select trim(to_char(REGEXP_SUBSTR(content_text_$,Phone_RegExp, Offset_Phone, 1,'i')))
          
into Phone from dual;
          
--获取从offset位置开始的第一个符合Phone表达式的字符串位置,并赋给offset
          select REGEXP_INSTR(content_text_$, Phone_RegExp, Offset_Phone, 11,'i')
          
into Offset_Phone from dual;
       
end if;
       
--获取Bank_Account
       if Offset_Account<>0 then
          
select trim(to_char(REGEXP_SUBSTR(content_text_$,Bank_Account_RegExp, Offset_Account, 1,'i')))
          
into Bank_Account from dual;
          
--获取从offset位置开始的第一个符合Phone表达式的字符串位置,并赋给offset
          select REGEXP_INSTR(content_text_$, Bank_Account_RegExp, Offset_Account, 11,'i')
          
into Offset_Account from dual;
       
end if;
       
       
--URL插入到数组中
       if (length(URL)>0 and length(URL)<800and REGEXP_INSTR(URL, URL_Escape, 110'i')=0 then
         Is_Exsit_Flag :
=0;         
         
FOR I IN 1..URL_Array.COUNT LOOP      
           
if URL=URL_Array(I) then
            Is_Exsit_Flag:
=1;
           
end if;
         
END LOOP;
         
--如果数组中不存在当前值,则插入到数组
         if Is_Exsit_Flag=0 then            
            URL_Array.EXTEND(
1);
            URL_Array(URL_V_Num):
=URL;
            URL_V_Num:
=URL_V_Num+1;
         
end if;
       
end if
       
--Email插入到数组中
       if (length(Email)>0 and length(Email)<100then
         Is_Exsit_Flag :
=0;         
         
FOR I IN 1..Email_Array.COUNT LOOP      
           
if Email=Email_Array(I) then
            Is_Exsit_Flag:
=1;
           
end if;
         
END LOOP;
         
--如果数组中不存在当前值,则插入到数组
         if Is_Exsit_Flag=0 then            
            Email_Array.EXTEND(
1);
            Email_Array(Email_V_Num):
=Email;
            Email_V_Num:
=Email_V_Num+1;
         
end if;
       
end if
       
--Phone插入到数组中
       if (length(Phone)>6 and length(Phone)<100then
         Is_Exsit_Flag :
=0;         
         
FOR I IN 1..Phone_Array.COUNT LOOP      
           
if Phone=Phone_Array(I) then
            Is_Exsit_Flag:
=1;
           
end if;
         
END LOOP;
         
--如果数组中不存在当前值,则插入到数组
         if Is_Exsit_Flag=0 then            
            Phone_Array.EXTEND(
1);
            Phone_Array(Phone_V_Num):
=Phone;
            Phone_V_Num:
=Phone_V_Num+1;
         
end if;
       
end if
       
--Bank_Account插入到数组中
       if (length(Bank_Account)>0 and length(Bank_Account)<100then
         Is_Exsit_Flag :
=0;         
         
FOR I IN 1..Account_Array.COUNT LOOP      
           
if Bank_Account=Account_Array(I) then
            Is_Exsit_Flag:
=1;
           
end if;
         
END LOOP;
         
--如果数组中不存在当前值,则插入到数组
         if Is_Exsit_Flag=0 then            
            Account_Array.EXTEND(
1);
            Account_Array(Account_V_Num):
=Bank_Account;
            Account_V_Num:
=Account_V_Num+1;
         
end if;
       
end if;       
    
end loop;
    
    
-- Dbms_Output.put_line('Array is:'||URL_Array(1));
    
    
--插入获取到的URL
       FOR I IN 1..URL_Array.COUNT LOOP      
          
insert into article_data(article_detail_id,article_record_md5_id,data_type,data_is_url,data_value)
          
values(article_detail_id_$,Record_Md5_ID_$,'URL','1',URL_Array(I));
       
END LOOP;
       
--插入获取到的Email
       FOR I IN 1..Email_Array.COUNT LOOP
          
insert into article_data(article_detail_id,article_record_md5_id,data_type,data_is_url,data_value)
          
values(article_detail_id_$,Record_Md5_ID_$,'Email','0',Email_Array(I));
       
END LOOP;
       
--插入获取到的Phone
       FOR I IN 1..Phone_Array.COUNT LOOP
          
insert into article_data(article_detail_id,article_record_md5_id,data_type,data_is_url,data_value)
          
values(article_detail_id_$,Record_Md5_ID_$,'Phone','0',Phone_Array(I));
       
END LOOP;
       
--插入获取到的Bank_Account
       FOR I IN 1..Account_Array.COUNT LOOP
          
insert into article_data(article_detail_id,article_record_md5_id,data_type,data_is_url,data_value)
          
values(article_detail_id_$,Record_Md5_ID_$,'Bank Account','0',Account_Array(I));
       
END LOOP;
       
   
end if;
  Exception
    
when NO_DATA_FOUND then
      ReturnValue:
=-1000;
    
when DUP_VAL_INDEX then
      ReturnValue:
=-1001;
    
when VALUE_ERROR then
      ReturnValue:
=-1002;
    
when TOO_MANY_ROWS then
      ReturnValue:
=-1003;
    
when OTHERS then
      ReturnValue:
=-1004;
      
--Dbms_Output.put_line('The SQLCode is: '||SQLCODE);
      --Dbms_Output.put_line('The SQLERRM is: '||SQLERRM);
  end;
end SP_GET_ARTICLE_DATA;

 

转载于:https://www.cnblogs.com/krisy/archive/2010/01/19/1651575.html

<think>好的,我现在需要回答用户关于在达梦数据库存储过程中如何将字符串变量转换为NUMBER类型数组,并通过动态SQL使用IN条件进行查询的问题。首先,我得回忆一下达梦数据库的相关知识,特别是存储过程和动态SQL的处理方法。 根据用户提供的引用内容,引用[1]提到在存储过程中处理返回结果时需要使用游标。引用[3]中提到了多表查询,特别是内连接和笛卡尔集的示例,这可能对构造动态SQL有帮助。引用[4]则指出达梦支持PL/SQL,包括DDL、DML等,这可能意味着存储过程的语法与Oracle类似。 首先,用户的问题是将字符串变量(比如'1,2,3,4')转换为NUMBER数组,然后在动态SQL中使用IN条件查询。我需要考虑如何在达梦的存储过程中处理字符串分割和数组转换。在Oracle中,可以使用正则表达式函数来分割字符串,但达梦是否有类似的功能呢?或者是否需要手动处理字符串? 接下来,动态SQL部分,用户需要使用IN条件,这意味着需要将数组展开成逗号分隔的值,并拼接到SQL语句中。需要注意的是,直接拼接字符串可能存在SQL注入的风险,但如果是内部使用且参数受控,可能可以接受。另外,在存储过程中执行动态SQL通常使用EXECUTE IMMEDIATE或者游标处理。 然后,关于数组类型,达梦是否支持集合类型,比如VARRAY或者嵌套表?根据引用[1]中的示例,存储过程使用了游标来处理结果集,但并没有提到数组类型。可能需要查阅达梦的文档,确认是否支持数组变量,或者是否有替代方法,比如临时表或字符串处理。 假设达梦支持类似Oracle的集合类型,那么步骤可能是这样的:1. 将字符串分割成数组元素;2. 使用该数组在动态SQL的IN条件中。但若数组处理不支持,可能需要将字符串转换为多个用逗号分隔的值,直接拼接到SQL语句中,例如IN (1,2,3,4)。 另外,考虑到动态SQL的构造,用户需要将变量值嵌入到SQL字符串中。例如,如果输入字符串是'1,2,3',则动态SQL应该是'SELECT * FROM table WHERE id IN (' || 输入的字符串 || ')',但这里需要确保字符串中的元素已经是数值,或者正确转义。 现在,结合引用中的例子,引用[1]的存储过程示例使用游标执行动态SQL,这可能是一个关键点。用户可能需要将IN条件的值通过字符串拼接,然后用动态SQL打开游标处理结果。 可能的步骤分解: 1. 接收输入字符串,例如'1,2,3,4'。 2. 在存储过程中,将该字符串分割成NUMBER数组。可能需要使用字符串函数,如split_part或者正则表达式。 3. 构造动态SQL语句,将数组元素转换为IN列表,例如'... WHERE id IN (1,2,3,4)'。 4. 使用游标执行该动态SQL并返回结果。 但达梦可能没有内置的split函数,可能需要手动处理字符串。或者,是否可以直接在IN条件中使用字符串变量?例如,如果输入是'1,2,3',动态SQL可以是'SELECT ... WHERE id IN (' || :input_str || ')',但这样生成的SQL是WHERE id IN ('1,2,3'),这显然不正确,因为IN期望的是多个值,而不是一个字符串。所以必须将字符串拆分成独立的数值,并去掉引号。 因此,正确的做法是将字符串拆分为独立的元素,并确保在构造动态SQL时,IN条件中的每个元素都是数值,不包含引号。例如,输入字符串是'1,2,3',构造的SQL应该是'... IN (1,2,3)'。 但是,如何确保分割后的字符串元素正确转换为数值?可能需要循环遍历每个分割后的元素,并验证是否为数字,或者信任输入来源。 综上,可能的解决方案是: - 使用字符串替换,将逗号分隔的字符串转换为括号内的数值列表,然后拼接到SQL语句中。 - 使用动态SQL执行该语句,并通过游标获取结果。 现在,我需要验证这个思路是否正确,并参考达梦的文档或已知示例。例如,引用[1]中的存储过程示例使用了动态SQL和游标,这可能适用。 因此,存储过程的大致结构可能如下: 1. 定义输入参数为字符串。 2. 构造动态SQL语句,将输入字符串处理后放入IN条件。 3. 使用游标执行动态SQL。 4. 处理结果集。 例如: CREATE OR REPLACE PROCEDURE proc_name(input_str VARCHAR) AS v_sql VARCHAR(1000); v_id NUMBER; CURSOR c1 IS EXECUTE IMMEDIATE v_sql; BEGIN v_sql := 'SELECT * FROM table_name WHERE id IN (' || input_str || ')'; OPEN c1; LOOP FETCH c1 INTO v_id; EXIT WHEN c1%NOTFOUND; -- 处理每一行 END LOOP; CLOSE c1; END; 但这里假设input_str已经是正确的数值列表,例如'1,2,3',这样拼接后的SQL是WHERE id IN (1,2,3),这是可行的。但如果input_str包含非数字字符,可能导致错误。因此,在存储过程中可能需要验证输入,或者在转换前确保字符串正确。 如果用户需要将字符串转换为NUMBER数组,可能需要使用达梦的数组功能。例如,声明一个数组变量,然后将分割后的元素存入数组。但需要知道达梦是否支持数组类型。如果支持,可能可以使用类似Oracle的VARRAY或者TABLE类型。 假设达梦支持数组类型,可能的步骤: 1. 分割字符串为数组。 2. 使用该数组在动态SQL中。 但动态SQL中的IN条件需要展开数组元素为逗号分隔的列表,这可能需要循环处理数组,并构造字符串。 例如,使用循环遍历数组元素,逐个添加到IN列表的字符串中,确保格式正确。 如果达梦不支持数组类型,可能需要使用临时表存储分割后的元素,然后在动态SQL中查询临时表。例如: - 将输入字符串分割后插入到临时表的一个NUMBER列中。 - 动态SQL使用子查询或JOIN临时表。 但这种方法可能更复杂,尤其是需要在存储过程中动态创建临时表或使用全局临时表。 综合来看,最简单的解决方案是直接拼接字符串到IN条件中,前提是输入字符串已经是正确的数值列表,如'1,2,3',这样构造的SQL语句是正确的。如果输入字符串可能包含不安全的内容,需要进行验证或转义。 因此,最终的存储过程示例可能如下: CREATE OR REPLACE PROCEDURE query_with_in_condition(p_input_str VARCHAR) AS v_sql VARCHAR(1000); v_cursor SYS_REFCURSOR; v_id NUMBER; BEGIN -- 构造动态SQL v_sql := 'SELECT * FROM your_table WHERE id IN (' || p_input_str || ')'; -- 使用游标执行动态SQL OPEN v_cursor FOR v_sql; LOOP FETCH v_cursor INTO v_id; EXIT WHEN v_cursor%NOTFOUND; -- 处理结果,例如打印 DBMS_OUTPUT.PUT_LINE('ID: ' || v_id); END LOOP; CLOSE v_cursor; END; 但需要注意,这里的p_input_str必须是像'1,2,3'这样的形式,不能有单引号,否则会导致语法错误。例如,如果输入是'1','2','3',则生成的SQL会是WHERE id IN (1,2,3),正确。但如果输入字符串包含非数值字符,或者带有单引号,则可能导致错误或SQL注入。 因此,安全的方法是将输入字符串分割为数组,并逐个验证是否为数值,然后重新构造为不带引号的字符串。但如何在达梦中分割字符串呢?如果达梦支持类似Oracle的REGEXP_SUBSTR函数,可以使用循环分割字符串。 例如,使用REGEXP_SUBSTR逐项提取每个数字,然后构造安全的字符串。 假设达梦支持类似语法,存储过程可能如下: CREATE OR REPLACE PROCEDURE query_with_in_condition(p_input_str VARCHAR) AS v_sql VARCHAR(1000); v_cursor SYS_REFCURSOR; v_id NUMBER; v_temp_str VARCHAR(100); v_num NUMBER; v_list_str VARCHAR(100) := ''; i INT := 1; BEGIN -- 分割输入字符串并构造安全列表 WHILE i <= LENGTH(p_input_str) - LENGTH(REPLACE(p_input_str, ',', '')) + 1 LOOP v_temp_str := REGEXP_SUBSTR(p_input_str, '[^,]+', 1, i); -- 尝试转换为NUMBER,若失败则抛出错误 v_num := TO_NUMBER(v_temp_str); -- 拼接成列表字符串 IF i = 1 THEN v_list_str := v_list_str || v_temp_str; ELSE v_list_str := v_list_str || ',' || v_temp_str; END IF; i := i + 1; END LOOP; -- 构造动态SQL v_sql := 'SELECT * FROM your_table WHERE id IN (' || v_list_str || ')'; -- 执行动态SQL OPEN v_cursor FOR v_sql; LOOP FETCH v_cursor INTO v_id; EXIT WHEN v_cursor%NOTFOUND; DBMS_OUTPUT.PUT_LINE('Found ID: ' || v_id); END LOOP; CLOSE v_cursor; EXCEPTION WHEN OTHERS THEN DBMS_OUTPUT.PUT_LINE('Error: ' || SQLERRM); END; 这个例子中,首先使用REGEXP_SUBSTR分割字符串,逐个检查是否为数值,然后拼接成安全的列表字符串。这样即使输入字符串包含非数值字符,转换时会抛出异常,避免SQL注入或语法错误。 总结,步骤包括:分割输入字符串、验证每个元素为数值、构造安全的IN列表、执行动态查询。这样既安全又符合用户的需求。</think>以下是在达梦数据库中实现字符串转NUMBER数组并通过动态SQL进行IN条件查询的完整解决方案: ### 存储过程实现步骤 1. **字符串分割处理**:使用正则表达式函数`REGEXP_SUBSTR`分割字符串 2. **数值类型验证**:通过`TO_NUMBER`函数确保元素合法性 3. **动态SQL构造**:安全拼接IN条件语句 4. **游标遍历结果**:使用`SYS_REFCURSOR`处理动态查询结果 ```sql CREATE OR REPLACE PROCEDURE SP_QUERY_BY_NUMARRAY( p_input_str VARCHAR(1000), p_out_cur OUT SYS_REFCURSOR ) AS v_sql VARCHAR(2000); v_temp_str VARCHAR(100); v_num NUMBER; v_list_str VARCHAR(1000) := ''; i INT := 1; BEGIN -- 分割字符串并构造安全数值列表 WHILE i <= REGEXP_COUNT(p_input_str, ',') + 1 LOOP v_temp_str := REGEXP_SUBSTR(p_input_str, '[^,]+', 1, i); v_num := TO_NUMBER(v_temp_str); -- 验证数值有效性 v_list_str := v_list_str || CASE WHEN i=1 THEN '' ELSE ',' END || v_num; i := i + 1; END LOOP; -- 构造动态SQL v_sql := 'SELECT * FROM employees WHERE department_id IN (' || v_list_str || ')'; -- 打开游标返回结果集 OPEN p_out_cur FOR v_sql; EXCEPTION WHEN OTHERS THEN RAISE_APPLICATION_ERROR(-20001, '输入包含非数值参数'); END; ``` ### 调用示例 ```sql DECLARE v_cursor SYS_REFCURSOR; v_emp_id NUMBER; v_emp_name VARCHAR(50); BEGIN SP_QUERY_BY_NUMARRAY('101,102,103', v_cursor); LOOP FETCH v_cursor INTO v_emp_id, v_emp_name; EXIT WHEN v_cursor%NOTFOUND; DBMS_OUTPUT.PUT_LINE(v_emp_id || ' : ' || v_emp_name); END LOOP; CLOSE v_cursor; END; ``` ### 关键点说明 1. **安全验证**:通过`TO_NUMBER`强制转换确保输入合法性,防止SQL注入 2. **动态游标**:使用`SYS_REFCURSOR`返回结果集,支持客户端程序直接获取[^1] 3. **性能优化**:直接拼接数值列表避免类型转换开销,保持查询效率[^4]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值