使用序列替换字段的办法

最新推荐文章于 2021-03-02 12:44:58 发布

转载最新推荐文章于 2021-03-02 12:44:58 发布 · 730 阅读

文章标签：

#login #user #parallel #null #insert #csv

资料收藏同时被 2 个专栏收录

122 篇文章

订阅专栏

数据库

10 篇文章

订阅专栏

如数据为：

1,1,Unmi,3,2009-1-5 20:34

2,2,Fantasia,5,2008-10-15
1,2,satiu,5,2008-10-15

想用序列替换一列的指，可用filler虚拟列的方法实现，详见例子二

原帖：http://blog.youkuaiyun.com/access20032004/article/details/7064919

sqlldr使用的三个例子

 
    view plain
    print
    ?
   

例：要插入的表为users
desc users
Name Null? Type
---------------------------------------------------- -------- -----------------
USER_ID NUMBER
USER_NAME VARCHAR2(50)
LOGIN_TIMES NUMBER
LAST_LOGIN DATE

sqlldr有两种用法：

1.控制文件+数据文件 --> 一般用这种.数据文件可是CSV文件，可以是PL/SQL DEV或Toad导出的，也可以sqlplus用spool导出的文件。

 
    view plain
    print
    ?
   
   a.控制文件的内容如下：  
       options (skip=1)            --在命令行执行sqlldr显示出的选项可以写在这里  
       load data  
       infile "/a.csv"             --指定数据文件，可写多个如再写个infile "/b.csv",还可用badfile、discardfile指定坏数据和丢弃数据的文件  
       truncate                    --操作类型，截断表中原有记录。默认为insert表要为空；若为append追加；若为replace则delect表中原有记录  
       into table users            --指定要插入记录的表  
       fields terminated by ","    -- 数据中每行记录用 "," 分隔  
       optionally enclosed by '"'  -- 数据中每个字段用 '"' 框起，比如字段中有 "," 分隔符时   
       trailing nullcols           --表的字段没有对应的值时允许为空  
       (  
       virtual_column filler,      --虚拟字段，可用filler来跳过由PL/SQL Developer 生成的第一列序号  
       user_id number,  
       user_name  
       login_times,  
       last_login date "yyyy-mm-dd hh24:mi:ss"  
       )  
    
   
   b.数据文件是csv文件，内容如下：  
       "   ","USER_ID","USER_NAME","LOGIN_TIMES","LAST_LOGIN"     
       "1","1","Unmi","3","2009-1-5 20:34:44"     
       "2","2","","5","2008-10-15"     
       "3","3","mini","8","2009-1-2"     
       "4","4","Kypfos","",""     
       "5","5","nic","1","2008-12-23"    
   
 执行命令：  
 sqlldr sys/oracle@ocm as sysdba control=/user.txt  

2.控制文件（包含数据） ----> 这种格式的控制文件可以由Toad导出

 
    view plain
    print
    ?
   
    这种是控制文件中包含有数据，并用begindata连接，infile "filename" 改为infile *,内容如下：  
       options (skip=1)              
       load data  
       infile *                    --因为数据同控制文件在一起，所以为*表示  
       truncate                      
       into table users      
       fields terminated by ","       
       trailing nullcols             
       (  
       virtual_column filler,        
       user_id "user_seq.nextval", --这一列取user_seq序列的下一值，而不用数据中提供的值  
       user_name "'hi'||upper(:user_name)", --还能用SQL函数或运算对数据加工处理  
       login_times terminated by "," NULLIF(login_times='NULL'),         --可为列单独指定分隔符  
       last_login date "yyyy-mm-dd hh24:mi:ss" nullif(last_login="NULL") --当字段为"NULL"时就是null  
       )  
       begindata                   --数据从这里开始  
       ,USER_ID,USER_NAME,LOGIN_TIMES,LAST_LOGIN     
       1,1,Unmi,3,2009-1-5 20:34     
       2,2,Fantasia,5,2008-10-15     
       3,3,mini,8,2009-1-2     
       4,4,Kypfos,NULL,NULL     
       5,5,nic,1,2008-12-23  
   
 执行一样的命令：  
 sqlldr sys/oracle@ocm as sysdba control=/user.txt  

 
    view plain
    print
    ?
   
 同样是使用 数据文件+控制文件。但是数据文件是sqlplus用spool导出的文件  
     a.控制文件的内容为：  
       options (skip=2,rows=128)  
       load data  
       infile "/script/4.sql"  
       into table users  
       append  
       trailing nullcols  
       (  
       user_id position(1:10),       --不指定分隔符，在列里用position来定位  
       user_name position(11:61),  
       login_times position(*:73),   -- *号表示开始位置在前一字段的结束位置  
       last_login position(*:93) date "yyyy-mm-dd hh24:mi:ss"  
       )  
    
     b.数据文件的内容为：  
    USER_ID USER_NAME                              LOGIN_TIMES LAST_LOGIN  
 ---------- -------------------------------------------------- ----------- -------------------  
          1 Unmi                                             3  2009-01-05 20:34:44  
          2                                                  5  2008-10-15 0:0:0  
          3 mini                                             8  2009-01-02 0:0:0  
          4 Kypfos  
          5 hello                                            1  2008-12-23 0:0:0  
   
 执行一样的命令：  
 sqlldr sys/oracle@ocm as sysdba control=/user.txt  

注意：
1)常规导入是通过使用 INSERT语句来导入数据。Direct导入可以跳过数据库的相关逻辑而直接将数据导入到数据文件中，可以提高导入数据的性能。当然，在很多情况下，不能使用此参数(如果主键重复的话会使索引的状态变成UNUSABLE!)。
2) 通过指定 UNRECOVERABLE选项，可以关闭数据库的日志。这个选项只能和 direct 一起使用。
当加载大量数据时（大约超过10GB），最好抑制日志的产生：
SQL>ALTER TABLE RESULTXT nologging; 这样不产生REDO LOG，可以提高效率。
然后在控制文件中 load data 上面加一行：unrecoverable。此选项必须要与DIRECT共同应用。
3) 对于超大数据文件的导入就要用并发操作了，即同时运行多个导入任务.
sqlldr userid=/ control=result1.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true
sqlldr userid=/ control=result2.ctl direct=true parallel=true