如何导入SAS中的多个.dbf文件

如何导入SAS中的多个.dbf文件

问题描述:

%let dirname = C:\Users\data; 
filename DIRLIST pipe 'dir/B &dirname\*.dbf'; 

/* Create a data set with one observation for each file name */ 
data dirlist; 
    length fname $8.; 
    infile dirlist length=reclen; 
    input fname $8.; 
run; 

data all_text (drop=fname); 
set dirlist; 
filepath = "&dirname\"||fname||".dbf"; 
infile dummy filevar = filepath length=reclen end=done missover; 
do while(not done);  
INPUT 
F1    : 2. 
F2    : 2. 
F3    : 2. 
F4    : 10. 
F5    : 4.; 
output;   
end;  
run; 

问题是,它只是读取每个文件的第一行,而不是整个文件,然后再转到下一个文件。变量F1也显示为丢失。如何导入SAS中的多个.dbf文件

欢迎提出建议

+0

我试图使用宏和管道在SAS中导入多个.dbf文件。我之前已经使用在线提供的标准代码,针对不同的文件格式完成此操作,但我无法为.dbf文件执行此操作。 我的数据结构如下,它对于所有文件 变量都是一样的:A-数字长度2; B - 数字长度2; c - 数字长度2; D - 最大数字长度10;电子数字长度4; 此外,每个文件名都遵循xxx_xxxx.dbf –

+0

您的代码用于读取文本文件。要读取DBF文件,请使用PROC IMPORT而不是DATA STEP。 – Tom

+0

我相信我一次可以对一个文件使用PROC IMPORT。但是我需要导入超过300个.dbf文件并将其附加到一个文件中。使用PROC IMPORT进行编码的示例代码将非常有帮助 –

所以一个标准的PROC进口将是:

proc import out=sample1 datafile="path to dbf file.dbf" dbms=DBF replace; 
run; 

现在的问题,是如何产生这组代码在文件列表中的每个文件。使用@Tom的CALL EXECUTE语句是你最好的选择。您也可以使用CALL EXECUTE创建一个小宏,并为每个文件名调用它。如果您是SAS新手,可以更容易理解。

*Create a macro that imports the DBF 

%macro import_dbf(input= , output=); 

    proc import out=&out datafile="&output" dbms=DBF replace; 
run; 

%mend; 

然后从数据集中调用宏。我正在命名数据集DBF001,DBF0002等。

%let dirname=C:\_localdata; 

data dirlist; 
    informat fname $20.; 
    input fname; 
    cards; 
    data1.dbf 
    data2.dbf 
    data3.dbf 
    data4.dbf 
    ; 
run; 

data out; 
    set dirlist; 
    str=catt('%import_dbf(input="', "&dirname", '\', fname, '", output=dbf', 
     put(_n_, z4.), ');'); 
run; 

proc print data=out; 
run; 

将它们一个一个地导入然后合并它们。

%let dirname = C:\Users\data; 
data filelist ; 
    infile "dir /b &dirname\*.dbf" pipe truncover end=eof; 
    fileno + 1; 
    input fname $256. ; 
    tempname = 'temp'||put(fileno,z4.); 
    call execute(catx(' ','proc import replace dbms=dbf' 
     ,'out=',tempname,'datafile=',quote(trim(fname)),';run;' 
)); 
    if eof then call symputx('lastname',tempname); 
run; 
data want ; 
    set temp0001-&lastname; 
run;