需求:将当前目录(fake)下1000 个含数字的文件名分为400+400+200 三组,并分别存放在3个文本文档中。需要包含父目录。 文件名形如 fake_face_0959.jpg

$ls 

获取文件列表

可以列出当前文件夹下的100个文件名,但是不含父目录.

$ls ../fake/* >fake_all_list.txt

可以列出父目录,但是保存的结果会多出../,形如 ../fake/fake_face_0999.jpg 使用cut 命令

$ls ../fake/* | cut -d "/" -f 2- > fake_all_list.txt

-d 定界符 来分割字符串 -f 选择切割后的字段,-f 2 即选择第二段,-f 2- 是选择2段至末尾

拆分成3组

用正则表达式按找文件名中的数字分组,末尾0,1,2,3分为一组,4-7,8-9 为另外两组。 直接用grep 过滤出来的结果带有行号,grep -E 使用正则表达式

$grep -rnE [0-3].jpg fake_all_list.txt
994:fake/fake_face_0993.jpg

还是使用cut 命令,从分号处切割字符串

$grep -rnE [0-3].jpg fake_all_list.txt | cut -d : -f 2-> fake_data_1.txt 
fake/fake_face_0993.jpg

解决