Loading, please wait...

Saturday, March 14, 2009

用正则验证文件名是否合法(仅限win平台)

的Java中用到文件操作时,经常要验证文件名是否合法.
我以前都是用File类的createNewFile()方法.当然,这个方法的确很管用.但当要批量验证时,总不能一个个创建文件吧.

于是想到了正则,正则匹配的开销比创建文件小了不知道多少倍.
Google了一下Win平台的文件名规则,并实践了一下.

ps: 这学期学习马哲,老师告诉我们黑格尔说的思想的运动也算是一种实践行为是不正确的.如此说来YY也不能算是实践.真是可惜.

那么一个合法的文件(Win下)应该符合如下规则 .
  1. 文件名不能为空,空在这里有两个意思


    • 文件名(包括扩展名)长度为0或仅由空字符组成(包括\t\b等不可见的转义字符)
    • 文件名和扩展名不能同时为空.但实际上我们可以用程序创建出类似.project,..txt等形式的文件,但却创建不出类似abc.的文件
  2. 文件名中不能包含\/:*?"<>|中的任意字符
  3. 文件名(包括扩展名)的长度不得大于255个字符
事实上形如".."(不包含引号,下同)的文件也不能被创建.
不合法的文件还有类似" aa", "aa ", "aa."(会被创建为"aa",也把它算作不合法),"a\ta"(\t为制表符等不可见字符(除空格外))

于是我们得到了文件名命名规则的更详细规定:
  1. 首尾不能有空字符(空格、制表符、换页符等空白字符的其中任意一个),文件名尾不能为.号
  2. 文件名和扩展名不能同时为空
  3. 文件名中不能包含\/:*?"<>|中的任意字符
  4. 文件名(包括扩展名)的长度不得大于255个字符
  5. 在1.的条件下,文件名中不能出出现除空格符外的任意空字符.出现控制字符其实也算不合法,但因为情况太复杂,就不做判断了。
于是有如下匹配
首字符: [^\s\\/:\*\?\"<>\|]
尾字符: [^\s\\/:\*\?\"<>\|\.]
其它字符: (\x20|[^\s\\/:\*\?\"<>\|])*

\s 只能匹配下面六种字符(via: java.util.regex.Pattern):
半角空格( )
水平制表符(\t)
竖直制表符
回车(\r)
换行(\n)
换页符(\f)

用Java语言实现:
public static boolean isValidFileName(String fileName) {
    if (fileName == null || fileName.length() > 255) 
        return false;
    else
        return fileName.matches(
           "[^\\s\\\\/:\\*\\?\\\"<>\\|](\\x20|[^\\s\\\\/:\\*\\?\\\"<>\\|])*[^\\s\\\\/:\\*\\?\\\"<>\\|\\.]$");
}

用于测试:
System.out.println("null(未初始化)" + "\t" + isValidFileName(null));
System.out.println(" .xml" + "\t" + isValidFileName(" .xml"));
System.out.println(".xml " + "\t" + isValidFileName(".xml "));
System.out.println(" .xml " + "\t" + isValidFileName(" .xml "));
System.out.println(".xml." + "\t" + isValidFileName(".xml."));
System.out.println(".xml" + "\t" + isValidFileName(".xml"));
System.out.println("    .xml(制表符)" + "\t" + isValidFileName("    .xml"));
System.out.println(".." + "\t" + isValidFileName(".."));
System.out.println("fdsa    fdsa(制表符)" + "\t" + isValidFileName("fdsa    fdsa(制表符)"));
System.out.println("a.txt" + "\t" + isValidFileName("a.txt"));

转载声明: 出自: Ghoul To World!作者: GreatGhoul

No comments:

Post a Comment

Note: Only a member of this blog may post a comment.