小白のjava实现wc.exe功能

2021-07-02 08:06

阅读:1256

标签:equal   info   getc   pattern   array   斜杠   blank   计数   new   

GitHub地址


 项目完成情况

  基本功能列表(已实现)

    wc.exe -c file.c     //返回文件 file.c 的字符数

    wc.exe -w file.c    //返回文件 file.c 的词的数目 

    wc.exe -l file.c      //返回文件 file.c 的行数

  扩展功能(已实现)

        -s   递归处理目录下符合条件的文件。
        -a   返回更复杂的数据(代码行 / 空行 / 注释行)。

      空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。

      代码行:本行包括多于一个字符的代码。

      注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:

          } //注释
      在这种情况下,这一行属于注释行。

      [file_name]: 文件或目录名,可以处理一般通配符。

  高级功能(未实现)

    -x 参数。这个参数单独使用。如果命令行有这个参数,则程序会显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。

    需求举例:
      wc.exe -s -a *.c        返回当前目录及子目录中所有*.c 文件的代码行数、空行数、注释行数。

PSP2.1表格预估

技术分享图片

解题思路 

  用java实现wc.exe文件:实现3个基本功能,必须通过输入流接收文件内容。实现“-s”扩展功能,则需要通过递归,将文件名存入字符串列表,之后循环输出。实现“-a”扩展功能,我的思路是用readLine()方法将源文件一行一行接收,然后通过条件语句判断;而判断的顺序是:先判断是否是空行,再判断是否为注释行,除去这两种,剩下的就都是代码行了。

代码说明

  统计字符数方法:countCharacter()

    filePath:文件路径

    用BufferedReader中的read()方法读取字符并进行判断:是否为可以用键盘键入的字符【ASCII码大于等于32,且不等于127(DEL)】,如果是,字符数加1。

1 public void countCharacter(String filePath) throws IOException {
2     int character=0;
3     BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(filePath),"gb2312"));
4     int i;
5     while(-1!=(i=br.read()))
6         if(i>=32&&i!=127) character++;//只计入键盘输入的字符
7     br.close();
8     System.out.println("字符数:"+character);
9 }

  统计行数方法:countLine()

    filePath:文件路径

    用BufferedReader中的readLine()方法读取每行字符,每读取一行,行数加1。

1 public void countLine(String filePath) throws IOException {
2     int line=0;
3     BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(filePath),"gb2312"));
4     while(null!=br.readLine()) line++;
5     br.close();
6     System.out.println("行数:"+line);
7 }

  统计单词数方法:countWord()

    filePath:文件路径

    用BufferedReader中的readLine()方法读取一行字符并存入str中,然后用replaceAll()方法将字符串中,非字母、单引号(‘)、下划线(_)、连接符(-)的字符替换成空格,再用split()分隔成字符串数组,统计数组中包含字母的字符串的数目即为该行字符的单词数,循环该流程得出整个源文件的单词数。

 1 public void countWord(String filePath) throws IOException {
 2     int word=0;
 3     BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(filePath),"gb2312"));
 4     String str="";
 5     while(null!=(str=br.readLine())){
 6         str=str.replaceAll("[^A-Za-z‘_-]"," ");   //将不是字母、单引号、下划线、连接符的字符替换成空格
 7         for(String s:str.split(" "))   //用空格分隔字符串
 8             if(Pattern.matches(".*[A-Za-z]+.*",s)) word++;  //字符串包含字母,就算是单词
 9     }
10     br.close();
11     System.out.println("单词数:"+word);
12 }

  统计代码行、空行、注释行:getCount()

    filePath:文件路径

    用BufferedReader中的readLine()方法读取每行字符并用replaceAll()方法,将非字母、斜杠(/)、星号(*)的字符都换成空字符,再存入字符串数组中。遍历字符串数组判断归类为代码行、空行、注释行:空字符串即为空行;以双斜杠(//)开头,或(/*)开头(*/)结尾之间的字符串都为注释行;剩下的就是代码行了。

 1 public void getCount(String filePath) throws IOException {
 2     int codeLine=0,blankLine=0,commentLine=0;
 3     BufferedReader br=new BufferedReader(new InputStreamReader(new FileInputStream(filePath),"gb2312"));
 4     String str="";
 5     List strs=new ArrayList();
 6     boolean sign=false;
 7     while(null!=(str=br.readLine()))
 8         strs.add(str.replaceAll("[^A-Za-z/*]",""));
 9     for(int i=0;i){
10         //空行
11         if(strs.get(i).equals("")&&sign==false) blankLine++;
12         //单行注释
13         else if(strs.get(i).startsWith("//")&&sign==false) commentLine++;
14         //多行注释
15         else if(strs.get(i).startsWith("/*")||sign==true){
16             commentLine++;
17             sign=true;
18         } else if(strs.get(i).endsWith("*/")&&sign==true){
19             commentLine++;
20             sign=false;
21         }
22         //代码行
23         else codeLine++;
24     }
25     System.out.println("代码行:"+codeLine);
26     System.out.println("空行:"+blankLine);
27     System.out.println("注释行:"+commentLine);
28     br.close();
29 }

  递归获取目录下符合条件的文件

    file:以文件夹路径实例化的File实例

    paths:用于存文件路径的字符串数组

    flag:要获取的文件的格式

    返回结果:存有获取文件的路径的字符串数组

    遍历file通过listFiles()方法提取出的File数组,用path接收File数组每个File元素的路径。判断路径是否以文件格式flag结尾:是就加入字符串数组paths;否则就判断路径是否是目录路径,是就通过递归执行该方法。

 1 public List getFiles(File file,List paths,String flag) {
 2     File[] files=file.listFiles();
 3     if(null==files) return paths;
 4     for(File f:files){
 5         String path=f.getPath();
 6         if(path.endsWith(flag)) paths.add(path);
 7         if(f.isDirectory()) getFiles(f,paths,flag);
 8     }
 9     return paths;
10 }

测试运行

  a.java为空文件

 技术分享图片

  a.java为一个源文件

                a.java
1
/******************************************************* 2 Hello World 3 *******************************************************/ 4 public void main(String[] args) { 5 6 //HelloWorld.java 7 8 System.out.println("HelloWorld");//HelloWorld.java 9 }

 技术分享图片

  查找D盘下所有以.java结尾的文件

技术分享图片

项目小结

  这是我第一次这么系统地完成一个项目。以前都是读完题目要求就直接敲代码,并没有去进行详细地分析,也没有计时。而现在能清楚地看到自己做一个项目所花的时间要比自己预估的时间要长,这点就必须改进,而且要学会更好地判断预估自己的能力。

  而在测试过程中发现在递归查找文件的算法耗时较多,不过目前没有较好的解决方案,期待日后能得以解决。

 

 

----------码场小白,求轻喷T T----------

小白のjava实现wc.exe功能

标签:equal   info   getc   pattern   array   斜杠   blank   计数   new   

原文地址:https://www.cnblogs.com/lqkStudy/p/9627237.html


评论


亲,登录后才可以留言!