Update to 2.7.3
[profile/ivi/python.git] / Tools / scripts / byext.py
1 #! /usr/bin/env python
2
3 """Show file statistics by extension."""
4
5 import os
6 import sys
7
8 class Stats:
9
10     def __init__(self):
11         self.stats = {}
12
13     def statargs(self, args):
14         for arg in args:
15             if os.path.isdir(arg):
16                 self.statdir(arg)
17             elif os.path.isfile(arg):
18                 self.statfile(arg)
19             else:
20                 sys.stderr.write("Can't find %s\n" % arg)
21                 self.addstats("<???>", "unknown", 1)
22
23     def statdir(self, dir):
24         self.addstats("<dir>", "dirs", 1)
25         try:
26             names = sorted(os.listdir(dir))
27         except os.error as err:
28             sys.stderr.write("Can't list %s: %s\n" % (dir, err))
29             self.addstats("<dir>", "unlistable", 1)
30             return
31         for name in names:
32             if name.startswith(".#"):
33                 continue # Skip CVS temp files
34             if name.endswith("~"):
35                 continue# Skip Emacs backup files
36             full = os.path.join(dir, name)
37             if os.path.islink(full):
38                 self.addstats("<lnk>", "links", 1)
39             elif os.path.isdir(full):
40                 self.statdir(full)
41             else:
42                 self.statfile(full)
43
44     def statfile(self, filename):
45         head, ext = os.path.splitext(filename)
46         head, base = os.path.split(filename)
47         if ext == base:
48             ext = "" # E.g. .cvsignore is deemed not to have an extension
49         ext = os.path.normcase(ext)
50         if not ext:
51             ext = "<none>"
52         self.addstats(ext, "files", 1)
53         try:
54             f = open(filename, "rb")
55         except IOError as err:
56             sys.stderr.write("Can't open %s: %s\n" % (filename, err))
57             self.addstats(ext, "unopenable", 1)
58             return
59         data = f.read()
60         f.close()
61         self.addstats(ext, "bytes", len(data))
62         if b'\0' in data:
63             self.addstats(ext, "binary", 1)
64             return
65         if not data:
66             self.addstats(ext, "empty", 1)
67         #self.addstats(ext, "chars", len(data))
68         lines = data.splitlines()
69         self.addstats(ext, "lines", len(lines))
70         del lines
71         words = data.split()
72         self.addstats(ext, "words", len(words))
73
74     def addstats(self, ext, key, n):
75         d = self.stats.setdefault(ext, {})
76         d[key] = d.get(key, 0) + n
77
78     def report(self):
79         exts = sorted(self.stats.keys())
80         # Get the column keys
81         columns = {}
82         for ext in exts:
83             columns.update(self.stats[ext])
84         cols = sorted(columns.keys())
85         colwidth = {}
86         colwidth["ext"] = max([len(ext) for ext in exts])
87         minwidth = 6
88         self.stats["TOTAL"] = {}
89         for col in cols:
90             total = 0
91             cw = max(minwidth, len(col))
92             for ext in exts:
93                 value = self.stats[ext].get(col)
94                 if value is None:
95                     w = 0
96                 else:
97                     w = len("%d" % value)
98                     total += value
99                 cw = max(cw, w)
100             cw = max(cw, len(str(total)))
101             colwidth[col] = cw
102             self.stats["TOTAL"][col] = total
103         exts.append("TOTAL")
104         for ext in exts:
105             self.stats[ext]["ext"] = ext
106         cols.insert(0, "ext")
107         def printheader():
108             for col in cols:
109                 print("%*s" % (colwidth[col], col), end=" ")
110             print()
111         printheader()
112         for ext in exts:
113             for col in cols:
114                 value = self.stats[ext].get(col, "")
115                 print("%*s" % (colwidth[col], value), end=" ")
116             print()
117         printheader() # Another header at the bottom
118
119 def main():
120     args = sys.argv[1:]
121     if not args:
122         args = [os.curdir]
123     s = Stats()
124     s.statargs(args)
125     s.report()
126
127 if __name__ == "__main__":
128     main()