source: trunk/lib/Stats.cc @ 482

Last change on this file since 482 was 482, checked in by Peter Johansson, 14 years ago

fixes #79 and #5. Only updating changed files.

  • Property svn:eol-style set to native
  • Property svn:keywords set to Id
File size: 10.5 KB
Line 
1// $Id: Stats.cc 482 2007-10-13 01:40:38Z peter $
2
3/*
4  Copyright (C) 2005 Peter Johansson
5  Copyright (C) 2006, 2007 Jari Häkkinen, Peter Johansson
6
7  This file is part of svndigest, http://trac.thep.lu.se/trac/svndigest
8
9  svndigest is free software; you can redistribute it and/or modify it
10  under the terms of the GNU General Public License as published by
11  the Free Software Foundation; either version 2 of the License, or
12  (at your option) any later version.
13
14  svndigest is distributed in the hope that it will be useful, but
15  WITHOUT ANY WARRANTY; without even the implied warranty of
16  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
17  General Public License for more details.
18
19  You should have received a copy of the GNU General Public License
20  along with this program; if not, write to the Free Software
21  Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
22  02111-1307, USA.
23*/
24
25#include "Stats.h"
26
27#include "Functor.h"
28#include "GnuplotFE.h"
29#include "SVNblame.h"
30#include "SVNinfo.h"
31#include "utility.h"
32
33#include <algorithm>
34#include <cassert>
35#include <cstdlib>
36#include <fstream>
37#include <iostream>
38#include <iterator>
39#include <map>
40#include <numeric>
41#include <string>
42#include <sstream>
43#include <unistd.h>
44#include <utility>
45#include <vector>
46
47
48namespace theplu{
49namespace svndigest{
50
51
52  Stats::Stats(const std::string& path)
53  {
54    // Make sure latest revision is set properly
55    SVNinfo svn_info(path);
56    revision_=svn_info.rev();
57    last_changed_rev_=svn_info.last_changed_rev();
58  }
59
60
61  std::vector<u_int> Stats::accumulated(const Map_& map) const
62  {
63    // sum of all users
64    std::vector<u_int> sum(revision_+1);
65    sum=std::accumulate(map.begin(), map.end(), sum,
66                        PairValuePlus<std::string,u_int>());
67
68    // calculate accumulated sum
69    std::vector<u_int> accum(sum.size());
70    std::partial_sum(sum.begin(),sum.end(),accum.begin());
71    assert(sum.size()==accum.size());
72    return accum;
73  }
74
75  std::vector<u_int> Stats::accumulated(const Map_& map, 
76                                        const std::string& user) const
77  {
78    if (!map.count(user))
79      return std::vector<u_int>(last_changed_rev_,0);
80    std::vector<u_int> vec=(map.find(user))->second;
81
82    // static_cast to remove annoying compiler warning
83    if (vec.size() < static_cast<size_t>(revision_+1))
84      vec.insert(vec.end(), revision_+1-vec.size(), 0);
85
86    std::vector<u_int> accum(vec.size());
87    std::partial_sum(vec.begin(),vec.end(),accum.begin());
88    return accum;
89  }
90
91  void Stats::add(const std::string& user, const u_int& rev, 
92                  const Parser::line_type& lt)
93  {
94    assert(user.size());
95    authors_.insert(user);
96
97    std::vector<u_int>* total = &(total_[user]);
98    assert(total);
99    if (total->size() < rev+1){
100      total->reserve(revision_ + 1);
101      total->insert(total->end(), rev - total->size(), 0);
102      total->push_back(1);
103    }
104    else
105      ++(*total)[rev];
106
107    std::vector<u_int>* code = &(code_[user]);
108    assert(code);
109    if (code->size() < rev+1){
110      code->reserve(revision_ + 1);
111      code->insert(code->end(), rev - code->size(), 0);
112      if (lt == Parser::code)
113        code->push_back(1);
114      else 
115        code->push_back(0);
116    }
117    else if (lt == Parser::code)
118      ++(*code)[rev];
119
120    std::vector<u_int>* comments = &(comments_[user]);
121    assert(comments);
122    if (comments->size() < rev+1){
123      comments->reserve(revision_ + 1);
124      comments->insert(comments->end(), rev - comments->size(), 0);
125      if (lt == Parser::comment)
126        comments->push_back(1);
127      else 
128        comments->push_back(0);
129    }
130    else if (lt == Parser::comment)
131      ++(*comments)[rev];
132
133    std::vector<u_int>* empty = &(empty_[user]);
134    assert(empty);
135    if (empty->size() < rev+1){
136      empty->reserve(revision_ + 1);
137      empty->insert(empty->end(), rev - empty->size(), 0);
138      if (lt == Parser::empty)
139        empty->push_back(1);
140      else 
141        empty->push_back(0);
142    }
143    else if (lt == Parser::empty)
144      ++(*empty)[rev];
145  }
146
147
148  bool Stats::load_cache(std::istream& is)
149  {
150    svn_revnum_t rev;
151    is >> rev;
152    if (rev<last_changed_rev_){
153      return false; // cache is not up to date
154    }
155    size_t a_size=0;
156    authors_.clear();
157    is >> a_size;
158    std::string str;
159    while (authors_.size()<a_size){
160      getline(is, str);
161      assert(str.size());
162      authors_.insert(str);
163    }
164    getline(is, str);
165    if (str!=code_cache()){
166      return false;
167    }
168    load(is, code_);
169    getline(is, str);
170    getline(is, str);
171    if (str!=comments_cache()){
172      return false;
173    }
174    load(is, comments_);
175    getline(is, str);
176    getline(is, str);
177    if (str!=empty_cache()){
178      return false;
179    }
180    load(is, empty_);
181    getline(is, str);
182    getline(is, str);
183    if (str!=total_cache()){
184      return false;
185    }
186    load(is, total_);
187    getline(is,str);
188    getline(is,str);
189    return str==end_of_cache();
190  }
191
192
193  void Stats::load(std::istream& is, Map_& m)
194  {
195    m.clear();
196    while (m.size() < authors_.size() && is.good()) {
197      std::string name;
198      std::getline(is, name);
199      assert(name.size());
200      std::vector<u_int>& vec=m[name];
201      size_t revs=0;
202      is >> revs;
203      vec.reserve(revs);
204      while (vec.size() < revs) {
205        u_int tmp;
206        is >> tmp;
207        vec.push_back(tmp);
208      }
209    }
210  }
211
212
213  void Stats::parse(const std::string& path)
214  {
215    Parser parser(path);
216    std::vector<Parser::line_type>::const_iterator count=parser.type().begin();
217
218    SVNblame svn_blame(path);
219    while (svn_blame.valid()) {
220      add(svn_blame.author(), svn_blame.revision(), *count);
221      svn_blame.next_line();
222      ++count;
223    }
224   
225  }
226
227
228  std::string Stats::plot(const std::string& filename,
229                          const std::string& linetype) const
230  {
231    plot_init(filename);
232    GnuplotFE* gp=GnuplotFE::instance();
233    const Map_* stat=NULL;
234    if (linetype=="total")
235      stat = &total_;
236    else if (linetype=="code")
237      stat = &code_;
238    else if (linetype=="comments")
239      stat = &comments_;
240    else if (linetype=="empty")
241      stat = &empty_;
242    assert(stat);
243    std::vector<u_int> total=accumulated(*stat);   
244    double yrange_max=1.03*total.back()+1;
245    gp->yrange(yrange_max);
246
247    typedef std::vector<std::pair<std::string, std::vector<u_int> > > vec_type;
248    vec_type author_cont;
249    author_cont.reserve(stat->size());
250    for (MapConstIter_ i= stat->begin(); i != stat->end(); ++i) {
251      author_cont.push_back(std::make_pair(i->first,
252                                           accumulated(*stat,i->first)));
253    }
254
255    LessReversed<std::vector<u_int> > lr;
256    PairSecondCompare<std::string, std::vector<u_int>, 
257      LessReversed<std::vector<u_int> > > compare(lr);
258    std::sort(author_cont.begin(), author_cont.end(), compare);
259
260    size_t plotno=author_cont.size();
261    std::stringstream ss;
262    vec_type::iterator end(author_cont.end());
263    for (vec_type::iterator i(author_cont.begin()); i!=end; ++i) {
264      ss.str("");
265      ss << "set key height " << 2*plotno;
266      gp->command(ss.str());
267      ss.str("");
268      ss << i->second.back() << " " << i->first;
269      gp->yrange(yrange_max);
270      gp->linetitle(ss.str());
271      ss.str("");
272      ss << "steps " << --plotno+2;
273      gp->linestyle(ss.str());
274      gp->plot(i->second);
275    }
276    ss.str("");
277    ss << total.back() << " total";
278    gp->command("set key height 0");
279    gp->linetitle(ss.str());
280    gp->linestyle("steps 1");
281    gp->plot(total);
282
283    gp->command("unset multiplot");
284    gp->yrange();
285
286    return filename;
287  }
288
289
290  void Stats::plot_init(const std::string& filename) const
291  {
292    GnuplotFE* gp=GnuplotFE::instance();
293    gp->command("set term png");
294    gp->command("set output '"+filename+"'");
295    gp->command("set xtics nomirror");
296    gp->command("set ytics nomirror");
297    gp->command("set key default");
298    gp->command("set key left Left reverse");
299    gp->command("set multiplot");
300  }
301
302
303  void Stats::plot_summary(const std::string& filename) const
304  {
305    plot_init(filename);
306    GnuplotFE* gp=GnuplotFE::instance();
307    std::vector<u_int> total=accumulated(total_);   
308    double yrange_max=1.03*total.back()+1;
309    gp->yrange(yrange_max);
310    std::stringstream ss;
311   
312    ss.str("");
313    std::vector<u_int> x=accumulated(code_);   
314    ss << x.back() << " code";
315    gp->command("set key height 2");
316    gp->linetitle(ss.str());
317    gp->linestyle("steps 2");
318    gp->plot(x);
319
320    ss.str("");
321    x=accumulated(comments_);   
322    ss << x.back() << " comment";
323    gp->command("set key height 4");
324    gp->linetitle(ss.str());
325    gp->linestyle("steps 3");
326    gp->plot(x);
327
328    ss.str("");
329    x=accumulated(empty_);   
330    ss << x.back() << " other";
331    gp->command("set key height 6");
332    gp->linetitle(ss.str());
333    gp->linestyle("steps 4");
334    gp->plot(x);
335
336    ss.str("");
337    ss << total.back() << " total";
338    gp->command("set key height 0");
339    gp->linetitle(ss.str());
340    gp->linestyle("steps 1");
341    gp->plot(total);
342
343    gp->command("unset multiplot");
344    gp->yrange();
345  }
346
347
348  void Stats::print(std::ostream& os) const
349  {
350    os << last_changed_rev_ << " ";
351    os << authors_.size() << " ";
352
353    std::copy(authors_.begin(), authors_.end(), 
354              std::ostream_iterator<std::string>(os, "\n"));
355    os << code_cache() << "\n";
356    print(os, code_);
357    os << "\n" << comments_cache() << "\n";
358    print(os, comments_);
359    os << "\n" << empty_cache() << "\n";
360    print(os, empty_);
361    os << "\n" << total_cache() << "\n";
362    print(os, total_);
363    os << "\n" << end_of_cache() << "\n";
364  }
365
366
367  void Stats::print(std::ostream& os, const Map_& m) const
368  {
369    for (MapConstIter_ i(m.begin()); i!=m.end(); ++i){
370      os << i->first << "\n";
371      os << i->second.size() << " ";
372      std::copy(i->second.begin(), i->second.end(),
373                std::ostream_iterator<u_int>(os, " "));
374    }
375  }
376
377
378  Stats& Stats::operator+=(const Stats& other)
379  {
380    for (MapConstIter_ o_i= other.code_.begin(); 
381         o_i != other.code_.end(); ++o_i)
382    {
383      std::pair<MapIter_,bool> result = code_.insert(*o_i);
384      if (!result.second)
385        code_[(*(result.first)).first] = 
386          VectorPlus<u_int>()( (*(result.first)).second, (*o_i).second );
387 
388    }
389 
390    for (MapConstIter_ o_i= other.comments_.begin(); 
391         o_i != other.comments_.end(); ++o_i)
392    {
393      std::pair<MapIter_,bool> result = comments_.insert(*o_i);
394      if (!result.second)
395        comments_[(*(result.first)).first] = 
396          VectorPlus<u_int>()( (*(result.first)).second, (*o_i).second );
397 
398    }
399   
400    for (MapConstIter_ o_i= other.empty_.begin(); 
401         o_i != other.empty_.end(); ++o_i)
402    {
403      std::pair<MapIter_,bool> result = empty_.insert(*o_i);
404      if (!result.second)
405        empty_[(*(result.first)).first] = 
406          VectorPlus<u_int>()( (*(result.first)).second, (*o_i).second );
407 
408    }
409   
410    for (MapConstIter_ o_i= other.total_.begin(); 
411         o_i != other.total_.end(); ++o_i)
412    {
413      std::pair<MapIter_,bool> result = total_.insert(*o_i);
414      if (!result.second)
415        total_[(*(result.first)).first] = 
416          VectorPlus<u_int>()( (*(result.first)).second, (*o_i).second );
417 
418    }
419   
420    if (!other.authors().empty())
421      authors_.insert(other.authors().begin(), other.authors().end());
422    return *this;
423  }
424
425}} // end of namespace svndigest and namespace theplu
Note: See TracBrowser for help on using the repository browser.