source: tags/0.6.8/lib/Parser.cc

Last change on this file was 731, checked in by Peter Johansson, 13 years ago

update copyright statements

  • Property svn:eol-style set to native
  • Property svn:keywords set to Id
File size: 5.0 KB
Line 
1// $Id: Parser.cc 731 2008-12-15 19:03:04Z peter $
2
3/*
4  Copyright (C) 2006, 2007 Jari Häkkinen, Peter Johansson
5  Copyright (C) 2008 Peter Johansson
6
7  This file is part of svndigest, http://dev.thep.lu.se/svndigest
8
9  svndigest is free software; you can redistribute it and/or modify it
10  under the terms of the GNU General Public License as published by
11  the Free Software Foundation; either version 2 of the License, or
12  (at your option) any later version.
13
14  svndigest is distributed in the hope that it will be useful, but
15  WITHOUT ANY WARRANTY; without even the implied warranty of
16  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
17  General Public License for more details.
18
19  You should have received a copy of the GNU General Public License
20  along with this program; if not, write to the Free Software
21  Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
22  02111-1307, USA.
23*/
24
25#include "Parser.h"
26#include "utility.h"
27
28#include <algorithm>
29#include <cassert>
30#include <functional>
31#include <fstream>
32#include <iostream>
33#include <string>
34#include <utility>
35#include <vector>
36
37namespace theplu{
38namespace svndigest{
39
40
41  Parser::Parser(std::string path)
42  {
43    std::ifstream is(path.c_str());
44    assert(is.good());
45    std::vector<std::pair<std::string, std::string> > codon;
46    // Ignore trailing '.in' in file names
47    if (match_end(path.rbegin(), path.rend(), ".in"))
48      path = path.substr(0, path.size()-3);
49    if (match_end(path.rbegin(), path.rend(), ".ac") ||
50        match_end(path.rbegin(), path.rend(), ".am") ||
51        match_end(path.rbegin(), path.rend(), ".m4")) {
52      codon.reserve(2);
53      codon.push_back(std::make_pair("#", "\n"));
54      codon.push_back(std::make_pair("dnl", "\n"));
55      parse(is, codon);
56    }
57    else if (match_end(path.rbegin(), path.rend(), ".c") ||
58             match_end(path.rbegin(), path.rend(), ".cc") ||
59             match_end(path.rbegin(), path.rend(), ".cpp") ||
60             match_end(path.rbegin(), path.rend(), ".cxx") ||
61             match_end(path.rbegin(), path.rend(), ".h") ||
62             match_end(path.rbegin(), path.rend(), ".hh") ||
63             match_end(path.rbegin(), path.rend(), ".hpp") ||
64             match_end(path.rbegin(), path.rend(), ".java")) {
65      codon.reserve(2);
66      codon.push_back(std::make_pair("//", "\n"));
67      codon.push_back(std::make_pair("/*", "*/"));
68      parse(is, codon);
69    }
70    else if (match_end(path.rbegin(), path.rend(), ".pl") ||
71             match_end(path.rbegin(), path.rend(), ".pm") ||
72             match_end(path.rbegin(), path.rend(), ".sh") ||
73             match_end(path.rbegin(), path.rend(), "config") ||
74             file_name(path)=="bootstrap" ||
75             file_name(path)=="Makefile") {
76      codon.push_back(std::make_pair("#", "\n"));
77      parse(is,codon);
78    }
79    else if (match_end(path.rbegin(), path.rend(), ".tex") || 
80             match_end(path.rbegin(), path.rend(), ".m")) {
81      codon.push_back(std::make_pair("%", "\n"));
82      parse(is,codon);
83    }
84    else if (match_end(path.rbegin(), path.rend(), ".jsp")) {
85      codon.reserve(2);
86      codon.push_back(std::make_pair("<!--", "-->"));
87      codon.push_back(std::make_pair("<%--", "--%>"));
88      parse(is,codon);
89    }
90    else if (match_end(path.rbegin(), path.rend(), ".html") || 
91             match_end(path.rbegin(), path.rend(), ".xml") ||
92             match_end(path.rbegin(), path.rend(), ".xsl") ||
93             match_end(path.rbegin(), path.rend(), ".xsd") ||
94             match_end(path.rbegin(), path.rend(), ".xhtml") ||
95             match_end(path.rbegin(), path.rend(), ".shtml") ||
96             match_end(path.rbegin(), path.rend(), ".xml") ||
97             match_end(path.rbegin(), path.rend(), ".css") ||
98             match_end(path.rbegin(), path.rend(), ".rss") ||
99             match_end(path.rbegin(), path.rend(), ".sgml") ){
100      codon.push_back(std::make_pair("<!--", "-->"));
101      parse(is,codon);
102    }
103    else
104      text_mode(is);
105    is.close();
106  }
107
108
109  void Parser::parse(std::istream& is,
110                     std::vector<std::pair<std::string, std::string> >& codon)
111  {
112    // mode zero means we are currently not in a comment
113    // if mode!=0 comment is closed by codon[mode-1].second -> mode=0
114    // if codon[x-1].start is found and x >= mode -> mode=x
115    size_t mode = 0;
116    std::string str;
117    while(getline(is,str)) {
118      line_type lt=empty;
119      for (std::string::iterator iter=str.begin(); iter!=str.end(); ++iter){
120        for (size_t i=mode; i<codon.size(); ++i) {
121          if (match_begin(iter, str.end(), codon[i].first)) {
122            mode = i+1;
123            break;
124          }
125        }
126        assert(mode==0 || mode-1<codon.size());
127        if (mode && match_begin(iter,str.end(), codon[mode-1].second)){
128          mode=0;
129          continue;
130        }
131        // A line of code or comment must contain at least one
132        // alphanumerical character.
133        if (isalnum(*iter)) {
134          if (!mode) {
135            lt=code;
136          }
137          else if (lt!=code) {
138            lt=comment;
139          }
140        }
141      }
142      if (mode && codon[mode-1].second==std::string("\n"))
143        mode=0;
144      type_.push_back(lt);
145    }
146  }
147
148
149  void Parser::text_mode(std::istream& is)
150  {
151    std::string str;
152    while(getline(is,str)) {
153      line_type lt=empty;
154      for (std::string::iterator iter=str.begin(); iter!=str.end(); ++iter){
155        if (lt==empty && isalnum(*iter))
156          lt = comment;
157      }
158      type_.push_back(lt);
159    }
160  }
161
162
163}} // end of namespace svndigest and namespace theplu
Note: See TracBrowser for help on using the repository browser.