source: trunk/lib/Parser.cc @ 276

Last change on this file since 276 was 276, checked in by Peter Johansson, 15 years ago

more file extensions for parsing. fixes #176

  • Property svn:eol-style set to native
  • Property svn:keywords set to Id
File size: 4.8 KB
Line 
1// $Id: Parser.cc 276 2007-05-03 09:38:05Z peter $
2
3/*
4  Copyright (C) 2006, 2007 Peter Johansson
5
6  This file is part of svndigest, http://lev.thep.lu.se/trac/svndigest
7
8  svndigest is free software; you can redistribute it and/or modify it
9  under the terms of the GNU General Public License as published by
10  the Free Software Foundation; either version 2 of the License, or
11  (at your option) any later version.
12
13  svndigest is distributed in the hope that it will be useful, but
14  WITHOUT ANY WARRANTY; without even the implied warranty of
15  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16  General Public License for more details.
17
18  You should have received a copy of the GNU General Public License
19  along with this program; if not, write to the Free Software
20  Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA
21  02111-1307, USA.
22*/
23
24#include "Parser.h"
25#include "utility.h"
26
27#include <algorithm>
28#include <functional>
29#include <fstream>
30#include <iostream>
31#include <string>
32#include <utility>
33#include <vector>
34
35namespace theplu{
36namespace svndigest{
37
38
39  Parser::Parser(const std::string& path)
40  {
41    std::ifstream is(path.c_str());
42    assert(is.good());
43    std::vector<std::pair<std::string, std::string> > codon;
44    if (match_end(path.rbegin(), path.rend(), ".ac") ||
45        match_end(path.rbegin(), path.rend(), ".am") ||
46        match_end(path.rbegin(), path.rend(), ".m4")) {
47      codon.reserve(2);
48      codon.push_back(std::make_pair("#", "\n"));
49      codon.push_back(std::make_pair("dnl", "\n"));
50      parse(is, codon);
51    }
52    else if (match_end(path.rbegin(), path.rend(), ".c") ||
53             match_end(path.rbegin(), path.rend(), ".cc") ||
54             match_end(path.rbegin(), path.rend(), ".cpp") ||
55             match_end(path.rbegin(), path.rend(), ".cxx") ||
56             match_end(path.rbegin(), path.rend(), ".h") ||
57             match_end(path.rbegin(), path.rend(), ".hh") ||
58             match_end(path.rbegin(), path.rend(), ".hpp") ||
59             match_end(path.rbegin(), path.rend(), ".java")) {
60      codon.reserve(2);
61      codon.push_back(std::make_pair("//", "\n"));
62      codon.push_back(std::make_pair("/*", "*/"));
63      parse(is, codon);
64    }
65    else if (match_end(path.rbegin(), path.rend(), ".pl") ||
66             match_end(path.rbegin(), path.rend(), ".pm") ||
67             match_end(path.rbegin(), path.rend(), ".sh") ||
68             match_end(path.rbegin(), path.rend(), "config") ||
69             file_name(path)=="bootstrap" ||
70             file_name(path)=="Makefile") {
71      codon.push_back(std::make_pair("#", "\n"));
72      parse(is,codon);
73    }
74    else if (match_end(path.rbegin(), path.rend(), ".tex") || 
75             match_end(path.rbegin(), path.rend(), ".m")) {
76      codon.push_back(std::make_pair("%", "\n"));
77      parse(is,codon);
78    }
79    else if (match_end(path.rbegin(), path.rend(), ".jsp")) {
80      codon.reserve(2);
81      codon.push_back(std::make_pair("<!--", "-->"));
82      codon.push_back(std::make_pair("<%--", "--%>"));
83      parse(is,codon);
84    }
85    else if (match_end(path.rbegin(), path.rend(), ".html") || 
86             match_end(path.rbegin(), path.rend(), ".xml") ||
87             match_end(path.rbegin(), path.rend(), ".xsl") ||
88             match_end(path.rbegin(), path.rend(), ".xsd") ||
89             match_end(path.rbegin(), path.rend(), ".xhtml") ||
90             match_end(path.rbegin(), path.rend(), ".shtml") ||
91             match_end(path.rbegin(), path.rend(), ".xml") ||
92             match_end(path.rbegin(), path.rend(), ".css") ||
93             match_end(path.rbegin(), path.rend(), ".rss") ||
94             match_end(path.rbegin(), path.rend(), ".sgml") ){
95      codon.push_back(std::make_pair("<!--", "-->"));
96      parse(is,codon);
97    }
98    else
99      text_mode(is);
100    is.close();
101  }
102
103
104  void Parser::parse(std::istream& is,
105                     std::vector<std::pair<std::string, std::string> >& codon)
106  {
107    // mode zero means we are currently not in a comment
108    // if mode!=0 comment is closed by codon[mode-1].second -> mode=0
109    // if codon[x-1].start is found and x >= mode -> mode=x
110    size_t mode = 0;
111    std::string str;
112    while(getline(is,str)) {
113      line_type lt=empty;
114      for (std::string::iterator iter=str.begin(); iter!=str.end(); ++iter){
115        for (size_t i=mode; i<codon.size(); ++i) {
116          if (match_begin(iter, str.end(), codon[i].first)) {
117            mode = i+1;
118            break;
119          }
120        }
121        assert(mode==0 || mode-1<codon.size());
122        if (mode && match_begin(iter,str.end(), codon[mode-1].second)){
123          mode=0;
124          continue;
125        }
126        // A line of code or comment must contain at least one
127        // alphanumerical character.
128        if (isalnum(*iter)) {
129          if (!mode) {
130            lt=code;
131          }
132          else if (lt!=code) {
133            lt=comment;
134          }
135        }
136      }
137      if (mode && codon[mode-1].second==std::string("\n"))
138        mode=0;
139      type_.push_back(lt);
140    }
141  }
142
143
144  void Parser::text_mode(std::istream& is)
145  {
146    std::string str;
147    while(getline(is,str)) {
148      line_type lt=empty;
149      for (std::string::iterator iter=str.begin(); iter!=str.end(); ++iter){
150        if (lt==empty && isalnum(*iter))
151          lt = comment;
152      }
153      type_.push_back(lt);
154    }
155  }
156
157
158}} // end of namespace svndigest and namespace theplu
Note: See TracBrowser for help on using the repository browser.