source: trunk/src/ROC.cc @ 102

Last change on this file since 102 was 102, checked in by Peter, 19 years ago

Fixed bug in interface between InputRanker? & ROC

  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 2.8 KB
Line 
1// $Id: ROC.cc 102 2004-06-15 09:40:52Z peter $
2
3// System includes
4//#include <algorithm>
5//#include <utility>
6//#include <vector>
7
8// Thep C++ Tools
9#include "ROC.h"
10#include "stl_utility.h"
11#include "vector.h"
12
13namespace theplu {
14namespace cpptools { 
15
16  ROC::ROC(const gslapi::vector& target, const gslapi::vector& value) 
17 
18    : Score(), value_(), nof_pos_(0), minimum_size_(10), area_(-1)
19   
20  {
21    for (unsigned int i=0; i<target.size(); i++){
22      int targ=static_cast<int>(target(i));
23      std::pair<int, double> tmp(targ, value(i));
24      value_.push_back(tmp);
25      if (targ==1)
26        nof_pos_++;
27    }
28    sort(value_.begin(),value_.end(),
29         pair_value_compare<int,double>());
30   
31  }
32
33  ROC::ROC() 
34    : Score(), value_(), nof_pos_(0), minimum_size_(10), area_(-1)
35       
36  {
37  }
38
39
40  double ROC::score(const gslapi::vector& target, const gslapi::vector& value)
41  {
42    for (unsigned int i=0; i<target.size(); i++){
43      int targ=static_cast<int>(target(i));
44      std::pair<int, double> tmp(targ, value(i));
45      value_.push_back(tmp);
46      if (targ==1)
47        nof_pos_++;
48    }
49    sort(value_.begin(),value_.end(),
50         pair_value_compare<int,double>());
51    double area_=0;
52    for (unsigned int i=0; i<value_.size(); i++)
53      if (value_[i].first==1)
54        area_+=i;
55    // Normalizing the area to 0-1
56    area_ = (area_/nof_pos_ - (nof_pos_ - 1)/2 )/(value_.size() - nof_pos_);
57
58    return area_;
59  }
60
61  double ROC::score()
62  {
63    if (area_==-1){
64      double area_=0;
65      for (unsigned int i=0; i<value_.size(); i++)
66        if (value_[i].first==1)
67          area_+=i;
68      // Normalizing the area to 0-1
69      area_ = (area_/nof_pos_ - (nof_pos_ - 1)/2 )/(value_.size() - nof_pos_);
70    }
71    return area_;
72  }
73
74
75  double ROC::p_value(void)
76  {
77    if (area_==-1)
78      area_ = score();
79    double p;
80    if (nof_pos_ < minimum_size_ & value_.size()-nof_pos_ < minimum_size_)
81      p = get_p_exact(area_*nof_pos_*(value_.size()-nof_pos_), 
82                          nof_pos_, value_.size()-nof_pos_);
83    else
84    p = get_p_approx(area_);
85    return p;
86  }
87
88
89  double ROC::get_p_approx(const double area) const
90  {
91    double x = area - 0.5;
92    // Not integrating from the middle of the bin, but from the inner edge.
93    if (x>0)
94      x -= 0.5/nof_pos_/(value_.size()-nof_pos_);
95    else if(x<0)
96      x += 0.5/nof_pos_/(value_.size()-nof_pos_);
97
98    double sigma = (std::sqrt((value_.size()-nof_pos_)* nof_pos_ *
99                        (value_.size()+1)/12) /
100                    (value_.size() - nof_pos_ ) / nof_pos_);
101    double p = gsl_cdf_gaussian_Q(x, sigma);
102       
103    return p;
104  }
105
106
107  double ROC::get_p_exact(const double block, const double nof_pos, 
108                            const double nof_neg)
109  {
110    double p;
111    if (block <= 0.0)
112      p = 1.0;
113    else if (block > nof_neg*nof_pos)
114      p = 0.0;
115    else {
116      double p1 = get_p_exact(block-nof_neg, nof_pos-1, nof_neg);
117      double p2 = get_p_exact(block, nof_pos, nof_neg-1);
118      p = nof_pos/(nof_pos+nof_neg)*p1 + nof_neg/(nof_pos+nof_neg)*p2;
119    }
120    return p;
121  }
122
123}} // of namespace cpptools and namespace theplu
Note: See TracBrowser for help on using the repository browser.