Plugins clarin.com.ar y olx.com.ar

Publicado por oogie.boogie, Septiembre 28, 2013, 09:09:53 PM

Tema anterior - Siguiente tema

oogie.boogie

Plugin para el diario Clarin.com.ar y para la pagina OLX.com.ar

Código (cpp) [Seleccionar]
#include <iostream>
#include <cstring>
#include <vector>
#include "../utils.cpp"

// clarin.com.ar

// use this line to compile
// g++ -I. -fPIC -shared -g -o clarin.com.so clarin.com.cpp
// regex
// http.*\.clarin\.com.*(\.jpg|\.png|\.gif|\.swf)

string get_filename(string url) {
vector<string> resultado;
if (url.find("?") != string::npos) {
stringexplode(url, "?", &resultado);
stringexplode(resultado.at(resultado.size()-2), "/", &resultado);
return resultado.at(resultado.size()-1);           
} else {
stringexplode(url, "/", &resultado);
return resultado.at(resultado.size()-1);
}
}

extern "C" resposta getmatch(const string url) {
    resposta r;

if ( (url.find(".clarin.com/") != string::npos) and
     (url.find(".jpg") != string::npos) or
(url.find(".png") != string::npos) or
(url.find(".gif") != string::npos) or
(url.find(".swf") != string::npos)

) {

    r.file = get_filename(url);
if (!r.file.empty()) {
r.match = true;
r.domain = "clarin";
} else {
r.match = false;
}
} else {
r.match = false;
}
return r;
}


Código (cpp) [Seleccionar]
#include <iostream>
#include <cstring>
#include <vector>
#include "../utils.cpp"

// OLX 

// use this line to compile
// g++ -I. -fPIC -shared -g -o olx-st.com.so olx-st.com.cpp
// regex
// http.*\.olx-st\.com.*(\.jpg|\.png\.gif)

string get_filename(string url) {
vector<string> resultado;
if (url.find("?") != string::npos) {
stringexplode(url, "?", &resultado);
stringexplode(resultado.at(resultado.size()-2), "/", &resultado);
return resultado.at(resultado.size()-4) + "_" + resultado.at(resultado.size()-3) + "_" + resultado.at(resultado.size()-2) + "_" +resultado.at(resultado.size()-1);           
} else {
stringexplode(url, "/", &resultado);
return resultado.at(resultado.size()-4) + "_" + resultado.at(resultado.size()-3) + "_" + resultado.at(resultado.size()-2) + "_" +resultado.at(resultado.size()-1); ;
}
}

extern "C" resposta getmatch(const string url) {
    resposta r;   
if ( (url.find(".olx-st.com") != string::npos)
   ) {   
       r.file = get_filename(url);
      if (!r.file.empty()) {
         r.match = true; 
         r.domain = "OLX_img";
      } else {
         r.match = false;
      }
   } else {
      r.match = false;
   }
   return r;
}


Adjunto las img.
Saludos