Plugin para el diario Clarin.com.ar y para la pagina OLX.com.ar
#include <iostream>
#include <cstring>
#include <vector>
#include "../utils.cpp"
// clarin.com.ar
// use this line to compile
// g++ -I. -fPIC -shared -g -o clarin.com.so clarin.com.cpp
// regex
// http.*\.clarin\.com.*(\.jpg|\.png|\.gif|\.swf)
string get_filename(string url) {
vector<string> resultado;
if (url.find("?") != string::npos) {
stringexplode(url, "?", &resultado);
stringexplode(resultado.at(resultado.size()-2), "/", &resultado);
return resultado.at(resultado.size()-1);
} else {
stringexplode(url, "/", &resultado);
return resultado.at(resultado.size()-1);
}
}
extern "C" resposta getmatch(const string url) {
resposta r;
if ( (url.find(".clarin.com/") != string::npos) and
(url.find(".jpg") != string::npos) or
(url.find(".png") != string::npos) or
(url.find(".gif") != string::npos) or
(url.find(".swf") != string::npos)
) {
r.file = get_filename(url);
if (!r.file.empty()) {
r.match = true;
r.domain = "clarin";
} else {
r.match = false;
}
} else {
r.match = false;
}
return r;
}
#include <iostream>
#include <cstring>
#include <vector>
#include "../utils.cpp"
// OLX
// use this line to compile
// g++ -I. -fPIC -shared -g -o olx-st.com.so olx-st.com.cpp
// regex
// http.*\.olx-st\.com.*(\.jpg|\.png\.gif)
string get_filename(string url) {
vector<string> resultado;
if (url.find("?") != string::npos) {
stringexplode(url, "?", &resultado);
stringexplode(resultado.at(resultado.size()-2), "/", &resultado);
return resultado.at(resultado.size()-4) + "_" + resultado.at(resultado.size()-3) + "_" + resultado.at(resultado.size()-2) + "_" +resultado.at(resultado.size()-1);
} else {
stringexplode(url, "/", &resultado);
return resultado.at(resultado.size()-4) + "_" + resultado.at(resultado.size()-3) + "_" + resultado.at(resultado.size()-2) + "_" +resultado.at(resultado.size()-1); ;
}
}
extern "C" resposta getmatch(const string url) {
resposta r;
if ( (url.find(".olx-st.com") != string::npos)
) {
r.file = get_filename(url);
if (!r.file.empty()) {
r.match = true;
r.domain = "OLX_img";
} else {
r.match = false;
}
} else {
r.match = false;
}
return r;
}
Adjunto las img.
Saludos