Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
12 changes: 12 additions & 0 deletions stemm_es.php
Original file line number Diff line number Diff line change
Expand Up @@ -196,5 +196,17 @@ function stemm($word) {

return stemm_es::removeAccent($word);
}

function stemmp($paragraph){
$results=array();
$word=strtok($paragraph, " \n\t\r");
while($word!== false){
// Clean
$word=preg_replace('/[^A-Za-z0-9áéúüóíñ ]/', '', strtolower($word));
array_push($results,stemm_es::stemm($word));
$word= strtok(" \n\t\r");
}
return $results;
}
}
?>
6 changes: 6 additions & 0 deletions stemmp_test.php
Original file line number Diff line number Diff line change
@@ -0,0 +1,6 @@
<?php
require_once 'stemm_es.php';
$string = "Fue un domingo. En el Teatro Royal del sector céntrico de la capital del Cesar se entretenían con la película ‘En busca del oro perdido’. Mientras tanto, al otro lado de la calle alrededor de 30 personas (con participación directa e indirecta) se apoderaban de 24.072 millones de pesos (unos 30 millones de dólares) producto de las consignaciones de fin de semana de las entidades bancarias del centro y norte del Cesar, y del sur de La Guajira.";

echo var_dump(stemm_es::stemmp($string));
?>