/*
* PortugueseSeoStopWordCleaner.java created on 2011-01-26
*
* Created by Brushing Bits Labs
* http://www.brushingbits.org
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
package org.brushingbits.jnap.common.seo;
import java.util.Locale;
/**
* @author Daniel Rochetti
* @since 1.0
*/
public class PortugueseSeoStopWordCleaner extends RegExpSeoStopWordCleaner {
private static final Locale PORTUGUESE = new Locale("pt");
private static final Locale PORTUGUESE_BRAZIL = new Locale("pt", "BR");
private static final Locale[] SUPPORTED_LOCALES = new Locale[] {
PORTUGUESE, PORTUGUESE_BRAZIL };
private static final String[] STOP_WORDS = new String[] { "a", "agora",
"ainda", "alguem", "algum", "alguma", "algumas", "alguns", "ampla",
"amplas", "amplo", "amplos", "ante", "antes", "ao", "aos", "apos",
"aquela", "aquelas", "aquele", "aqueles", "aquilo", "as", "ate",
"atraves", "cada", "coisa", "coisas", "com", "como", "contra",
"contudo", "da", "daquele", "daqueles", "das", "de", "dela",
"delas", "dele", "deles", "depois", "dessa", "dessas", "desse",
"desses", "desta", "destas", "deste", "destes", "deve", "devem",
"devendo", "dever", "devera", "deverao", "deveria", "deveriam",
"devia", "deviam", "disse", "disso", "disto", "dito", "diz",
"dizem", "do", "dos", "e", "ela", "elas", "ele", "eles", "em",
"enquanto", "entre", "era", "essa", "essas", "esse", "esses",
"esta", "estamos", "estao", "estas", "estava", "estavam",
"estavamos", "este", "estes", "estou", "eu", "fazendo", "fazer",
"feita", "feitas", "feito", "feitos", "foi", "for", "foram",
"fosse", "fossem", "grande", "grandes", "ha", "isso", "isto", "ja",
"la", "lhe", "lhes", "lo", "mas", "me", "mesma", "mesmas", "mesmo",
"mesmos", "meu", "meus", "minha", "minhas", "muita", "muitas",
"muito", "muitos", "na", "nao", "nas", "nem", "nenhum", "nessa",
"nessas", "nesta", "nestas", "ninguem", "no", "nos", "nossa",
"nossas", "nosso", "nossos", "num", "numa", "nunca", "o", "os",
"ou", "outra", "outras", "outro", "outros", "para", "pela",
"pelas", "pelo", "pelos", "pequena", "pequenas", "pequeno",
"pequenos", "per", "perante", "pode", "pude", "podendo", "poder",
"poderia", "poderiam", "podia", "podiam", "pois", "por", "porem",
"porque", "posso", "pouca", "poucas", "pouco", "poucos",
"primeiro", "primeiros", "propria", "proprias", "proprio",
"proprios", "quais", "qual", "quando", "quanto", "quantos", "que",
"quem", "sao", "se", "seja", "sejam", "sem", "sempre", "sendo",
"sera", "serao", "seu", "seus", "si", "sido", "so", "sob", "sobre",
"sua", "suas", "talvez", "tambem", "tampouco", "te", "tem",
"tendo", "tenha", "ter", "teu", "teus", "ti", "tido", "tinha",
"tinham", "toda", "todas", "todavia", "todo", "todos", "tu", "tua",
"tuas", "tudo", "ultima", "ultimas", "ultimo", "ultimos", "um",
"uma", "umas", "uns", "vendo", "ver", "vez", "vindo", "vir", "vos" };
public Locale[] getSupportedLocales() {
return SUPPORTED_LOCALES;
}
public String[] getSeoStopWords() {
return STOP_WORDS;
}
}