/*
* FrenchSeoStopWordCleaner.java created on 2011-01-26
*
* Created by Brushing Bits Labs
* http://www.brushingbits.org
*
* Licensed under the Apache License, Version 2.0 (the "License");
* you may not use this file except in compliance with the License.
* You may obtain a copy of the License at
*
* http://www.apache.org/licenses/LICENSE-2.0
*
* Unless required by applicable law or agreed to in writing, software
* distributed under the License is distributed on an "AS IS" BASIS,
* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
* See the License for the specific language governing permissions and
* limitations under the License.
*/
package org.brushingbits.jnap.common.seo;
import java.util.Locale;
/**
* @author Daniel Rochetti
* @since 1.0
*/
public class FrenchSeoStopWordCleaner extends RegExpSeoStopWordCleaner {
private static final Locale[] SUPPORTED_LOCALES = new Locale[] { Locale.FRANCE, Locale.FRENCH };
private static final String[] STOP_WORDS = new String[] { "a", "adieu",
"afin", "ah", "ai", "aie", "aient", "aies", "aille", "ainsi",
"ait", "all", "alla", "allais", "allait", "allant", "alle",
"aller", "allerent", "allez", "allons", "alors", "apres", "aprcs",
"as", "assez", "au", "au-dela", "au-delr", "au-dessous",
"au-dessus", "aucun", "aucune", "aucunes", "aucuns", "aupres",
"auprcs", "auquel", "aura", "aurai", "aurais", "aurez", "auront",
"aussi", "aussitot", "autant", "autour", "autre", "autres",
"autrui", "aux", "auxquelles", "auxquels", "av", "avaient",
"avais", "avait", "aval", "avant", "avec", "avez", "avoir",
"avons", "ayant", "ayez", "ayons", "bah", "bas", "beaucoup",
"bien", "bonte", "bout", "but", "c'", "c'est-a-dire",
"c'est-r-dire", "ca", "car", "ce", "ceci", "cela", "celle",
"celle-ci", "celle-la", "celle-lr", "celles", "celles-ci",
"celles-la", "celles-lr", "celui", "celui-ci", "celui-la",
"celui-lr", "cependant", "ces", "cet", "cette", "ceux", "ceux-ci",
"ceux-la", "ceux-lr", "chacun", "chacune", "chaque", "chez",
"chut", "ci", "circa", "combien", "comme", "comment", "commme",
"compte", "contre", "crac", "crainte", "cotc", "d", "d'", "dans",
"de", "deca", "dedans", "dehors", "dela", "delr", "depuis", "des",
"desquelles", "desquels", "dessous", "dessus", "devant", "de�r",
"dire", "divers", "diverses", "donc", "dont", "du", "duquel",
"durant", "dcs", "depens", "depit", "e", "elle", "elle-meme",
"elles", "elles-memes", "en", "entre", "envers", "es", "est", "et",
"etaient", "etais", "etait", "etant", "ete", "etes", "etiez",
"etions", "etre", "eu", "eurent", "eut", "eux", "eux-memes", "fai",
"faire", "fais", "faisais", "faisait", "faisant", "faisons",
"fait", "faites", "fasse", "faute", "fera", "ferai", "ferais",
"feras", "ferez", "ferons", "firent", "fit", "font", "furent",
"fut", "he", "helas", "holr", "hors", "il", "ils", "irai", "irais",
"iras", "irons", "iront", "j'", "je", "jusqu'", "jusque", "l'",
"la", "laquelle", "le", "lequel", "les", "lesquelles", "lesquels",
"leur", "leurs", "lieu", "loin", "lors", "lorsqu'", "lorsque",
"lui", "lui-meme", "m'", "ma", "mains", "maintes", "maints",
"mais", "malgre", "me", "merci", "mes", "mien", "mienne",
"miennes", "miens", "milieu", "moi", "moi-meme", "moins", "mon",
"moyen", "meme", "memes", "na", "ne", "neanmoins", "ni", "nom.",
"nombre", "non", "nos", "notre", "notres", "nous", "nous-memes",
"on", "ont", "or", "ou", "ouais", "oude", "par", "par-dela",
"par-delr", "par-dessus", "parce", "parmi", "part", "partant",
"partir", "pas", "passe", "pendant", "personne", "peu",
"peut-etre", "plein", "plupart", "plus", "plusieurs", "plutot",
"pour", "pourquoi", "pourvu", "pres", "prises", "proche", "proie",
"prcs", "puis", "puisqu'", "puisque", "periode", "qu'", "quand",
"que", "quel", "quelconque", "quelle", "quelles", "quelqu'un",
"quelque", "quelques", "quelques-unes", "quelques-uns", "quels",
"qui", "quiconque", "quoi", "quoique", "revoici", "revoila",
"revoilr", "rien", "s'", "sa", "sais", "sans", "sauf", "se",
"sein", "selon", "sens", "sera", "serai", "serais", "seras",
"serez", "serons", "seront", "ses", "si", "sien", "sienne",
"siennes", "siens", "signe", "sinon", "soi", "soi-meme", "soient",
"sois", "soit", "sommes", "son", "sont", "souci", "sous", "soyez",
"soyons", "suis", "sur", "surtout", "sus", "ta", "tandis", "tant",
"te", "tel", "telle", "telles", "tels", "tes", "toc", "toi", "ton",
"tous", "tout", "toute", "toutes", "travers", "trop", "trcve",
"tu", "un", "une", "unes", "uns", "va", "vais", "vas", "vers",
"voici", "voie", "voila", "voilr", "vont", "vos", "vous",
"vous-meme", "vous-memes", "vu", "vue", "votre", "votres", "y", "r" };
public Locale[] getSupportedLocales() {
return SUPPORTED_LOCALES;
}
public String[] getSeoStopWords() {
return STOP_WORDS;
}
}