CoreFrenchMinimalStemmer.java example

Explorer

owsi-core-parent-master
- basic-application
  - basic-application-core
    - src
      - main
        java
        fr
        openwide
        core
        basicapp
        core
        BasicApplicationCorePackage.java
        business
        BasicApplicationCoreCommonBusinessPackage.java
        authority
        BasicApplicationAuthorityUtils.java
        common
        model
        EmailAddress.java
        IHierarchicalListItem.java
        LocalizedGenericListItem.java
        PhoneNumber.java
        PostalCode.java
        comparator
        LocalizedGenericListItemComparator.java
        LocalizedTextComparator.java
        embeddable
        LocalizedText.java
        util
        BasicApplicationLocale.java
        history
        dao
        HistoryLogDaoImpl.java
        IHistoryLogDao.java
        model
        HistoryDifference.java
        HistoryLog.java
        atomic
        HistoryEventType.java
        bean
        HistoryLogAdditionalInformationBean.java
        search
        HistoryLogSearchQueryImpl.java
        IHistoryLogSearchQuery.java
        service
        HistoryEventSummaryServiceImpl.java
        HistoryLogServiceImpl.java
        HistoryValueServiceImpl.java
        IHistoryEventSummaryService.java
        IHistoryLogService.java
        notification
        service
        EmptyNotificationContentDescriptorFactoryImpl.java
        EmptyNotificationUrlBuilderServiceImpl.java
        IBasicApplicationNotificationContentDescriptorFactory.java
        INotificationService.java
        INotificationUrlBuilderService.java
        NotificationServiceImpl.java
        referencedata
        dao
        CityDaoImpl.java
        ICityDao.java
        model
        City.java
        service
        IReferenceDataService.java
        ReferenceDataServiceImpl.java
        task
        model
        BasicApplicationTaskQueueId.java
        upgrade
        DataUpgradeServiceImpl.java
        user
        dao
        IUserDao.java
        IUserGroupDao.java
        UserDaoImpl.java
        UserGroupDaoImpl.java
        difference
        service
        IUserDifferenceService.java
        UserDifferenceServiceImpl.java
        model
        BasicUser.java
        TechnicalUser.java
        User.java
        UserGroup.java
        atomic
        UserPasswordRecoveryRequestInitiator.java
        UserPasswordRecoveryRequestType.java
        embeddable
        UserPasswordInformation.java
        UserPasswordRecoveryRequest.java
        search
        AbstractUserSearchQueryImpl.java
        BasicUserSearchQueryImpl.java
        IBasicUserSearchQuery.java
        IGenericUserSearchQuery.java
        ITechnicalUserSearchQuery.java
        IUserGroupSearchQuery.java
        IUserSearchQuery.java
        TechnicalUserSearchQueryImpl.java
        UserGroupSearchQueryImpl.java
        UserGroupSort.java
        UserSearchQueryImpl.java
        UserSort.java
        service
        IUserGroupService.java
        IUserService.java
        UserGroupServiceImpl.java
        UserServiceImpl.java
        config
        hibernate
        HibernateConfigPackage.java
        TypeDefinitions.java
        type
        EmailAddressType.java
        PhoneNumberType.java
        PostalCodeType.java
        scheduling
        service
        ISchedulingService.java
        SchedulingServiceImpl.java
        spring
        BasicApplicationAdviceOrder.java
        BasicApplicationCoreApplicationPropertyConfig.java
        BasicApplicationCoreCommonConfig.java
        BasicApplicationCoreCommonJpaConfig.java
        BasicApplicationCoreNotificationConfig.java
        BasicApplicationCoreSchedulingConfig.java
        BasicApplicationCoreSecurityConfig.java
        BasicApplicationCoreTaskManagementConfig.java
        util
        Environment.java
        property
        BasicApplicationCorePropertyIds.java
        security
        model
        BasicApplicationAuthorityConstants.java
        BasicApplicationPermission.java
        BasicApplicationPermissionConstants.java
        BasicApplicationSecurityExpressionConstants.java
        SecurityOptions.java
        service
        AbstractGenericPermissionEvaluator.java
        BasicApplicationPermissionEvaluator.java
        DefaultGenericListItemPermissionEvaluatorImpl.java
        IDefaultGenericListItemPermissionEvaluator.java
        ISecurityManagementService.java
        SecurityManagementServiceImpl.java
        util
        binding
        Bindings.java
        init
        service
        ImportDataServiceImpl.java
        monitoring
        DatabaseConsistencyCheckServiceImpl.java
      - test
        java
        fr
        openwide
        core
        basicapp
        core
        test
        AbstractBasicApplicationTestCase.java
        business
        TestUserService.java
        config
        spring
        BasicApplicationCoreTestCommonConfig.java
        metamodel
        TestMetaModel.java
        service
        CoreTestNotificationDescriptorFactoryImpl.java
        CoreTestNotificationUrlBuilderServiceImpl.java
  - basic-application-init
    - src
      - main
        java
        fr
        openwide
        core
        basicapp
        init
        BasicApplicationInitFromExcelMain.java
        BasicApplicationInitPackage.java
        config
        spring
        BasicApplicationInitConfig.java
        notification
        service
        InitNotificationContentDescriptorFactoryImpl.java
        InitNotificationUrlBuilderServiceImpl.java
        util
        SpringContextWrapper.java
  - basic-application-webapp
    - src
      - main
        java
        fr
        openwide
        core
        basicapp
        web
        application
        BasicApplicationApplication.java
        BasicApplicationSession.java
        administration
        component
        UserGroupDescriptionPanel.java
        UserGroupMembersPanel.java
        UserGroupPortfolioPanel.java
        UserHistoryLogPanel.java
        UserMembershipsPanel.java
        UserProfilePanel.java
        UserSearchPanel.java
        export
        UserExcelTableExport.java
        form
        AbstractUserPopup.java
        UserGroupDropDownSingleChoice.java
        UserGroupPopup.java
        UserPasswordUpdatePopup.java
        UserPopup.java
        model
        AbstractUserDataProvider.java
        BasicUserDataProvider.java
        RoleDataProvider.java
        TechnicalUserDataProvider.java
        UserDataProvider.java
        UserGroupDataProvider.java
        page
        AdministrationBasicUserDescriptionPage.java
        AdministrationBasicUserPortfolioPage.java
        AdministrationTechnicalUserDescriptionPage.java
        AdministrationTechnicalUserPortfolioPage.java
        AdministrationUserGroupDescriptionPage.java
        AdministrationUserGroupPortfolioPage.java
        template
        AdministrationTemplate.java
        AdministrationUserDescriptionTemplate.java
        AdministrationUserPortfolioTemplate.java
        common
        component
        EnvironmentPanel.java
        FeatureNotYetAvailablePanel.java
        NavTabsPanel.java
        converter
        EmailAddressConverter.java
        PhoneNumberConverter.java
        PostalCodeConverter.java
        form
        UserAutocompleteAjaxComponent.java
        UserGroupAutocompleteAjaxComponent.java
        UserQuickSearchComponent.java
        impl
        UserChoiceRenderer.java
        UserGroupChoiceRenderer.java
        renderer
        ActionRenderers.java
        AuthorityRenderer.java
        LocalizedGenericListItemRenderer.java
        UserGroupRenderer.java
        UserRenderer.java
        template
        ApplicationAccessTemplate.java
        MainTemplate.java
        styles
        StylesLessCssResourceReference.java
        application_access
        ApplicationAccessLessCssResourceReference.java
        notification
        NotificationLessCssResourceReference.java
        typedescriptor
        AbstractGenericEntityChildTypeDescriptor.java
        AbstractGenericEntityTypeDescriptor.java
        user
        AdministrationUserTypeDescriptor.java
        NotificationUserTypeDescriptor.java
        SecurityUserTypeDescriptor.java
        UserTypeDescriptor.java
        util
        CssClassConstants.java
        ResourceKeyGenerator.java
        validator
        EmailExistsValidator.java
        EmailUnicityValidator.java
        PostalCodeValidator.java
        UserPasswordValidator.java
        UsernamePatternValidator.java
        UsernameUnicityValidator.java
        config
        spring
        BasicApplicationWebappApplicationPropertyRegistryConfig.java
        BasicApplicationWebappCacheConfig.java
        BasicApplicationWebappConfig.java
        BasicApplicationWebappSecurityConfig.java
        console
        notification
        demo
        page
        ConsoleNotificationDemoIndexPage.java
        NotificationDemoPage.java
        template
        ConsoleNotificationDemoTemplate.java
        util
        NotificationDemoEntry.java
        history
        column
        HistoryLogDetailColumn.java
        component
        CompositeHistoryDifferencePanel.java
        DefaultHistoryDifferencePanel.java
        HistoryDifferenceListPanel.java
        HistoryLogDetailColumnPanel.java
        factory
        CustomizableHistoryComponentFactory.java
        IHistoryComponentFactory.java
        model
        HistoryLogDataProvider.java
        renderer
        AbstractHistoryRenderer.java
        DefaultHistoryDifferenceValueRenderer.java
        HistoryDifferencePathRenderer.java
        HistoryValueRenderer.java
        navigation
        link
        LinkFactory.java
        page
        HomePage.java
        MaintenancePage.java
        notification
        component
        AbstractHtmlNotificationPanel.java
        ExampleHtmlNotificationPanel.java
        SimpleUserActionHtmlNotificationPanel.java
        service
        BasicApplicationNotificationContentDescriptorFactoryImpl.java
        BasicApplicationNotificationUrlBuilderServiceImpl.java
        profile
        component
        ProfileInformationPanel.java
        page
        ProfilePage.java
        template
        ProfileTemplate.java
        property
        BasicApplicationWebappPropertyIds.java
        referencedata
        component
        AbstractGenericListItemListPanel.java
        CityListPanel.java
        CitySearchPanel.java
        SimpleGenericListItemListPanel.java
        SimpleGenericListItemSearchPanel.java
        form
        AbstractGenericListItemPopup.java
        CityPopup.java
        SimpleGenericListItemPopup.java
        model
        AbstractGenericListItemDataProvider.java
        SimpleGenericListItemDataProvider.java
        page
        ReferenceDataPage.java
        template
        ReferenceDataTemplate.java
        validator
        CityUnicityFormValidator.java
        resources
        application
        BasicApplicationApplicationResources.java
        business
        BasicApplicationBusinessResources.java
        common
        BasicApplicationCommonResources.java
        console
        BasicApplicationConsoleResources.java
        enums
        BasicApplicationEnumResources.java
        navigation
        BasicApplicationNavigationResources.java
        notifications
        BasicApplicationNotificationResources.java
        security
        login
        component
        SignInContentPanel.java
        SignInFooterPanel.java
        page
        SignInPage.java
        password
        component
        SecurityPasswordCreationContentPanel.java
        SecurityPasswordExpirationContentPanel.java
        SecurityPasswordIntroPanel.java
        SecurityPasswordRecoveryContentPanel.java
        SecurityPasswordResetContentPanel.java
        page
        SecurityPasswordCreationPage.java
        SecurityPasswordExpirationPage.java
        SecurityPasswordRecoveryPage.java
        SecurityPasswordResetPage.java
        template
        SecurityPasswordTemplate.java
        util
        binding
        WebappBindings.java
- owsi-core
  - owsi-core-components
  - owsi-core-examples
    - wicket-showcase
      - wicket-showcase-core
        src
        main
        java
        fr
        openwide
        core
        showcase
        core
        ShowcaseCorePackage.java
        business
        ShowcaseCoreBusinessPackage.java
        fileupload
        dao
        IShowcaseFileDao.java
        ShowcaseFileDaoImpl.java
        model
        ShowcaseFile.java
        service
        IShowcaseFileFileStoreService.java
        IShowcaseFileService.java
        ShowcaseFileFileStoreServiceImpl.java
        ShowcaseFileServiceImpl.java
        statistic
        dao
        IStatisticDao.java
        StatisticDaoImpl.java
        service
        IStatisticService.java
        StatisticServiceImpl.java
        task
        dao
        IShowcaseTaskDao.java
        ShowcaseTaskDaoImpl.java
        model
        FailedTask.java
        FailedWithBusinessExceptionTask.java
        MyBusinessException.java
        ShowcaseBatchReportBean.java
        ShowcaseTaskQueueId.java
        SuccessTask.java
        SuccessWithAlertTask.java
        SuccessWithErrorTask.java
        TaskTypeEnum.java
        search
        TaskSearchQueryParameters.java
        service
        IShowcaseTaskService.java
        ShowcaseTaskServiceImpl.java
        user
        dao
        IUserDao.java
        IUserGroupDao.java
        UserDaoImpl.java
        UserGroupDaoImpl.java
        model
        User.java
        UserGender.java
        UserGroup.java
        search
        AbstractUserSearchQueryImpl.java
        IGenericUserSearchQuery.java
        IUserSearchQuery.java
        UserSearchQueryImpl.java
        UserSort.java
        service
        IUserGroupService.java
        IUserService.java
        UserGroupServiceImpl.java
        UserServiceImpl.java
        config
        spring
        ShowcaseCoreApplicationPropertyConfig.java
        ShowcaseCoreConfig.java
        ShowcaseCoreJpaConfig.java
        ShowcaseCoreJpaMoreTaskManagementConfig.java
        ShowcaseCoreSecurityConfig.java
        init
        BootstrapApplicationServiceImpl.java
        service
        InitDataServiceImpl.java
        util
        SpringContextWrapper.java
        security
        service
        ShowcasePermissionEvaluator.java
        util
        binding
        Bindings.java
        property
        ShowcaseCorePropertyIds.java
        test
        java
        test
        geocoder
        TestGeocoder.java
      - wicket-showcase-webapp
        src
        main
        java
        fr
        openwide
        core
        showcase
        web
        ShowcaseWebPackage.java
        application
        ShowcaseApplication.java
        ShowcaseSession.java
        config
        spring
        ShowcaseWebappApplicationPropertyRegistryConfig.java
        ShowcaseWebappConfig.java
        ShowcaseWebappJQPlotConfig.java
        ShowcaseWebappSecurityConfig.java
        links
        component
        DynamicImageTestPanel.java
        DynamicLinkTestPanel.java
        page
        LinksPage1.java
        LinksPage2.java
        LinksPage3.java
        LinksTemplate.java
        navigation
        link
        LinkFactory.java
        model
        TestIconResourceReferenceModel.java
        page
        HomePage.java
        SignInPage.java
        others
        page
        ButtonsPage.java
        HideableComponentsPage.java
        TitlesPage.java
        portfolio
        component
        UserPortfolioPanel.java
        UserProfilePanel.java
        UserQuickSearchComponent.java
        UserSearchPanel.java
        form
        EditUserPopupPanel.java
        model
        AbstractUserDataProvider.java
        UserDataProvider.java
        page
        PortfolioMainPage.java
        UserDescriptionPage.java
        task
        component
        NotTreatedObjectsPanel.java
        ShowcaseTaskQueueIdDropDownChoice.java
        TaskPortfolioPanel.java
        TaskSearchPanel.java
        model
        NotTreatedObjectNameModel.java
        NotTreatedObjectsIdsModel.java
        TaskDataProvider.java
        page
        TaskMainPage.java
        util
        binding
        WebappBindings.java
        property
        ShowcaseWebappPropertyIds.java
        template
        MainTemplate.java
        styles
        SignInLessCssResourceReference.java
        StylesLessCssResourceReference.java
        widgets
        component
        AddUserPopupPanel.java
        CalendarPanel.java
        CalendarPopupPanel.java
        FileDownloadPanel.java
        FileUploadPanel.java
        ImageCarouselPanel.java
        SortableUserListPanel.java
        UserAutocompleteAjaxComponent.java
        UserItemItField.java
        UserJson.java
        UserSelect2AjaxAdapter.java
        UserSelect2AjaxMultipleChoice.java
        UserSelect2DropDownChoice.java
        UserSelect2ListMultipleChoice.java
        ZIndexTestModalPopupPanel.java
        page
        AutocompletePage.java
        AutosizePage.java
        BootstrapJsPage.java
        CalendarPage.java
        CarouselPage.java
        FileDownloadPage.java
        FileUploadPage.java
        ListFilterPage.java
        ModalPage.java
        SelectBoxPage.java
        SortableListPage.java
        StatisticsPage.java
        WidgetsMainPage.java
        WidgetsTemplate.java
        resource
        FileUploadResource.java

package fr.openwide.core.jpa.search.analysis.fr;

/**
 * Stemmer adapté depuis le FrenchMinimalStemmer qui a les particularités
 * suivantes :
 * - on ne désactive le stemming que si la chaîne fait moins de 4
 * caractères et pas 6 (typiquement, problème sur stage et stages, noir et noire)
 * - on enlève la suppression des doublements de lettres en fin de mot pour éviter marmot == marmotte
 * - on arrête le stemming si le mot devient trop court de manière à éviter le phénomène stage/stages sur des mots
 * très courts
 */
public class CoreFrenchMinimalStemmer {

	/**
	 * on analyse les mots dès qu'ils font plus de tant de caractères
	 * 
	 * /!\ certaines règles dépendent de ce choix de longueur : il faut donc faire attention à ne pas le descendre
	 * ou alors il faut intégrer des checks en plus ci-dessous quand on remonte dans les index
	 */
	private static final int MIN_LENGTH_HARD_LIMIT = 5;
	
	private static final int MIN_LENGTH_PLURAL_LIMIT = 4;

	public int stem(char s[], int len) {
		if (len < MIN_LENGTH_HARD_LIMIT) {
			if (len >= MIN_LENGTH_PLURAL_LIMIT) {
				return stemLetter(s, len, 's', MIN_LENGTH_PLURAL_LIMIT);
			}
			return len;
		}

		if (s[len - 1] == 'x') {
			if (s[len - 3] == 'a' && s[len - 2] == 'u' && s[len -4] != 'e') {
				s[len - 2] = 'l';
			}
			return len - 1;
		}
		
		int refLen = len;
		
		len = stemLetter(s, len, 's');
		if (len == refLen) {
			// on ne s'attaque au r que s'il n'y a pas eu remplacement avant
			len = stemLetterIfPreviousLetterIs(s, len, 'r', 'e');
		}
		len = stemLetter(s, len, 'e');
		len = stemLetter(s, len, 'é');

		return len;
	}

	private int stemLetter(char s[], int len, char letter) {
		return stemLetter(s, len, letter, MIN_LENGTH_HARD_LIMIT);
	}
	
	private int stemLetter(char s[], int len, char letter, int limit) {
		if (len >= limit && s[len - 1] == letter) {
			return len - 1;
		}
		return len;
	}
	
	private int stemLetterIfPreviousLetterIs(char s[], int len, char letter, char previousLetter) {
		if (len >= MIN_LENGTH_HARD_LIMIT && s[len - 1] == letter) {
			return len - 1;
		}
		return len;
	}
}