NormalizerData.java example

Explorer

Saxon-CE-master
- src
  - client
    - Saxonce.java
    - net
      - sf
        saxon
        ce
        Configuration.java
        Controller.java
        LicenseException.java
        LogController.java
        PreparedStylesheet.java
        SaxonceApi.java
        Version.java
        XSLT20Processor.java
        Xslt20ProcessorImpl.java
        client
        HTTPHandler.java
        dom
        DOMNodeList.java
        DOMWriter.java
        HTMLAttributeNode.java
        HTMLDocumentWrapper.java
        HTMLNodeWrapper.java
        HTMLWriter.java
        XMLDOM.java
        event
        Builder.java
        CommentStripper.java
        ComplexContentOutputter.java
        ImplicitResultChecker.java
        NamespaceReducer.java
        NoOpenStartTagException.java
        PipelineConfiguration.java
        ProxyReceiver.java
        Receiver.java
        ReceiverOptions.java
        RuleBasedStripper.java
        SequenceOutputter.java
        SequenceReceiver.java
        StartTagBuffer.java
        Stripper.java
        TeeOutputter.java
        TreeReceiver.java
        expr
        AdjacentTextNodeMerger.java
        ArithmeticExpression.java
        ArithmeticExpression10.java
        Assignation.java
        AtomicSequenceConverter.java
        Atomizer.java
        AxisExpression.java
        BinaryExpression.java
        Binding.java
        BooleanExpression.java
        Calculator.java
        CardinalityChecker.java
        CardinalityCheckingIterator.java
        CastExpression.java
        CastableExpression.java
        ComparisonExpression.java
        Container.java
        ContextItemExpression.java
        ContextMappingFunction.java
        ContextMappingIterator.java
        CurrentItemExpression.java
        DifferenceEnumeration.java
        EarlyEvaluationContext.java
        EmptyTextNodeRemover.java
        ErrorExpression.java
        ErrorIterator.java
        Expression.java
        ExpressionParser.java
        ExpressionTool.java
        ExpressionVisitor.java
        FilterExpression.java
        FilterIterator.java
        FirstItemExpression.java
        ForExpression.java
        FunctionCall.java
        GeneralComparison.java
        GeneralComparison10.java
        GeneralComparison20.java
        IdentityComparison.java
        InstanceOfExpression.java
        IntegerRangeTest.java
        IntersectionEnumeration.java
        ItemChecker.java
        ItemMappingFunction.java
        ItemMappingIterator.java
        LastItemExpression.java
        LastPositionFinder.java
        LetExpression.java
        Literal.java
        LocalVariableReference.java
        MappingFunction.java
        MappingIterator.java
        MonoIterator.java
        MultiIterator.java
        NegateExpression.java
        NumericPromoter.java
        Optimizer.java
        PairIterator.java
        ParentNodeExpression.java
        PathExpression.java
        PromoteToDouble.java
        PromoteToFloat.java
        PromotionOffer.java
        QuantifiedExpression.java
        RangeExpression.java
        RangeIterator.java
        RoleLocator.java
        RootExpression.java
        SingleItemFilter.java
        SingleNodeExpression.java
        SlashExpression.java
        StackFrame.java
        StatefulMappingFunction.java
        StaticContext.java
        StaticProperty.java
        StringLiteral.java
        SubsequenceIterator.java
        SuppliedParameterReference.java
        TailCallLoop.java
        Token.java
        Tokenizer.java
        TraceExpression.java
        TypeChecker.java
        UnaryExpression.java
        UnionEnumeration.java
        UntypedAtomicConverter.java
        UserFunctionCall.java
        ValueComparison.java
        VariableDeclaration.java
        VariableReference.java
        VennExpression.java
        XPathContext.java
        XPathContextMajor.java
        XPathContextMinor.java
        instruct
        AnalyzeString.java
        ApplyImports.java
        ApplyTemplates.java
        AttributeCreator.java
        AttributeSet.java
        Bindery.java
        Block.java
        BlockIterator.java
        CallTemplate.java
        Choose.java
        Comment.java
        ComputedAttribute.java
        ComputedElement.java
        Copy.java
        CopyOf.java
        DocumentInstr.java
        ElementCreator.java
        Executable.java
        FixedAttribute.java
        FixedElement.java
        ForEach.java
        ForEachGroup.java
        GeneralVariable.java
        GlobalParam.java
        GlobalVariable.java
        Instruction.java
        LocalParam.java
        LocalParamBlock.java
        LocalVariable.java
        Message.java
        NamespaceConstructor.java
        NextMatch.java
        NumberInstruction.java
        ParameterSet.java
        ParentNodeConstructor.java
        Procedure.java
        ProcessingInstruction.java
        RemoveAttribute.java
        ResultDocument.java
        ScheduleExecution.java
        SetAttribute.java
        SetProperty.java
        SimpleNodeConstructor.java
        SlotManager.java
        TailCall.java
        TailCallReturner.java
        Template.java
        TerminationException.java
        UseAttributeSets.java
        UserFunction.java
        UserFunctionParameter.java
        ValueOf.java
        WithParam.java
        number
        AbstractNumberer.java
        Alphanumeric.java
        NumberFormatter.java
        Numberer_en.java
        NumericGroupFormatter.java
        RegularGroupFormatter.java
        parser
        CodeInjector.java
        sort
        AtomicComparer.java
        AtomicSortComparer.java
        CalendarValueComparer.java
        CaseFirstCollator.java
        CaseInsensitiveCollator.java
        CodepointCollatingComparer.java
        CodepointCollator.java
        CollatingAtomicComparer.java
        ComparableAtomicValueComparer.java
        ComparisonKey.java
        DecimalSortComparer.java
        DescendingComparer.java
        DocumentOrderIterator.java
        DocumentSorter.java
        DoubleSortComparer.java
        EmptyIntIterator.java
        EqualityComparer.java
        GenericAtomicComparer.java
        GenericSorter.java
        GlobalOrderComparer.java
        GroupAdjacentIterator.java
        GroupByIterator.java
        GroupBySingletonIterator.java
        GroupEndingIterator.java
        GroupIterator.java
        GroupMatchingIterator.java
        GroupStartingIterator.java
        LocalOrderComparer.java
        NodeOrderComparer.java
        NumericComparer.java
        SetUtils.java
        SortExpression.java
        SortKeyDefinition.java
        SortKeyEvaluator.java
        Sortable.java
        SortedGroupIterator.java
        SortedIterator.java
        TextComparer.java
        z
        AbstractIntSet.java
        IntArraySet.java
        IntBlockSet.java
        IntCheckingSet.java
        IntComplementPredicate.java
        IntComplementSet.java
        IntEmptySet.java
        IntExceptPredicate.java
        IntHashMap.java
        IntHashSet.java
        IntIntersectionPredicate.java
        IntIterator.java
        IntPredicate.java
        IntRangeSet.java
        IntSet.java
        IntSetPredicate.java
        IntSingletonSet.java
        IntToIntArrayMap.java
        IntToIntHashMap.java
        IntToIntMap.java
        IntUnionPredicate.java
        IntUniversalSet.java
        IntValuePredicate.java
        functions
        Adjust.java
        Aggregate.java
        Available.java
        Average.java
        BaseURI.java
        BooleanFn.java
        CodepointEqual.java
        CodepointsToString.java
        CollatingFunction.java
        Compare.java
        Component.java
        Concat.java
        ConstructorFunctionLibrary.java
        Contains.java
        Count.java
        Current.java
        CurrentDateTime.java
        CurrentGroup.java
        CurrentGroupingKey.java
        DateTimeConstructor.java
        DeepEqual.java
        DistinctValues.java
        Doc.java
        DocAvailable.java
        DocumentFn.java
        Empty.java
        EndsWith.java
        Error.java
        EscapeURI.java
        ExecutableFunctionLibrary.java
        Exists.java
        ForceCase.java
        FormatDate.java
        FormatNumber.java
        FunctionLibrary.java
        FunctionLibraryList.java
        Id.java
        InScopePrefixes.java
        IndexOf.java
        Insert.java
        KeyFn.java
        Lang.java
        Last.java
        Matches.java
        Minimax.java
        NamePart.java
        NamespaceForPrefix.java
        NormalizeSpace.java
        NormalizeUnicode.java
        NumberFn.java
        Position.java
        QNameFn.java
        RegexGroup.java
        Remove.java
        Replace.java
        ResolveQName.java
        ResolveURI.java
        Reverse.java
        Root.java
        Rounding.java
        StandardFunction.java
        StartsWith.java
        StringFn.java
        StringJoin.java
        StringLength.java
        StringToCodepoints.java
        Subsequence.java
        Substring.java
        SubstringAfter.java
        SubstringBefore.java
        Sum.java
        SystemFunction.java
        SystemFunctionLibrary.java
        SystemProperty.java
        Tokenize.java
        Trace.java
        Translate.java
        UnparsedText.java
        codenorm
        BitSet.java
        Normalizer.java
        NormalizerData.java
        UnicodeDataParserFromXML.java
        js
        IXSLFunction.java
        IXSLFunctionLibrary.java
        JSObjectType.java
        JSObjectValue.java
        lib
        ErrorListener.java
        FeatureKeys.java
        GenericLogHandler.java
        Initializer.java
        JavaScriptAPIException.java
        JsLogHandler.java
        ListenerLogHandler.java
        NamespaceConstant.java
        Numberer.java
        ParseOptions.java
        SaxonLogFormatter.java
        StandardErrorListener.java
        StandardURIChecker.java
        StringCollator.java
        TraceListener.java
        Validation.java
        om
        AttributeCollection.java
        Axis.java
        CopyOptions.java
        DocumentInfo.java
        DocumentPool.java
        DocumentURI.java
        FingerprintedNode.java
        GroundedValue.java
        InscopeNamespaceResolver.java
        Item.java
        NameChecker.java
        NamePool.java
        NamespaceBinding.java
        NamespaceException.java
        NamespaceResolver.java
        NodeInfo.java
        QNameException.java
        SequenceIterator.java
        StandardNames.java
        StructuredQName.java
        ValueRepresentation.java
        pattern
        AnyChildNodeTest.java
        AnyJSObjectNodeTest.java
        AnyNodeTest.java
        CombinedNodeTest.java
        ContentTypeTest.java
        DocumentNodeTest.java
        EmptySequenceTest.java
        JSObjectPattern.java
        KeyPattern.java
        LocalNameTest.java
        LocationPathPattern.java
        NameTest.java
        NamespaceTest.java
        NodeKindTest.java
        NodeSetPattern.java
        NodeTest.java
        NodeTestPattern.java
        Pattern.java
        PatternMaker.java
        PatternParser.java
        PatternSponsor.java
        UnionPattern.java
        regex
        ARegexIterator.java
        ARegularExpression.java
        ATokenIterator.java
        BMPString.java
        CaseVariants.java
        Categories.java
        GeneralUnicodeString.java
        MultiCharEscape.java
        Operation.java
        RECompiler.java
        REFlags.java
        REMatcher.java
        REProgram.java
        RESyntaxException.java
        RegexIterator.java
        RegularExpression.java
        UnicodeBlocks.java
        UnicodeString.java
        style
        AbsentExtensionElement.java
        AttributeValueTemplate.java
        DataElement.java
        Declaration.java
        ExpressionContext.java
        IXSLRemoveAttribute.java
        IXSLScheduleAction.java
        IXSLSetAttribute.java
        IXSLSetProperty.java
        LiteralResultElement.java
        PrincipalStylesheetModule.java
        StyleElement.java
        StyleNodeFactory.java
        StylesheetFunctionLibrary.java
        StylesheetModule.java
        StylesheetProcedure.java
        StylesheetStripper.java
        UseWhenFilter.java
        UseWhenStaticContext.java
        XSLAnalyzeString.java
        XSLApplyImports.java
        XSLApplyTemplates.java
        XSLAttribute.java
        XSLAttributeSet.java
        XSLCallTemplate.java
        XSLCharacterMap.java
        XSLChoose.java
        XSLComment.java
        XSLCopy.java
        XSLCopyOf.java
        XSLDecimalFormat.java
        XSLDocument.java
        XSLElement.java
        XSLFallback.java
        XSLForEach.java
        XSLForEachGroup.java
        XSLFunction.java
        XSLGeneralIncorporate.java
        XSLGeneralVariable.java
        XSLIf.java
        XSLImport.java
        XSLImportSchema.java
        XSLInclude.java
        XSLKey.java
        XSLLeafNodeConstructor.java
        XSLMatchingSubstring.java
        XSLMessage.java
        XSLNamespace.java
        XSLNamespaceAlias.java
        XSLNextMatch.java
        XSLNumber.java
        XSLOtherwise.java
        XSLOutput.java
        XSLOutputCharacter.java
        XSLParam.java
        XSLPerformSort.java
        XSLPreserveSpace.java
        XSLProcessingInstruction.java
        XSLResultDocument.java
        XSLSequence.java
        XSLSort.java
        XSLStylesheet.java
        XSLTemplate.java
        XSLText.java
        XSLValueOf.java
        XSLVariable.java
        XSLVariableDeclaration.java
        XSLWhen.java
        XSLWithParam.java
        sxpath
        AbstractStaticContext.java
        SimpleContainer.java
        trace
        AbstractTraceListener.java
        ContextStackFrame.java
        ContextStackIterator.java
        ExpressionPresenter.java
        InstructionInfo.java
        Location.java
        TimingCodeInjector.java
        TraceCodeInjector.java
        TraceEventMulticaster.java
        XSLTTraceCodeInjector.java
        XSLTTraceListener.java
        trans
        BuiltInRuleSet.java
        CompilerInfo.java
        DecimalFormatManager.java
        DecimalSymbols.java
        Err.java
        IntellijTest.java
        KeyDefinition.java
        KeyDefinitionSet.java
        KeyManager.java
        Mode.java
        NoDynamicContextException.java
        Rule.java
        RuleManager.java
        StringifyRuleSet.java
        StripSpaceRules.java
        XPathException.java
        update
        DeleteAction.java
        InsertAction.java
        PendingUpdateAction.java
        PendingUpdateList.java
        RemoveAttributeAction.java
        SetAttributeAction.java
        tree
        NamespaceNode.java
        iter
        ArrayIterator.java
        AxisIterator.java
        AxisIteratorImpl.java
        EmptyIterator.java
        GroundedIterator.java
        JsArrayIterator.java
        ListIterator.java
        LookaheadIterator.java
        NodeArrayIterator.java
        NodeListIterator.java
        OneItemGoneIterator.java
        PrependIterator.java
        ReverseArrayIterator.java
        ReverseNodeArrayIterator.java
        SingleNodeIterator.java
        SingletonIterator.java
        UnfailingIterator.java
        linked
        AncestorEnumeration.java
        AttributeEnumeration.java
        AttributeImpl.java
        CharSlice.java
        ChildEnumeration.java
        CommentImpl.java
        DescendantEnumeration.java
        DocumentImpl.java
        ElementImpl.java
        FollowingEnumeration.java
        FollowingSiblingEnumeration.java
        LineNumberMap.java
        LinkedTreeBuilder.java
        NodeFactory.java
        NodeImpl.java
        ParentNodeImpl.java
        PrecedingEnumeration.java
        PrecedingOrAncestorEnumeration.java
        PrecedingSiblingEnumeration.java
        ProcInstImpl.java
        SystemIdMap.java
        TextImpl.java
        TreeEnumeration.java
        util
        DocumentNumberAllocator.java
        FastStringBuffer.java
        NamespaceIterator.java
        Navigator.java
        Orphan.java
        ProcInstParser.java
        SourceLocator.java
        StringTokenizer.java
        URI.java
        UTF16CharacterSet.java
        UTF8CharacterSet.java
        wrapper
        AbstractVirtualNode.java
        SiblingCountingNode.java
        SpaceStrippedDocument.java
        SpaceStrippedNode.java
        VirtualNode.java
        WrappingFunction.java
        WrappingIterator.java
        type
        AnyItemType.java
        AnySimpleType.java
        AnyType.java
        AtomicType.java
        BuiltInAtomicType.java
        BuiltInType.java
        ConversionResult.java
        ItemType.java
        SchemaType.java
        StringToDouble.java
        Type.java
        TypeHierarchy.java
        Untyped.java
        ValidationFailure.java
        value
        AnyURIValue.java
        AtomicValue.java
        Base64BinaryValue.java
        BooleanValue.java
        CalendarValue.java
        Cardinality.java
        Closure.java
        DateTimeValue.java
        DateValue.java
        DayTimeDurationValue.java
        DecimalValue.java
        DoubleValue.java
        DurationValue.java
        EmptySequence.java
        FloatValue.java
        GDateValue.java
        GDayValue.java
        GMonthDayValue.java
        GMonthValue.java
        GYearMonthValue.java
        GYearValue.java
        HexBinaryValue.java
        IntegerRange.java
        IntegerValue.java
        MemoClosure.java
        NumericValue.java
        QNameValue.java
        QualifiedNameValue.java
        SequenceExtent.java
        SequenceType.java
        SingletonClosure.java
        SingletonItem.java
        StringValue.java
        TextFragmentValue.java
        TimeValue.java
        UntypedAtomicValue.java
        Value.java
        Whitespace.java
        YearMonthDurationValue.java
        xmldom
        AttrImpl.java
        CDATASectionImpl.java
        CharacterDataImpl.java
        CommentImpl.java
        DOMNodeExceptionXml.java
        DocumentFragmentImpl.java
        DocumentImpl.java
        DomItemXml.java
        ElementImpl.java
        NamedNodeMapImpl.java
        NodeListImpl.java
        NodeXml.java
        ProcessingInstructionImpl.java
        TextImpl.java
        XMLParser.java
        XMLParserImpl.java
        XMLParserImplXMLDoc.java
  - org
    - timepedia
      - exporter
        client
        Export.java
        ExportAfterCreateMethod.java
        ExportClosure.java
        ExportConstructor.java
        ExportInstanceMethod.java
        ExportJsInitMethod.java
        ExportOverlay.java
        ExportPackage.java
        ExportStaticMethod.java
        Exportable.java
        Exporter.java
        ExporterBaseActual.java
        ExporterBaseImpl.java
        ExporterUtil.java
        NoExport.java
        SOptional.java
        SType.java
        StructuralType.java
        rebind
        ClassExporter.java
        DispatchTable.java
        ExportableTypeOracle.java
        ExporterGenerator.java
        ExporterGeneratorNoExport.java
        JExportOverlayClassType.java
        JExportable.java
        JExportableArrayType.java
        JExportableClassType.java
        JExportableConstructor.java
        JExportableField.java
        JExportableMethod.java
        JExportableParameter.java
        JExportablePrimitiveType.java
        JExportableType.java
        JStructuralTypeField.java

package client.net.sf.saxon.ce.functions.codenorm;

import client.net.sf.saxon.ce.tree.util.UTF16CharacterSet;

import java.util.Map;


public class NormalizerData {
    
    /**
    * Constant for use in getPairwiseComposition
    */
    public static final int NOT_COMPOSITE = '\uFFFF';

    /**
    * Gets the combining class of a character from the
    * Unicode Character Database.
    * @param   ch      the source character
    * @return          value from 0 to 255
    */
    public int getCanonicalClass(int ch) {
        Integer i = canonicalClass.get(ch);
        return (i==null ? 0 : i.intValue());
    }

    /**
    * Returns the composite of the two characters. If the two
    * characters don't combine, returns NOT_COMPOSITE.
    * Only has to worry about BMP characters, since those are the only ones that can ever compose.
    * @param   first   first character (e.g. 'c')
    * @param   second   second character (e.g. '�' cedilla)
    * @return          composite (e.g. '�')
    */
    public char getPairwiseComposition(int first, int second) {
    	if (first < 0 || first > 0x10FFFF || second < 0 || second > 0x10FFFF) return NOT_COMPOSITE;
        Integer i = compose.get((first << 16) | second);
        return (i==null ? NormalizerData.NOT_COMPOSITE : (char)i.intValue());
    }

    /**
    * Gets recursive decomposition of a character from the
    * Unicode Character Database.
    * @param   canonical    If true
    *                  bit is on in this byte, then selects the recursive
    *                  canonical decomposition, otherwise selects
    *                  the recursive compatibility and canonical decomposition.
    * @param   ch      the source character
    * @param   buffer  buffer to be filled with the decomposition
    */
    public void getRecursiveDecomposition(boolean canonical, int ch, StringBuffer buffer) {
        String decomp = (String)decompose.get(ch);
        if (decomp != null && !(canonical && isCompatibility.get(ch))) {
            for (int i = 0; i < decomp.length(); ++i) {
                getRecursiveDecomposition(canonical, decomp.charAt(i), buffer);
            }
        } else {                    // if no decomp, append
        	//UTF16.append(buffer, ch);
            if (ch<65536) {
                buffer.append((char)ch);
            } else {  // output a surrogate pair
                buffer.append(UTF16CharacterSet.highSurrogate(ch));
                buffer.append(UTF16CharacterSet.lowSurrogate(ch));
            }
        }
    }

    // =================================================
    //                   PRIVATES
    // =================================================

    /**
     * Only accessed by NormalizerBuilder.
     */
    NormalizerData(Map<Integer, Integer> canonicalClass, Map decompose,
      Map<Integer, Integer> compose, BitSet isCompatibility, BitSet isExcluded) {
        this.canonicalClass = canonicalClass;
        this.decompose = decompose;
        this.compose = compose;
        this.isCompatibility = isCompatibility;
        this.isExcluded = isExcluded;
    }

    /**
    * Just accessible for testing.
    */
    boolean getExcluded (char ch) {
        return isExcluded.get(ch);
    }

    /**
    * Just accessible for testing.
    */
    String getRawDecompositionMapping (char ch) {
        return (String)decompose.get(ch);
    }

    /**
    * For now, just use IntHashtable
    * Two-stage tables would be used in an optimized implementation.
    */
    private Map<Integer, Integer> canonicalClass;

    /**
    * The main data table maps chars to a 32-bit int.
    * It holds either a pair: top = first, bottom = second
    * or singleton: top = 0, bottom = single.
    * If there is no decomposition, the value is 0.
    * Two-stage tables would be used in an optimized implementation.
    * An optimization could also map chars to a small index, then use that
    * index in a small array of ints.
    */
    private Map decompose;

    /**
    * Maps from pairs of characters to single.
    * If there is no decomposition, the value is NOT_COMPOSITE.
    */
    private Map<Integer, Integer> compose;

    /**
    * Tells whether decomposition is canonical or not.
    */
    private BitSet isCompatibility;

    /**
    * Tells whether character is script-excluded or not.
    * Used only while building, and for testing.
    */

    private BitSet isExcluded;
}

/**
 * Accesses the Normalization Data used for Forms C and D.
 * <p>Copyright (c) 1998-1999 Unicode, Inc. All Rights Reserved.
 * For terms of use, see http://www.unicode.org/terms_of_use.html
 * The Unicode Consortium makes no expressed or implied warranty of any
 * kind, and assumes no liability for errors or omissions.
 * No liability is assumed for incidental and consequential damages
 * in connection with or arising out of the use of the information here.</p>
 * @author Mark Davis
 */
 
 // Modified by Michael Kay (Saxonica), to change the way in which the normalization
 // date is stored.