GrammarParser.java example

Explorer

delcyon-capo-master
- java
  - com
    - delcyon
      - capo
        CapoApplication.java
        CapoThreadFactory.java
        Configuration.java
        ContextThread.java
        InterruptibleRunnable.java
        annotations
        ControlNamespaceURI.java
        DefaultDocumentProvider.java
        DirectoyProvider.java
        XmlMappedArrays.java
        client
        CapoClient.java
        controller
        AbstractClientSideControl.java
        AbstractControl.java
        ControlElement.java
        ControlElementProvider.java
        Group.java
        LocalRequestProcessor.java
        client
        ClientSideControl.java
        ControllerRequest.java
        ServerControllerResponse.java
        elements
        AppendElement.java
        CallElement.java
        ChooseElement.java
        CommandElement.java
        CreateElement.java
        DebugElement.java
        DiffElement.java
        ExportElement.java
        GroupElement.java
        ImportElement.java
        InsertBeforeElement.java
        LogElement.java
        OpenElement.java
        OtherwiseElement.java
        ParseElement.java
        RemoteGroupElement.java
        RemoteGroupMessage.java
        RemoveElement.java
        RepeatElement.java
        ReplaceElement.java
        RequestElement.java
        ResourceControlElement.java
        ResourceMetaDataElement.java
        ResourceMonitorElement.java
        RestartElement.java
        SetAttributeElement.java
        SetIDElement.java
        SnapshotElement.java
        StepElement.java
        SyncElement.java
        TaskElement.java
        TransformElement.java
        UpdateElement.java
        VarElement.java
        WhenElement.java
        server
        ClientControllerRequest.java
        ControllerClientRequestProcessor.java
        ControllerProcessingException.java
        ControllerResponse.java
        ServerSideControl.java
        crypto
        CertificateRequest.java
        CertificateRequestProcessor.java
        datastream
        AccessibleByteArrayOutputStream.java
        BufferedSocket.java
        ConsoleOutputStreamFilter.java
        NullOutputStream.java
        OutputStreamAttributeFilterProvider.java
        RegexFilterOutputStream.java
        SocketFinalizer.java
        StreamEventFilterInputStream.java
        StreamEventFilterOutputStream.java
        StreamEventListener.java
        StreamFinalizer.java
        StreamHandler.java
        StreamProcessor.java
        StreamProcessorProvider.java
        StreamUtil.java
        TriggerFilterOutputStream.java
        stream_attribute_filter
        AbstractFilterInputStream.java
        ContentFormatTypeFilterInputStream.java
        ContentFormatTypeFilterOutputStream.java
        InputStreamAttributeFilterProvider.java
        MD5FilterInputStream.java
        MD5FilterOutputStream.java
        MimeTypeFilterInputStream.java
        SizeFilterInputStream.java
        SizeFilterOutputStream.java
        StreamAttributeFilter.java
        exceptions
        MissingAttributeException.java
        http
        HTTPStreamConsumer.java
        SimpleHttpRequest.java
        SimpleHttpResponse.java
        modules
        ModuleProvider.java
        ModuleRequest.java
        ModuleRequestProcessor.java
        parsers
        GrammarParser.java
        ParseNode.java
        ParseRule.java
        ParseTape.java
        ParseToken.java
        ParseTree.java
        Tokenizer.java
        preferences
        Preference.java
        PreferenceInfo.java
        PreferenceInfoHelper.java
        PreferenceProvider.java
        protocol
        client
        CapoConnection.java
        Request.java
        XMLRequest.java
        XMLServerResponse.java
        XMLServerResponseProcessor.java
        XMLServerResponseProcessorProvider.java
        server
        AbstractClientRequestProcessor.java
        AbstractResponse.java
        ClientRequest.java
        ClientRequestProcessor.java
        ClientRequestProcessorProvider.java
        ClientRequestProcessorSession.java
        ClientRequestProcessorSessionManager.java
        ClientRequestXMLProcessor.java
        Response.java
        XMLResponse.java
        resourcemanager
        CapoDataManager.java
        ContentFormatType.java
        ErrorResourceDescriptor.java
        ResourceDescriptor.java
        ResourceListener.java
        ResourceManager.java
        ResourceParameter.java
        ResourceParameterBuilder.java
        ResourceType.java
        ResourceTypeProvider.java
        ResourceURI.java
        remote
        RemoteResourceDescriptorMessage.java
        RemoteResourceDescriptorProxy.java
        RemoteResourceRequest.java
        RemoteResourceResponse.java
        RemoteResourceResponseProcessor.java
        RemoteResourceType.java
        types
        AbstractContentMetaData.java
        AbstractResourceDescriptor.java
        AbstractResourceType.java
        ClientsResourceDescriptor.java
        ClientsResourceType.java
        ContentMetaData.java
        FileResourceContentMetaData.java
        FileResourceDescriptor.java
        FileResourceType.java
        HttpResourceDescriptor.java
        HttpResourceType.java
        JcrContentMetaData.java
        JcrResourceDescriptor.java
        JcrResourceType.java
        JcrVersionContentMetaData.java
        JdbcResourceDescriptor.java
        JdbcResourceType.java
        RefResourceDescriptor.java
        RefResourceType.java
        ShellResourceDescriptor.java
        ShellResourceType.java
        SimpleContentMetaData.java
        StateParameters.java
        Versionable.java
        server
        CapoServer.java
        jackrabbit
        CapoJcrServer.java
        jetty
        CapoJettyServer.java
        tasks
        TaskManagerDocumentUpdaterThread.java
        TaskManagerThread.java
        util
        CloneControl.java
        CommandExecution.java
        ControlledClone.java
        EqualityProcessor.java
        HexUtil.java
        InternHashMap.java
        LeveledConsoleHandler.java
        LogPrefixFormatter.java
        MarshalWrapper.java
        MarshalWrapperInterface.java
        NamespaceContextMap.java
        ReflectionUtility.java
        StacktraceElementMarshalWrapper.java
        ToStringControl.java
        VariableContainerWrapper.java
        XMLAttribute.java
        XMLElement.java
        XMLSerializer.java
        diff
        Diff.java
        DiffDataConsumer.java
        DiffDataProvider.java
        DiffEntry.java
        InputStreamTokenizer.java
        Window.java
        WindowItem.java
        WindowItemLink.java
        XMLTextDiff.java
        webapp
        models
        DomItemModel.java
        ResourceDescriptorItemModel.java
        WContentMetaDataItemModel.java
        servlets
        CapoWebApplication.java
        CapoWebWTServlet.java
        resource
        AbstractResourceServlet.java
        DefaultResourceStreamer.java
        ResourceStreamer.java
        WResourceDescriptor.java
        WebResourcesServlet.java
        widgets
        CapoWTreeView.java
        WAceEditor.java
        WBoundedContainerWidget.java
        WCSSItemDelegate.java
        WCapoResourceEditor.java
        WCapoResourceExplorer.java
        WCapoResourceTreeView.java
        WCapoSearchControl.java
        WCapoXmlTreeView.java
        WConsoleWidget.java
        WCursorState.java
        WDiffWidget.java
        WLoginControl.java
        WResourceFactory.java
        WTailFileWidget.java
        WValidatorFactory.java
        WWindowAnchor.java
        WWorker.java
        WXMLEditor.java
        WXmlElementEditor.java
        WXmlNavigationBar.java
        xml
        CapoXPathFunction.java
        CapoXPathFunctionResolver.java
        XMLDiff.java
        XMLProcessor.java
        XMLProcessorProvider.java
        XMLStreamProcessor.java
        XPath.java
        XPathFunctionProcessor.java
        XPathFunctionProvider.java
        XPathFunctionUtility.java
        cdom
        CAttr.java
        CComment.java
        CDOMEvent.java
        CDOMEventListener.java
        CDOMHandler.java
        CDOMImplementation.java
        CDocument.java
        CDocumentBuilder.java
        CDocumentBuilderFactory.java
        CDocumentType.java
        CElement.java
        CNamedNodeMap.java
        CNode.java
        CNodeDefinition.java
        CNodeList.java
        CNodeValidator.java
        CNodeValidator2.java
        CProcessingInstruction.java
        CText.java
        CValidationException.java
        NodeProcessor.java
        NodeValidationUtilitesFI.java
        OccurancePredicate.java
        VariableContainer.java
        VariableProcessor.java
        dom
        ResourceAttr.java
        ResourceDeclarationElement.java
        ResourceDocument.java
        ResourceDocumentBuilder.java
        ResourceElement.java
        ResourceElementResourceDescriptor.java
        ResourceElementResourceType.java
        ResourceNode.java
        ResourceText.java
  - eu
    - medsea
      - mimeutil
        MimeException.java
        MimeType.java
        MimeTypeHashSet.java
        MimeUtil.java
        MimeUtil2.java
        TextMimeDetector.java
        TextMimeType.java
        detector
        ExtensionMimeDetector.java
        InvalidMagicMimeEntryException.java
        MagicMimeEntry.java
        MagicMimeEntryOperation.java
        MagicMimeMimeDetector.java
        MatchingMagicMimeEntry.java
        MimeDetector.java
        OpendesktopMimeDetector.java
        WindowsRegistryMimeDetector.java
        handler
        TextMimeHandler.java
      - util
        EncodingGuesser.java
        StringUtil.java
        ZipJarUtil.java
- tests
  - com
    - delcyon
      - capo
        ProblemTests.java
        controller
        elements
        GroupElementTest.java
        ImportElementTest.java
        ParserElementTest.java
        ResourceElementTest.java
        RestartElementTest.java
        SnapshotElementTest.java
        SyncElementTest.java
        TaskElementTest.java
        crypto
        CertificateRequestProcessorTest.java
        datastream
        RegexFilterOutputStreamTest.java
        parsers
        GrammarParserTest.java
        TokenizerTest.java
        resourcemanager
        ResourceDescriptorTest.java
        ResourceURITest.java
        types
        ClientsResourceDescriptorTest.java
        FileResourceDescriptorTest.java
        HttpResourceDescriptorTest.java
        JcrResourceDescriptorTest.java
        JdbcResourceDescriptorTest.java
        RefResourceDescriptorTest.java
        ShellResourceDescriptorTest.java
        server
        CapoServerTest.java
        tests
        util
        ExternalTestClient.java
        ExternalTestServer.java
        TestCapoApplication.java
        TestClient.java
        TestServer.java
        Util.java
        external
        Util.java
        util
        TestInterface.java
        XMLSerializerTest.java
        XMLSerializerTestData.java
        diff
        DiffTest.java
        XMLDiffTest.java
        xml
        cdom
        CDocumentTest.java
        dom
        ResourceDocumentTest.java
        xsd
        SchemaDocumentTest.java

/**
Copyright (c) 2012 Delcyon, Inc.
This library is free software; you can redistribute it and/or
modify it under the terms of the GNU Lesser General Public
License as published by the Free Software Foundation; either
version 2.1 of the License, or (at your option) any later version.

This library is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
Lesser General Public License for more details.

You should have received a copy of the GNU Lesser General Public
License along with this library; if not, write to the Free Software
Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA
 */
package com.delcyon.capo.parsers;

import java.io.InputStream;
import java.util.HashMap;
import java.util.Map.Entry;
import java.util.Set;
import java.util.Vector;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

import com.delcyon.capo.parsers.Tokenizer.CharacterType;
import com.delcyon.capo.xml.XPath;

/**
 * @author jeremiah
 */
public class GrammarParser
{
	public enum SymbolType
	{
	    /** used to specify WHITESPACE in the tokenizer **/
		DELIMITER,
		/** used to specify a regex replacement pattern to identify LITERALS and strip them of their indicator chars **/  
		LITERAL, 
		ASSIGNMENT, 
		ALTERNATION, 
		DECLARATION, 
		EOL,
		SYMBOL
	}

	
	private HashMap<SymbolType, String[]> symbolHashMap = new HashMap<SymbolType, String[]>();
	
	//symbol types are only used in the setDelimter code
	private HashMap<String, SymbolType> symbolTypeHashMap = new HashMap<String, SymbolType>();
	
	
    private Vector<ParseRule> notationParseRuleVector; //this is used to parse and understand a grammar.
    private Vector<ParseRule> grammerParseRuleVector; //this set of rules is used to parse input based on a grammar.

    private String prefix;

    private String uri;

	public GrammarParser()
	{

		symbolHashMap.put(SymbolType.DELIMITER, new String[] { " ", "\t", "EOL" });
		symbolHashMap.put(SymbolType.LITERAL, new String[] {  "'(.+)'" });
		//symbolHashMap.put(SymbolType.LITERAL.toString(), new String[] { "\"(.+)\"", "'(.+)'" });
//		symbolHashMap.put(SymbolType.ASSIGNMENT, new String[] { "=" });
//		symbolHashMap.put(SymbolType.ALTERNATION, new String[] { "|" });
//		symbolHashMap.put(SymbolType.EOL, new String[] { "\n" });

		Set<Entry<SymbolType, String[]>> symbolEntrySet = symbolHashMap.entrySet();
		for (Entry<SymbolType, String[]> entry : symbolEntrySet)
		{
			String[] symbols = entry.getValue();
			for (String symbol : symbols)
			{
				symbolTypeHashMap.put(symbol, entry.getKey());
			}
		}
		
	}

	
	private ParseTree loadDefaultNotationParseTree()
    {
        ParseTree parseTree = new ParseTree();
        parseTree.setSymbolHashMap(symbolHashMap);      
        ParseRule ruleListParseRule = new ParseRule("RULE_LIST",new String[]{"RULE+"});
        parseTree.addRule(ruleListParseRule);
        ParseRule ruleParseRule = new ParseRule("RULE",new String[]{"RULE_NAME","'='", "EXPRESSION+","EOL"});
        parseTree.addRule(ruleParseRule);
        ParseRule expressionParseRule = new ParseRule("EXPRESSION",new String[]{"TERM+"},new String[]{"'|'", "TERM+"});
        parseTree.addRule(expressionParseRule);
        ParseRule termParseRule = new ParseRule("TERM",new String[]{"VALUE"});
        parseTree.addRule(termParseRule);

        return parseTree;
    }
	
	public void loadNotationGrammer(InputStream inputStream) throws Exception
	{

        //prepare symbol table with loaded symbols
        Tokenizer streamTokenizer = new Tokenizer(inputStream);
        streamTokenizer.resetSyntax();
        streamTokenizer.setCharRangeType(33, 126,CharacterType.ALPHA);
                
        streamTokenizer.setCharType('"', CharacterType.QUOTE);
        streamTokenizer.setCharType('\\', CharacterType.ESCAPE);
        streamTokenizer.setCharType('\n', CharacterType.EOL);
        streamTokenizer.setCharType('\r', CharacterType.EOL);
        setDelimiters(streamTokenizer, SymbolType.DELIMITER);
        
        
        ParseTree notationParseTree = loadDefaultNotationParseTree();
        notationParseTree.setSymbolHashMap(symbolHashMap);
        notationParseTree.setUseLiteralsAsTokens(false);
        //notationParseTree.setSymbolTypeHashMap(symbolTypeHashMap);
        Document parseDocument = notationParseTree.parse(streamTokenizer);
        //XPath.dumpNode(parseDocument, System.out);
        
        notationParseRuleVector = getParseRules(parseDocument);
	}
	
	
	public void loadGrammer(InputStream inputStream) throws Exception
	{

        //prepare symbol table with loaded symbols
        Tokenizer streamTokenizer = new Tokenizer(inputStream);
        streamTokenizer.resetSyntax();
        streamTokenizer.setCharRangeType(33, 126,CharacterType.ALPHA);                
        streamTokenizer.setCharType('"', CharacterType.QUOTE);
        streamTokenizer.setCharType('\\', CharacterType.ESCAPE);
        streamTokenizer.setCharType('\n', CharacterType.EOL);
        streamTokenizer.setCharType('\r', CharacterType.EOL);
        setDelimiters(streamTokenizer, SymbolType.DELIMITER);
        
        ParseTree grammerParseTree = null;
        
        if(notationParseRuleVector != null)
        {
            grammerParseTree = new ParseTree();                   
            for (ParseRule parseRule : notationParseRuleVector)
            {
                grammerParseTree.addRule(parseRule);
            }
            
        }
        else
        {
            grammerParseTree = loadDefaultNotationParseTree();            
        }
        
        grammerParseTree.setSymbolHashMap(symbolHashMap);
        grammerParseTree.setUseLiteralsAsTokens(false);
        //grammerParseTree.setSymbolTypeHashMap(symbolTypeHashMap);
        Document parseDocument = grammerParseTree.parse(streamTokenizer);
        
        //XPath.dumpNode(parseDocument, System.out);        
        grammerParseRuleVector = getParseRules(parseDocument);

	}
	
	

	public Document parse(InputStream inputStream) throws Exception
	{

        //prepare symbol table with loaded symbols
        Tokenizer streamTokenizer = new Tokenizer(inputStream);
        streamTokenizer.resetSyntax();
        streamTokenizer.setCharRangeType(33, 126,CharacterType.ALPHA);
        streamTokenizer.setCharType('\n', CharacterType.EOL);
        streamTokenizer.setCharType('\r', CharacterType.EOL);
        //streamTokenizer.setCharType('"', CharacterType.QUOTE);
        //streamTokenizer.quoteChar('\'');
        setDelimiters(streamTokenizer, SymbolType.DELIMITER);
        
        
        ParseTree inputParseTree = new ParseTree();        
        inputParseTree.setNamespace(prefix,uri);
        inputParseTree.setAllowPartialMatch(true);
        inputParseTree.setSymbolHashMap(symbolHashMap);
        inputParseTree.setUseLiteralsAsTokens(true);
        for (ParseRule parseRule : grammerParseRuleVector)
        {
            inputParseTree.addRule(parseRule);
        }
        Document parseDocument = inputParseTree.parse(streamTokenizer);
       
       // XPath.dumpNode(parseDocument, System.out);
        
        return parseDocument;

	}

	private void setDelimiters(Tokenizer streamTokenizer, SymbolType symbolName)
	{
		String[] delimiters = symbolHashMap.get(symbolName);
		if (delimiters == null)
		{
			return;
		}
		for (String string : delimiters)
		{
			if (string.length() == 1)
			{			            
		        streamTokenizer.setCharType(string.charAt(0), CharacterType.WHITESPACE);		        
			}
			else if (string.length() > 1)
			{
				setDelimiters(streamTokenizer, SymbolType.valueOf(string));
			}
		}
	}
	
	/**
     * This returns a set of rules that represent a grammar. 
     * @param ruleDocument
     * @return
     * @throws Exception
     */
    private Vector<ParseRule> getParseRules(Document ruleDocument) throws Exception
    {
        Vector<ParseRule> parseRuleVector = new Vector<ParseRule>();
        
        NodeList ruleList = XPath.selectNodes(ruleDocument, "//RULE");
        for(int ruleIndex = 0; ruleIndex < ruleList.getLength(); ruleIndex++)
        {
            Element ruleElement = (Element) ruleList.item(ruleIndex);
            
            NodeList expressionNodeList =  XPath.selectNodes(ruleElement, "EXPRESSION");
            Vector<Vector<String>> expressionsVector = new Vector<Vector<String>>();
           
            
            for(int expressionIndex = 0; expressionIndex < expressionNodeList.getLength(); expressionIndex++)
            {   
                Vector<String> expressionVector = new Vector<String>();     
                NodeList termNodeList = XPath.selectNodes(expressionNodeList.item(expressionIndex), "TERM");
                
                for(int termIndex = 0; termIndex < termNodeList.getLength(); termIndex++)
                {
                    String value = ((Element) termNodeList.item(termIndex)).getAttribute("VALUE");
                    if(symbolTypeHashMap.get(value) == SymbolType.ALTERNATION)
                    {                   
                        expressionsVector.add(expressionVector);
                        expressionVector = new Vector<String>();
                        //System.err.println(symbolTypeHashMap.get(value)+"<---"+value);
                    }
                    else
                    {
                        //System.err.println(symbolTypeHashMap.get(value)+"<==="+value);
                        expressionVector.add(value);
                    }
                }
                expressionsVector.add(expressionVector);    
            }
            
            
            String[][] expressions = new String[expressionsVector.size()][];
            for(int expressionsIndex = 0 ; expressionsIndex < expressionsVector.size(); expressionsIndex++)
            {
                Vector<String> expressionVectorLocal = expressionsVector.get(expressionsIndex);
                expressions[expressionsIndex] = new String[expressionVectorLocal.size()];
                for(int termIndex = 0; termIndex < expressions[expressionsIndex].length; termIndex++)
                {
                    expressions[expressionsIndex][termIndex] = expressionVectorLocal.get(termIndex);
                }
            }
            ParseRule parseRule = new ParseRule(ruleElement.getAttribute("RULE_NAME"),expressions);
            if(parseRule.getName().equals("ALTERNATION"))
            {
                System.out.println(parseRule.getName()+"==>"+expressionsVector);
            }
            else if(parseRule.getName().equals("ASSIGNMENT"))            
            {
                System.out.println(parseRule.getName()+"==>"+expressionsVector);
            }
            else
            {
                parseRuleVector.add(parseRule);
                //System.out.println(parseRule);
            }
        }
        return parseRuleVector;
    }


    public void setNamespace(String prefix, String uri)
    {
        this.prefix = prefix;
        this.uri = uri;
    }
}