ParseTree.java example

Explorer

delcyon-capo-master
- java
  - com
    - delcyon
      - capo
        CapoApplication.java
        CapoThreadFactory.java
        Configuration.java
        ContextThread.java
        InterruptibleRunnable.java
        annotations
        ControlNamespaceURI.java
        DefaultDocumentProvider.java
        DirectoyProvider.java
        XmlMappedArrays.java
        client
        CapoClient.java
        controller
        AbstractClientSideControl.java
        AbstractControl.java
        ControlElement.java
        ControlElementProvider.java
        Group.java
        LocalRequestProcessor.java
        client
        ClientSideControl.java
        ControllerRequest.java
        ServerControllerResponse.java
        elements
        AppendElement.java
        CallElement.java
        ChooseElement.java
        CommandElement.java
        CreateElement.java
        DebugElement.java
        DiffElement.java
        ExportElement.java
        GroupElement.java
        ImportElement.java
        InsertBeforeElement.java
        LogElement.java
        OpenElement.java
        OtherwiseElement.java
        ParseElement.java
        RemoteGroupElement.java
        RemoteGroupMessage.java
        RemoveElement.java
        RepeatElement.java
        ReplaceElement.java
        RequestElement.java
        ResourceControlElement.java
        ResourceMetaDataElement.java
        ResourceMonitorElement.java
        RestartElement.java
        SetAttributeElement.java
        SetIDElement.java
        SnapshotElement.java
        StepElement.java
        SyncElement.java
        TaskElement.java
        TransformElement.java
        UpdateElement.java
        VarElement.java
        WhenElement.java
        server
        ClientControllerRequest.java
        ControllerClientRequestProcessor.java
        ControllerProcessingException.java
        ControllerResponse.java
        ServerSideControl.java
        crypto
        CertificateRequest.java
        CertificateRequestProcessor.java
        datastream
        AccessibleByteArrayOutputStream.java
        BufferedSocket.java
        ConsoleOutputStreamFilter.java
        NullOutputStream.java
        OutputStreamAttributeFilterProvider.java
        RegexFilterOutputStream.java
        SocketFinalizer.java
        StreamEventFilterInputStream.java
        StreamEventFilterOutputStream.java
        StreamEventListener.java
        StreamFinalizer.java
        StreamHandler.java
        StreamProcessor.java
        StreamProcessorProvider.java
        StreamUtil.java
        TriggerFilterOutputStream.java
        stream_attribute_filter
        AbstractFilterInputStream.java
        ContentFormatTypeFilterInputStream.java
        ContentFormatTypeFilterOutputStream.java
        InputStreamAttributeFilterProvider.java
        MD5FilterInputStream.java
        MD5FilterOutputStream.java
        MimeTypeFilterInputStream.java
        SizeFilterInputStream.java
        SizeFilterOutputStream.java
        StreamAttributeFilter.java
        exceptions
        MissingAttributeException.java
        http
        HTTPStreamConsumer.java
        SimpleHttpRequest.java
        SimpleHttpResponse.java
        modules
        ModuleProvider.java
        ModuleRequest.java
        ModuleRequestProcessor.java
        parsers
        GrammarParser.java
        ParseNode.java
        ParseRule.java
        ParseTape.java
        ParseToken.java
        ParseTree.java
        Tokenizer.java
        preferences
        Preference.java
        PreferenceInfo.java
        PreferenceInfoHelper.java
        PreferenceProvider.java
        protocol
        client
        CapoConnection.java
        Request.java
        XMLRequest.java
        XMLServerResponse.java
        XMLServerResponseProcessor.java
        XMLServerResponseProcessorProvider.java
        server
        AbstractClientRequestProcessor.java
        AbstractResponse.java
        ClientRequest.java
        ClientRequestProcessor.java
        ClientRequestProcessorProvider.java
        ClientRequestProcessorSession.java
        ClientRequestProcessorSessionManager.java
        ClientRequestXMLProcessor.java
        Response.java
        XMLResponse.java
        resourcemanager
        CapoDataManager.java
        ContentFormatType.java
        ErrorResourceDescriptor.java
        ResourceDescriptor.java
        ResourceListener.java
        ResourceManager.java
        ResourceParameter.java
        ResourceParameterBuilder.java
        ResourceType.java
        ResourceTypeProvider.java
        ResourceURI.java
        remote
        RemoteResourceDescriptorMessage.java
        RemoteResourceDescriptorProxy.java
        RemoteResourceRequest.java
        RemoteResourceResponse.java
        RemoteResourceResponseProcessor.java
        RemoteResourceType.java
        types
        AbstractContentMetaData.java
        AbstractResourceDescriptor.java
        AbstractResourceType.java
        ClientsResourceDescriptor.java
        ClientsResourceType.java
        ContentMetaData.java
        FileResourceContentMetaData.java
        FileResourceDescriptor.java
        FileResourceType.java
        HttpResourceDescriptor.java
        HttpResourceType.java
        JcrContentMetaData.java
        JcrResourceDescriptor.java
        JcrResourceType.java
        JcrVersionContentMetaData.java
        JdbcResourceDescriptor.java
        JdbcResourceType.java
        RefResourceDescriptor.java
        RefResourceType.java
        ShellResourceDescriptor.java
        ShellResourceType.java
        SimpleContentMetaData.java
        StateParameters.java
        Versionable.java
        server
        CapoServer.java
        jackrabbit
        CapoJcrServer.java
        jetty
        CapoJettyServer.java
        tasks
        TaskManagerDocumentUpdaterThread.java
        TaskManagerThread.java
        util
        CloneControl.java
        CommandExecution.java
        ControlledClone.java
        EqualityProcessor.java
        HexUtil.java
        InternHashMap.java
        LeveledConsoleHandler.java
        LogPrefixFormatter.java
        MarshalWrapper.java
        MarshalWrapperInterface.java
        NamespaceContextMap.java
        ReflectionUtility.java
        StacktraceElementMarshalWrapper.java
        ToStringControl.java
        VariableContainerWrapper.java
        XMLAttribute.java
        XMLElement.java
        XMLSerializer.java
        diff
        Diff.java
        DiffDataConsumer.java
        DiffDataProvider.java
        DiffEntry.java
        InputStreamTokenizer.java
        Window.java
        WindowItem.java
        WindowItemLink.java
        XMLTextDiff.java
        webapp
        models
        DomItemModel.java
        ResourceDescriptorItemModel.java
        WContentMetaDataItemModel.java
        servlets
        CapoWebApplication.java
        CapoWebWTServlet.java
        resource
        AbstractResourceServlet.java
        DefaultResourceStreamer.java
        ResourceStreamer.java
        WResourceDescriptor.java
        WebResourcesServlet.java
        widgets
        CapoWTreeView.java
        WAceEditor.java
        WBoundedContainerWidget.java
        WCSSItemDelegate.java
        WCapoResourceEditor.java
        WCapoResourceExplorer.java
        WCapoResourceTreeView.java
        WCapoSearchControl.java
        WCapoXmlTreeView.java
        WConsoleWidget.java
        WCursorState.java
        WDiffWidget.java
        WLoginControl.java
        WResourceFactory.java
        WTailFileWidget.java
        WValidatorFactory.java
        WWindowAnchor.java
        WWorker.java
        WXMLEditor.java
        WXmlElementEditor.java
        WXmlNavigationBar.java
        xml
        CapoXPathFunction.java
        CapoXPathFunctionResolver.java
        XMLDiff.java
        XMLProcessor.java
        XMLProcessorProvider.java
        XMLStreamProcessor.java
        XPath.java
        XPathFunctionProcessor.java
        XPathFunctionProvider.java
        XPathFunctionUtility.java
        cdom
        CAttr.java
        CComment.java
        CDOMEvent.java
        CDOMEventListener.java
        CDOMHandler.java
        CDOMImplementation.java
        CDocument.java
        CDocumentBuilder.java
        CDocumentBuilderFactory.java
        CDocumentType.java
        CElement.java
        CNamedNodeMap.java
        CNode.java
        CNodeDefinition.java
        CNodeList.java
        CNodeValidator.java
        CNodeValidator2.java
        CProcessingInstruction.java
        CText.java
        CValidationException.java
        NodeProcessor.java
        NodeValidationUtilitesFI.java
        OccurancePredicate.java
        VariableContainer.java
        VariableProcessor.java
        dom
        ResourceAttr.java
        ResourceDeclarationElement.java
        ResourceDocument.java
        ResourceDocumentBuilder.java
        ResourceElement.java
        ResourceElementResourceDescriptor.java
        ResourceElementResourceType.java
        ResourceNode.java
        ResourceText.java
  - eu
    - medsea
      - mimeutil
        MimeException.java
        MimeType.java
        MimeTypeHashSet.java
        MimeUtil.java
        MimeUtil2.java
        TextMimeDetector.java
        TextMimeType.java
        detector
        ExtensionMimeDetector.java
        InvalidMagicMimeEntryException.java
        MagicMimeEntry.java
        MagicMimeEntryOperation.java
        MagicMimeMimeDetector.java
        MatchingMagicMimeEntry.java
        MimeDetector.java
        OpendesktopMimeDetector.java
        WindowsRegistryMimeDetector.java
        handler
        TextMimeHandler.java
      - util
        EncodingGuesser.java
        StringUtil.java
        ZipJarUtil.java
- tests
  - com
    - delcyon
      - capo
        ProblemTests.java
        controller
        elements
        GroupElementTest.java
        ImportElementTest.java
        ParserElementTest.java
        ResourceElementTest.java
        RestartElementTest.java
        SnapshotElementTest.java
        SyncElementTest.java
        TaskElementTest.java
        crypto
        CertificateRequestProcessorTest.java
        datastream
        RegexFilterOutputStreamTest.java
        parsers
        GrammarParserTest.java
        TokenizerTest.java
        resourcemanager
        ResourceDescriptorTest.java
        ResourceURITest.java
        types
        ClientsResourceDescriptorTest.java
        FileResourceDescriptorTest.java
        HttpResourceDescriptorTest.java
        JcrResourceDescriptorTest.java
        JdbcResourceDescriptorTest.java
        RefResourceDescriptorTest.java
        ShellResourceDescriptorTest.java
        server
        CapoServerTest.java
        tests
        util
        ExternalTestClient.java
        ExternalTestServer.java
        TestCapoApplication.java
        TestClient.java
        TestServer.java
        Util.java
        external
        Util.java
        util
        TestInterface.java
        XMLSerializerTest.java
        XMLSerializerTestData.java
        diff
        DiffTest.java
        XMLDiffTest.java
        xml
        cdom
        CDocumentTest.java
        dom
        ResourceDocumentTest.java
        xsd
        SchemaDocumentTest.java

/**
Copyright (c) 2012 Delcyon, Inc.
This library is free software; you can redistribute it and/or
modify it under the terms of the GNU Lesser General Public
License as published by the Free Software Foundation; either
version 2.1 of the License, or (at your option) any later version.

This library is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty of
MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
Lesser General Public License for more details.

You should have received a copy of the GNU Lesser General Public
License along with this library; if not, write to the Free Software
Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA
 */
package com.delcyon.capo.parsers;

import java.util.HashMap;
import java.util.Map.Entry;
import java.util.Set;
import java.util.Vector;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;

import com.delcyon.capo.parsers.GrammarParser.SymbolType;
import com.delcyon.capo.parsers.Tokenizer.CharacterType;

/**
 * @author jeremiah
 *
 */
public class ParseTree
{

    /**
     * Used when multiple but different expression matches are found for a rule. 
     * @author jeremiah
     *
     */
	public enum ParseOrderPreference
	{
	    /**
	     * choose the farthest left matching expression
	     */
		LEFT,
		/**
		 * choose the farthest right matching expression
		 */
		RIGHT,
		/**
		 * choose the expression with the longest match, starting from the left. 
		 */
		MAX_LENGTH
	}
	
	public enum TermType
	{
	    /**
	     * indicates this term is a RULE
	     */
		RULE,
		/**
		 * indicates this term is a SYMBOL, which means it has no defined meaning.
		 */
		SYMBOL,
		/**
		 * indicates that this term is used to separate terms, 
		 * generally EOL is the only one that should really show up this way, 
		 * most others will be taken care of by the tokenizer.
		 */
		DELIMITER,
		/**
		 * indicates that this term is a literal, and should be used for demarcation of a token list.
		 */
		LITERAL
	}
	
	//contains an ordered list of the parseRules
	private Vector<ParseRule> parseRuleVector = new Vector<ParseRule>();
	
	//used for quick lookup of rules by name
	private HashMap<String, ParseRule> parseRuleHashMap = new HashMap<String, ParseRule>();
	
	//a hash table keyed by SymbolType.toString() and an array of symbols or setting for that type.
	private HashMap<SymbolType, String[]> symbolHashMap = new HashMap<SymbolType, String[]>();
	
	//this is a reverse lookup against the symbol hashmap, that's keyed by the symbol, and returns it's symbol type.
	private HashMap<String, SymbolType> symbolTypeHashMap = new HashMap<String, SymbolType>();
	
	//used to lookup if a term is a literal
	private HashMap<String, String> literalHashMap = new HashMap<String, String>();
	
	
	private ParseOrderPreference parseOrderPreference = ParseOrderPreference.LEFT;
	private boolean allowPartialMatch = false;
	private boolean includeLiterals = false;
	private boolean useLiteralsAsTokens = false;
	private String namespaceURI = null;
	private String prefix = null;
    private boolean isEOLSignificant = false;
	
	
	/**
     * determines of EOL will be returned as a separate token, or treated as whitespace.
     * This will automatically be set if EOL is used as a term in a RULE added to this parse tree.
     * @param isEOLSignificant
     */
    public void setEOLSignificant(boolean isEOLSignificant)
    {
        this.isEOLSignificant = isEOLSignificant;
    }

    public boolean isEOLSignificant()
    {
        return isEOLSignificant;
    }
    
	/**
	 * Setting this to true will cause any length 1 literals in a rule to be marked as separate tokens when reading the input. 
	 * This should always be turned off if parsing a notation, and probably a grammar.  
	 * @param useLiteralsAsTokens
	 */
	public void setUseLiteralsAsTokens(boolean useLiteralsAsTokens)
	{
		this.useLiteralsAsTokens = useLiteralsAsTokens;
	}
	
	public boolean isUseLiteralsAsTokens()
	{
		return useLiteralsAsTokens;
	}
	
	/**
	 * This will set the namespace to be used for any created elements resulting from the parse.
	 * @param prefix prefix of the namespace to use.  
	 * @param namespaceURI namespaceURI to use.
	 */
	public void setNamespace(String prefix, String namespaceURI)
    {
        this.namespaceURI = namespaceURI;
        this.prefix = prefix;
    }
	
	public String getNamespaceURI()
    {
        return namespaceURI;
    }
	
	public String getPrefix()
    {
        return prefix;
    }
	
	public boolean isIncludeLiterals()
    {
        return includeLiterals;
    }
	
	/**
	 * The parse can either consume any literals it encounters, or include them in the result XML as <LITERAL VALUE=""/> elements.
	 * @param includeLiterals
	 */
	public void setIncludeLiterals(boolean includeLiterals)
    {
        this.includeLiterals = includeLiterals;
    }
	
	/**
	 * Controls whether or not we return the best match we've found, even if all of the data has not been matched. 
	 * This is handy if you want to partially parse the first part of a file, but don't care about the remainder.   
	 *  
	 *  defaults to false
	 */
	
	public void setAllowPartialMatch(boolean allowPartialMatch)
    {
        this.allowPartialMatch = allowPartialMatch;
    }
	
	public boolean isAllowPartialMatch()
    {
        return allowPartialMatch;
    }
	
	
	/**
	 * This adds a parse rule to the tree. The order that these rules are added is the order in which they will be processed. 
	 * @param parseRule
	 */
	public void addRule(ParseRule parseRule)
	{
		parseRuleVector.add(parseRule);
		parseRuleHashMap.put(parseRule.getName(), parseRule);
		//find any literals in the expression, and mark them as a literal
		String[][] expressions = parseRule.getExpressions();
		for (String[] expresssion : expressions)
		{
			for (String term : expresssion)
			{
			    if(term.equals("EOL"))
			    {
			        isEOLSignificant = true;
			    }
				String[] patterns = symbolHashMap.get(SymbolType.LITERAL);			
				if (patterns != null)
				{
					for (String literalPattern : patterns)
					{
						if(term.matches(literalPattern))
						{							
							literalHashMap.put(term.replaceAll(literalPattern, "$1"), term);
						}
					}
				}
			}
		}
		parseRule.setParseTree(this);
	}

	/**
	 * Given a tokenizer object, apply an parse rules, and return the resulting XML Document 
	 * @param tokenizer
	 * @return
	 * @throws Exception
	 */
	public Document parse(Tokenizer tokenizer) throws Exception
	{		
	    DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
	    documentBuilderFactory.setNamespaceAware(true);
		DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();		
		Document parseDocument = documentBuilder.newDocument();		
		parse(tokenizer, parseDocument);		
		return parseDocument;
		
	}
	
	/**
	 * Given a tokenizer, and an XML Element or Document, this will append the result of the parse rules to that node. 
	 * @param tokenizer
	 * @param node
	 * @throws Exception
	 */
	public void parse(Tokenizer tokenizer, Node node) throws Exception
    {
	    //walk the list of literals, and find any that have a length of 1. then make sure that, that char is treated as a separate token, and not part of a word.
		
	    Set<Entry<String, String>> entries =  literalHashMap.entrySet();
	    for (Entry<String, String> entry : entries)
	    {	        
	        if(entry.getKey().length() == 1)
	        {
	            if(useLiteralsAsTokens == true)
	            {
	                tokenizer.setCharType(entry.getKey().charAt(0), CharacterType.TOKEN);
	            }
	        }
	    }
	    
	    tokenizer.setEOLSignificant(isEOLSignificant);
	    
        ParseTape parseTape = new ParseTape(tokenizer);        
        
        Element parseNode = createElement(node, parseRuleVector.firstElement().getName());        
        //appendChild(parseNode);
        if(parseRuleVector.firstElement().parse(parseNode,parseTape))
        {
            if(allowPartialMatch == true || parseTape.hasMore() == false)
            {
                node.appendChild(parseNode);               
            }
        }        
        
    }

	/**
	 * This returns whether or not a string in the name of a parse Rule. 
	 * @param term
	 * @return
	 */
	public boolean isRule(String term)
	{
		return parseRuleHashMap.containsKey(term);
	}

	public void setSymbolHashMap(HashMap<SymbolType, String[]> symbolHashMap)
	{
		this.symbolHashMap = symbolHashMap;
		Set<Entry<SymbolType, String[]>> symbolEntrySet = symbolHashMap.entrySet();
		for (Entry<SymbolType, String[]> entry : symbolEntrySet)
		{
			String[] symbols = entry.getValue();
			for (String symbol : symbols)
			{
			    symbolTypeHashMap.put(symbol, entry.getKey());
			}
		}
	}

	/**
	 * This returns a rule for a given name.
	 * @param term
	 * @return
	 */
	public ParseRule getRule(String term)
	{
		return parseRuleHashMap.get(term);
	}

	/**
	 * this returns the TermType for a given string.
	 * @param term
	 * @return
	 */
	public TermType getTermType(String term)
	{
		if (symbolTypeHashMap.containsKey(term) )
		{
			if(symbolTypeHashMap.get(term) == SymbolType.LITERAL)
			{
				return TermType.LITERAL;
			}
			else
			{
				return TermType.DELIMITER;
			}
		}
		else if (parseRuleHashMap.containsKey(term))
		{
			return TermType.RULE;
		}
		else
		{
			String[] patterns = symbolHashMap.get(SymbolType.LITERAL);			
			if (patterns != null)
			{
				for (String literalPattern : patterns)
				{
					if(term.matches(literalPattern))
					{
						return TermType.LITERAL;
					}
				}
			}
			return TermType.SYMBOL;
		}
	}
	
	/**
	 * Given a term that still has it's literal indicators around it, will find a matching pattern and use it to remove them.
	 * For example 'value' will result in value.
	 * @param term
	 * @return
	 */
	public String getLiteralValue(String term)
	{
		String[] patterns = symbolHashMap.get(SymbolType.LITERAL);		
		if (patterns != null)
		{
			for (String literalPattern : patterns)
			{
				if(term.matches(literalPattern))
				{										
					return term.replaceAll(literalPattern, "$1");
				}
			}
		}
		return term;
	}

	/**
	 * Check to see if a token value is registered as a literal
	 * @param value
	 * @return
	 */
	public boolean isLiteral(String value)
	{
	    return literalHashMap.containsKey(value);
	}
	
	
	/**
	 * Allows you to set the way the parse tree will choose when finding multiple rules that match a particular token list.
	 * @param parseOrderPreference
	 */
	public void setParseOrderPreference(ParseOrderPreference parseOrderPreference)
	{
		this.parseOrderPreference = parseOrderPreference;
	}

	public ParseOrderPreference getParseOrderPreference()
    {
        return parseOrderPreference;
    }
	
	/**
	 * Returns the symbol type of this literal, or LITERAL if there is no match.
	 * @param value
	 * @return
	 */
    public SymbolType getLiteralType(String value)
    {
        if(symbolTypeHashMap.containsKey(SymbolType.valueOf(value)))
        {
            return symbolTypeHashMap.get(value);
        }
        else
        {
            return SymbolType.LITERAL;
        }
    }

    /**
     * centralized method for creating an element where we take set namespace and prefix into account. 
     * @param someNode
     * @param name
     * @return
     */
    public Element createElement(Node someNode, String name)
    {
        Document ownerDocument = null;
        if(someNode instanceof Document)
        {
            ownerDocument = (Document) someNode;
        }
        else
        {
            ownerDocument = someNode.getOwnerDocument();
        }
        if(namespaceURI != null && prefix != null)
        {
            return ownerDocument.createElementNS(namespaceURI,prefix+":"+name);
        }
        else
        {
            return ownerDocument.createElement(name);
        }
    }
	
	
}