StreamBasedSeedGenerator.java example

Explorer

cl1-master
- src
  - java
    - uk
      - ac
        rhul
        cs
        cl1
        ClusterONE.java
        ClusterONEAlgorithmParameters.java
        ClusterONEException.java
        Intersectable.java
        MutableNodeSet.java
        NodeSet.java
        NullTaskMonitor.java
        Sized.java
        TaskMonitor.java
        TaskMonitorSupport.java
        ValuedNodeSet.java
        ValuedNodeSetList.java
        api
        Cluster.java
        ClusterONEResult.java
        EntityNotFoundException.java
        EntityStore.java
        InMemoryEntityStore.java
        PersistentEntityStore.java
        rest
        DatasetResource.java
        JAXBContextResolver.java
        MissingParameterException.java
        NotFoundException.java
        ResultResource.java
        StandaloneWebServer.java
        WebApplication.java
        filters
        DensityFilter.java
        DiameterFilter.java
        FilterChain.java
        FluffingFilter.java
        HaircutFilter.java
        KCoreFilter.java
        NodeSetFilter.java
        SizeFilter.java
        growth
        ClusterGrowthAction.java
        ClusterGrowthProcess.java
        ClusterGrowthWorker.java
        GreedyClusterGrowthProcess.java
        io
        AbstractClusteringWriter.java
        AbstractGraphWriter.java
        CSVClusteringWriter.java
        ClusteringWriter.java
        ClusteringWriterFactory.java
        EdgeListReader.java
        EdgeListWriter.java
        GeneProClusteringWriter.java
        GraphReader.java
        GraphReaderFactory.java
        GraphWriter.java
        PlainTextClusteringWriter.java
        SIFReader.java
        merging
        AbstractNodeSetMerger.java
        DummyNodeSetMerger.java
        MultiPassNodeSetMerger.java
        NodeSetMerger.java
        SinglePassNodeSetMerger.java
        quality
        CohesivenessFunction.java
        DummyQualityFunction.java
        LogLikelihoodFunction.java
        QualityFunction.java
        seeding
        EveryEdgeSeedGenerator.java
        EveryNodeSeedGenerator.java
        FileBasedSeedGenerator.java
        MaximalCliqueSeedGenerator.java
        NodeSetCollectionBasedSeedGenerator.java
        NodeSetCollectionBasedSeedIterator.java
        Seed.java
        SeedGenerator.java
        SeedIterator.java
        StreamBasedSeedGenerator.java
        similarity
        DiceSimilarity.java
        JaccardSimilarity.java
        MatchingScore.java
        SimilarityFunction.java
        SimpsonCoefficient.java
        support
        OrderMaintainingQueue.java
        UsedNodeSet.java
        ui
        AboutDialog.java
        ClusterONEAlgorithmParametersDialog.java
        ClusterONEAlgorithmParametersPanel.java
        CollapsiblePanel.java
        ConsoleTaskMonitor.java
        EmptyIcon.java
        ExtendedSpinnerNumberModel.java
        GraphRenderer.java
        HeightLimitedJLabelRenderer.java
        JMultiLineToolTip.java
        NodeSetDetails.java
        NodeSetPropertiesPanel.java
        NodeSetTableModel.java
        PValueRenderer.java
        PopupMenuTrigger.java
        RemoveClusterFromResultAction.java
        ResultViewerPanel.java
        ShowDetailedResultsAction.java
        SwingTaskMonitor.java
        cmdline
        CommandLineApplication.java
        cytoscape
        AboutAction.java
        AboutDialog.java
        AffinityColouringAction.java
        CloseControlPanelAction.java
        ClusterONECytoscapeTask.java
        ControlPanel.java
        CopyClusterToClipboardAction.java
        CyNetworkCache.java
        CytoscapePlugin.java
        CytoscapeResultViewerPanel.java
        CytoscapeTaskMonitorWrapper.java
        ExtractClusterAction.java
        FindAction.java
        Graph.java
        GrowClusterAction.java
        HelpAction.java
        NodeContextMenuAction.java
        NonNumericAttributeException.java
        SaveClusterAction.java
        SaveClusterAsCyGroupAction.java
        SaveClusteringAction.java
        SelectionPropertiesPanel.java
        ShowControlPanelAction.java
        StartAction.java
        VisualStyleManager.java
        cytoscape3
        AboutAction.java
        AboutDialog.java
        AbstractClusterONEAction.java
        AffinityColouringAction.java
        CloseControlPanelAction.java
        ClusterONECytoscapeApp.java
        ClusterONECytoscapeTask.java
        ClusterONECytoscapeTaskFactory.java
        ControlPanel.java
        CopyClusterToClipboardAction.java
        CyNetworkCache.java
        CyNetworkUtil.java
        CyNodeUtil.java
        CytoscapeAppActivator.java
        CytoscapeResultViewerPanel.java
        CytoscapeTaskMonitorWrapper.java
        ExtractClusterAction.java
        FindAction.java
        Graph.java
        GrowClusterAction.java
        HelpAction.java
        NodeContextMenuFactory.java
        NonNumericAttributeException.java
        SaveClusterAction.java
        SaveClusteringAction.java
        SelectionPropertiesPanel.java
        ShowControlPanelAction.java
        StartAction.java
        VisualStyleManager.java
        procope
        ProcopePlugin.java
        collections
        HashMultimap.java
        IntIntHashMap.java
        IntObjectHashMap.java
        Multimap.java
        MultimapBase.java
        Multiset.java
        TreeMultimap.java
        TreeMultiset.java
        graph
        BreadthFirstSearch.java
        BreadthFirstSearchIterator.java
        BronKerboschMaximalCliqueFinder.java
        CircularLayoutAlgorithm.java
        DepthFirstSearch.java
        DepthFirstSearchIterator.java
        Directedness.java
        Edge.java
        EdgeIterator.java
        FruchtermanReingoldLayoutAlgorithm.java
        Graph.java
        GraphAlgorithm.java
        GraphFactory.java
        GraphLayoutAlgorithm.java
        GraphTraversalAlgorithm.java
        Layout.java
        RandomLayoutAlgorithm.java
        TarjanCutVertexFinder.java
        TransitivityCalculator.java
        stats
        StatsUtils.java
        correlation
        KendallCorrelation.java
        LinearCorrelation.java
        curvefitting
        LineFit.java
        StraightLineFit.java
        datastructures
        PairedData.java
        descriptive
        MeanVar.java
        independentsamples
        MannWhitneyTest.java
        tests
        H1.java
        SignificanceTest.java
        utils
        ArrayUtils.java
        BlockingQueueAdapter.java
        DebugHelper.java
        IntegerRange.java
        IteratorUtils.java
        ObjectUtils.java
        Ordered.java
        Pair.java
        StringUtils.java
        UniqueIDGenerator.java
        UnorderedPair.java
- test
  - java
    - uk
      - ac
        rhul
        cs
        cl1
        MutableNodeSetTest.java
        NodeSetTest.java
        filters
        DensityFilterTest.java
        FilterChainTest.java
        SizeFilterTest.java
        merging
        MultiPassNodeSetMergerTest.java
        quality
        LogLikelihoodFunctionTest.java
        seeding
        SeedGeneratorTest.java
        similarity
        DiceSimilarityTest.java
        JaccardSimilarityTest.java
        MatchingScoreTest.java
        SimilarityTestBase.java
        SimpsonCoefficientTest.java
        support
        OrderMaintainingQueueTest.java
        graph
        BreadthFirstSearchTest.java
        BronKerboschMaximalCliqueFinderTest.java
        DepthFirstSearchTest.java
        LayoutTest.java
        TarjanCutVertexFinderTest.java
        TransitivityCalculatorTest.java
        stats
        KendallCorrelationTest.java
        LineFitTest.java
        LinearCorrelationTest.java
        MannWhitneyTestTest.java
        MeanVarTest.java
        StatsUtilsTest.java
        utils
        ArrayUtilsTest.java
        IntegerRangeTest.java
        StringUtilsTest.java

package uk.ac.rhul.cs.cl1.seeding;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.StringTokenizer;

import com.sosnoski.util.hashmap.StringIntHashMap;

import uk.ac.rhul.cs.cl1.MutableNodeSet;
import uk.ac.rhul.cs.graph.Graph;

/**
 * Seed generator where seeds will be generated from an input stream.
 * 
 * Each line in the stream must contain node names separated by spaces. Unknown
 * nodes will silently be ignored.
 * 
 * @see {@link FileBasedSeedGenerator} for reading seeds from a file
 * @author tamas
 */
public class StreamBasedSeedGenerator extends SeedGenerator {
	/**
	 * Reader that will be used to read the list of seeds.
	 */
	BufferedReader reader = null;
	
	/**
	 * Delimiters to be used when tokenizing the lines from the stream
	 */
	String delimiters = " \t\r\n";

	/**
	 * Constructs a new seed generator backed by the given stream.
	 * 
	 * @param  stream  the stream from which we will read the seeds. The stream
	 *                 is assumed to have a default encoding.
	 */
	public StreamBasedSeedGenerator(Graph graph, InputStream stream) {
		this(graph, new BufferedReader(new InputStreamReader(stream)));
	}
	
	/**
	 * Constructs a new seed generator backed by the given reader.
	 * 
	 * @param  reader  the reader that will be used to read the list of seeds.
	 */
	public StreamBasedSeedGenerator(Graph graph, BufferedReader reader) {
		super(graph);
		this.reader = reader;
	}
	
	/**
	 * Gets the delimiters used when splitting a line into node names
	 */
	public String getDelimiters() {
		return this.delimiters;
	}
	
	/**
	 * Internal iterator class that will be used when calling iterator()
	 */
	private class IteratorImpl extends SeedIterator {
		/** A mutable node set that contains no nodes */
		MutableNodeSet emptyNodeSet;

		/** The current nodeset that will be returned with the next call to next() */
		MutableNodeSet currentNodeSet = null;
		
		/** A map mapping node names to indices */
		StringIntHashMap namesToIndices = new StringIntHashMap();
		
		public IteratorImpl() {
			/* Populate the mapping from node names to node indices */
			int n = graph.getNodeCount();
			for (int i = 0; i < n; i++) {
				namesToIndices.add(graph.getNodeName(i), i);
			}

			/* Construct the empty node set */
			emptyNodeSet = new MutableNodeSet(graph);

			/* Process the first line */
			processLine();
		}

		private void processLine() {
			do {
				String line;
				currentNodeSet = emptyNodeSet.clone();

				try {
					line = reader.readLine();
				} catch (IOException ex) {
					ex.printStackTrace();
					currentNodeSet = null;
					return;
				}
				if (line == null) {
					currentNodeSet = null;
					return;
				}

				StringTokenizer st = new StringTokenizer(line, delimiters);
				
				/* Process current line */
				while (st.hasMoreTokens()) {
					String name = st.nextToken();
					int idx = namesToIndices.get(name);
					if (idx >= 0) {
						currentNodeSet.add(idx);
					}
					// TODO: error reporting here
				}
			} while (currentNodeSet.size() == 0);
		}
		
		public boolean hasNext() {
			return (currentNodeSet != null);
		}
		
		public Seed next() {
			Seed result = new Seed(currentNodeSet);
			processLine();
			return result;
		}
	}
	
	/**
	 * Returns an iterator that iterates over the seeds.
	 * 
	 * This method must be called only once as it is not possible to rewind
	 * the reader once the seeds have been generated.
	 */
	public SeedIterator iterator() {
		return new IteratorImpl();
	}
	
	/**
	 * Sets the delimiters used when splitting a line into node names
	 * 
	 * @param  delimiters  a string containing characters to be used as delimiters
	 */
	public void setDelimiters(String delimiters) {
		this.delimiters = delimiters;
	}
	
	/**
	 * Returns -1 as we cannot know in advance how many seeds there will be.
	 */
	public int size() {
		return -1;
	}
}