LearnToRankQuery.java example

Explorer

DoSeR-master
- doser-core
  - src
    - main
      - java
        doser
        categorysuggestion
        algorithm
        StandardDbPediaCategorySuggestion.java
        dpo
        CatSugRequest.java
        CatSugResponse.java
        entity
        disambiguation
        feedback
        Feedback.java
        entitydisambiguation
        algorithms
        AbstractDisambiguationAlgorithm.java
        Candidate.java
        DisambiguationHandler.java
        DocumentCentricAlgorithmDefault.java
        EntityCentricAlgorithmCSTable.java
        EntityCentricAlgorithmDefault.java
        EntityCentricAlgorithmTableDefault.java
        IllegalDisambiguationAlgorithmInputException.java
        SurfaceForm.java
        collective
        AbstractWord2VecPageRank.java
        CandidatePruning.java
        CandidateReduction.java
        Edge.java
        Vertex.java
        dbpedia
        AdditionalCandidateQuery.java
        CandidateReductionDBpediaW2V.java
        CollectiveAndContextDriver.java
        CollectiveDisambiguationDBpediaEntities.java
        FinalEntityDisambiguation.java
        LocationDisambiguation.java
        TableColumnFilter.java
        TimeNumberDisambiguation.java
        Word2VecDisambiguator.java
        general
        CandidateReductionGeneralW2V.java
        CollectiveContextDriverGeneral.java
        CollectiveDisambiguationGeneralEntities.java
        FinalEntityDisambiguatorGeneral.java
        Word2VecDisambiguatorGeneral.java
        rules
        AbstractRule.java
        CheckGeneralEntities.java
        ContextRule.java
        NoCandidatesCheckPlural.java
        NoCandidatesExpansionRules.java
        PatternRule.java
        RuleAdapation.java
        UnambiguousToAmbiguousRule.java
        backend
        AbstractDisambiguationTask.java
        DisambiguationMainService.java
        DisambiguationTaskCollective.java
        DisambiguationTaskSingle.java
        dpo
        BoundingBox.java
        DisambiguatedEntity.java
        DisambiguationRequest.java
        DisambiguationResponse.java
        EntityDisambiguationDPO.java
        Response.java
        Time.java
        package-info.java
        feedback
        dpo
        BoundingBox.java
        FeedbackItem.java
        FeedbackRequest.java
        FeedbackResponse.java
        RequestFeedbackProxy.java
        knowledgebases
        AbstractEntityCentricKBGeneral.java
        AbstractKnowledgeBase.java
        DocumentCentricKnowledgeBaseDefault.java
        EnCenKBCStable.java
        EntityCentricKBBiomed.java
        EntityCentricKBDBpedia.java
        EntityCentricKnowledgeBase.java
        KnowledgeBaseIdentifiers.java
        modknowledgebase
        AbstractKnowledgebaseOperator.java
        AddNewDocumentsOperator.java
        KBModifications.java
        KnowledgeBaseEntryCreation.java
        KnowledgebaseModification.java
        ModifyKnowledgeBaseException.java
        NewDocumentOrUpdateOperator.java
        UpdateKnowledgeBaseEntryOperator.java
        dpo
        DocumentToProcess.java
        EntryToProcess.java
        KBEnrichmentRequest.java
        KBEnrichmentResponse.java
        properties
        Properties.java
        table
        celldisambiguation
        CellDisAlgorithm_CSDomain.java
        CellDisAlgorithm_Standard.java
        CellDisambiguationInterface.java
        columndisambiguation
        AbstractTypeDisFeatures.java
        ColumnDisAlgorithm.java
        ColumnHeaderFeature.java
        HillClimbingColumnDisambiguation.java
        IncreaseOfEntitiesFeature.java
        InverseDocumentFrequencyFeature.java
        LayerVarianceFeature.java
        LearntoRankOutputObject.java
        NumberOfEntitiesFeature.java
        TypePathLengthFeature.java
        TypeRankHillClimbingFactory.java
        TypeRankHillClimbingGoalTest.java
        TypeRankHillClimbingHeuristicFunction.java
        dpo
        CellResponse.java
        ColumnResponseItem.java
        TableCell.java
        TableColumn.java
        TableDisambiguationRequest.java
        TableDisambiguationResponse.java
        logic
        DisambiguateTable.java
        LearnToRankTableDisambiguationOutput.java
        Table.java
        TableCell.java
        TableColumn.java
        TableDisambiguationMainService.java
        TableDisambiguationTask.java
        Type.java
        language
        Languages.java
        summarization
        algorithm
        SummarizationSOLRIndex.java
        SummaryInfos.java
        dpo
        RDFSRequest.java
        RDFSResponse.java
        Summary.java
        tools
        Inflector.java
        LuceneTest.java
        NTToDbPediaUrlEncoding.java
        RDFGraphOperations.java
        ServiceQueries.java
        webclassify
        algorithm
        EntityRelevanceAlgorithm.java
        EntitySignificanceAlgorithmHITSRelations.java
        EntitySignificanceAlgorithmPR_W2V.java
        EntitySignificanceAlgorithm_Doc2Vec.java
        PageSimilarity.java
        SessionBreakDetection.java
        annotation
        AnnotateCategories.java
        AnnotateEntities.java
        AnnotateTime.java
        dpo
        DBpediaResourceNotIncluded.java
        Document.java
        DocumentStatistic.java
        Paragraph.java
        SimpleMainTopicInput.java
        SimpleMainTopicOutput.java
        WebClassificationRequest.java
        WebClassificationResponse.java
        WebSite.java
        WebTypeRequest_Deprecated.java
        WebTypeResponse_Deprecated.java
        word2vec
        Data.java
        Doc2VecJsonFormat.java
        Word2VecJsonFormat.java
        Word2VecModel.java
    - test
      - java
        doser
        test
        breakdetection
        BreakDetection.java
- doser-disambiguationserver
  - src
    - main
      - java
        doser
        server
        actions
        FrameworkInitialization.java
        categorysuggestion
        CategorySuggestionService.java
        disambiguation
        DisambiguationService.java
        FeedbackService.java
        documentannotation
        DocumentClassification.java
        WebSessionClassification.java
        WebSessionGetTypes_Deprecation.java
        kbenrichment
        CheckRequestsForKBModification.java
        DisplayEntityCandidatesServlet.java
        KBEnrichmentService.java
        ShowIndexEntityServlet.java
        StoreIndexModificationServlet.java
        StoreNewIndexEntryServlet.java
        package-info.java
        rdfsummarization
        RDFSummarizationService.java
        tabledisambiguation
        TableDisambiguationServiceProxy.java
- doser-experiments
  - src
    - main
      - java
        ACE_MSNBC_AQUAINT_Evaluation
        MainEvaluation.java
        AidaDatasetEvaluation
        AidaDataSetEvaluation.java
        Type.java
        CalbCDataSetCollectiveEvaluation
        Evaluation.java
        DisambiguationApproachDPO
        BoundingBox.java
        Category.java
        DisambiguatedEntity.java
        DisambiguationRequest.java
        DisambiguationResponse.java
        EntityDisambiguationDPO.java
        Response.java
        doser
        sequencedetection
        graph
        AbstractGraph.java
        Dijkstra.java
        DijkstraData.java
        Edge.java
        GraphContent.java
        NoRouteFoundException.java
        Node.java
        NodeTypes.java
        TemporalGraph.java
        UndirectedWeightedShotGraph.java
        word2vec
        dbpediaGraphThinning
        DbpediaGraphModification.java
        EvaluatePureDbpediaCategories.java
        FullyEvaluateCategories.java
        TestNegativeCosine.java
        semanticCategories
        ComputeSimilarities.java
        EntityPair.java
        Sampling.java
        experiments
        collective
        entdoccentric
        CollectiveTestApproach.java
        CompleteCalbCSGeneration.java
        LTR
        ConjunctionScorer.java
        ConjunctionTermScorer.java
        DisjunctionScorer.java
        DisjunctionSumScorer.java
        LTRBooleanQuery.java
        LearnToRankClause.java
        LearnToRankFuzzyQuery.java
        LearnToRankQuery.java
        LearnToRankScorer.java
        LearnToRankTermQuery.java
        LearnToRankTermScorer.java
        ReqOptSumScorer.java
        LearntoRankOutputObject.java
        ParameterHandler.java
        PriorLoader.java
        QueryDataGeneration.java
        ResultProcessing.java
        StandardInitialize.java
        StandardQueryDataObject.java
        StartEvaluation.java
        StartupInformationLoader.java
        TestClass.java
        TrecEvalResultObject.java
        TrecEvalResultProcessing.java
        calbc
        Author.java
        CalbCPubMedID.java
        Concept.java
        Entity.java
        Metadata.java
        dpo
        BoundingBox.java
        EntityToDisambiguate.java
        Position.java
        filter
        Filter.java
        query
        CalbCAnalyzer.java
        CalbCTokenizer.java
        LearnToRankFeatureSetup.java
        LearnToRankFeatureSetupDocumentCentric.java
        LearnToRankFeatureSetupEntityBased.java
        LearnToRankInitialize.java
        PositionalPorterStopAnalyzer.java
        PositionalStopFilter.java
        PriorQuery.java
        QueryGenerator.java
        QuerySettings.java
        SensePriorQuery.java
        evaluation
        CorrectEntry.java
        FilePreProcessing.java
        LineParsingException.java
        M_Accuracy.java
        M_Accuracy2.java
        M_F1.java
        M_MAP.java
        M_Precision.java
        M_Recall.java
        M_ReciprocalRank.java
        M_StringVariance.java
        Output.java
        Query.java
        ResultEntry.java
        StartEvaluation.java
        StatisticalMeasure.java
        UnicodeBOMInputStream.java
        WorkingChain.java
        table
        imdbAndMusicBrainz
        StartEvaluationTableEntities.java
        limaye
        DisServiceAnswer.java
        DisServiceAnswerResult.java
        DisServiceAnswerResultEntities.java
        EvaluationPoster.java
        LimayeAnnotationParserWebTables.java
        LimayeGroundtruthAnnotationParser.java
        StartEvaluationTableEntities.java
        Table.java
        Type.java
        WikiPediaUriConverter.java
        corrected
        LimayeAnnotationParserWebTables.java
        StartEvaluationTableEntities.java
        Table.java
        webclassify
        firstexperiments
        AnnotateSinglePages.java
        ExtractWikipediaText.java
        ldatest
        CreateLDAOutput.java
        table
        imdb
        IMDBTableConverter.java
        MusicBrainzConverter.java
        test
        test.java
- doser-extensions
  - src
    - main
      - java
        doser
        algorithms
        MajorityVoteAlgorithm.java
        general
        HelpfulMethods.java
        Test.java
        UnicodeBOMInputStream.java
        lucene
        analysis
        DoserIDAnalyzer.java
        DoserIDFilter.java
        DoserIDTokenizer.java
        DoserStandardAnalyzer.java
        DoserStandardTokenizer.java
        features
        DocCenExtFeatures.java
        IEntityCentricExtFeatures.java
        LuceneFeatures.java
        query
        AbstractDisjunctionScorer.java
        ConjunctionScorer.java
        DisjunctionSumScorer.java
        FuzzyLabelSimilarity.java
        LTRBooleanQuery.java
        LearnToRankClause.java
        LearnToRankFeatureDefaultValueManager.java
        LearnToRankFuzzyQuery.java
        LearnToRankQuery.java
        LearnToRankScorer.java
        LearnToRankTermQuery.java
        LearnToRankTermScorer.java
        PriorQuery.java
        ReqOptSumScorer.java
        SensePriorQuery.java
        TermQuery.java
        TermScorer.java
        nlp
        NLPTools.java
        StopWordAnnotator.java
        word2vec
        Word2VecModel.java
- doser-externtools
  - src
    - main
      - java
        DBpediaCategoryCorrection
        DBpediaCategoryCorrection.java
        ExtractRelevantDBpediaCategories.java
        doc2vec
        corpuscreation
        CreateD2VCorpus_Wikipedia.java
        CreateD2VCorpus_Wikipedia_WikiSFContext.java
        ExtractContextOfWikipediaPages.java
        doser
        tools
        indexcreation
        AddFactsToIndex.java
        AddPattyFactsToIndex.java
        CountYago2sTypes.java
        CreateBiomedicalDomainIndex.java
        CreateDBPediaIndex.java
        CreateDBpediaIndexV2.java
        CreateEntityList.java
        CreateWikipediaDocumentCentricKB.java
        MergeEntityLists.java
        Test.java
        Test1.java
        WikiPediaUriConverter.java
        evidencemining
        parse
        wikipedia
        S1HtmlToPlainTextWithEntities.java
        S2PlainTextWithEntitiesToAnnotationList.java
        word2vec
        corpuscreation
        CreateBiomedicalEntityCorpus.java
        CreateDBpediaEdgeList.java
        CreateEntityCorpus.java
        CreateEntityWordCorpus.java
        CreateRandomDBpediaModel.java
        CreateWikipediaAndWebEntityCorpus.java
        evidencecomputation
        EvidenceThread.java
        W2VEvidenceMain.java
        tools
        Word2VecModel.java
- doser-gerbilrest
  - src
    - main
      - java
        doser
        gerbilwrapper
        AidaWrapper.java
        BoundingBox.java
        DisambiguatedEntity.java
        DisambiguationRequest.java
        DisambiguationResponse.java
        DoserResource.java
        EntityDisambiguationDPO.java
        IllinoisWrapper.java
        Response.java
        Type.java
        WrapperApplication.java
- doser-hadoop
  - src
    - main
      - java
        examples
        mapred
        temperature
        MaxTemperatureDriver.java
        MaxTemperatureMapper.java
        MaxTemperatureReducer.java
        hadoop
        convertFilesToSequenceFile
        ConvertWebTablesToSequenceFile.java
        SequenceFileReader.java
        extensions
        JobBuilder.java
        WebTableInputFormat.java
        WebTableRecordReader.java
        WholeFileInputFormat.java
        WholeFileRecordReader.java
        hdfs
        examples
        ReadFileAndWriteData.java
        ReadHadoopUrl.java
        webtables
        wordcount
        WordcountJob.java
        WordcountMapper.java
        WordcountReducer.java
        wikievidence
        ldadataconstruction
        WikipediaLDADataGeneratorDriver.java
        WikipediaLDADataGeneratorMapper.java
        WikipediaLDADataGeneratorReducer.java
        hbase
        operations
        HBaseOperations.java
        TestHbaseConnection.java
        lda
        categoryclass
        dataconstruction
        S1CategoryToEntities.java
        properties
        LDAProperties.java
        wikievidence
        dataconstruction
        S3ConstructHBaseContext.java
        S3ConstructHBaseEntries.java
        S4CreateCircles.java
        modelcreation
        ConfigCreation.java
        LDAClient.java
        LDAClientExtractProbabilities.java
        LDAExecutor.java
        MineEvidences.java
        WikipediaLDAThreadExtractEvidenceTerms.java

package experiments.collective.entdoccentric.LTR;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;
import java.util.Set;

import org.apache.lucene.index.AtomicReaderContext;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Explanation;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.Scorer;
import org.apache.lucene.search.Weight;
import org.apache.lucene.util.Bits;

import experiments.collective.entdoccentric.LTR.LearnToRankTermQuery.TermWeight;

public class LearnToRankQuery extends Query implements
		Iterable<LearnToRankClause> {

	private ArrayList<LearnToRankClause> clauses;

	public LearnToRankQuery() {
		clauses = new ArrayList<LearnToRankClause>();
	}

	@Override
	public String toString(String field) {
		return new String(
				"This is a Learn To Rank query whose string representation is not implemented.");
	}

	/**
	 * Returns an iterator on the clauses in this query. It implements the
	 * {@link Iterable} interface to make it possible to do:
	 * 
	 * <pre class="prettyprint">
	 * for (FeatureClause clause : featureQuery) {
	 * }
	 * </pre>
	 */
	@Override
	public Iterator<LearnToRankClause> iterator() {
		return clauses().iterator();
	}

	/** Returns the list of clauses in this query. */
	public List<LearnToRankClause> clauses() {
		return clauses;
	}

	/**
	 * Adds a clause to a LearnToRank query.
	 */
	public LearnToRankClause add(Query query, String name, boolean mustOccur) {
		LearnToRankClause clause = new LearnToRankClause(query, name, mustOccur);
		clauses.add(clause);
		return clause;
	}

	/** Returns the set of clauses in this query. */
	public LearnToRankClause[] getClauses() {
		return clauses.toArray(new LearnToRankClause[clauses.size()]);
	}

	@Override
	public Weight createWeight(IndexSearcher searcher) throws IOException {
		return new LearnToRankWeight(searcher);
	}

	public double[] createFeatureVector(int docIndex) {
		double[] result = new double[clauses.size()];
		for (int i = 0; i < clauses.size(); i++) {
			result[i] = clauses.get(i).getFeatureValue(docIndex);
		}
		return result;
	}

	/**
	 * Expert: called to re-write queries into primitive queries. For example, a
	 * PrefixQuery will be rewritten into a BooleanQuery that consists of
	 * TermQuerys.
	 * 
	 * But this method is not used or optimized in this class!
	 */
	@Override
	public Query rewrite(IndexReader reader) throws IOException {
		for (int i = 0; i < clauses.size(); i++) {
			Query query = clauses.
					get(i)
					.getQuery()
					.rewrite(reader);
			clauses.get(i).setQuery(query);
		}
		return this;
	}

	@Override
	public void extractTerms(Set<Term> terms) {
		// Not needed up to now
	}

	@Override
	@SuppressWarnings("unchecked")
	public LearnToRankQuery clone() {
		LearnToRankQuery clone = (LearnToRankQuery) super.clone();
		clone.clauses = (ArrayList<LearnToRankClause>) this.clauses.clone();
		return clone;
	}

	/** Returns true iff <code>o</code> is equal to this. */
	@Override
	public boolean equals(Object o) {
		if (!(o instanceof LearnToRankQuery)) {
			return false;
		}
		LearnToRankQuery other = (LearnToRankQuery) o;
		return (this.getBoost() == other.getBoost())
				&& this.clauses.equals(other.clauses);
	}

	/** Returns a hash code value for this object. */
	@Override
	public int hashCode() {
		return Float.floatToIntBits(getBoost()) ^ clauses.hashCode();
	}

	/**
	 * Expert: the Weight for LearnToRankQuery, used to normalize, score and
	 * explain these queries.
	 * 
	 * <p>
	 * NOTE: this API and implementation is subject to change suddenly in the
	 * next release.
	 * </p>
	 */
	public class LearnToRankWeight extends Weight {

		private List<LearnToRankClause> requiredClauses;

		private List<LearnToRankClause> optionalClauses;
		
		private Weight[] weights;

		private final boolean termConjunction;

		public LearnToRankWeight(IndexSearcher searcher) throws IOException {
			// Check for required and optional weights
			List<LearnToRankClause> requiredClauses = new LinkedList<LearnToRankClause>();
			List<LearnToRankClause> optionalClauses = new LinkedList<LearnToRankClause>();
			weights = new Weight[clauses.size()];
			
			boolean termConjunction = true;
			for (int i = 0; i < clauses.size(); i++) {
				LearnToRankClause clause = clauses.get(i);
				Weight w = clause.getQuery().createWeight(searcher);
				if (clause.isMustOccur()) {
					requiredClauses.add(clause);
				} else {
					optionalClauses.add(clause);
				}
				if (!(clause.isMustOccur() && w instanceof TermWeight)) {
					termConjunction = false;
				}
				weights[i] = w;
				clause.setW(w);
			}
			this.requiredClauses = requiredClauses;
			this.optionalClauses = optionalClauses;
			this.termConjunction = termConjunction;
		}

		/**
		 * Explanation is not necessary to create a working LearnToRank Query.
		 * Method content will be created later! :-)
		 */
		@Override
		public Explanation explain(AtomicReaderContext context, int doc)
				throws IOException {
			return new Explanation();
		}

		@Override
		public Query getQuery() {
			return LearnToRankQuery.this;
		}

		/**
		 * Possibility to additionally boost the featureclauses with a weight w
		 * but this is not recommended! Boost should be one!
		 */
		@Override
		public float getValueForNormalization() throws IOException {
			return 1f;
		}

		@Override
		public void normalize(float norm, float topLevelBoost) {
			topLevelBoost *= getBoost(); // incorporate boost
			for (Iterator<LearnToRankClause> iterator = requiredClauses
					.iterator(); iterator.hasNext();) {
				LearnToRankClause clause = (LearnToRankClause) iterator.next();
				clause.getW().normalize(norm, topLevelBoost);
			}
			for (Iterator<LearnToRankClause> iterator = optionalClauses
					.iterator(); iterator.hasNext();) {
				LearnToRankClause clause = (LearnToRankClause) iterator.next();
				clause.getW().normalize(norm, topLevelBoost);
			}
		}

		@Override
		public Scorer scorer(AtomicReaderContext context,
				boolean scoreDocsInOrder, boolean topScorer, Bits acceptDocs)
				throws IOException {
			if (termConjunction) {
				// Wird bewusst ausgeklammert um irgendwann durch Zufall rauszufinden was hier genau passiert.
//				// specialized scorer for term conjunctions
//				return createConjunctionTermScorer(context, acceptDocs);
//				new Exception().printStackTrace();
			}

			List<Scorer> requiredScorer = new ArrayList<Scorer>();
			List<Scorer> optionalScorer = new ArrayList<Scorer>();
			List<LearnToRankClause> requiredClausesWithoutNull = new ArrayList<LearnToRankClause>();
			List<LearnToRankClause> optionalClausesWithoutNull = new ArrayList<LearnToRankClause>();
			
			for (Iterator<LearnToRankClause> iterator = requiredClauses
					.iterator(); iterator.hasNext();) {
				LearnToRankClause clause = (LearnToRankClause) iterator.next();
				Scorer subscorer = clause.getW().scorer(context, true, false,
						acceptDocs);
				if (subscorer != null) {
					requiredScorer.add(subscorer);
					requiredClausesWithoutNull.add(clause);
				} else {
					return null;
				}
			}

			for (Iterator<LearnToRankClause> iterator = optionalClauses
					.iterator(); iterator.hasNext();) {
				LearnToRankClause clause = (LearnToRankClause) iterator.next();
				Scorer subscorer = clause.getW().scorer(context, true, false,
						acceptDocs);
				if (subscorer != null) {
					optionalScorer.add(subscorer);
					optionalClausesWithoutNull.add(clause);
				}
			}

			LearnToRankClause[] requiredClausesArr = new LearnToRankClause[requiredClausesWithoutNull
					.size()];
			LearnToRankClause[] optionalClausesArr = new LearnToRankClause[optionalClausesWithoutNull
					.size()];
			requiredClausesWithoutNull.toArray(requiredClausesArr);
			optionalClausesWithoutNull.toArray(optionalClausesArr);

			if (requiredClausesArr.length == 0
					&& optionalClausesArr.length == 0) {
				return null;
			}
			Scorer scorer = new LearnToRankScorer(this, optionalScorer, requiredScorer,
					optionalClausesArr, requiredClausesArr, context.docBase);
			return scorer;
		}

		public float coord(int overlap, int maxOverlap) {
			// LUCENE-4300: in most cases of maxOverlap=1, BQ rewrites itself
			// away,
			// so coord() is not applied. But when BQ cannot optimize itself
			// away
			// for a single clause (minNrShouldMatch, prohibited clauses, etc),
			// its
			// important not to apply coord(1,1) for consistency, it might not
			// be 1.0F
			return maxOverlap == 1 ? 1F : (overlap / (float) maxOverlap);
		}
//
//		private Scorer createConjunctionTermScorer(AtomicReaderContext context,
//				Bits acceptDocs) throws IOException {
//
//			// TODO: fix scorer API to specify "needsScores" up
//			// front, so we can do match-only if caller doesn't
//			// needs scores
//
//			final DocsAndFreqs[] docsAndFreqs = new DocsAndFreqs[weights.length];
//			for (int i = 0; i < docsAndFreqs.length; i++) {
//				final TermWeight weight = (TermWeight) weights[i];
//				final Scorer scorer = weight.scorer(context, true, false,
//						acceptDocs);
//				if (scorer == null) {
//					return null;
//				} else {
//					assert scorer instanceof TermScorer;
//					docsAndFreqs[i] = new DocsAndFreqs(
//							(LearnToRankTermScorer) scorer);
//				}
//			}
//			return new ConjunctionTermScorer(this, coord(
//					docsAndFreqs.length, docsAndFreqs.length), docsAndFreqs);
//		}
	}
}