LinkbackServiceImpl.java example

Explorer

ambra-master
- base
  - src
    - main
      - java
        org
        ambraproject
        ApplicationException.java
        Constants.java
        action
        BaseActionSupport.java
        BaseSessionAwareActionSupport.java
        ListingAction.java
        LogoutAction.java
        RedirectAction.java
        freemarker
        AmbraFreemarkerConfig.java
        AmbraFreemarkerManager.java
        AmbraTemplateStorage.java
        rhino
        shared
        AuthorsXmlExtractor.java
        Rhino.java
        XPathExtractor.java
        service
        annotation
        AnnotationService.java
        AnnotationServiceImpl.java
        article
        AIArticleClassifier.java
        ArticleAssetService.java
        ArticleAssetServiceImpl.java
        ArticleAssetWrapper.java
        ArticleClassifier.java
        ArticleService.java
        ArticleServiceImpl.java
        ArticleServiceSearchParameters.java
        BrowseParameters.java
        BrowseService.java
        BrowseServiceImpl.java
        DuplicateArticleIdException.java
        FetchArticleService.java
        FetchArticleServiceImpl.java
        MostViewedArticleService.java
        NoSuchArticleIdException.java
        NoSuchObjectIdException.java
        SecondaryObject.java
        cache
        Cache.java
        EhcacheProvider.java
        EternalCache.java
        NullCache.java
        captcha
        CaptchaService.java
        CaptchaServiceImpl.java
        cas
        ConfigWrapper.java
        ConfigWrapperUtil.java
        InitParamProvider.java
        client
        filter
        CASFilter.java
        CASFilterWrapper.java
        crossref
        CrossRefLookupService.java
        CrossRefLookupServiceImpl.java
        feed
        AnnotationFeedSearchParameters.java
        FeedSearchParameters.java
        FeedService.java
        FeedServiceImpl.java
        hibernate
        HibernateService.java
        HibernateServiceImpl.java
        journal
        JournalCreator.java
        JournalCreatorImpl.java
        JournalService.java
        JournalServiceImpl.java
        mailer
        AmbraMailer.java
        AmbraMailerImpl.java
        migration
        BootstrapMigratorService.java
        BootstrapMigratorServiceImpl.java
        LegacyMigration.java
        Migration.java
        Migrations.java
        SchemaMigration.java
        ScriptMigration.java
        orcid
        OrcidAuthorizationException.java
        OrcidService.java
        OrcidServiceImpl.java
        permission
        PermissionsService.java
        PermissionsServiceImpl.java
        raptor
        RaptorService.java
        RaptorServiceImpl.java
        search
        MostViewedArticleServiceImpl.java
        MostViewedCache.java
        SearchParameters.java
        SearchService.java
        SolrException.java
        SolrFieldConversion.java
        SolrFieldConversionImpl.java
        SolrHttpService.java
        SolrHttpServiceImpl.java
        SolrSearchService.java
        SolrServerFactory.java
        SolrServiceUtil.java
        taxonomy
        TaxonomyService.java
        TaxonomyServiceImpl.java
        trackback
        BlogLinkDigest.java
        DuplicateTrackbackException.java
        InboundLinkTranslator.java
        LinkbackService.java
        LinkbackServiceImpl.java
        PingbackFault.java
        PingbackService.java
        PingbackServiceImpl.java
        TrackbackService.java
        TrackbackServiceImpl.java
        user
        DuplicateOrcidException.java
        DuplicateUserException.java
        NoSuchUserException.java
        RegistrationConstants.java
        UserAlert.java
        UserAlreadyVerifiedException.java
        UserRegistrationService.java
        UserRegistrationServiceImpl.java
        UserService.java
        UserServiceImpl.java
        VerificationTokenException.java
        xml
        XMLService.java
        XMLServiceImpl.java
        struts2
        AmbraFeedResult.java
        AmbraFreemarkerResult.java
        AmbraStreamResult.java
        AmbraStruts2Dispatcher.java
        CitationResult.java
        EnsureRoleInterceptor.java
        EnsureUserAccountInterceptor.java
        InternalIpInterceptor.java
        JsonResult.java
        util
        ArticleFormattingDirective.java
        AuthorNameAbbreviationDirective.java
        CategoryUtils.java
        DateParser.java
        DocumentBuilderFactoryCreator.java
        FileUtils.java
        HibernateEntityUtil.java
        InvalidDateException.java
        MimeTypeToFileExtMapper.java
        Pair.java
        ProfanityCheckingService.java
        ProfanityCheckingServiceImpl.java
        RandomNumberDirective.java
        SimpleTextDirective.java
        StringListTypeConverter.java
        TextUtils.java
        URLParametersDirective.java
        UriUtil.java
        VersionedCSSDirective.java
        VersionedFileDirective.java
        VersionedJSDirective.java
        XPathUtil.java
        views
        AcademicEditorView.java
        AnnotationView.java
        ArticleAmendment.java
        ArticleCategory.java
        ArticleCategoryPair.java
        AssetView.java
        AuthorView.java
        BrowseResult.java
        CategoryView.java
        CitationReference.java
        CitationView.java
        CitedArticleView.java
        CrossRefSearch.java
        IssueInfo.java
        JournalView.java
        LinkbackView.java
        OrcidAuthorization.java
        SavedSearchHit.java
        SavedSearchView.java
        SearchHit.java
        SearchResultSinglePage.java
        TOCArticle.java
        TOCArticleGroup.java
        TOCRelatedArticle.java
        TaxonomyCookie.java
        UserProfileInfo.java
        VolumeInfo.java
        article
        ArticleInfo.java
        ArticleType.java
        BaseArticleInfo.java
        CitationInfo.java
        Days.java
        FeaturedArticle.java
        HomePageArticleInfo.java
        Months.java
        RelatedArticleInfo.java
        Years.java
        web
        Cookies.java
        DebuggingFilter.java
        DummySSOFilter.java
        GatekeeperFilter.java
        HttpResourceServer.java
        JournalStaticResourceFilter.java
        MultipleRequestFilter.java
        SessionCounter.java
        VirtualJournalContext.java
        VirtualJournalContextFilter.java
        VirtualJournalMappingFilter.java
    - test
      - java
        org
        ambraproject
        action
        BaseHttpTest.java
        BaseInterceptorTest.java
        BaseTest.java
        BaseWebTest.java
        freemarker
        AmbraFreeMarkerConfigTest.java
        model
        ArticleTypeTest.java
        service
        annotation
        AnnotationServiceTest.java
        article
        ArticleAssetServiceTest.java
        ArticleClassifierTest.java
        ArticleServiceTest.java
        BrowseServiceSolrTest.java
        BrowseServiceTest.java
        DummyArticleClassifier.java
        FetchArticleServiceTest.java
        HtmlChecker.java
        MostViewedArticleServiceTest.java
        crossref
        CrossRefLookupServiceImplTest.java
        journal
        JournalCreatorTest.java
        JournalServiceTest.java
        orcid
        OrcidServiceImplTest.java
        permission
        PermissionServiceTest.java
        raptor
        RaptorServiceTest.java
        search
        EmbeddedSolrServerFactoryTest.java
        MostViewedCacheTest.java
        SearchParametersTest.java
        SearchServiceTest.java
        SolrFieldConversionTest.java
        SolrHttpServiceTest.java
        trackback
        TrackbackServiceTest.java
        user
        UserRegistrationServiceTest.java
        UserServiceTest.java
        xml
        XMLServiceTest.java
        XSLTransformationTest.java
        struts2
        EnsureRoleInterceptorTest.java
        EnsureUserAccountInterceptorTest.java
        testutils
        AmbraTestConfigurationFactory.java
        DummyAmbraMailer.java
        DummyCaptcha.java
        DummyDataStore.java
        DummyHibernateDataStore.java
        EmbeddedSolrServerFactory.java
        HibernateTestSessionFactory.java
        MockHttpClient.java
        MockPermissionsService.java
        util
        ArticleFormattingDirectiveTest.java
        CategoryUtilsTest.java
        DateParserTest.java
        FileUtilsTest.java
        ProfanityCheckingServiceTest.java
        SimpleTextDirectiveTest.java
        TextUtilsTest.java
        VersionedFileDirectiveTest.java
        XPathUtilTest.java
        web
        HttpResourceServerTest.java
        apache
        commons
        httpclient
        HttpClientMock.java
- libs
  - ambra-emailer
    - src
      - main
        java
        org
        ambraproject
        email
        MailerUser.java
        TemplateMailer.java
        impl
        FreemarkerTemplateMailer.java
      - test
        java
        org
        ambraproject
        email
        MockTemplateMailer.java
  - conf-helper
    - src
      - main
        java
        org
        ambraproject
        configuration
        ConfigurationStore.java
        SpringPlaceholderConfigurer.java
        WebAppListener.java
      - test
        java
        org
        ambraproject
        configuration
        ConfigurationTest.java
        OverrideTest.java
  - dom-ranges-helper
    - src
      - main
        java
        org
        ambraproject
        dom
        ranges
        RangeNodeFilter.java
        SelectionRange.java
        SelectionRangeList.java
      - test
        java
        AnnotateExample.java
        org
        ambraproject
        dom
        ranges
        Bug298Test.java
        SelectionRangeListTest.java
  - entity-resolver
    - src
      - main
        java
        org
        ambraproject
        xml
        transform
        CustomEntityResolver.java
        EntityResolvingSource.java
        MemoryCacheURLRetriever.java
        NetworkURLRetriever.java
        ResourceURLRetriever.java
        URLRetriever.java
        cache
        CachedSource.java
      - test
        java
        org
        ambraproject
        xml
        transform
        EntityResolverTest.java
  - password-service
    - src
      - main
        java
        org
        ambraproject
        service
        password
        PasswordDigestService.java
      - test
        java
        org
        ambraproject
        service
        password
        TestPasswordDigestService.java
- models
  - src
    - main
      - java
        org
        ambraproject
        hibernate
        GenerateSchemaSQL.java
        GenericEnumUserType.java
        SchemaGenerator.java
        models
        AmbraEntity.java
        Annotation.java
        AnnotationType.java
        Article.java
        ArticleAsset.java
        ArticleAuthor.java
        ArticleCategoryFlagged.java
        ArticleEditor.java
        ArticleList.java
        ArticlePerson.java
        ArticleRelationship.java
        ArticleView.java
        Category.java
        CitedArticle.java
        CitedArticleAuthor.java
        CitedArticleEditor.java
        CitedArticlePerson.java
        Flag.java
        FlagReasonCode.java
        Issue.java
        Journal.java
        Linkback.java
        Pingback.java
        SavedSearch.java
        SavedSearchQuery.java
        SavedSearchType.java
        Syndication.java
        Trackback.java
        UserLogin.java
        UserOrcid.java
        UserProfile.java
        UserProfileMetaData.java
        UserRole.java
        UserSearch.java
        Version.java
        Volume.java
        util
        TokenGenerator.java
        URIGenerator.java
    - test
      - java
        org
        ambraproject
        models
        AnnotationTest.java
        ArticleAssetTest.java
        ArticleListTest.java
        ArticleRelationshipTest.java
        ArticleTest.java
        ArticleViewTest.java
        BaseHibernateTest.java
        CategoryTest.java
        CitedArticleTest.java
        CreateAndModifiedDateTest.java
        FlagTest.java
        IssueTest.java
        JournalTest.java
        SavedSearchTest.java
        SyndicationTest.java
        TrackbackTest.java
        UserLoginTest.java
        UserOrcidTest.java
        UserProfileMetaDataTest.java
        UserProfileTest.java
        UserRoleTest.java
        UserSearchTest.java
        VersionTest.java
        VolumeTest.java
        util
        URIGeneratorTest.java
- queue
  - src
    - main
      - java
        org
        ambraproject
        amendment
        AmendmentService.java
        AmendmentServiceImpl.java
        category
        CategoryService.java
        CategoryServiceImpl.java
        queue
        CamelSender.java
        MessageSender.java
        MessageService.java
        MessageServiceImpl.java
        routes
        CrossRefLookupRoutes.java
        SavedSearchEmailRoutes.java
        search
        SavedSearchJob.java
        SavedSearchRetriever.java
        SavedSearchRetrieverImpl.java
        SavedSearchRunner.java
        SavedSearchRunnerImpl.java
        SavedSearchSender.java
        SavedSearchSenderImpl.java
        service
        ned
        NedService.java
        NedServiceImpl.java
        syndication
        SyndicationException.java
        SyndicationService.java
        impl
        SyndicationServiceImpl.java
        solr
        XmlTransformer.java
        util
        xml
        ArticleXMLReader.java
    - test
      - java
        org
        ambraproject
        category
        CategoryServiceTest.java
        queue
        CamelSenderTest.java
        CrossRefLookupRoutesTest.java
        MessageServiceImplTest.java
        SavedSearchRetrieverTest.java
        SavedSearchRouteBaseTest.java
        SavedSearchRouteMonthlyTest.java
        SavedSearchRouteWeeklyTest.java
        SavedSearchRunnerTest.java
        SavedSearchSenderTest.java
        search
        service
        DummySOLRMessageSender.java
        service
        ned
        NedServiceMock.java
        syndication
        SyndicationServiceTest.java
- webapp
  - src
    - main
      - java
        org
        ambraproject
        action
        FeedbackAction.java
        HomePageAction.java
        InternalIpAction.java
        MostViewedAction.java
        NoOpAction.java
        PageNotFoundAction.java
        annotation
        CreateAnnotationAction.java
        CreateFlagAction.java
        CreateReplyAction.java
        DiscussionAction.java
        GetAnnotationAction.java
        ListReplyAction.java
        StartDiscussionAction.java
        article
        ArticleHeaderAction.java
        ArticleListAction.java
        BrowseIssueAction.java
        BrowseVolumeAction.java
        CreateCitation.java
        EmailArticleAction.java
        FetchArticleAction.java
        FetchArticleAmendmentAction.java
        FetchArticleCategoriesAction.java
        FetchArticleTabsAction.java
        FetchObjectAction.java
        FetchPowerPointAction.java
        FigureSlideShow.java
        MediaCoverageAction.java
        SlideshowAction.java
        debug
        DebugInfoAction.java
        ProcessDumpAction.java
        ThreadDumpAction.java
        feed
        FeedAction.java
        ObsoleteFeedAction.java
        search
        BaseSearchAction.java
        ListFacetAction.java
        SaveJournalAlertAction.java
        SaveSearchAction.java
        SearchAction.java
        taxonomy
        BrowseAction.java
        DeflagTaxonomyTermAction.java
        FlagTaxonomyTermAction.java
        TaxonomyAction.java
        trackback
        CreatePingbackAction.java
        CreateTrackbackAction.java
        user
        DisplayUserAction.java
        EditUserAction.java
        OrcidConfirmAction.java
        OrcidRemoveAction.java
        UserActionSupport.java
    - test
      - java
        org
        ambraproject
        action
        AmbraHttpTest.java
        AmbraWebTest.java
        FeedbackActionTest.java
        HomepageActionTest.java
        MostViewedActionTest.java
        annotation
        CreateAnnotationActionTest.java
        CreateFlagActionTest.java
        CreateReplyActionTest.java
        ListReplyActionTest.java
        article
        BrowseIssueActionTest.java
        CreateCitationTest.java
        EmailArticleActionTest.java
        FetchActionTest.java
        FetchArticleActionTest.java
        FetchArticleTabsActionTest.java
        FetchObjectActionTest.java
        FetchPowerPointActionTest.java
        MediaCoverageActionTest.java
        SlideshowActionTest.java
        search
        SaveSearchActionTest.java
        SearchActionTest.java
        trackback
        CreateTrackbackActionTest.java
        TrackbackHttpTest.java
        user
        DisplayUserActionTest.java
        EditUserActionTest.java

/*
 * $HeadURL$
 * $Id$
 *
 * Copyright (c) 2007-2012 by Public Library of Science
 * http://plos.org
 * http://ambraproject.org
 *
 * Licensed under the Apache License, Version 2.0 (the "License");
 * you may not use this file except in compliance with the License.
 * You may obtain a copy of the License at
 *
 *     http://www.apache.org/licenses/LICENSE-2.0
 *
 * Unless required by applicable law or agreed to in writing, software
 * distributed under the License is distributed on an "AS IS" BASIS,
 * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 * See the License for the specific language governing permissions and
 * limitations under the License.
 */

package org.ambraproject.service.trackback;

import org.ambraproject.models.Article;
import org.ambraproject.models.Journal;
import org.ambraproject.models.Linkback;
import org.ambraproject.service.hibernate.HibernateServiceImpl;
import org.ambraproject.views.LinkbackView;
import org.apache.commons.configuration.Configuration;
import org.apache.commons.lang.StringUtils;
import org.hibernate.Criteria;
import org.hibernate.criterion.DetachedCriteria;
import org.hibernate.criterion.Order;
import org.hibernate.criterion.Projections;
import org.hibernate.criterion.Restrictions;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.orm.hibernate3.HibernateTemplate;

import javax.swing.text.MutableAttributeSet;
import javax.swing.text.html.HTML;
import javax.swing.text.html.HTMLEditorKit;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.StringReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;

public abstract class LinkbackServiceImpl extends HibernateServiceImpl implements LinkbackService {

  private static final Logger log = LoggerFactory.getLogger(LinkbackServiceImpl.class);
  protected static final String DOI_RESOLVER_HOST = "dx.doi.org";
  private static final String DEFAULT_DOI_SCHEME = "info:doi/";

  protected abstract Configuration getConfiguration();


  /**
   * {@inheritDoc}
   */
  @Override
  public BlogLinkDigest examineBlogPage(URL blogUrl, LinkValidator linkValidator) throws IOException {
    log.debug("Validating blog at {}", blogUrl);

    // Trick gets Swing's HTML parser
    HTMLEditorKit.Parser parser = (new HTMLEditorKit() {
      public Parser getParser() {
        return super.getParser();
      }
    }).getParser();


    // Read HTML file into string
    StringBuilder html = new StringBuilder();
    BufferedReader bufferedReader = null;
    try {
      InputStream inputStream = blogUrl.openStream();
      bufferedReader = new BufferedReader(new InputStreamReader(inputStream));
      String line;
      while ((line = bufferedReader.readLine()) != null) {
        html.append(line);
      }

      //parse the html, looking for links
      LinkCallback callback = new LinkCallback(linkValidator);
      parser.parse(new StringReader(html.toString()), callback, true);
      return callback.makeDigest();
    } finally {
      //close our reader (closes all the encapsulated streams)
      if (bufferedReader != null) {
        try {
          bufferedReader.close();
        } catch (IOException e) {
          log.error("Error closing buffered input reader to " + blogUrl, e);
        }
      }
    }
  }

  protected static String fetchJournalName(HibernateTemplate hibernateTemplate, String eIssn) {
    return (String) hibernateTemplate.findByCriteria(
        DetachedCriteria.forClass(Journal.class)
            .add(Restrictions.eq("eIssn", eIssn))
            .setProjection(Projections.property("journalKey")),
        0, 1).get(0);
  }

  @Override
  @SuppressWarnings("unchecked")
  public List<LinkbackView> getLinkbacksForArticle(String articleDoi) {
    return getLinkbacksForArticle(Linkback.class, articleDoi);
  }

  protected List<LinkbackView> getLinkbacksForArticle(Class<? extends Linkback> type, String articleDoi) {
    if (StringUtils.isEmpty(articleDoi)) {
      throw new IllegalArgumentException("No Doi specified");
    }
    Long articleId;
    String articleTitle;
    try {
      Object[] articleRow = (Object[]) hibernateTemplate.findByCriteria(
          DetachedCriteria.forClass(Article.class)
              .add(Restrictions.eq("doi", articleDoi))
              .setProjection(Projections.projectionList()
                  .add(Projections.id())
                  .add(Projections.property("title"))
              ), 0, 1
      ).get(0);
      articleId = (Long) articleRow[0];
      articleTitle = (String) articleRow[1];
    } catch (IndexOutOfBoundsException e) {
      throw new IllegalArgumentException("Doi " + articleDoi + " didn't correspond to an article");
    }
    log.debug("loading up linkbacks for article {}", articleDoi);

    List<? extends Linkback> linkbacks = (List<? extends Linkback>) hibernateTemplate.findByCriteria(
        DetachedCriteria.forClass(type)
            .add(Restrictions.eq("articleID", articleId))
            .addOrder(Order.desc("created"))
            .setResultTransformer(Criteria.DISTINCT_ROOT_ENTITY)
    );
    List<LinkbackView> results = new ArrayList<LinkbackView>(linkbacks.size());
    for (Linkback linkback : linkbacks) {
      results.add(new LinkbackView(linkback, articleDoi, articleTitle));
    }

    log.info("Loaded {} linkbacks for {}", results.size(), articleDoi);
    return results;
  }

  @Override
  public int countLinkbacksForArticle(String articleDoi) {
    return countLinkbacksForArticle(Linkback.class, articleDoi);
  }

  protected int countLinkbacksForArticle(Class<? extends Linkback> type, String articleDoi) {
    if (StringUtils.isEmpty(articleDoi)) {
      throw new IllegalArgumentException("Didn't specify an article doi");
    }
    Long articleId;
    try {
      articleId = (Long) hibernateTemplate.findByCriteria(
          DetachedCriteria.forClass(Article.class)
              .add(Restrictions.eq("doi", articleDoi))
              .setProjection(Projections.id()), 0, 1
      ).get(0);
    } catch (IndexOutOfBoundsException e) {
      throw new IllegalArgumentException("Doi: " + articleDoi + " didn't correspond to an article");
    }

    // Get a list of row counts, one for each subtype. Return their sum.
    List<? extends Number> counts = (List<? extends Number>) hibernateTemplate.findByCriteria(
        DetachedCriteria.forClass(type)
            .add(Restrictions.eq("articleID", articleId))
            .setProjection(Projections.rowCount())
    );
    int sum = 0;
    for (Number count : counts) {
      sum += count.intValue();
    }
    return sum;
  }

  /**
   * Parser callback that examines HTML (typically a blog post) to see if there is a link to the article URL in it. It
   * also picks up the page title, and can yield both pieces of data as a {@link BlogLinkDigest}.
   * <p/>
   * Once the parser using this callback has found enough data for a complete {@link BlogLinkDigest}, the callback will
   * throw a {@code ParserEarlyHaltException} to interrupt the parser. Any code calling the parser must catch (and will
   * generally ignore) the exception.
   */
  protected static final class LinkCallback extends HTMLEditorKit.ParserCallback {

    private final LinkValidator linkValidator;

    private boolean atTitle = false;
    private URL link = null;
    private String title = null;

    private LinkCallback(LinkValidator linkValidator) {
      this.linkValidator = linkValidator;
    }

    //Callback method
    @Override
    public void handleStartTag(HTML.Tag tag, MutableAttributeSet attributes, int pos) {
      if (HTML.Tag.A == tag) {
        String href = (String) attributes.getAttribute(HTML.Attribute.HREF);
        if (href == null) {
          return;
        }

        URL blogLink;
        try {
          blogLink = new URL(href);
        } catch (MalformedURLException e) {
          return; // Ignore invalid or non-URL links
        }
        if (linkValidator.isValid(blogLink)) {
          this.link = blogLink;
        }
      } else if (HTML.Tag.TITLE == tag) {
        // Valid HTML has no elements nested in <title>, so expect the next handleText call to have the title
        atTitle = true;
      }
    }

    @Override
    public void handleText(char[] data, int pos) {
      if (atTitle) {
        title = String.valueOf(data);
        atTitle = false;
      }
    }

    public BlogLinkDigest makeDigest() {
      return new BlogLinkDigest(link, title);
    }

  }

  /**
   * Signals that we have everything we need from an external HTML page. Throw it to interrupt the parser.
   */
  private static class ParserEarlyHaltException extends RuntimeException {
    private ParserEarlyHaltException() {
      super();
    }
  }

}