asahi.com:朝日新聞の速報記事一覧をPlaggerで全文取得してみた

何故か自分の環境だと朝日新聞のRSSからEntryFullTextを使って、
記事の全文を取得することが出来なくなってしまった。
(以前は出来ていた)

Plaggerを使い始めてからRSSで概要だけ読むなんてことはもう
出来なくなってしまったので早速、違う方法で朝日新聞の速報記事の
全文を取得できるようにしてみた。

RSSから上手く全文記事を引っ張ってくる事が出来なかったために、
よく解らず藻朝日新聞の速報記事一覧のページから一覧を取得し、
EntryFullTextを使って全文を取得するようにした。

[asahi.com:朝日新聞の速報記事一覧]
http://www.asahi.com/list.html

asahi_com_list.yaml

author: labs.zsrv.net
custom_feed_handle: http://www.asahi.com
custom_feed_follow_link: .*?/update/d*/.*?.html
handle: http://www.asahi.com/
extract: <!– End of Headline –>(.*?)<!– google_ad_section_end
extract_capture: body

feeds.yaml

global:
 assets_path: /usr/lib/perl5/site_perl/5.8.6/Plagger/assets
 timezone: Asia/Tokyo

plugins:
  – module: Subscription::Config
    config:
      feed:
        – url: http://www.asahi.com/list.html

  – module: Filter::Rule
    rule:
     module: Deduped
     compare_body: 1

  – module: Filter::EntryFullText
    config:
      store_html_on_failure: 1

  – module: Filter::ResolveRelativeLink

  – module: Publish::Gmail
    config:
      mailto: [username]@gmail.com
      mailfrom: [from mail address]
      mailroute:
       via: sendmail
       host: /usr/sbin/sendmail



Popularity: 2% [?]

DiggGoogle BookmarksGoogle ReaderFacebookDeliciousFriendFeedEvernoteTwitterShare
  1. No comments yet.

  1. No trackbacks yet.