再びPlaggerで宇多田ヒカルの日記をRSS化
先日の「Plaggerで宇多田ヒカルの日記をRSS化」のエントリーに、大旦那 otsune さんから「はてブ」でコメントをいただいた。
はてなブックマーク - Plaggerで宇多田ヒカルの日記をRSS化 - koji's blog
linkの値をどうすれば参照できるかわからなかったのだが、otsuneさんのページのこの辺を参考にしてやってみたら、うまくいった。
- assets/plugins/Filter-EntryFullText/u3music_com_message.yaml
# Message from Utada Hikaru / Utada
# http://www.u3music.com/message/
author: Koji Kawade
custom_feed_handle: http://www\.u3music\.com/message/
custom_feed_follow_link: index\.php\?m=1&d=\d+j\.xml
handle: http://www\.u3music\.com/message/index\.php\?m=1&d=\d+j\.xml
extract_xpath:
title: //div[@class="blue"]/text()
date2: //div[@class="blue02"]/text()
body: //div[@class="txt"]/..
extract_after_hook: |
$data->{year} = $args->{entry}->link;
$data->{year} =~ s!http://www\.u3music\.com/message/index\.php\?m=1\&d=(\d{4})\d+.\.xml!\1!;
$data->{date} = $data->{year} . "." . $data->{date2};
$data->{body} =~ s!<td>(.*?)</td>!\1!;
linkの値は「$args->{entry}->link」で参照できるようだ。
linkから年に当たる箇所を取り出すのは、
$data->{year} =~ s!http://www\.u3music\.com/message/index\.php\?m=1\&d=(\d{4})\d+.\.xml!\1!;
とやって、不要な部分を取り除いている。
先日のものよりこちらの方がスッキリしていいよね。