02.FeedWordPressってすごい! でも、ダメだった……あなたへ

02.FeedWordPressってすごい! でも、ダメだった……あなたへ


すいません、さっきのFeedWordPressのことなんですが、そのプラグインがあればアンテナサイトが作れちゃうんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。基本的には作れます。
基本的にということは応用的にはダメ?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。ワードプレスではRSS系だとFeedWordPressが一強という感じなんですが、色々と課題もあるんです。
昔、私もFeedWordPressを使っていたんですが止めました。
えっなんでですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
大きな理由は2つあります。
1つは複数のRSSフィードを登録すると負荷が掛かり過ぎて止まります(笑)
1つは抜粋しか取得できないことです。
だから自分で作っちゃったんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
そうですね。作っちゃいました。
特に抜粋しか取得できないというのが一番の難点だと思います。
タイトルとリンクだけ必要という方はそれでいいとは思いますけどね。
抜粋というのは記事の一部ということですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
はい。最近ではRSSフィードで配信される記事は全文ではなく、抜粋のことが多いです。
続きは本家サイトで見てね、ということなんでしょう。
なので当然、RSSを取得すると元々が抜粋なので、ワードプレスに投稿される記事も抜粋ということになります。
あーなるほど。そういうことなんですね。
でもないものをどうやって手に入れるんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
具体的にいうとスクレイピングという手法です。
RSSフィードには元記事のURLが必ず記述されているので、元記事のURLは分かります。
元記事のURLが分かればそこには記事全文があるので、全文をスクレイピングという手法で取得するんです。
スクレイピング? どんな手法なんですか?
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
簡単に説明するとHTML構造から目的のタグを指定して、その内容を取得するというものです。
なので、私が作ったWP RSS Scrapeing PostはRSS×スクレイピング機能の二段構えなんです。
へーよく分からないですけど、すごいんですね!
ランファ
ランファ
阿修羅ワークス
阿修羅ワークス
しかも、FeedWordPressの問題点であった複数のRSSフィードを設定するとサーバーが落ちる問題もありません。
負荷分散処理を用いて一点にサーバーの負荷が掛からないようにしているからです。
動作も軽量です。
恐れ入りました!
ランファ
ランファ