生成AIデータの自動生成WordPressプラグイン「LLMS TXT and Full TXT Generator」

【公開】LLMS.txt/Full Textを自動生成するWordPressプラグイン「LLMS TXT and Full TXT Generator」
当記事には広告が含まれますが、消費者庁および国民生活センターの情報を参考に、広告ポリシーに基づいて作成しています。

WordPressサイトのコンテンツを、LLM(大規模言語モデル)の学習データ「llms.txt」と「llms-full.txt」として、簡単に生成できるプラグイン「LLMS TXT and Full TXT Generator」を公開しました。

いつもの匠

元システムエンジニアの いつもの匠 です。

エンジニアは辞めたはずなのに、勢い余って開発してしまった…

本プラグインは、元々WordPress.orgで公開されていた「LLMs-Full.txt and LLMs.txt Generator」をフォークして、日本人専用に機能拡張したものです。

\\ クリックタップできる //
目次

なぜこのプラグインを開発したのか

当サイトを運営する中で、LLMによるコンテンツ参照や学習を最適化しなければならない!と判断した2025年3月。まずは既存の同種プラグインを使い始めました。しかし、実際に使っていく中で「こんな機能があったらもっと便利なのに」と思う点がいくつも出てきました。

  • コンテンツ更新時の自動反映
  • 定期的な自動生成
  • より柔軟なURLフィルタリング
  • デバッグ機能
いつもの匠

どのプラグインも「帯に長したすきに短し」で困ってたんだよね…

そこで仕方なく、筆者自ら既存プラグインをフォークし、機能追加していくことにしました。出来上がってみれば大幅に拡張され、ほぼ別物のプラグインとなりました。

いつもの匠

どうせなら皆で使って、生成AI時代を乗り切りたいよね!

そう感じて、公開に踏み切った次第です。

主な機能と特徴

LLMS TXT and Full TXT Generator 管理画面
LLMS TXT and Full TXT Generator 管理画面

今回の公開で、元のプラグインから機能拡張した点は以下です。

1. 自動更新機能

投稿の追加・更新・削除時に自動的にllms.txtとllms-full.txtファイルを更新します。これにより、常に最新のコンテンツがLLMに認識されるようになります。サイト管理者が手動で更新する手間が省け、コンテンツの鮮度を保つことができます。

いつもの匠

これが一番欲しかった機能だね。手動で作成するのは大変だからさ

とにかく自動化したいサイト管理者に取って、必要不可欠な機能になるはずです。少なくとも筆者には。

2. 定期実行機能

WordPress Cronを利用した定期的な自動生成機能を実装しました。更新頻度を「毎時」「1日2回」「毎日」「毎週」から選択可能で、サイトの更新頻度に合わせた設定ができます。

いつもの匠

これは必要か分からなかったんだよね…でも、負荷が高いサイトは1日1回生成するようにしたいかも、と思って追加してみたんだ。

この昨日はサイト更新が頻繁な大規模サイトにとって、有用になるであろう機能です。

3. URLフィルター処理の改善

元のプラグインでは、特定のURLを除外する機能がありましたが、実際の運用では思ったように動作しないケースがありました。特に末尾のスラッシュの有無による不一致が問題でした。

そこで筆者のプラグインでは、以下の仕様としました。

LLMS TXT and Full TXT Generator  フィルター処理
LLMS TXT and Full TXT Generator フィルター処理
  • URLの正規化処理(末尾のスラッシュを一貫して処理)
  • 完全一致とパターンマッチの二段階チェック
  • 絶対URLと相対URLの両方での検証
  • デバッグログによる処理の可視化

これらの改善により、意図通りにURLをフィルタリングできるようになりました。

いつもの匠

生成AIに学習させたくない記事を、細かく制御したかったんだ!

4. カスタムヘッダーテキスト機能

生成されるファイルの先頭に任意のテキストを追加できる機能も実装しました。

LLMS TXT and Full TXT Generator  カスタムヘッダーテキスト管理画面

サイトポリシーやAI利用のガイドライン、著作権表示などを記載できるため、LLMによるコンテンツ参照時の文脈を提供できます。

いつもの匠

ちょっとマニアックだし、robots.txtで代替できそうな内容もあるよね。だから、利用者の任意で追加できるようにしたよ。使わないかもだけど…

5. デバッグモード

URLフィルタリングの挙動を詳細に記録するデバッグモードを追加しました。これにより、「なぜこのURLが含まれている/除外されている」のかを正確に把握でき、トラブルシューティングが容易になりました。

いつもの匠

実はデバッグしてる中で必要になって、仕方なく追加した機能なんだ…

6. UI/UX改善

管理画面をタブ式インターフェースに刷新し、設定項目をカテゴリ別に整理しました。

LLMS TXT and Full TXT Generator タブ

また、生成されたファイルの情報(最終更新日時、サイズ)を詳細表示するなど、使い勝手も大幅に向上させました。

いつもの匠

割り切って、日本人専用の画面にしたよ!

もはや元プラグインの影も形も無くなってしまいましたが…すいません💦

使用方法

同じ内容がReadme.mdにもありますが、自力でZIPファイルをダウンロードして、インストールする必要があります。そのため、WordPress完全初心者には難しいかもしれませんので、ご注意ください。

インストール

  1. GitHubからZIPファイルをダウンロード
  2. WordPressの管理画面から「プラグイン」→「新規追加」→「プラグインのアップロード」を選択
  3. ダウンロードしたZIPファイルをアップロードしてインストール
  4. プラグインを有効化

基本設定

  1. WordPress管理画面の「設定」→「LLMS.txt生成設定」を開く
  2. 「基本設定」タブで、ファイルに含める投稿タイプを選択
  3. 必要に応じてカスタムヘッダーテキストを追加
  4. 「抜粋を含める」オプションを設定(llms-full.txtに投稿の抜粋を含めるかどうか)

更新設定

  1. 「投稿の変更時に自動更新」を有効にすると、コンテンツ更新時に自動的にファイルが生成されます
  2. 「定期的に自動生成」を有効にして頻度を設定すると、指定した間隔で自動的にファイルが生成されます
  3. 「デバッグモード」を有効にすると、URL処理の詳細なログが生成されます

URLフィルター設定

URLフィルターでは、ワイルドカード(*)を使用してパターンを指定できます:

https://example.com/page1
https://example.com/page2
/contact
/about-us
*/exclude-this-part/*

URLの末尾のスラッシュは自動的に削除されるため、/contact//contact は同じものとして扱われます。

今後の展望

LLMS.txtやllms-full.txtの仕様は、LLM技術の進化に伴って変更される可能性があります。今後も仕様変更に応じて機能更新を続けていく予定です。

謝辞とフィードバック

このプラグインは元々rankth氏が開発した「LLMS Full TXT Generator」をベースにしています。素晴らしい基盤を作ってくださったrankth氏に感謝します。

使ってみて不具合や改善要望があれば、ぜひGitHubのissueで報告してください。可能な限り対応していきます。

ダウンロード

GitHubリポジトリからダウンロード可能です。

免責事項

このプログラムによるいかなる不都合や事故も補償しません。ご使用は自己責任でお願いします。


生成AIは今後もどんどん発展していくでしょう。このプラグインがWordPressユーザーのみなさんと、LLMの橋渡しになれば幸いです。ぜひご活用ください!

目次