DocStripper logo

DocStripper

無料のAI駆動のバッチドキュメントクリーナー

Artificial Intelligence GitHub Open Source

概要

DocStripperは、テキストドキュメントから不要な要素を自動的に除去するツールです。特に、ページ番号、ヘッダー、フッター、重複行、空行を簡単に取り除くことができます。

主な機能

  • ファストクリーンモード: ルールベースで瞬時にクリーン
  • スマートクリーンモード: AIを活用して知能的にクリーン(デバイス内のLLM使用)
  • 完全にブラウザ内で作業可能: アップロードやサインアップ不要でプライベート
  • オフラインでも動作
  • 無料でオープンソース

利用シーン

学生や研究者、スキャンしたドキュメントやPDFを扱う人々にとって最適です。また、CLIツールとしても利用できるため、開発者にも向いています。

DocStripperを使うことで、手間のかかるクリーン作業から解放され、時間を有効に活用できます。

投票数: 5
← 投稿一覧に戻る