37.5Kпросмотров
11 июня 2025 г.
📷 ФотоScore: 41.3K
PDFRip: вытаскивает текст и картинки из PDF PDFRip — это утилита на Python, которая помогает быстро извлечь текст и изображения из PDF-документов. Работает через командную строку. Удобна, если надо разобрать большой файл на составляющие. Установка:
git clone https://github.com/mufeedvh/pdfrip cd pdfrip pip install -r requirements.txt python3 rip.py yourfile.pdf Использование:
Запускаешь с файлом PDF — получаешь в папке output/ текстовые файлы и изображения по страницам.