У меня есть много технических электронных книг в формате PDF, в которых нет глав (нет интерактивного оглавления или других средств быстрой навигации по документу), и поэтому очень болезненно искать информацию без полнотекстового поиска. Как я мог их создать? Я хотел бы просто взять книгу в формате PDF и создать точную структуру глав и подразделов, например:
- Intro
- Первая глава
- Инструменты, которые вам понадобятся
- Инструмент XYZ
- Вторая глава
Ну, вы всегда можете купить копию Adobe Acrobat, которая на самом деле предназначена исключительно для создания и редактирования файлов PDF.
Или вы можете импортировать файл в Caliber, преобразовать его в формат ePub, отредактировать ePub, чтобы добавить оглавление, а затем преобразовать обратно в PDF.
Существуют и другие бесплатные инструменты для работы с PDF напрямую. Если вы выполните поиск в Google, вы найдете эту страницу, на которой перечислены несколько бесплатных инструментов для редактирования или изменения PDF различными способами.
Я использовал jPdfBookmarks как в Windows, так и в Linux, чтобы делать именно то, что вы описываете – создавать свои собственные закладки. Найдите его здесь.

-
Это моя рекомендация, если у вас заранее есть оглавление. См. Мой полный учебник ниже – Ooker 21 июня ’18 в 1:52
Я использовал jPdfBookmarks как в Windows, так и в Linux, чтобы делать именно то, что вы описываете – создавать свои собственные закладки. Найдите его здесь.
Я расширю на ответ @Donald, но я также хотел бы отметить, что я не рекомендую лично из-за проблем с качеством когда-либо использовать Caliber для разработки электронных книг.
Как уже говорилось, я предлагаю получить копию Acrobat, и вы можете (в этом примере я использую Acrobat X Standard, но обратите внимание, что я не заметил никакой разницы в кнопках быстрого доступа, НО графический интерфейс изменился начиная с версии 9):
- Откройте файл
.pdf
в Acrobat
- Выберите вкладку закладок слева
- Создание закладки (двумя разными способами): кнопкой
или используйте сочетание клавиш Ctrl + B (windows) или Cmd + B (mac):
Вы можете создавать закладки, перетаскивая закладку подуровня на закладку уровня 1 например:

-
Немного более дешевая альтернатива Adobe Acrobat – Foxit PhantomPDF. Я часто использую его в офисе, чтобы управлять закладками в PDF-документы. – Натан Осман 20 дек. ’13 в 17:20
Я продолжу ответ @Donald, но я также хотел бы отметить, что я не рекомендую, лично по вопросам качества, когда-либо использующим Caliber для разработки электронных книг.
Как уже говорилось, я предлагаю получить копию Acrobat, и вы можете (в этом примере я использую Acrobat X Standard, но обратите внимание, что я не заметил никакой разницы в кнопках быстрого доступа, НО графический интерфейс изменился начиная с версии 9):
- Откройте файл
.pdf
в Acrobat
- Выберите вкладку закладок слева
- Создание закладки (двумя разными способами): кнопкой
или используйте сочетание клавиш Ctrl + B (windows) или Cmd + B (mac):
Вы можете создавать закладки, перетаскивая закладку подуровня на закладку уровня 1, например:
k2pdfopt (бесплатно, с открытым исходным кодом) также может сделать это, предоставив текстовый файл. См. Параметр -toclist
. Используйте так:
k2pdfopt -mode copy -n -toclist my_chapter_list.txt srcfile.pdf -o outfile.pdf
… где my_chapter_list.txt – простой файл ASCII с номерами страниц в начале каждой строки, например
1 Cover2 Table of Contents5 Chapter 125 Chapter 2 ...

-
Редактирует ли это PDF-файл каким-либо образом, кроме добавления toc в качестве метаданных? – MattHusz, 12 июня ’20, 18:01
-
На самом деле cpdf – лучший инструмент для этого – он более прост в использовании и имеет очень похожий параметр (-add-bookmarks), продемонстрированный на coherentpdf.com/usage-examples.html. – willus 12 дек. ’20 в 18:17
k2pdfopt (бесплатно, с открытым исходным кодом) также может сделать это, предоставив текстовый файл. См. Параметр -toclist
. Используйте так:
k2pdfopt -mode copy -n -toclist my_chapter_list.txt srcfile.pdf -o outfile.pdf
… где my_chapter_list.txt – это простой файл ASCII с номерами страниц в начале каждой строки, например,
1 Cover2 Содержание5 Глава 125 Глава 2 ...
Есть также бесплатные инструменты, которые позволяют редактирование/добавление закладок. Примером кроссплатформенности является jPdf Tweak.
Это немного неуклюже в использовании, но вы можете создать оглавление в своей любимой программе для работы с электронными таблицами, экспортировать как csv, а затем просто импортировать его.
-
1У меня также есть использовал jpdftweak, и он мне очень пригодился. Номера страниц могут немного сбивать с толку, если вы хотите, чтобы они были помечены как i, ii, iii, iv, … а затем 1, 2, 3 …, но стоит потратить время, чтобы понять это. – Diagon 3 авг., 19:42
Есть также бесплатные инструменты, позволяющие редактировать/добавлять закладки. Примером кроссплатформенности является jPdf Tweak.
Это немного неудобно в использовании, но вы можете создать оглавление в своей любимой программе для работы с электронными таблицами, экспортировать как csv, а затем просто импортировать его.
-
Подготовьте оглавление в файле .txt
Глава 1. Начало/23, параграф 1.1, потомок начала/25, FitWidth, 96, параграф 1.1.1, потомок. of The Beginning/26, FitHeight, 43Chapter 2. The Continue/30, TopLeft, 120,42 Para 2.1 Child of the Beginning/32, FitPage
Вы можете OCR OCR и используйте регулярное выражение, чтобы исправить это.
-
Загрузить этот оглавление
-
Разверните все закладки ( Ctrl + E ), выберите их все, затем перейдите в Инструменты> Применить смещение страницы
-
Введите первые страницы, которые превосходят номер страницы в оглавлении
Вы можете прочитать его руководство или просмотреть краткое видеоурок. Он имеет режим командной строки и может работать в Linux, Mac.

-
Подготовить оглавление в файле .txt
Глава 1. Начало/23 Пункт 1.1 Дочерний элемент начала/25, FitWidth, 96 Пункт 1.1.1 Дочерний ребенок начала/26, FitHeight, 43 Глава 2. Продолжение/30, TopLeft, 120,42 Пункт 2.1 Дочерний элемент Beginning/32, FitPage
Вы можете OCR TOC и использовать регулярное выражение для его исправления.
-
Загрузить оглавление
-
Разверните все закладки ( Ctrl + E ), выберите их все, затем перейдите в Инструменты> Применить смещение страницы
-
Введите первые страницы, которые превосходят номер страницы в оглавлении
Вы можете прочитать его руководство или посмотреть краткое видеоурок. Он имеет режим командной строки и может работать в Linux, Mac.
Я привык к простому и бесплатному инструменту, который добавляет интерактивные закладки в файлы PDF или DjVU: http://handyoutlinerfo.sourceforge.net/.
Сначала вам нужно подготовиться (и импортировать в инструмент) закладки, введенные в текстовый файл в виде списка ярлыков и страниц с отступом. Затем инструмент создает их в документе в виде закладок, которые вы можете открыть/уменьшить и щелкнуть на левой панели.
Есть несколько хороших вариантов, например сдвиг всех номеров страниц сначала с заданной константой. Это полезно, когда подготовленный файл на самом деле является копией/вставкой отрывка из оглавления, существующего (но только как текст и без закладок) в документе: как обложка, предисловие, введение и т. Д. Обычно нумеруются отдельно.
-
Добро пожаловать в SE-электронные книги. Вы можете заметить, что это старый вопрос, поэтому реакции может быть меньше. Тем не менее, ответы на старые вопросы приветствуются, когда они предоставляют новые данные или знания. – babou 27 сен 2018 в 10:58
Я привык к простому и бесплатному инструменту, который добавляет интерактивные закладки в файлы PDF или DjVU: http://handyoutlinerfo.sourceforge.net /.
Сначала необходимо подготовить (и импортировать в инструмент) закладки, введенные в текстовый файл в виде списка ярлыков и страниц с отступом. Затем инструмент создает их в документе в виде закладок, которые вы можете открыть/уменьшить и щелкнуть на левой панели.
Есть несколько хороших вариантов, например, сдвиг всех номеров страниц сначала с заданной константой. Это полезно, когда подготовленный файл на самом деле является копией/вставкой отрывка из оглавления, существующего (но только как текст и без закладок) в документе: как обложка, предисловие, введение и т. Д. Обычно нумеруются отдельно.
ЭТА ЧАСТЬ РЕДАКТИРУЕТСЯ
Для PDF-файлов, сгенерированных программным способом, т.е. PDF-файлов, созданных не из сканированных изображений, я рекомендую использовать (и проголосовать за ответ Krasjet) pdf.tocgen. Использование этого пакета становится еще проще с описанным далее пакетом toc-mode для (Spac) Emacs.
Для всех других документов PDF и DJVU существует новый пакет, называемый toc-mode для Emacs, который в на мой взгляд, это самый простой способ добавить оглавление в документы (для Linux и, возможно, также для разных ОС). Он включает параметры для извлечения оглавления через OCR.
В случае, если функциональности этого пакета недостаточно или использование Emacs не является вариантом, оставшаяся часть этого ответа остается действительной.
КОНЕЦ ОТредактированной части
(Недостаточно очков репутации для комментариев) Как и ответ Патрика Бурдона, я также рекомендовал бы HandyOutliner (http://handyoutlinerfo.sourceforge.net/). Тем не менее, я бы посоветовал вам попробовать скрипт python под названием document-contents-extractor для извлечения содержимого.
Если эти параметры не работают, я также хотел бы рекомендовать PDF-XChange Viewer в качестве очень мощный экстрактор закладок/содержимого (выделенный текст можно легко добавить в закладки). Хорошо работает под вином.
Хотя это и не связано с вопросом, я просто хотел бы добавить, что на данный момент программа просмотра PDF X-Change кажется мне самым мощным редактором/программой просмотра PDF в Linux. (хотя замечательные инструменты для работы с PDF в Emacs и Zathura – мой любимый редактор PDF и программа просмотра соответственно).
ЭТА ЧАСТЬ РЕДАКТИРУЕТСЯ
Для PDF-файлов, созданных программным обеспечением, т.е. PDF-файлов, созданных не из сканов, рекомендую использовать (и проголосовать за ответ Krasjet) pdf.tocgen. Использование этого пакета становится еще проще с описанным далее пакетом toc-mode для (Spac) Emacs.
Для всех других документов PDF и DJVU существует новый пакет, называемый toc-mode для Emacs, который в на мой взгляд, это самый простой способ добавить оглавление в документы (для Linux и, возможно, также для разных ОС). Он включает параметры для извлечения оглавления через OCR.
В случае, если функциональности этого пакета недостаточно или использование Emacs не является вариантом, оставшаяся часть этого ответа остается действительной.
КОНЕЦ ОТредактированной части
(Недостаточно очков репутации для комментариев) Как и ответ Патрика Бурдона, я также рекомендовал бы HandyOutliner (http://handyoutlinerfo.sourceforge.net/). Тем не менее, я бы посоветовал вам попробовать скрипт python под названием document-contents-extractor для извлечения содержимого.
Если эти параметры не работают, я также хотел бы рекомендовать PDF-XChange Viewer в качестве очень мощный экстрактор закладок/содержимого (выделенный текст можно легко добавить в закладки). Он хорошо работает под вином.
Хотя это и не связано с вопросом, я просто хотел бы добавить, что на данный момент программа просмотра PDF X-Change кажется мне самым мощным редактором/программой просмотра PDF на Linux. (хотя замечательные PDF-инструменты Emacs и Zathura – мой любимый редактор PDF и программа просмотра соответственно).
Офисный пакет WPS в Windows позволяет создавать или редактировать оглавление PDF-файла
Однако имейте в виду, что это немного агрессивно (ярлыки, по умолчанию, работают в фоновом режиме … )
Офисный пакет WPS в Windows позволяет создавать или редактировать оглавление PDF-файлов
Имейте в виду, что это немного агрессивно. (ярлыки, по умолчанию, выполняется в фоновом режиме …)
Я написал набор инструментов командной строки с открытым исходным кодом под названием pdf.tocgen только для этого. Он использует встроенные атрибуты шрифта и информацию о положении заголовков для автоматического создания оглавления.
Например, для версии PDF On Lisp Пола Грэма доступно для загрузки на его веб-сайте, но поставляется без оглавления. Вы можете использовать инструмент pdfxmeta
для создания файла “рецепта”
[[heading]] level = 1font.name = "Times- Полужирный шрифт "font.size = 19.92530059814453 [[заголовок]] level = 2font.name =" Times-Bold "font.size = 11.9552001953125
сохраните его как рецепт .toml
и используйте команду pdftocgen
для автоматического создания структуры
$ pdftocgen onlisp.pdf
Вы могли сохранить вывод в файл с именем toc
$ pdftocgen onlisp.pdf toc
и импортируйте его в файл PDF с помощью pdftocio
:
$ pdftocio -o output.pdf onlisp.pdf
Пожалуйста, прочтите домашнюю страницу, чтобы узнать, как использовать этот набор инструментов. Я надеюсь ты сочтёшь это полезным.
Я написал набор инструментов командной строки с открытым исходным кодом под названием pdf.tocgen только для этого. Он использует встроенные атрибуты шрифта и информацию о положении заголовков для автоматического создания оглавления.
Например, для версии PDF On Lisp Пола Грэма доступно для загрузки на его веб-сайте, но поставляется без оглавления. Вы можете использовать инструмент pdfxmeta
для создания файла “рецепта”
[[heading]] level = 1font.name = "Times- Полужирный шрифт "font.size = 19.92530059814453 [[заголовок]] level = 2font.name =" Times-Bold "font.size = 11.9552001953125
сохраните его как рецепт .toml
и используйте команду pdftocgen
для автоматического создания структуры
$ pdftocgen onlisp.pdf
Вы могли сохранить вывод в файл с именем toc
$ pdftocgen onlisp.pdf toc
и импортируйте его в файл PDF с помощью pdftocio
:
$ pdftocio -o output.pdf onlisp.pdf
Пожалуйста, прочтите домашнюю страницу, чтобы узнать, как использовать этот набор инструментов. Надеюсь, вы найдете это полезным.
Полную версию Adobe Acrobat Pro версии 8 можно бесплатно загрузить по адресу http://www.techspot.com/downloads/4683-adobe-acrobat-8-free.html как для Mac, так и для Windows. Конечно, это не последняя версия, но бесплатная – это хорошо, и она отлично работает для добавления или редактирования оглавления..

-
Это не выглядит законным – я подозреваю, что в нем есть вирусы и трояны. Где на сайте Adobe это можно получить? или, по крайней мере, документ Adobe, в котором говорится, что это законно – мммммм 25 августа 2016, 18:16
-
Теперь, по крайней мере, бесплатно только в течение 7 дней. – Диагон 3 авг. ’19 в 13:20
Полную версию Adobe Acrobat Pro версии 8 можно бесплатно загрузить с сайта http://www.techspot.com/downloads/. 4683-adobe-acrobat-8-free.html для Mac и Windows. Конечно, это не последняя версия, но бесплатная – это хорошо, и она отлично подходит для добавления или редактирования оглавления.
Вот мой репозиторий, в котором я планирую автоматизировать процедуру. https://github.com/aminya/tocPDF
На данный момент это ручная процедура (которая также основана на ответах других людей).
Вот мой репозиторий, в котором я планирую автоматизировать процедуру. https://github.com/aminya/tocPDF
На данный момент это ручная процедура (которая также основана на ответах других людей).
Из Word в PDF, включая закладки
Я создал файл Microsoft Word с помощью Office 2007 и экспортировал его с помощью Jaws PDF Creator. Теперь мне нужны закладки или какие-либо «связующие действия», которые упрощают навигацию по документу. Моя программа просмотра PDF-файлов не позволяет создавать закладки в бесплатной версии, поэтому я думаю, мне нужно справиться с этим через Word! Может быть, с помощью оглавления? Все, что распознается как PDF.
Edit : я понял это с помощью таблицы содержания. Он отлично работает, но это было не то решение, которое я искал. Мне нравятся закладки, но мой создатель PDF не берет на себя тот, который я создал в Word. Мне нужно выяснить, как это может работать.
Это легко сделать в Word 2007 и 2010.. Вам не нужны никакие сторонние инструменты.
В Word 2007 вам понадобится надстройка Microsoft PDF, позволяющая сохранять в формате PDF. Загрузите его отсюда. В Word 2010 надстройка не требуется.
- Откройте документ
- Отметьте нужные заголовки, используя стандартный заголовок 1, заголовок 2, и др. стили. Вы также можете создать оглавление, но это не обязательно.
- Выберите “Сохранить как”> PDF.
- В первый раз, когда вы это сделаете, вы должны установить параметр
- Щелкните Параметры
- Установите флажок Создавать закладки с использованием заголовков .
- Нажмите “ОК”.
- Нажмите “Опубликовать”.
-
1также работает для Word 2010 (в 2010 вам не нужен плагин PDF) – juFo 16 апр. ’12 в 10:10
-
1Я не могу найти эти параметры в Word 2013. – Pedro77, 21 окт. 2015, в 18:33
-
Это также работает без каких-либо плагинов в Word 2016. (Экспорт – Параметры) – Legxis, 3 марта ’20 в 11:39
Это легко сделать в Word 2007 и 2010. Вам не нужны сторонние инструменты.
В Word 2007 вам понадобится надстройка Microsoft PDF, позволяющая сохранять в формате PDF. Загрузите его отсюда. В Word 2010 надстройка не требуется.
- Откройте документ
- Отметьте нужные заголовки, используя стандартный заголовок 1, заголовок 2, и др. стили. Вы также можете создать оглавление, но это не обязательно.
- Выберите “Сохранить как”> PDF.
- В первый раз, когда вы это сделаете, вы должны установить параметр
- Щелкните Параметры
- Установите флажок Создавать закладки с использованием заголовков .
- Нажмите “ОК”.
- Нажмите “Опубликовать”.
Используйте такие вещи, как оглавление и ссылки в вашем файле Word. Затем получите дополнение для экспорта в PDF. Это должно работать нормально, см. Надстройка Microsoft Office 2007: Microsoft Сохранить как PDF .
Используйте такие вещи, как оглавление и ссылки в вашем файле Word. Затем получите дополнение для экспорта в PDF. Это должно работать нормально, см. 2007 Microsoft Office Add-in: Microsoft Save as PDF .
«Правильный» способ сделать это – использовать PDF с тегами. Перейдите в меню преобразования PDF в Word и отметьте «Доступный PDF» (это то, что Word называет PDF с тегами). После этого оглавление создаваемого PDF-файла должно быть видно в приличных средствах просмотра PDF.
Это действительно вопрос SU …
Постскриптум . Посетите http://www.webaim.org/techniques/acrobat/converting.php, где приведены подробные инструкции о том, как это сделать.
«Правильный» способ сделать это – использовать PDF с тегами. Перейдите в меню преобразования PDF в Word и отметьте «Доступный PDF» (это то, что Word называет PDF с тегами). После этого оглавление создаваемого PDF-файла должно быть видно в приличных средствах просмотра PDF.
Это действительно вопрос SU …
Постскриптум . Посетите http://www.webaim.org/techniques/acrobat/converting.php, где приведены подробные инструкции о том, как это сделать.
GS4Word – единственный известный мне бесплатный инструмент, который делает это для более старых версий Word (Word 2003 и ранее) . Не тестировал для Word 2007, но подозреваю, что шансы неплохие, что он будет работать. Сайт, на который я ссылаюсь, на немецком языке, не знаю, является ли это проблемой для вас.

GS4Word – единственный известный мне бесплатный инструмент, который делает это для более старых версий Word (Word 2003 и ранее). Не тестировал для Word 2007, но подозреваю, что шансы неплохие, что он будет работать. Сайт, на который я ссылался, написан на немецком языке, не знаю, является ли это проблемой для вас.
Некоторые расширенные программы просмотра PDF позволяют вручную добавлять закладки к существующим файлам PDF:
- Foxit Reader
- Просмотрщик PDF-XChange

-
о программе просмотра xchange, которая вам нужна d, чтобы использовать профессиональную версию, если вам не нравятся громоздкие замечания «это демонстрация» – wanderameise 12 января 2010 г., 13:36
Некоторые расширенные программы просмотра PDF позволяют вручную добавлять закладки к существующим файлам PDF:
- Foxit Reader
- Программа просмотра PDF-XChange
Попробуйте бесплатный (и бесплатный) OpenOffice.org. При экспорте в PDF закладки сохраняются.
Попробуйте бесплатный (и бесплатный) OpenOffice.org. Экспорт PDF сохраняет закладки.
Теперь ситуация изменилась. Word для Mac 2016 предлагает либо создание PDF-файла на вашем Mac «лучше всего для печати» (и все еще имеет эти ограничения, потому что он использует средство создания PDF-файлов Mac), но теперь предлагает создание «лучшего для электронного распространения и доступности» – файл загружается в Microsoft, а затем загружает созданный PDF-файл, в котором включены все списки содержимого и т. Д.
Я предполагаю, что это работа Microsoft для решения проблемы.
Сейчас ситуация изменилась. Word для Mac 2016 предлагает либо создание PDF-файла на вашем Mac «лучше всего для печати» (и все еще имеет эти ограничения, потому что он использует средство создания PDF-файлов Mac), но теперь предлагает создание «лучшего для электронного распространения и доступности» – файл загружается в Microsoft, а затем загружает созданный PDF-файл, в котором включены все списки содержимого и т. Д.
Я предполагаю, что это работа Microsoft для решения проблемы.
Единственная проблема с вариантом «Лучшее для электронного распространения» состоит в том, что он удаляет любые встроенные шрифты. Так что для меня это даже хуже, чем то, что закладки не работают.
Это кошмар. Такая простая вещь, чтобы получить право. Я страстно ненавижу продукты Microsoft
Единственная проблема с опцией «Лучшее для электронного распространения» состоит в том, что он удаляет все встроенные шрифты. Так что для меня это даже хуже, чем то, что закладки не работают.
Это кошмар. Такая простая вещь, чтобы получить право. Я страстно ненавижу продукты Microsoft