-
Кельвин Муриуки
- 31 октября 2019 г.
- Документы
- 12 комментариев
- Читать 5 мин.
Итак, на днях я имел в виду автономный документ, который на самом деле был просто скомпилированным источником многих HTML-страниц. Открытие каждой страницы каждый раз из индекса оказалось довольно сложной задачей, не говоря уже о временных затратах.
По этой причине я решил скомпилировать все эти страницы в один HTML, чтобы я мог легко выполнять поиск по одной странице вместо 22 страниц.
Сначала мне показалось, что я мог получить в Интернете бесплатное программное обеспечение, которое могло бы делать именно это, и, к счастью, я получил HTML Merge от SourceForge. Однако моя удача длилась недолго из-за того, что это программное обеспечение не соответствовало этой задаче: оно отклонило эти конкретные HTML-страницы из-за того, что они были в неподдерживаемой кодировке , а затем забыло упомянуть что он поддерживал. Поэтому я попытался сохранить некоторые из них в том, что я считал стандартом (UTF-8), но это вызвало у меня ту же самую ошибку.
Не имея возможности, я решил пойти по ручному маршруту: откройте каждый HTML-код по отдельности, а затем используйте находку – копирование и вставку. Пройдя несколько страниц, я вспомнил, что недавно Notepad ++ помог мне объединить несколько простых текстовых файлов. Так что насчет HTML? Оказалось, что он тоже может справиться с этим.
Объединение HTML-файлов с помощью NPP Combine Плагин
Примечание:
- Когда я говорю “объединить” или “объединить”, я имею в виду именно это: добавление одного файла за другим, без какого-либо редактирования HTML-тегов.
- Менее двусмысленный, хотя и непопулярный термин для этого, я считаю, – это конкатенация . Поэтому я бы не советовал использовать этот метод для контента, который вы планируете публиковать на веб-сайте. Однако для автономных HTML-документов из того же источника (например, книги) я не вижу вреда.
1. Сначала откройте Notepad ++. Вы можете получить переносную или устанавливаемую версию здесь.
2. Теперь нам нужно установить плагин под названием Combine (NPP Combine) , чтобы это работало. Вы можете сделать это одним из способов:
a. При подключении к Интернету перейдите в меню Плагины и в разделе Диспетчер плагинов выберите Показать диспетчер плагинов . Менеджер плагинов автоматически загрузит все доступные плагины и перечислит их там. Найдите и выберите Объединить , затем нажмите кнопку Установить .
b. Получите плагин вручную со страницы разработчиков и установите его. Для установки просто скопируйте загруженный файл (common.dll) в подпапку плагинов, расположенную внутри установочной папки Notepad ++. Перезапустите программу, чтобы загрузить плагин.
3. Откройте все HTML-файлы, которые нужно объединить, с помощью Notepad ++.. Чтобы сделать это простым способом, просто выберите их все в файловом менеджере, а затем перетащите их в окно Notepad ++.
4. Теперь перейдите в меню Плагины и выберите Пуск под плагином Объединить .
Откроется окно плагинов с некоторыми настройками. Поскольку это HTML, я не думаю, что разумно что-либо добавлять, поэтому просто нажмите кнопку OK.
5. В результате все открытые файлы будут объединены в один большой файл в том порядке, в котором они были открыты (т. Е. От первой до последней вкладки). Чтобы закончить, сохраните этот новый файл, и все готово.
Теперь вы можете продолжить и открыть объединенную HTML-страницу в браузере, чтобы увидеть результат. Если вам нужно удалить любой повторяющийся элемент со страниц (например, изображения или навигационные ссылки на другие страницы, которые сейчас не существуют), просто откройте объединенный файл с помощью Notepad ++ и используйте функцию Replace ( Ctrl + H), чтобы удалить элементы за один раз.
После этого, если это книга, как в моем случае, я полагаю, вы хотели бы преобразовать объединенный HTML в более переносимый формат, например PDF или Word, если вы хотите отредактировать содержимое.
HTML в PDF
Для PDF я бы рекомендовал открыть файл HTML с помощью браузера Chrome и использовать его превосходный экспорт в PDF, которая также предлагает некоторые изящные настройки.
Если вы используете Windows 8/10, вы также можете использовать встроенный в Windows принтер PDF для экспорта в PDF из любого браузера. Есть также множество бесплатных программ и онлайн-сервисов, которые могут вам в этом помочь.
HTML to WORD
Для Word хорошая новость заключается в том, что практически любой MS Версия Word по умолчанию обрабатывает файлы HTML. MS Word фактически отображает фактический HTML, а не отображает его необработанный вывод.
Поэтому просто откройте файл с помощью MS Word, а затем сохраните документ в редактируемом формате Word ( * docx, * .doc).

12 комментариев
-
Anonymous
Очень полезная статья, спаси мне жизнь, спасибо!
Ответ -
Мухаммед Налхир Назим
Спасибо. Ваш пост – посланный Богом. Желаю вам больше сил, чтобы облегчить нам жизнь компьютерным гикам.
Ответить -
Travelbytes
Рад помочь. И тебе больше сил, брат.
Ответить -
Николас Корманик
Почему не просто копировать по старинке ?:
copy * .h * big
Затем переименуйте big в something.htm.
Николай Корманик
Ответ -
Джо Руссо
У меня было 120 файлов HTML в экспорте из заархивированного проекта Basecamp. Эти шаги позволили легко объединить все для удобной прокрутки/поиска. Большое спасибо!
Ответ -
Кельвин Муриуки
Я рад, что вы нашли его полезным.
Ответить -
куя
Обычно я выполнял комбинирование вручную с помощью текстового процессора. Это экономия времени. Спасибо!
Ответ -
journeybytes
Добро пожаловать
Ответ -
JK
К вашему сведению, я вижу, что многие изображения и графика в статьях «сломаны». Я использую текущую установку Brave на Win10.
Пример URL: https://www.journeybytes.com/wp-content/uploads/2017/07/2017-07-0616_15_19-NPPCombine1.03.png
Результат: ошибка 522 от Cloudflare. «Если вы являетесь владельцем этого веб-сайта:
обратитесь к своему хостинг-провайдеру и сообщите ему, что ваш веб-сервер не выполняет запросы. Ошибка 522 означает, что запрос смог подключиться к вашему веб-серверу, но запрос не завершился ».Ответ -
Кельвин
Здравствуйте, JK,
Большое спасибо, что дали мне знать, я займусь этим. Недавно я сменил сервер, и это было совсем не гладко.Ответ -
Гэри
Привет,
Я попробовал слияние HTML с помощью Notepad ++, как было предложено. Когда комбайн завершился, у меня был файл .TXT, а не HTML. Я не видел возможности использовать «Сохранить как» для получения комбинированного HTML-файла,
Пожалуйста, посоветуйте.
Спасибо,
ГэриОтвет -
Kelvin
Привет, Гэри,
Когда объединение завершено, он создает файл без формата. Именно при сохранении файла вы должны выбрать файл языка гипертекстовой разметки (* .html, * .htm…) из раскрывающегося списка. И «Сохранить», и «Сохранить как…» должны работать. Только что протестировано с последней версией (7.9.1). Сообщите мне, если вам по-прежнему не удается сохранить файл.Ответ