Как конвертировать Word файлы в HTML бесплатно?
Сегодня перед контент-менеджерами встала задача: перенести тексты и картинки из порядка 500 Word-документов на сайт. Само собой, что для картинок копи-паст не катит. Поискав какую нибудь тулзу для конвертации, я понял, что дело это гиблое, т.к. некоторые сохраняли все файлы в одну директорию, давая картинкам лаконичные названия типа image<num>.<ext>.
Само собой, что такой вариант не подходил, ибо получалось примерно 1500 картинок, в которых совершенно невозможно было найти нужную.
Решение пришло не сразу, но оказалось, как все гениальное, очень простым!
Есть такой всем известный сервис Google Docs. Туда можно пачками закачивать файлы и так же пачками конвертировать их в другие документы.
Как это работает?
Ну во-первых, заходим в сервис (желательно завести для таких целей левый аккаунт, чтобы не засорять рабочий, если вы им конечно пользуетесь).
Во-вторых, заливаем файлы на сервер. Сделать это можно двумя способами: вручную или с помощью програмки Google Docs Uploader. В принципе между этими двумя способами разница не велика. А потом экспортируем закаченные файлы в нужный формат. Данный процесс в картинках:
Вот, собственно, и все!
Пара ложек дегтя
- Некоторые документы при закачке на сервер криво конвертируются. Поэтому могут быть глюки в верстке документа или отсутствовать некоторые картинки (я предполагаю, что особо крупные картинки)
- Максимальный размер файла после конвертации не должен превышать 500 Kb, иначе документ не закачается. Зависит размер от многого, но в среднем файлы размером 1M-1.5M при конвертации помещались в данный лимит
- Третий, и, возможно, самый обидный минус: кирилические символы в именах файлов при экспорте преобразуются в «-«. Казалось бы мелочь, но когда встречаются фалы с именами одинаковой длины, написанными в кирилице, происходит перезаписывание результата. В итоге, при экспорте, в архиве может оказаться процентов на 10-40 (а то и больше) меньше файлов, чем было загружено на сервер.
Теги: HTML, Web-programing, Word, Всяко-разно, Работа