pluton 31.05.2009 17:48
Tips & tricks — Скрипт перекодировки fb2 из win1251 в utf8
Всем привет!Выкладываю небольшой скрипт для перекодировки fb2-файлов из win1251 в utf8.
Скрипт распаковывает все *.fb2.zip файлы, дальше проверяет кодировку, если она windows-1251, то конвертирует в utf-8. Потом каждый файл запаковывается в архив.
1 |
#!/bin/bash
|
Собственно, fb2 -- это обычный xml, поэтому можно (попробовать) изменить константу MASK вначале на нужные типы файлов.
зы. это мой первый работающий и полезный шелл-скрипт, поэтому буд рад всяким улучшениям и предложениям.
konkere 31.05.2009 19:26 #
+ -1 -
А iconv не возьмёт fb2?
Сначала тоже про iconv подумал, но прочитав код, понял свою ошибку. Вобщем-то да, неплохо — только зачем? Все FB2 ридеры понимают encoding, к тому же UTF-8 избыточна по отношению к CP1251 (файл разрастётся в полтора-два раза)… Или ты читаешь FB2 с помощью less или more? :)
P.S. И не ржите — впервые я FB2 читал в Блокноте под виндой :)
P.S. И не ржите — впервые я FB2 читал в Блокноте под виндой :)
Присоединяюсь - зачем?!
эта затея понадобилась с покупкой lbook reader v3. он действительно читает в utf8 и cp1251, но, как говорят, только с последней прошивки (у меня она и стоит). но, мало ли чего, мож захочу более старые посмотреть (вроде там батарея меньше тратится).
то есть, смысла не много, но пусть будет в Ъ кодировке.
+ появилась возможность поковырять shell scripting и написать полезный скрипт
fb2 файлы это XML, и тут уже по барабану какая у него кодировка, если она указана в заголовке конечно - <?xml version="1.0" encoding="windows-1251"?>
Неужели есть программы, не умеющие работать с отличной от utf-8 кодировкой в fb2?
Неужели есть программы, не умеющие работать с отличной от utf-8 кодировкой в fb2?