Есть вопрос! — CP1251 - > UTF-8 & XML
Друзья мои! Есть вопрос! Подтолкните в нужную сторону, плз!
Есть FB2-библиотека, которая содержит в себе книги как в нормальной кодировке (UTF8), так и в ненормальной (CP1251). Подскажите, как можно всю библиотеку одним махом переконвертировать в UTF8? Это первый вопрос.
Вопрос номер два. В этой же библиотеке содержаться книги с не совсем правильным указанием автора/названия/серии/etc. Необходимо подправить определенные тэги в определенных книгах. С помощью чего это можно сделать скопом? Т.е. - указываем каталог, в котором находится определенный автор, указываем в скрипте именяемый параметр и запускаем.
Естественно, я осознаю, что все решения будут строиться на скриптах - после оформлю в ХАУТУ или в СКРИПТС.
Всем спасибо за помощь.
UPD 1: Перекодировка из любых/неизвестных кодировок в кодировку текущей локали (спасибо urandom за подсказку)
В случае, если необходимо кодировать в кодировку, отличную от текущей локали, используем ключ -x
Есть FB2-библиотека, которая содержит в себе книги как в нормальной кодировке (UTF8), так и в ненормальной (CP1251). Подскажите, как можно всю библиотеку одним махом переконвертировать в UTF8? Это первый вопрос.
Вопрос номер два. В этой же библиотеке содержаться книги с не совсем правильным указанием автора/названия/серии/etc. Необходимо подправить определенные тэги в определенных книгах. С помощью чего это можно сделать скопом? Т.е. - указываем каталог, в котором находится определенный автор, указываем в скрипте именяемый параметр и запускаем.
Естественно, я осознаю, что все решения будут строиться на скриптах - после оформлю в ХАУТУ или в СКРИПТС.
Всем спасибо за помощь.
UPD 1: Перекодировка из любых/неизвестных кодировок в кодировку текущей локали (спасибо urandom за подсказку)
find -iname '*.fb2' -print0 | xargs -0 -I {} enconv {}
В случае, если необходимо кодировать в кодировку, отличную от текущей локали, используем ключ -x