Да, utf8 - самая хорошая кодировка, бла-бла-бла. Только это понимает мало кто в этой и соседних странах - практически ВСЕ mp3-шки (и не только), которые я качаю, содержат теги в cp1251.
Для того чтобы перекодировать ID3-теги всех файлов рекурсивно я использую такую команду: find -iname -print0 "*.mp3" | xargs -0 mid3iconv -e CP1251 --remove-v1
Упорное гугление на предмет дружбы SciTE с cp1251 не дало никаких конструктивных результатов. Единственный совет, связанный с кодировкой был в дописывании двух строк в конфиг .SciTEUser.properties:
1
2
|
code.page=1251
character.set=204 |
Кракозябры с одних сменились на другие и появилась возможность русского ввода. Русиш в виндовых файлах по-прежнему не определяется.
Итого, вопрос: как научить SciTE корректно отображать кодировки при одновременной работе с файлами разных кодировок: cp1251 и utf-8?
Перезаписать теги из кодировки cp1251 в utf8 можно командной:
find -iname '*.mp3' -print0 | xargs -0 mid3iconv -d -eCP1251 --remove-v1
Нужен пакет python-mutagen.
Многие сталкивались с проблемой отображения кириллических тегов в Amarok. В этой статье я опишу два наиболее подходящих на мой взгляд способа решения этой проблемы.
Корень проблемы
Скажу сразу, Amarok тут не при чем. Дело в том, что большинство музыки, которую вы добываете на торрентах, покупаете на дисках и пр. содержит теги в кодировке cp1251. Это кодировка принята по умолчанию для отображения кириллицы в Windows. Данный подход давно устарел и все Linux дистрибутивы перешли на универсальную кодировку UTF-8.
Если глянуть еще глубже, то можно увидеть, что для чтения и отображения тегов amarok использует библиотеку taglib. Вот она-то и не хочет отображать теги в кодировке cp1251 корректно. Оно и понятно, зачем, если вся система работает с UTF-8?. В итоге вместо русских тегов в amarok мы видим каракули. Но не стоит отчаиваться, решение есть и не одно!