Eleneldil G. Arilou (arilou) wrote,
Eleneldil G. Arilou
arilou

Excel, CSV, UTF-8

Матерно ругался, что в начале второго десятилетия XXI-го века "клятый мелкософт" не может даже распознать, что в текстовом файле utf-8, и упорно читает его в 8-битной кодировке. Очень мешало тем, что подготовленные скриптом CSV'шки перекодировать записывать в виндовой кодировки для подачи начальству.

Сегодня лишний раз об этом задумавшийсь, спросил гугля. Быстро наткнулся не на ответ, но на подсказку (ответ там был на другой вопрос из той же области). Проверил. И точно! Оказалось, Microsoft поступил как раз вполне прилично: не пытаясь что-то угадать, просто ожидал в начале файла BOM. Есть BOM -- по нему определяет разновидность юникода, нету - считаем кодировку 8-битной (и используем ту, что в локали). И даже поправить файл без BOM проще простого - открыть его в Notepad (этот юникодный текст поймёт и так) и селать "Save as", убедившись, что там кодировка указана правильно.

PS: Да, в моём любимом редакторе это, конечно, тоже можно сделать.

This entry was originally posted at http://arilou.dreamwidth.org/873329.html. Please comment there using OpenID.
Tags: компы, на заметку, работа
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 3 comments