August 19th, 2014

Ларикко Дайнин

И ты бы, Ваня, у них был Vanä

Внезапно наткнулся на то, что MySQL при COLLATE utf8_general_ci (или utf8_unicode_ci) не различает не только большие и маленькие буквы (что как раз нужно, и суффиксу _ci соответствует), но также не отличает буквы с диакритикой от их "обычных" аналогов, в частности 'Melkor' == 'Melkör' и 'kossak' == 'KOŞŞAK'.

Если задать COLLATE utf8_bin -- то теряем и регистронезависимость, что не устраивает.

Погугли немного, поискал на http://stackoverflow.com -- похоже, решение на уровне базы данных отсутствует, т.е. придётся включать utf8_bin, а регистронезависимость реализовывать на уровне приложения.

This entry was originally posted at http://arilou.dreamwidth.org/946980.html. Please comment there using OpenID.