Image

Imagepapaha wrote in Imageru_java

Category:

Производительность при работе с данными в кодировках UTF-8, UTF-16

    Никто из участников сообщества не задавался вопросом, с какой кодировкой работает  Java быстрее (UTF-8 или UTF-16)? Учитывая, что низкоуровневая работа со строками, безусловно, осуществляется в кодировке UTF-16, корректно говорить не о работе над строками, а о задачах потокового ввода/вывода.
    Проведя ряд не очень сложных экспериментов, мы пришли к выводу, что с UTF-8 работа идет быстрее, хотя можно было бы и ожидать обратное, поскольку внутреннее представление в UTF-16. Надо сказать, что тестирование проводилось на текстах с символами, выходящими за BMP, т.е. символы кодировались 4 байтами в обоих случаях, кроме пробелов.
    Возмжно, в JVM есть дополнительная оптимизация под UTF-8?