5.3. Pcre

Обновленная версия пакета pcre 7.8 включает следующие изменения:
  • Проверка UTF-8 теперь производится в соответствии с правилами RFC 3629 вместо RFC 2279, которые являются более строгими. Так, например, порядковое значение знаков UTF-8 ограничивается 0x0010FFFF:
    $ echo -ne "\x00\x11\xff\xff" | recode UCS-4-BE..UTF8 | pcregrep --utf-8 '.'
    pcregrep: pcre_exec() error -10 while matching this line:
    
    За подробной информацией обратитесь к http://tools.ietf.org/html/rfc3629#section-12.
  • Созданные предыдущими версиями PCRE шаблоны надо будет пересоздать. Это может сказаться на производительности программ, которые хранят выражения PCRE во внешней памяти и загружают их при необходимости. Обычно применяется с целью повышения производительности, в частности при создании комплексных спам-фильтров.