title: Convert binary regexp to use Unicode code points
authorThiemo Kreuz <thiemo.kreuz@wikimedia.de>
Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
committerThiemo Kreuz <thiemo.kreuz@wikimedia.de>
Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
commitc00c1f0b21ec4b07ab317e410945fb9cd336317a
tree547bd52871b62f7a9fddba8d4a4617b2ec304594
parent38962766742bd4319027f8f8da5a7f908de05eed
title: Convert binary regexp to use Unicode code points

The hex sequences are the raw binary values for the Unicode code points.
Now that we have a more modern PHP at hand, we can use \x{FFFF} for
Unicode characters.

I believe the /S is not needed any more. It "precompiles" the regular
expression. But this is a pretty trivial regular expression.
Precompiling it is most probably even slower.

Change-Id: I49435114b3bc31dcce8aa4e48091d509844a2a07
includes/title/MediaWikiTitleCodec.php