title: Convert binary regexp to use Unicode code points

author Thiemo Kreuz <thiemo.kreuz@wikimedia.de>

Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)

committer Thiemo Kreuz <thiemo.kreuz@wikimedia.de>

Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
author Thiemo Kreuz <thiemo.kreuz@wikimedia.de>
Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
committer Thiemo Kreuz <thiemo.kreuz@wikimedia.de>
Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
diff --git a/includes/title/MediaWikiTitleCodec.php b/includes/title/MediaWikiTitleCodec.php

index 31a0222..7af0c1e 100644 (file)
--- a/includes/title/MediaWikiTitleCodec.php
+++ b/includes/title/MediaWikiTitleCodec.php
@@ -284,7 +284,7 @@ class MediaWikiTitleCodec implements TitleFormatter, TitleParser {
                 # Strip Unicode bidi override characters.
                 # Sometimes they slip into cut-n-pasted page titles, where the
                 # override chars get included in list displays.
-               $dbkey = preg_replace( '/\xE2\x80[\x8E\x8F\xAA-\xAE]/S', '', $dbkey );
+               $dbkey = preg_replace( '/[\x{200E}\x{200F}\x{202A}-\x{202E}]+/u', '', $dbkey );
  
                 # Clean up whitespace
                 # Note: use of the /u option on preg_replace here will cause
author	Thiemo Kreuz <thiemo.kreuz@wikimedia.de>
	Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)
committer	Thiemo Kreuz <thiemo.kreuz@wikimedia.de>
	Mon, 13 May 2019 09:28:30 +0000 (11:28 +0200)