Strip U+0000 in wikitext
authorC. Scott Ananian <cscott@cscott.net>
Mon, 27 Feb 2017 21:27:15 +0000 (16:27 -0500)
committerLegoktm <legoktm@member.fsf.org>
Mon, 6 Mar 2017 22:23:38 +0000 (22:23 +0000)
commit3e32d21210362b9a050862e28b75a11a52b6021e
tree044e8978679b869072f18e5ae4c6bb83b275f6e5
parent22c59e66e7513e7d320042f63a16f35045ee2879
Strip U+0000 in wikitext

U+0000 is not allowed in HTML5, there's no reason to allow it in wikitext.

It simplifies our code if we can just strip them at the start.  Strip in
PST as well so they don't sneak into our database either.

Tweaked the EXT_LINK URLs to account for the fact that invalid characters
get transformed into U+FFFD when using Preprocessor_DOM.  See 73649741ed1e
(r65967) for context on that change.

Bug: T159174
Change-Id: I3f67e92b61aacc87a40c3662085c84d1dac08bfb
includes/parser/Parser.php
languages/LanguageConverter.php
tests/parser/extraParserTests.txt