merged from master
[lhc/web/wiklou.git] / includes / MagicWord.php
index 87efa55..131ae1d 100644 (file)
@@ -1,6 +1,7 @@
 <?php
 /**
  * File for magic words
+ *
  * See docs/magicword.txt
  *
  * @file
@@ -9,8 +10,13 @@
 
 /**
  * This class encapsulates "magic words" such as #redirect, __NOTOC__, etc.
- * Usage:
- *     if (MagicWord::get( 'redirect' )->match( $text ) )
+ *
+ * @par Usage:
+ * @code
+ *     if (MagicWord::get( 'redirect' )->match( $text ) ) {
+ *       // some code
+ *     }
+ * @endcode
  *
  * Possible future improvements:
  *   * Simultaneous searching for a number of magic words
  * Please avoid reading the data out of one of these objects and then writing
  * special case code. If possible, add another match()-like function here.
  *
- * To add magic words in an extension, use the LanguageGetMagic hook. For
- * magic words which are also Parser variables, add a MagicWordwgVariableIDs
+ * To add magic words in an extension, use $magicWords in a file listed in
+ * $wgExtensionMessagesFiles[].
+ * 
+ * @par Example:
+ * @code
+ * $magicWords = array();
+ *
+ * $magicWords['en'] = array(
+ *     'magicwordkey' => array( 0, 'case_insensitive_magic_word' ),
+ *     'magicwordkey2' => array( 1, 'CASE_sensitive_magic_word2' ),
+ * );
+ * @endcode
+ *
+ * For magic words which are also Parser variables, add a MagicWordwgVariableIDs
  * hook. Use string keys.
  *
  * @ingroup Parser
@@ -29,9 +47,14 @@ class MagicWord {
        /**#@+
         * @private
         */
-       var $mId, $mSynonyms, $mCaseSensitive, $mRegex;
-       var $mRegexStart, $mBaseRegex, $mVariableRegex;
-       var $mModified, $mFound;
+       var $mId, $mSynonyms, $mCaseSensitive;
+       var $mRegex = '';
+       var $mRegexStart = '';
+       var $mBaseRegex = '';
+       var $mVariableRegex = '';
+       var $mVariableStartToEndRegex = '';
+       var $mModified = false;
+       var $mFound = false;
 
        static public $mVariableIDsInitialised = false;
        static public $mVariableIDs = array(
@@ -60,6 +83,7 @@ class MagicWord {
                'numberofarticles',
                'numberoffiles',
                'numberofedits',
+               'articlepath',
                'sitename',
                'server',
                'servername',
@@ -71,6 +95,7 @@ class MagicWord {
                'fullpagenamee',
                'namespace',
                'namespacee',
+               'namespacenumber',
                'currentweek',
                'currentdow',
                'localweek',
@@ -79,13 +104,12 @@ class MagicWord {
                'revisionday',
                'revisionday2',
                'revisionmonth',
+               'revisionmonth1',
                'revisionyear',
                'revisiontimestamp',
                'revisionuser',
                'subpagename',
                'subpagenamee',
-               'pipetrick',
-               'pipetricke',
                'talkspace',
                'talkspacee',
                'subjectspace',
@@ -177,44 +201,35 @@ class MagicWord {
 
        /**#@-*/
 
-       function __construct($id = 0, $syn = '', $cs = false) {
+       function __construct($id = 0, $syn = array(), $cs = false) {
                $this->mId = $id;
                $this->mSynonyms = (array)$syn;
                $this->mCaseSensitive = $cs;
-               $this->mRegex = '';
-               $this->mRegexStart = '';
-               $this->mVariableRegex = '';
-               $this->mVariableStartToEndRegex = '';
-               $this->mModified = false;
        }
 
        /**
         * Factory: creates an object representing an ID
-        * @static
+        *
+        * @param $id
+        *
+        * @return MagicWord
         */
        static function &get( $id ) {
-               wfProfileIn( __METHOD__ );
                if ( !isset( self::$mObjects[$id] ) ) {
                        $mw = new MagicWord();
                        $mw->load( $id );
                        self::$mObjects[$id] = $mw;
                }
-               wfProfileOut( __METHOD__ );
                return self::$mObjects[$id];
        }
 
        /**
         * Get an array of parser variable IDs
+        *
+        * @return array
         */
        static function getVariableIDs() {
                if ( !self::$mVariableIDsInitialised ) {
-                       # Deprecated constant definition hook, available for extensions that need it
-                       $magicWords = array();
-                       wfRunHooks( 'MagicWordMagicWords', array( &$magicWords ) );
-                       foreach ( $magicWords as $word ) {
-                               define( $word, $word );
-                       }
-
                        # Get variable IDs
                        wfRunHooks( 'MagicWordwgVariableIDs', array( &self::$mVariableIDs ) );
                        self::$mVariableIDsInitialised = true;
@@ -224,21 +239,31 @@ class MagicWord {
 
        /**
         * Get an array of parser substitution modifier IDs
+        * @return array
         */
        static function getSubstIDs() {
-               return self::$mSubstIDs; 
+               return self::$mSubstIDs;
        }
 
-       /* Allow external reads of TTL array */
-       static function getCacheTTL($id) {
-               if (array_key_exists($id,self::$mCacheTTLs)) {
+       /**
+        * Allow external reads of TTL array
+        *
+        * @param $id int
+        * @return array
+        */
+       static function getCacheTTL( $id ) {
+               if ( array_key_exists( $id, self::$mCacheTTLs ) ) {
                        return self::$mCacheTTLs[$id];
                } else {
                        return -1;
                }
        }
 
-       /** Get a MagicWordArray of double-underscore entities */
+       /**
+        * Get a MagicWordArray of double-underscore entities
+        *
+        * @return MagicWordArray
+        */
        static function getDoubleUnderscoreArray() {
                if ( is_null( self::$mDoubleUnderscoreArray ) ) {
                        self::$mDoubleUnderscoreArray = new MagicWordArray( self::$mDoubleUnderscoreIDs );
@@ -254,9 +279,14 @@ class MagicWord {
                self::$mObjects = array();
        }
 
-       # Initialises this object with an ID
+       /**
+        * Initialises this object with an ID
+        *
+        * @param $id
+        */
        function load( $id ) {
                global $wgContLang;
+               wfProfileIn( __METHOD__ );
                $this->mId = $id;
                $wgContLang->getMagic( $this );
                if ( !$this->mSynonyms ) {
@@ -264,6 +294,7 @@ class MagicWord {
                        #throw new MWException( "Error: invalid magic word '$id'" );
                        wfDebugLog( 'exception', "Error: invalid magic word '$id'\n" );
                }
+               wfProfileOut( __METHOD__ );
        }
 
        /**
@@ -271,13 +302,13 @@ class MagicWord {
         * @private
         */
        function initRegex() {
-               #$variableClass = Title::legalChars();
-               # This was used for matching "$1" variables, but different uses of the feature will have
-               # different restrictions, which should be checked *after* the MagicWord has been matched,
-               # not here. - IMSoP
+               // Sort the synonyms by length, descending, so that the longest synonym
+               // matches in precedence to the shortest
+               $synonyms = $this->mSynonyms;
+               usort( $synonyms, array( $this, 'compareStringLength' ) );
 
                $escSyn = array();
-               foreach ( $this->mSynonyms as $synonym )
+               foreach ( $synonyms as $synonym )
                        // In case a magic word contains /, like that's going to happen;)
                        $escSyn[] = preg_quote( $synonym, '/' );
                $this->mBaseRegex = implode( '|', $escSyn );
@@ -290,8 +321,32 @@ class MagicWord {
                        "/^(?:{$this->mBaseRegex})$/{$case}" );
        }
 
+       /**
+        * A comparison function that returns -1, 0 or 1 depending on whether the
+        * first string is longer, the same length or shorter than the second
+        * string.
+        *
+        * @param $s1 string
+        * @param $s2 string
+        *
+        * @return int
+        */
+       function compareStringLength( $s1, $s2 ) {
+               $l1 = strlen( $s1 );
+               $l2 = strlen( $s2 );
+               if ( $l1 < $l2 ) {
+                       return 1;
+               } elseif ( $l1 > $l2 ) {
+                       return -1;
+               } else {
+                       return 0;
+               }
+       }
+
        /**
         * Gets a regex representing matching the word
+        *
+        * @return string
         */
        function getRegex() {
                if ($this->mRegex == '' ) {
@@ -304,6 +359,8 @@ class MagicWord {
         * Gets the regexp case modifier to use, i.e. i or nothing, to be used if
         * one is using MagicWord::getBaseRegex(), otherwise it'll be included in
         * the complete expression
+        *
+        * @return string
         */
        function getRegexCase() {
                if ( $this->mRegex === '' )
@@ -314,6 +371,8 @@ class MagicWord {
 
        /**
         * Gets a regex matching the word, if it is at the string start
+        *
+        * @return string
         */
        function getRegexStart() {
                if ($this->mRegex == '' ) {
@@ -324,6 +383,8 @@ class MagicWord {
 
        /**
         * regex without the slashes and what not
+        *
+        * @return string
         */
        function getBaseRegex() {
                if ($this->mRegex == '') {
@@ -334,6 +395,9 @@ class MagicWord {
 
        /**
         * Returns true if the text contains the word
+        *
+        * @param $text string
+        *
         * @return bool
         */
        function match( $text ) {
@@ -342,6 +406,9 @@ class MagicWord {
 
        /**
         * Returns true if the text starts with the word
+        *
+        * @param $text string
+        *
         * @return bool
         */
        function matchStart( $text ) {
@@ -353,6 +420,10 @@ class MagicWord {
         * The return code is the matched string, if there's no variable
         * part in the regex and the matched variable part ($1) if there
         * is one.
+        *
+        * @param $text string
+        *
+        * @return string
         */
        function matchVariableStartToEnd( $text ) {
                $matches = array();
@@ -367,8 +438,11 @@ class MagicWord {
 
                        $matches = array_values(array_filter($matches));
 
-                       if ( count($matches) == 1 ) { return $matches[0]; }
-                       else { return $matches[1]; }
+                       if ( count($matches) == 1 ) {
+                               return $matches[0];
+                       } else {
+                               return $matches[1];
+                       }
                }
        }
 
@@ -376,6 +450,10 @@ class MagicWord {
        /**
         * Returns true if the text matches the word, and alters the
         * input string, removing all instances of the word
+        *
+        * @param $text string
+        *
+        * @return bool
         */
        function matchAndRemove( &$text ) {
                $this->mFound = false;
@@ -383,6 +461,10 @@ class MagicWord {
                return $this->mFound;
        }
 
+       /**
+        * @param  $text
+        * @return bool
+        */
        function matchStartAndRemove( &$text ) {
                $this->mFound = false;
                $text = preg_replace_callback( $this->getRegexStart(), array( &$this, 'pregRemoveAndRecord' ), $text );
@@ -391,17 +473,24 @@ class MagicWord {
 
        /**
         * Used in matchAndRemove()
-        * @private
-        **/
-       function pregRemoveAndRecord( ) {
+        *
+        * @return string
+        */
+       function pregRemoveAndRecord() {
                $this->mFound = true;
                return '';
        }
 
        /**
         * Replaces the word with something else
-        */
-       function replace( $replacement, $subject, $limit=-1 ) {
+        *
+        * @param $replacement
+        * @param $subject
+        * @param $limit int
+        *
+        * @return string
+        */
+       function replace( $replacement, $subject, $limit = -1 ) {
                $res = preg_replace( $this->getRegex(), StringUtils::escapeRegexReplacement( $replacement ), $subject, $limit );
                $this->mModified = !($res === $subject);
                return $res;
@@ -411,6 +500,11 @@ class MagicWord {
         * Variable handling: {{SUBST:xxx}} style words
         * Calls back a function to determine what to replace xxx with
         * Input word must contain $1
+        *
+        * @param $text string
+        * @param $callback
+        *
+        * @return string
         */
        function substituteCallback( $text, $callback ) {
                $res = preg_replace_callback( $this->getVariableRegex(), $callback, $text );
@@ -420,6 +514,8 @@ class MagicWord {
 
        /**
         * Matches the word, where $1 is a wildcard
+        *
+        * @return string
         */
        function getVariableRegex()     {
                if ( $this->mVariableRegex == '' ) {
@@ -430,6 +526,8 @@ class MagicWord {
 
        /**
         * Matches the entire string, where $1 is a wildcard
+        *
+        * @return string
         */
        function getVariableStartToEndRegex() {
                if ( $this->mVariableStartToEndRegex == '' ) {
@@ -440,11 +538,18 @@ class MagicWord {
 
        /**
         * Accesses the synonym list directly
+        *
+        * @param $i int
+        *
+        * @return string
         */
        function getSynonym( $i ) {
                return $this->mSynonyms[$i];
        }
 
+       /**
+        * @return array
+        */
        function getSynonyms() {
                return $this->mSynonyms;
        }
@@ -452,6 +557,8 @@ class MagicWord {
        /**
         * Returns true if the last call to replace() or substituteCallback()
         * returned a modified text, otherwise false.
+        *
+        * @return bool
         */
        function getWasModified(){
                return $this->mModified;
@@ -462,8 +569,14 @@ class MagicWord {
         * This method uses the php feature to do several replacements at the same time,
         * thereby gaining some efficiency. The result is placed in the out variable
         * $result. The return value is true if something was replaced.
-        * @static
-        **/
+        * @todo Should this be static? It doesn't seem to be used at all
+        *
+        * @param $magicarr
+        * @param $subject
+        * @param $result
+        *
+        * @return bool
+        */
        function replaceMultiple( $magicarr, $subject, &$result ){
                $search = array();
                $replace = array();
@@ -480,6 +593,9 @@ class MagicWord {
        /**
         * Adds all the synonyms of this MagicWord to an array, to allow quick
         * lookup in a list of magic words
+        *
+        * @param $array
+        * @param $value
         */
        function addToArray( &$array, $value ) {
                global $wgContLang;
@@ -488,10 +604,16 @@ class MagicWord {
                }
        }
 
+       /**
+        * @return bool
+        */
        function isCaseSensitive() {
                return $this->mCaseSensitive;
        }
 
+       /**
+        * @return int
+        */
        function getId() {
                return $this->mId;
        }
@@ -513,15 +635,18 @@ class MagicWordArray {
 
        /**
         * Add a magic word by name
+        *
+        * @param $name string
         */
        public function add( $name ) {
-               global $wgContLang;
                $this->names[] = $name;
                $this->hash = $this->baseRegex = $this->regex = null;
        }
 
        /**
         * Add a number of magic words by name
+        *
+        * @param $names array
         */
        public function addArray( $names ) {
                $this->names = array_merge( $this->names, array_values( $names ) );
@@ -572,7 +697,7 @@ class MagicWordArray {
        }
 
        /**
-        * Get an unanchored regex
+        * Get an unanchored regex that does not match parameters
         */
        function getRegex() {
                if ( is_null( $this->regex ) ) {
@@ -589,29 +714,35 @@ class MagicWordArray {
        }
 
        /**
-        * Get a regex for matching variables
+        * Get a regex for matching variables with parameters
+        *
+        * @return string
         */
        function getVariableRegex() {
                return str_replace( "\\$1", "(.*?)", $this->getRegex() );
        }
 
        /**
-        * Get a regex for matching a prefix. Does not match parameters.
+        * Get a regex anchored to the start of the string that does not match parameters
+        *
+        * @return array
         */
        function getRegexStart() {
                $base = $this->getBaseRegex();
                $newRegex = array( '', '' );
                if ( $base[0] !== '' ) {
-                       $newRegex[0] = str_replace( "\\$1", "", "/^(?:{$base[0]})/iuS" );
+                       $newRegex[0] = "/^(?:{$base[0]})/iuS";
                }
                if ( $base[1] !== '' ) {
-                       $newRegex[1] = str_replace( "\\$1", "", "/^(?:{$base[1]})/S" );
+                       $newRegex[1] = "/^(?:{$base[1]})/S";
                }
                return $newRegex;
        }
 
        /**
-        * Get an anchored regex for matching variables
+        * Get an anchored regex for matching variables with parameters
+        *
+        * @return array
         */
        function getVariableStartToEndRegex() {
                $base = $this->getBaseRegex();
@@ -629,6 +760,10 @@ class MagicWordArray {
         * Parse a match array from preg_match
         * Returns array(magic word ID, parameter value)
         * If there is no parameter value, that element will be false.
+        *
+        * @param $m array
+        *
+        * @return array
         */
        function parseMatch( $m ) {
                reset( $m );
@@ -648,7 +783,6 @@ class MagicWordArray {
                }
                // This shouldn't happen either
                throw new MWException( __METHOD__.': parameter not found' );
-               return array( false, false );
        }
 
        /**
@@ -656,9 +790,12 @@ class MagicWordArray {
         * Returns an array with the magic word name in the first element and the
         * parameter in the second element.
         * Both elements are false if there was no match.
+        *
+        * @param $text string
+        *
+        * @return array
         */
        public function matchVariableStartToEnd( $text ) {
-               global $wgContLang;
                $regexes = $this->getVariableStartToEndRegex();
                foreach ( $regexes as $regex ) {
                        if ( $regex !== '' ) {
@@ -674,6 +811,10 @@ class MagicWordArray {
        /**
         * Match some text, without parameter capture
         * Returns the magic word name, or false if there was no capture
+        *
+        * @param $text string
+        *
+        * @return string|bool False on failure
         */
        public function matchStartToEnd( $text ) {
                $hash = $this->getHash();
@@ -691,6 +832,10 @@ class MagicWordArray {
        /**
         * Returns an associative array, ID => param value, for all items that match
         * Removes the matched items from the input string (passed by reference)
+        *
+        * @param $text string
+        *
+        * @return array
         */
        public function matchAndRemove( &$text ) {
                $found = array();
@@ -710,22 +855,31 @@ class MagicWordArray {
        }
 
        /**
-        * Returns the magic word id removed from the start, or false
-        * does not match parameters.
+        * Return the ID of the magic word at the start of $text, and remove
+        * the prefix from $text.
+        * Return false if no match found and $text is not modified.
+        * Does not match parameters.
+        *
+        * @param $text string
+        *
+        * @return int|bool False on failure
         */
        public function matchStartAndRemove( &$text ) {
-               $found = FALSE;
                $regexes = $this->getRegexStart();
                foreach ( $regexes as $regex ) {
                        if ( $regex === '' ) {
                                continue;
                        }
-                       preg_match_all( $regex, $text, $matches, PREG_SET_ORDER );
-                       foreach ( $matches as $m ) {
-                               list( $found, $param ) = $this->parseMatch( $m );
+                       if ( preg_match( $regex, $text, $m ) ) {
+                               list( $id, ) = $this->parseMatch( $m );
+                               if ( strlen( $m[0] ) >= strlen( $text ) ) {
+                                       $text = '';
+                               } else {
+                                       $text = substr( $text, strlen( $m[0] ) );
+                               }
+                               return $id;
                        }
-                       $text = preg_replace( $regex, '', $text );
                }
-               return $found;
+               return false;
        }
 }