* Correct case for formatNum
[lhc/web/wiklou.git] / includes / GlobalFunctions.php
index b7ac5d1..c9a7693 100644 (file)
@@ -8,10 +8,11 @@ if ( !defined( 'MEDIAWIKI' ) ) {
  * Global functions used everywhere
  */
 
-require_once dirname(__FILE__) . '/LogPage.php';
 require_once dirname(__FILE__) . '/normal/UtfNormalUtil.php';
 require_once dirname(__FILE__) . '/XmlFunctions.php';
-require_once dirname(__FILE__) . '/MessageFunctions.php';
+
+// Hide compatibility functions from Doxygen
+/// @cond
 
 /**
  * Compatibility functions
@@ -88,6 +89,22 @@ if ( !function_exists( 'array_diff_key' ) ) {
        }
 }
 
+// Support for Wietse Venema's taint feature
+if ( !function_exists( 'istainted' ) ) {
+       function istainted( $var ) {
+               return 0;
+       }
+       function taint( $var, $level = 0 ) {}
+       function untaint( $var, $level = 0 ) {}
+       define( 'TC_HTML', 1 );
+       define( 'TC_SHELL', 1 );
+       define( 'TC_MYSQL', 1 );
+       define( 'TC_PCRE', 1 );
+       define( 'TC_SELF', 1 );
+}
+/// @endcond
+
+
 /**
  * Like array_diff( $a, $b ) except that it works with two-dimensional arrays.
  */
@@ -146,16 +163,31 @@ function wfRandom() {
 }
 
 /**
- * We want / and : to be included as literal characters in our title URLs.
+ * We want some things to be included as literal characters in our title URLs
+ * for prettiness, which urlencode encodes by default.  According to RFC 1738,
+ * all of the following should be safe:
+ *
+ * ;:@&=$-_.+!*'(),
+ *
+ * But + is not safe because it's used to indicate a space; &= are only safe in
+ * paths and not in queries (and we don't distinguish here); ' seems kind of
+ * scary; and urlencode() doesn't touch -_. to begin with.  Plus, although /
+ * is reserved, we don't care.  So the list we unescape is:
+ *
+ * ;:@$!*(),/
+ *
  * %2F in the page titles seems to fatally break for some reason.
  *
  * @param $s String:
  * @return string
 */
-function wfUrlencode ( $s ) {
+function wfUrlencode( $s ) {
        $s = urlencode( $s );
-       $s = preg_replace( '/%3[Aa]/', ':', $s );
-       $s = preg_replace( '/%2[Ff]/', '/', $s );
+       $s = str_ireplace(
+               array( '%3B','%3A','%40','%24','%21','%2A','%28','%29','%2C','%2F' ),
+               array(   ';',  ':',  '@',  '$',  '!',  '*',  '(',  ')',  ',',  '/' ),
+               $s
+       );
 
        return $s;
 }
@@ -175,6 +207,7 @@ function wfUrlencode ( $s ) {
  */
 function wfDebug( $text, $logonly = false ) {
        global $wgOut, $wgDebugLogFile, $wgDebugComments, $wgProfileOnly, $wgDebugRawPage;
+       global $wgDebugLogPrefix;
        static $recursion = 0;
 
        static $cache = array(); // Cache of unoutputted messages
@@ -207,10 +240,25 @@ function wfDebug( $text, $logonly = false ) {
                # Strip unprintables; they can switch terminal modes when binary data
                # gets dumped, which is pretty annoying.
                $text = preg_replace( '![\x00-\x08\x0b\x0c\x0e-\x1f]!', ' ', $text );
+               $text = $wgDebugLogPrefix . $text;
                wfErrorLog( $text, $wgDebugLogFile );
        }
 }
 
+/**
+ * Send a line giving PHP memory usage.
+ * @param $exact Bool : print exact values instead of kilobytes (default: false)
+ */
+function wfDebugMem( $exact = false ) {
+       $mem = memory_get_usage();
+       if( !$exact ) {
+               $mem = floor( $mem / 1024 ) . ' kilobytes';
+       } else {
+               $mem .= ' bytes';
+       }
+       wfDebug( "Memory usage: $mem\n" );
+}
+
 /**
  * Send a line to a supplementary debug log file, if configured, or main debug log if not.
  * $wgDebugLogGroups[$logGroup] should be set to a filename to send to a separate log.
@@ -221,12 +269,17 @@ function wfDebug( $text, $logonly = false ) {
  *                     log file is specified, (default true)
  */
 function wfDebugLog( $logGroup, $text, $public = true ) {
-       global $wgDebugLogGroups;
-       if( $text{strlen( $text ) - 1} != "\n" ) $text .= "\n";
+       global $wgDebugLogGroups, $wgShowHostnames;
+       $text = trim($text)."\n";
        if( isset( $wgDebugLogGroups[$logGroup] ) ) {
                $time = wfTimestamp( TS_DB );
                $wiki = wfWikiID();
-               wfErrorLog( "$time $wiki: $text", $wgDebugLogGroups[$logGroup] );
+               if ( $wgShowHostnames ) {
+                       $host = wfHostname();
+               } else {
+                       $host = '';
+               }
+               wfErrorLog( "$time $host $wiki: $text", $wgDebugLogGroups[$logGroup] );
        } else if ( $public === true ) {
                wfDebug( $text, true );
        }
@@ -246,16 +299,50 @@ function wfLogDBError( $text ) {
 }
 
 /**
- * Log to a file without getting "file size exceeded" signals
+ * Log to a file without getting "file size exceeded" signals.
+ * 
+ * Can also log to TCP or UDP with the syntax udp://host:port/prefix. This will 
+ * send lines to the specified port, prefixed by the specified prefix and a space.
  */
 function wfErrorLog( $text, $file ) {
-       wfSuppressWarnings();
-       $exists = file_exists( $file );
-       $size = $exists ? filesize( $file ) : false;
-       if ( !$exists || ( $size !== false && $size + strlen( $text ) < 0x7fffffff ) ) {
-               error_log( $text, 3, $file );
+       if ( substr( $file, 0, 4 ) == 'udp:' ) {
+               if ( preg_match( '!^(tcp|udp):(?://)?\[([0-9a-fA-F:]+)\]:(\d+)(?:/(.*))?$!', $file, $m ) ) {
+                       // IPv6 bracketed host
+                       $protocol = $m[1];
+                       $host = $m[2];
+                       $port = $m[3];
+                       $prefix = isset( $m[4] ) ? $m[4] : false;
+               } elseif ( preg_match( '!^(tcp|udp):(?://)?([a-zA-Z0-9.-]+):(\d+)(?:/(.*))?$!', $file, $m ) ) {
+                       $protocol = $m[1];
+                       $host = $m[2];
+                       $port = $m[3];
+                       $prefix = isset( $m[4] ) ? $m[4] : false;
+               } else {
+                       throw new MWException( __METHOD__.": Invalid UDP specification" );
+               }
+               // Clean it up for the multiplexer
+               if ( strval( $prefix ) !== '' ) {
+                       $text = preg_replace( '/^/m', $prefix . ' ', $text );
+                       if ( substr( $text, -1 ) != "\n" ) {
+                               $text .= "\n";
+                       }
+               }
+
+               $sock = fsockopen( "$protocol://$host", $port );
+               if ( !$sock ) {
+                       return;
+               }
+               fwrite( $sock, $text );
+               fclose( $sock );
+       } else {
+               wfSuppressWarnings();
+               $exists = file_exists( $file );
+               $size = $exists ? filesize( $file ) : false;
+               if ( !$exists || ( $size !== false && $size + strlen( $text ) < 0x7fffffff ) ) {
+                       error_log( $text, 3, $file );
+               }
+               wfRestoreWarnings();
        }
-       wfRestoreWarnings();
 }
 
 /**
@@ -320,6 +407,362 @@ function wfReadOnlyReason() {
        return $wgReadOnly;
 }
 
+/**
+ * Return a Language object from $langcode
+ * @param $langcode Mixed: either:
+ *                  - a Language object
+ *                  - code of the language to get the message for, if it is
+ *                    a valid code create a language for that language, if
+ *                    it is a string but not a valid code then make a basic
+ *                    language object
+ *                  - a boolean: if it's false then use the current users
+ *                    language (as a fallback for the old parameter
+ *                    functionality), or if it is true then use the wikis
+ * @return Language object
+ */
+function wfGetLangObj( $langcode = false ){
+       # Identify which language to get or create a language object for.
+       if( $langcode instanceof Language )
+               # Great, we already have the object!
+               return $langcode;
+               
+       global $wgContLang;
+       if( $langcode === $wgContLang->getCode() || $langcode === true )
+               # $langcode is the language code of the wikis content language object.
+               # or it is a boolean and value is true
+               return $wgContLang;
+       
+       global $wgLang;
+       if( $langcode === $wgLang->getCode() || $langcode === false )
+               # $langcode is the language code of user language object.
+               # or it was a boolean and value is false
+               return $wgLang;
+
+       $validCodes = array_keys( Language::getLanguageNames() );
+       if( in_array( $langcode, $validCodes ) )
+               # $langcode corresponds to a valid language.
+               return Language::factory( $langcode );
+
+       # $langcode is a string, but not a valid language code; use content language.
+       wfDebug( "Invalid language code passed to wfGetLangObj, falling back to content language.\n" );
+       return $wgContLang;
+}
+
+/**
+ * Get a message from anywhere, for the current user language.
+ *
+ * Use wfMsgForContent() instead if the message should NOT
+ * change depending on the user preferences.
+ *
+ * @param $key String: lookup key for the message, usually
+ *    defined in languages/Language.php
+ *
+ * This function also takes extra optional parameters (not
+ * shown in the function definition), which can by used to
+ * insert variable text into the predefined message.
+ */
+function wfMsg( $key ) {
+       $args = func_get_args();
+       array_shift( $args );
+       return wfMsgReal( $key, $args, true );
+}
+
+/**
+ * Same as above except doesn't transform the message
+ */
+function wfMsgNoTrans( $key ) {
+       $args = func_get_args();
+       array_shift( $args );
+       return wfMsgReal( $key, $args, true, false, false );
+}
+
+/**
+ * Get a message from anywhere, for the current global language
+ * set with $wgLanguageCode.
+ *
+ * Use this if the message should NOT change  dependent on the
+ * language set in the user's preferences. This is the case for
+ * most text written into logs, as well as link targets (such as
+ * the name of the copyright policy page). Link titles, on the
+ * other hand, should be shown in the UI language.
+ *
+ * Note that MediaWiki allows users to change the user interface
+ * language in their preferences, but a single installation
+ * typically only contains content in one language.
+ *
+ * Be wary of this distinction: If you use wfMsg() where you should
+ * use wfMsgForContent(), a user of the software may have to
+ * customize over 70 messages in order to, e.g., fix a link in every
+ * possible language.
+ *
+ * @param $key String: lookup key for the message, usually
+ *    defined in languages/Language.php
+ */
+function wfMsgForContent( $key ) {
+       global $wgForceUIMsgAsContentMsg;
+       $args = func_get_args();
+       array_shift( $args );
+       $forcontent = true;
+       if( is_array( $wgForceUIMsgAsContentMsg ) &&
+               in_array( $key, $wgForceUIMsgAsContentMsg ) )
+               $forcontent = false;
+       return wfMsgReal( $key, $args, true, $forcontent );
+}
+
+/**
+ * Same as above except doesn't transform the message
+ */
+function wfMsgForContentNoTrans( $key ) {
+       global $wgForceUIMsgAsContentMsg;
+       $args = func_get_args();
+       array_shift( $args );
+       $forcontent = true;
+       if( is_array( $wgForceUIMsgAsContentMsg ) &&
+               in_array( $key, $wgForceUIMsgAsContentMsg ) )
+               $forcontent = false;
+       return wfMsgReal( $key, $args, true, $forcontent, false );
+}
+
+/**
+ * Get a message from the language file, for the UI elements
+ */
+function wfMsgNoDB( $key ) {
+       $args = func_get_args();
+       array_shift( $args );
+       return wfMsgReal( $key, $args, false );
+}
+
+/**
+ * Get a message from the language file, for the content
+ */
+function wfMsgNoDBForContent( $key ) {
+       global $wgForceUIMsgAsContentMsg;
+       $args = func_get_args();
+       array_shift( $args );
+       $forcontent = true;
+       if( is_array( $wgForceUIMsgAsContentMsg ) &&
+               in_array( $key, $wgForceUIMsgAsContentMsg ) )
+               $forcontent = false;
+       return wfMsgReal( $key, $args, false, $forcontent );
+}
+
+
+/**
+ * Really get a message
+ * @param $key String: key to get.
+ * @param $args
+ * @param $useDB Boolean
+ * @param $transform Boolean: Whether or not to transform the message.
+ * @param $forContent Boolean
+ * @return String: the requested message.
+ */
+function wfMsgReal( $key, $args, $useDB = true, $forContent=false, $transform = true ) {
+       wfProfileIn( __METHOD__ );
+       $message = wfMsgGetKey( $key, $useDB, $forContent, $transform );
+       $message = wfMsgReplaceArgs( $message, $args );
+       wfProfileOut( __METHOD__ );
+       return $message;
+}
+
+/**
+ * This function provides the message source for messages to be edited which are *not* stored in the database.
+ * @param $key String:
+ */
+function wfMsgWeirdKey ( $key ) {
+       $source = wfMsgGetKey( $key, false, true, false );
+       if ( wfEmptyMsg( $key, $source ) )
+               return "";
+       else
+               return $source;
+}
+
+/**
+ * Fetch a message string value, but don't replace any keys yet.
+ * @param string $key
+ * @param bool $useDB
+ * @param string $langcode Code of the language to get the message for, or
+ *                         behaves as a content language switch if it is a
+ *                         boolean.
+ * @return string
+ * @private
+ */
+function wfMsgGetKey( $key, $useDB, $langCode = false, $transform = true ) {
+       global $wgContLang, $wgMessageCache;
+
+       wfRunHooks('NormalizeMessageKey', array(&$key, &$useDB, &$langCode, &$transform));
+       
+       # If $wgMessageCache isn't initialised yet, try to return something sensible.
+       if( is_object( $wgMessageCache ) ) {
+               $message = $wgMessageCache->get( $key, $useDB, $langCode );
+               if ( $transform ) {
+                       $message = $wgMessageCache->transform( $message );
+               }
+       } else {
+               $lang = wfGetLangObj( $langCode );
+
+               # MessageCache::get() does this already, Language::getMessage() doesn't
+               # ISSUE: Should we try to handle "message/lang" here too?
+               $key = str_replace( ' ' , '_' , $wgContLang->lcfirst( $key ) );
+
+               if( is_object( $lang ) ) {
+                       $message = $lang->getMessage( $key );
+               } else {
+                       $message = false;
+               }
+       }
+
+       return $message;
+}
+
+/**
+ * Replace message parameter keys on the given formatted output.
+ *
+ * @param string $message
+ * @param array $args
+ * @return string
+ * @private
+ */
+function wfMsgReplaceArgs( $message, $args ) {
+       # Fix windows line-endings
+       # Some messages are split with explode("\n", $msg)
+       $message = str_replace( "\r", '', $message );
+
+       // Replace arguments
+       if ( count( $args ) ) {
+               if ( is_array( $args[0] ) ) {
+                       $args = array_values( $args[0] );
+               }
+               $replacementKeys = array();
+               foreach( $args as $n => $param ) {
+                       $replacementKeys['$' . ($n + 1)] = $param;
+               }
+               $message = strtr( $message, $replacementKeys );
+       }
+
+       return $message;
+}
+
+/**
+ * Return an HTML-escaped version of a message.
+ * Parameter replacements, if any, are done *after* the HTML-escaping,
+ * so parameters may contain HTML (eg links or form controls). Be sure
+ * to pre-escape them if you really do want plaintext, or just wrap
+ * the whole thing in htmlspecialchars().
+ *
+ * @param string $key
+ * @param string ... parameters
+ * @return string
+ */
+function wfMsgHtml( $key ) {
+       $args = func_get_args();
+       array_shift( $args );
+       return wfMsgReplaceArgs( htmlspecialchars( wfMsgGetKey( $key, true ) ), $args );
+}
+
+/**
+ * Return an HTML version of message
+ * Parameter replacements, if any, are done *after* parsing the wiki-text message,
+ * so parameters may contain HTML (eg links or form controls). Be sure
+ * to pre-escape them if you really do want plaintext, or just wrap
+ * the whole thing in htmlspecialchars().
+ *
+ * @param string $key
+ * @param string ... parameters
+ * @return string
+ */
+function wfMsgWikiHtml( $key ) {
+       global $wgOut;
+       $args = func_get_args();
+       array_shift( $args );
+       return wfMsgReplaceArgs( $wgOut->parse( wfMsgGetKey( $key, true ), /* can't be set to false */ true ), $args );
+}
+
+/**
+ * Returns message in the requested format
+ * @param string $key Key of the message
+ * @param array $options Processing rules.  Can take the following options:
+ *   <i>parse</i>: parses wikitext to html
+ *   <i>parseinline</i>: parses wikitext to html and removes the surrounding
+ *       p's added by parser or tidy
+ *   <i>escape</i>: filters message through htmlspecialchars
+ *   <i>escapenoentities</i>: same, but allows entity references like &nbsp; through
+ *   <i>replaceafter</i>: parameters are substituted after parsing or escaping
+ *   <i>parsemag</i>: transform the message using magic phrases
+ *   <i>content</i>: fetch message for content language instead of interface
+ * Also can accept a single associative argument, of the form 'language' => 'xx':
+ *   <i>language</i>: Language object or language code to fetch message for
+ *       (overriden by <i>content</i>), its behaviour with parser, parseinline
+ *       and parsemag is undefined.
+ * Behavior for conflicting options (e.g., parse+parseinline) is undefined.
+ */
+function wfMsgExt( $key, $options ) {
+       global $wgOut;
+
+       $args = func_get_args();
+       array_shift( $args );
+       array_shift( $args );
+       $options = (array)$options;
+
+       foreach( $options as $arrayKey => $option ) {
+               if( !preg_match( '/^[0-9]+|language$/', $arrayKey ) ) {
+                       # An unknown index, neither numeric nor "language"
+                       trigger_error( "wfMsgExt called with incorrect parameter key $arrayKey", E_USER_WARNING );
+               } elseif( preg_match( '/^[0-9]+$/', $arrayKey ) && !in_array( $option,
+               array( 'parse', 'parseinline', 'escape', 'escapenoentities',
+               'replaceafter', 'parsemag', 'content' ) ) ) {
+                       # A numeric index with unknown value
+                       trigger_error( "wfMsgExt called with incorrect parameter $option", E_USER_WARNING );
+               }
+       }
+
+       if( in_array('content', $options, true ) ) {
+               $forContent = true;
+               $langCode = true;
+       } elseif( array_key_exists('language', $options) ) {
+               $forContent = false;
+               $langCode = wfGetLangObj( $options['language'] );
+       } else {
+               $forContent = false;
+               $langCode = false;
+       }
+
+       $string = wfMsgGetKey( $key, /*DB*/true, $langCode, /*Transform*/false );
+
+       if( !in_array('replaceafter', $options, true ) ) {
+               $string = wfMsgReplaceArgs( $string, $args );
+       }
+
+       if( in_array('parse', $options, true ) ) {
+               $string = $wgOut->parse( $string, true, !$forContent );
+       } elseif ( in_array('parseinline', $options, true ) ) {
+               $string = $wgOut->parse( $string, true, !$forContent );
+               $m = array();
+               if( preg_match( '/^<p>(.*)\n?<\/p>\n?$/sU', $string, $m ) ) {
+                       $string = $m[1];
+               }
+       } elseif ( in_array('parsemag', $options, true ) ) {
+               global $wgMessageCache;
+               if ( isset( $wgMessageCache ) ) {
+                       $string = $wgMessageCache->transform( $string,
+                               !$forContent,
+                               is_object( $langCode ) ? $langCode : null );
+               }
+       }
+
+       if ( in_array('escape', $options, true ) ) {
+               $string = htmlspecialchars ( $string );
+       } elseif ( in_array( 'escapenoentities', $options, true  ) ) {
+               $string = Sanitizer::escapeHtmlAllowEntities( $string );
+       }
+
+       if( in_array('replaceafter', $options, true ) ) {
+               $string = wfMsgReplaceArgs( $string, $args );
+       }
+
+       return $string;
+}
+
+
 /**
  * Just like exit() but makes a note of it.
  * Commits open transactions except if the error parameter is set
@@ -341,7 +784,7 @@ function wfAbruptExit( $error = false ){
                        wfDebug("WARNING: Abrupt exit in $file at line $line\n");
                }
        } else {
-               wfDebug('WARNING: Abrupt exit\n');
+               wfDebug("WARNING: Abrupt exit\n");
        }
 
        wfLogProfilingData();
@@ -386,18 +829,25 @@ function wfDebugDieBacktrace( $msg = '' ) {
  * @return string
  */
 function wfHostname() {
-       if ( function_exists( 'posix_uname' ) ) {
-               // This function not present on Windows
-               $uname = @posix_uname();
-       } else {
-               $uname = false;
-       }
-       if( is_array( $uname ) && isset( $uname['nodename'] ) ) {
-               return $uname['nodename'];
-       } else {
-               # This may be a virtual server.
-               return $_SERVER['SERVER_NAME'];
+       static $host;
+       if ( is_null( $host ) ) {
+               if ( function_exists( 'posix_uname' ) ) {
+                       // This function not present on Windows
+                       $uname = @posix_uname();
+               } else {
+                       $uname = false;
+               }
+               if( is_array( $uname ) && isset( $uname['nodename'] ) ) {
+                       $host = $uname['nodename'];
+               } elseif ( getenv( 'COMPUTERNAME' ) ) {
+                       # Windows computer name
+                       $host = getenv( 'COMPUTERNAME' );
+               } else {
+                       # This may be a virtual server.
+                       $host = $_SERVER['SERVER_NAME'];
+               }
        }
+       return $host;
 }
 
        /**
@@ -536,11 +986,11 @@ function wfViewPrevNext( $offset, $limit, $link, $query = '', $atend = false ) {
        } else {
                $nlink = '<a href="' . $title->escapeLocalUrl( $q ) . "\" class=\"mw-nextlink\">{$next}</a>";
        }
-       $nums = wfNumLink( $offset, 20, $title, $query ) . ' | ' .
-         wfNumLink( $offset, 50, $title, $query ) . ' | ' .
-         wfNumLink( $offset, 100, $title, $query ) . ' | ' .
-         wfNumLink( $offset, 250, $title, $query ) . ' | ' .
-         wfNumLink( $offset, 500, $title, $query );
+       $nums = $wgLang->pipeList( array( wfNumLink( $offset, 20, $title, $query ),
+         wfNumLink( $offset, 50, $title, $query ),
+         wfNumLink( $offset, 100, $title, $query ),
+         wfNumLink( $offset, 250, $title, $query ),
+         wfNumLink( $offset, 500, $title, $query ) ) );
 
        return wfMsg( 'viewprevnext', $plink, $nlink, $nums );
 }
@@ -608,7 +1058,7 @@ function wfCheckLimits( $deflimit = 50, $optionname = 'rclimit' ) {
  */
 function wfEscapeWikiText( $text ) {
        $text = str_replace(
-               array( '[',     '|',      ']',     '\'',    'ISBN ',     'RFC ',     '://',     "\n=",     '{{' ),
+               array( '[',     '|',      ']',     '\'',    'ISBN ',     'RFC ',     '://',     "\n=",     '{{' ), # }}
                array( '&#91;', '&#124;', '&#93;', '&#39;', 'ISBN&#32;', 'RFC&#32;', '&#58;//', "\n&#61;", '&#123;&#123;' ),
                htmlspecialchars($text) );
        return $text;
@@ -707,6 +1157,34 @@ function wfArrayToCGI( $array1, $array2 = NULL )
        return $cgi;
 }
 
+/**
+ * This is the logical opposite of wfArrayToCGI(): it accepts a query string as
+ * its argument and returns the same string in array form.  This allows compa-
+ * tibility with legacy functions that accept raw query strings instead of nice
+ * arrays.  Of course, keys and values are urldecode()d.  Don't try passing in-
+ * valid query strings, or it will explode.
+ *
+ * @param $query string Query string
+ * @return array Array version of input
+ */
+function wfCgiToArray( $query ) {
+       if( isset( $query[0] ) and $query[0] == '?' ) {
+               $query = substr( $query, 1 );
+       }
+       $bits = explode( '&', $query );
+       $ret = array();
+       foreach( $bits as $bit ) {
+               if( $bit === '' ) {
+                       continue;
+               }
+               list( $key, $value ) = explode( '=', $bit );
+               $key = urldecode( $key );
+               $value = urldecode( $value );
+               $ret[$key] = $value;
+       }
+       return $ret;
+}
+
 /**
  * Append a query string to an existing URL, which may or may not already
  * have query string parameters already. If so, they will be combined.
@@ -753,9 +1231,14 @@ function wfPurgeSquidServers ($urlArr) {
 /**
  * Windows-compatible version of escapeshellarg()
  * Windows doesn't recognise single-quotes in the shell, but the escapeshellarg()
- * function puts single quotes in regardless of OS
+ * function puts single quotes in regardless of OS.
+ *
+ * Also fixes the locale problems on Linux in PHP 5.2.6+ (bug backported to 
+ * earlier distro releases of PHP)
  */
 function wfEscapeShellArg( ) {
+       wfInitShellLocale();
+
        $args = func_get_args();
        $first = true;
        $retVal = '';
@@ -806,7 +1289,7 @@ function wfMerge( $old, $mine, $yours, &$result ){
 
        # This check may also protect against code injection in
        # case of broken installations.
-       if(! file_exists( $wgDiff3 ) ){
+       if( !$wgDiff3 || !file_exists( $wgDiff3 ) ) {
                wfDebug( "diff3 not found\n" );
                return false;
        }
@@ -858,7 +1341,72 @@ function wfMerge( $old, $mine, $yours, &$result ){
 }
 
 /**
- * @todo document
+ * Returns unified plain-text diff of two texts.
+ * Useful for machine processing of diffs.
+ * @param $before string The text before the changes.
+ * @param $after string The text after the changes.
+ * @param $params string Command-line options for the diff command.
+ * @return string Unified diff of $before and $after
+ */
+function wfDiff( $before, $after, $params = '-u' ) {
+       global $wgDiff;
+
+       # This check may also protect against code injection in
+       # case of broken installations.
+       if( !file_exists( $wgDiff ) ){
+               wfDebug( "diff executable not found\n" );
+               $diffs = new Diff( explode( "\n", $before ), explode( "\n", $after ) );
+               $format = new UnifiedDiffFormatter();
+               return $format->format( $diffs );
+       }
+
+       # Make temporary files
+       $td = wfTempDir();
+       $oldtextFile = fopen( $oldtextName = tempnam( $td, 'merge-old-' ), 'w' );
+       $newtextFile = fopen( $newtextName = tempnam( $td, 'merge-your-' ), 'w' );
+
+       fwrite( $oldtextFile, $before ); fclose( $oldtextFile );
+       fwrite( $newtextFile, $after ); fclose( $newtextFile );
+       
+       // Get the diff of the two files
+       $cmd = "$wgDiff " . $params . ' ' .wfEscapeShellArg( $oldtextName, $newtextName );
+       
+       $h = popen( $cmd, 'r' );
+       
+       $diff = '';
+       
+       do {
+               $data = fread( $h, 8192 );
+               if ( strlen( $data ) == 0 ) {
+                       break;
+               }
+               $diff .= $data;
+       } while ( true );
+       
+       // Clean up
+       pclose( $h );
+       unlink( $oldtextName );
+       unlink( $newtextName );
+       
+       // Kill the --- and +++ lines. They're not useful.
+       $diff_lines = explode( "\n", $diff );
+       if (strpos( $diff_lines[0], '---' ) === 0) {
+               unset($diff_lines[0]);
+       }
+       if (strpos( $diff_lines[1], '+++' ) === 0) {
+               unset($diff_lines[1]);
+       }
+       
+       $diff = implode( "\n", $diff_lines );
+       
+       return $diff;
+}
+
+/**
+ * A wrapper around the PHP function var_export().
+ * Either print it or add it to the regular output ($wgOut).
+ *
+ * @param $var A PHP variable to dump.
  */
 function wfVarDump( $var ) {
        global $wgOut;
@@ -934,6 +1482,7 @@ function wfResetOutputBuffers( $resetGzipEncoding=true ) {
                                // Reset the 'Content-Encoding' field set by this handler
                                // so we can start fresh.
                                header( 'Content-Encoding:' );
+                               break;
                        }
                }
        }
@@ -1156,6 +1705,11 @@ define('TS_ORACLE', 6);
  */
 define('TS_POSTGRES', 7);
 
+/**
+ * DB2 format time
+ */
+define('TS_DB2', 8);
+
 /**
  * @param mixed $outputtype A timestamp in one of the supported formats, the
  *                          function will autodetect which format is supplied
@@ -1180,11 +1734,11 @@ function wfTimestamp($outputtype=TS_UNIX,$ts=0) {
                # TS_ORACLE
                $uts = strtotime(preg_replace('/(\d\d)\.(\d\d)\.(\d\d)(\.(\d+))?/', "$1:$2:$3",
                                str_replace("+00:00", "UTC", $ts)));
-       } elseif (preg_match('/^(\d{4})-(\d{2})-(\d{2})T(\d{2}):(\d{2}):(\d{2})Z$/', $ts, $da)) {
+       } elseif (preg_match('/^(\d{4})-(\d{2})-(\d{2})T(\d{2}):(\d{2}):(\d{2})(?:\.*\d*)?Z$/', $ts, $da)) {
                # TS_ISO_8601
-       } elseif (preg_match('/^(\d{4})\-(\d\d)\-(\d\d) (\d\d):(\d\d):(\d\d)[\+\- ](\d\d)$/',$ts,$da)) {
+       } elseif (preg_match('/^(\d{4})\-(\d\d)\-(\d\d) (\d\d):(\d\d):(\d\d)\.*\d*[\+\- ](\d\d)$/',$ts,$da)) {
                # TS_POSTGRES
-       } elseif (preg_match('/^(\d{4})\-(\d\d)\-(\d\d) (\d\d):(\d\d):(\d\d) GMT$/',$ts,$da)) {
+       } elseif (preg_match('/^(\d{4})\-(\d\d)\-(\d\d) (\d\d):(\d\d):(\d\d)\.*\d* GMT$/',$ts,$da)) {
                # TS_POSTGRES
        } else {
                # Bogus value; fall back to the epoch...
@@ -1217,6 +1771,8 @@ function wfTimestamp($outputtype=TS_UNIX,$ts=0) {
                        return gmdate( 'd-M-y h.i.s A', $uts) . ' +00:00';
                case TS_POSTGRES:
                        return gmdate( 'Y-m-d H:i:s', $uts) . ' GMT';
+               case TS_DB2:
+                       return gmdate( 'Y-m-d H:i:s', $uts);
                default:
                        throw new MWException( 'wfTimestamp() called with illegal output type.');
        }
@@ -1260,7 +1816,7 @@ function swap( &$x, &$y ) {
 }
 
 function wfGetCachedNotice( $name ) {
-       global $wgOut, $parserMemc;
+       global $wgOut, $wgRenderHashAppend, $parserMemc;
        $fname = 'wfGetCachedNotice';
        wfProfileIn( $fname );
 
@@ -1282,7 +1838,9 @@ function wfGetCachedNotice( $name ) {
                }
        }
 
-       $cachedNotice = $parserMemc->get( wfMemcKey( $name ) );
+       // Use the extra hash appender to let eg SSL variants separately cache.
+       $key = wfMemcKey( $name . $wgRenderHashAppend );
+       $cachedNotice = $parserMemc->get( $key );
        if( is_array( $cachedNotice ) ) {
                if( md5( $notice ) == $cachedNotice['hash'] ) {
                        $notice = $cachedNotice['html'];
@@ -1296,10 +1854,10 @@ function wfGetCachedNotice( $name ) {
        if( $needParse ) {
                if( is_object( $wgOut ) ) {
                        $parsed = $wgOut->parse( $notice );
-                       $parserMemc->set( wfMemcKey( $name ), array( 'html' => $parsed, 'hash' => md5( $notice ) ), 600 );
+                       $parserMemc->set( $key, array( 'html' => $parsed, 'hash' => md5( $notice ) ), 600 );
                        $notice = $parsed;
                } else {
-                       wfDebug( 'wfGetCachedNotice called for ' . $name . ' with no $wgOut available' );
+                       wfDebug( 'wfGetCachedNotice called for ' . $name . ' with no $wgOut available'."\n" );
                        $notice = '';
                }
        }
@@ -1388,60 +1946,21 @@ function wfTempDir() {
 
 /**
  * Make directory, and make all parent directories if they don't exist
+ * 
+ * @param string $dir Full path to directory to create
+ * @param int $mode Chmod value to use, default is $wgDirectoryMode
+ * @return bool
  */
-function wfMkdirParents( $fullDir, $mode = 0777 ) {
-       if( strval( $fullDir ) === '' )
-               return true;
-       if( file_exists( $fullDir ) )
-               return true;
+function wfMkdirParents( $dir, $mode = null ) {
+       global $wgDirectoryMode;
 
-       # Go back through the paths to find the first directory that exists
-       $currentDir = $fullDir;
-       $createList = array();
-       while ( strval( $currentDir ) !== '' && !file_exists( $currentDir ) ) {
-               # Strip trailing slashes
-               $currentDir = rtrim( $currentDir, '/\\' );
-
-               # Add to create list
-               $createList[] = $currentDir;
-
-               # Find next delimiter searching from the end
-               $p = max( strrpos( $currentDir, '/' ), strrpos( $currentDir, '\\' ) );
-               if ( $p === false ) {
-                       $currentDir = false;
-               } else {
-                       $currentDir = substr( $currentDir, 0, $p );
-               }
-       }
-
-       if ( count( $createList ) == 0 ) {
-               # Directory specified already exists
+       if( strval( $dir ) === '' || file_exists( $dir ) )
                return true;
-       } elseif ( $currentDir === false ) {
-               # Went all the way back to root and it apparently doesn't exist
-               wfDebugLog( 'mkdir', "Root doesn't exist?\n" );
-               return false;
-       }
-       # Now go forward creating directories
-       $createList = array_reverse( $createList );
 
-       # Is the parent directory writable?
-       if ( $currentDir === '' ) {
-               $currentDir = '/';
-       }
-       if ( !is_writable( $currentDir ) ) {
-               wfDebugLog( 'mkdir', "Not writable: $currentDir\n" );
-               return false;
-       }
+       if ( is_null( $mode ) )
+               $mode = $wgDirectoryMode;
 
-       foreach ( $createList as $dir ) {
-               # use chmod to override the umask, as suggested by the PHP manual
-               if ( !mkdir( $dir, $mode ) || !chmod( $dir, $mode ) ) {
-                       wfDebugLog( 'mkdir', "Unable to create directory $dir\n" );
-                       return false;
-               }
-       }
-       return true;
+       return mkdir( $dir, $mode, true );  // PHP5 <3
 }
 
 /**
@@ -1600,16 +2119,32 @@ function wfIniGetBool( $setting ) {
  * @return collected stdout as a string (trailing newlines stripped)
  */
 function wfShellExec( $cmd, &$retval=null ) {
-       global $IP, $wgMaxShellMemory, $wgMaxShellFileSize;
-
-       if( wfIniGetBool( 'safe_mode' ) ) {
-               wfDebug( "wfShellExec can't run in safe_mode, PHP's exec functions are too broken.\n" );
+       global $IP, $wgMaxShellMemory, $wgMaxShellFileSize, $wgMaxShellTime;
+
+       static $disabled;
+       if ( is_null( $disabled ) ) {
+               $disabled = false;
+               if( wfIniGetBool( 'safe_mode' ) ) {
+                       wfDebug( "wfShellExec can't run in safe_mode, PHP's exec functions are too broken.\n" );
+                       $disabled = true;
+               }
+               $functions = explode( ',', ini_get( 'disable_functions' ) );
+               $functions = array_map( 'trim', $functions );
+               $functions = array_map( 'strtolower', $functions );
+               if ( in_array( 'passthru', $functions ) ) {
+                       wfDebug( "passthru is in disabled_functions\n" );
+                       $disabled = true;
+               }
+       }
+       if ( $disabled ) {
                $retval = 1;
                return "Unable to run external programs in safe mode.";
        }
 
+       wfInitShellLocale();
+
        if ( php_uname( 's' ) == 'Linux' ) {
-               $time = intval( ini_get( 'max_execution_time' ) );
+               $time = intval( $wgMaxShellTime );
                $mem = intval( $wgMaxShellMemory );
                $filesize = intval( $wgMaxShellFileSize );
 
@@ -1631,8 +2166,26 @@ function wfShellExec( $cmd, &$retval=null ) {
        passthru( $cmd, $retval );
        $output = ob_get_contents();
        ob_end_clean();
+
+       if ( $retval == 127 ) {
+               wfDebugLog( 'exec', "Possibly missing executable file: $cmd\n" );
+       }
        return $output;
+}
 
+/**
+ * Workaround for http://bugs.php.net/bug.php?id=45132
+ * escapeshellarg() destroys non-ASCII characters if LANG is not a UTF-8 locale
+ */
+function wfInitShellLocale() {
+       static $done = false;
+       if ( $done ) return;
+       $done = true;
+       global $wgShellLocale;
+       if ( !wfIniGetBool( 'safe_mode' ) ) {
+               putenv( "LC_CTYPE=$wgShellLocale" );
+               setlocale( LC_CTYPE, $wgShellLocale );
+       }
 }
 
 /**
@@ -1754,31 +2307,61 @@ function wfRelativePath( $path, $from ) {
 }
 
 /**
- * array_merge() does awful things with "numeric" indexes, including
- * string indexes when happen to look like integers. When we want
- * to merge arrays with arbitrary string indexes, we don't want our
- * arrays to be randomly corrupted just because some of them consist
- * of numbers.
- *
- * Fuck you, PHP. Fuck you in the ear!
+ * Backwards array plus for people who haven't bothered to read the PHP manual
+ * XXX: will not darn your socks for you.
  *
  * @param array $array1, [$array2, [...]]
  * @return array
  */
 function wfArrayMerge( $array1/* ... */ ) {
-       $out = $array1;
-       for( $i = 1; $i < func_num_args(); $i++ ) {
-               foreach( func_get_arg( $i ) as $key => $value ) {
-                       $out[$key] = $value;
-               }
+       $args = func_get_args();
+       $args = array_reverse( $args, true );
+       $out = array();
+       foreach ( $args as $arg ) {
+               $out += $arg;
        }
        return $out;
 }
 
 /**
- * Make a URL index, appropriate for the el_index field of externallinks.
+ * Merge arrays in the style of getUserPermissionsErrors, with duplicate removal
+ * e.g.
+ *     wfMergeErrorArrays( 
+ *             array( array( 'x' ) ), 
+ *             array( array( 'x', '2' ) ), 
+ *             array( array( 'x' ) ), 
+ *             array( array( 'y') )
+ *     );
+ * returns:
+ *             array( 
+ *             array( 'x', '2' ),
+ *             array( 'x' ),
+ *             array( 'y' )
+ *     )
  */
-function wfMakeUrlIndex( $url ) {
+function wfMergeErrorArrays(/*...*/) {
+       $args = func_get_args();
+       $out = array();
+       foreach ( $args as $errors ) {
+               foreach ( $errors as $params ) {
+                       $spec = implode( "\t", $params );
+                       $out[$spec] = $params;
+               }
+       }
+       return array_values( $out );
+}
+
+/**
+ * parse_url() work-alike, but non-broken.  Differences:
+ *
+ * 1) Does not raise warnings on bad URLs (just returns false)
+ * 2) Handles protocols that don't use :// (e.g., mailto: and news:) correctly
+ * 3) Adds a "delimiter" element to the array, either '://' or ':' (see (2))
+ *
+ * @param string $url A URL to parse
+ * @return array Bits of the URL in an associative array, per PHP docs
+ */
+function wfParseUrl( $url ) {
        global $wgUrlProtocols; // Allow all protocols defined in DefaultSettings/LocalSettings.php
        wfSuppressWarnings();
        $bits = parse_url( $url );
@@ -1786,12 +2369,12 @@ function wfMakeUrlIndex( $url ) {
        if ( !$bits ) {
                return false;
        }
+
        // most of the protocols are followed by ://, but mailto: and sometimes news: not, check for it
-       $delimiter = '';
-       if ( in_array( $bits['scheme'] . '://' , $wgUrlProtocols ) ) {
-               $delimiter = '://';
-       } elseif ( in_array( $bits['scheme'] .':' , $wgUrlProtocols ) ) {
-               $delimiter = ':';
+       if ( in_array( $bits['scheme'] . '://', $wgUrlProtocols ) ) {
+               $bits['delimiter'] = '://';
+       } elseif ( in_array( $bits['scheme'] . ':', $wgUrlProtocols ) ) {
+               $bits['delimiter'] = ':';
                // parse_url detects for news: and mailto: the host part of an url as path
                // We have to correct this wrong detection
                if ( isset ( $bits['path'] ) ) {
@@ -1802,6 +2385,15 @@ function wfMakeUrlIndex( $url ) {
                return false;
        }
 
+       return $bits;
+}
+
+/**
+ * Make a URL index, appropriate for the el_index field of externallinks.
+ */
+function wfMakeUrlIndex( $url ) {
+       $bits = wfParseUrl( $url );
+
        // Reverse the labels in the hostname, convert to lower case
        // For emails reverse domainpart only
        if ( $bits['scheme'] == 'mailto' ) {
@@ -1823,7 +2415,7 @@ function wfMakeUrlIndex( $url ) {
        }
        // Reconstruct the pseudo-URL
        $prot = $bits['scheme'];
-       $index = "$prot$delimiter$reversedHost";
+       $index = $prot . $bits['delimiter'] . $reversedHost;
        // Leave out user and password. Add the port, path, query and fragment
        if ( isset( $bits['port'] ) )      $index .= ':' . $bits['port'];
        if ( isset( $bits['path'] ) ) {
@@ -2147,7 +2739,7 @@ function wfSplitWikiID( $wiki ) {
  * will always return the same object, unless the underlying connection or load
  * balancer is manually destroyed.
  */
-function &wfGetDB( $db = DB_LAST, $groups = array(), $wiki = false ) {
+function &wfGetDB( $db, $groups = array(), $wiki = false ) {
        return wfGetLB( $wiki )->getConnection( $db, $groups, $wiki );
 }
 
@@ -2177,10 +2769,15 @@ function &wfGetLBFactory() {
  *                    current version. An image object will be returned which
  *                    was created at the specified time.
  * @param mixed $flags FileRepo::FIND_ flags
+ * @param boolean $bypass Bypass the file cache even if it could be used
  * @return File, or false if the file does not exist
  */
-function wfFindFile( $title, $time = false, $flags = 0 ) {
-       return RepoGroup::singleton()->findFile( $title, $time, $flags );
+function wfFindFile( $title, $time = false, $flags = 0, $bypass = false ) {
+        if( !$time && !$flags && !$bypass ) {
+               return FileCache::singleton()->findFile( $title );
+       } else {
+               return RepoGroup::singleton()->findFile( $title, $time, $flags );
+       }
 }
 
 /**
@@ -2233,6 +2830,8 @@ function wfBoolToStr( $value ) {
  * @param string $extensionName Name of extension to load messages from\for.
  * @param string $langcode Language to load messages for, or false for default
  *                         behvaiour (en, content language and user language).
+ * @since r24808 (v1.11) Using this method of loading extension messages will not work
+ * on MediaWiki prior to that
  */
 function wfLoadExtensionMessages( $extensionName, $langcode = false ) {
        global $wgExtensionMessagesFiles, $wgMessageCache, $wgLang, $wgContLang;
@@ -2356,6 +2955,21 @@ function wfWaitForSlaves( $maxLag ) {
        }
 }
 
+/**
+ * Output some plain text in command-line mode or in the installer (updaters.inc).
+ * Do not use it in any other context, its behaviour is subject to change.
+ */
+function wfOut( $s ) {
+       static $lineStarted = false;
+       global $wgCommandLineMode;
+       if ( $wgCommandLineMode && !defined( 'MEDIAWIKI_INSTALL' ) ) {
+               echo $s;
+       } else {
+               echo htmlspecialchars( $s );
+       }
+       flush();
+}
+
 /** Generate a random 32-character hexadecimal token.
  * @param mixed $salt Some sort of salt, if necessary, to add to random characters before hashing.
  */
@@ -2364,3 +2978,13 @@ function wfGenerateToken( $salt = '' ) {
 
        return md5( mt_rand( 0, 0x7fffffff ) . $salt );
 }
+
+/**
+ * Replace all invalid characters with -
+ * @param mixed $title Filename to process
+ */
+function wfStripIllegalFilenameChars( $name ) {
+       $name = wfBaseName( $name );
+       $name = preg_replace ( "/[^".Title::legalChars()."]|:/", '-', $name );
+       return $name;
+}