"else if" to "elseif"
[lhc/web/wiklou.git] / includes / MimeMagic.php
index 58a9cbe..6232523 100644 (file)
@@ -1,15 +1,31 @@
 <?php
-/** Module defining helper functions for detecting and dealing with mime types.
+/**
+ * Module defining helper functions for detecting and dealing with mime types.
  *
+ * @file
  */
 
- /** Defines a set of well known mime types
+/**
+ * Defines a set of well known mime types
  * This is used as a fallback to mime.types files.
  * An extensive list of well known mime types is provided by
  * the file mime.types in the includes directory.
+ * 
+ * This list concatenated with mime.types is used to create a mime <-> ext
+ * map. Each line contains a mime type followed by a space separated list of
+ * extensions. If multiple extensions for a single mime type exist or if 
+ * multiple mime types exist for a single extension then in most cases
+ * MediaWiki assumes that the first extension following the mime type is the
+ * canonical extension, and the first time a mime type appears for a certain
+ * extension is considered the canonical mime type.
+ * 
+ * (Note that appending $wgMimeTypeFile to the end of MM_WELL_KNOWN_MIME_TYPES
+ * sucks because you can't redefine canonical types. This could be fixed by 
+ * appending MM_WELL_KNOWN_MIME_TYPES behind $wgMimeTypeFile, but who knows
+ * what will break? In practice this probably isn't a problem anyway -- Bryan)
  */
 define('MM_WELL_KNOWN_MIME_TYPES',<<<END_STRING
-application/ogg ogg ogm ogv
+application/ogg ogx ogg ogm ogv oga spx
 application/pdf pdf
 application/vnd.oasis.opendocument.chart odc
 application/vnd.oasis.opendocument.chart-template otc
@@ -33,24 +49,28 @@ audio/midi mid midi kar
 audio/mpeg mpga mpa mp2 mp3
 audio/x-aiff aif aiff aifc
 audio/x-wav wav
-audio/ogg ogg
+audio/ogg oga spx ogg
 image/x-bmp bmp
 image/gif gif
 image/jpeg jpeg jpg jpe
 image/png png
-image/svg+xml image/svg svg
+image/svg+xml svg 
+image/svg svg
 image/tiff tiff tif
-image/vnd.djvu image/x.djvu image/x-djvu djvu
+image/vnd.djvu djvu
+image/x.djvu djvu
+image/x-djvu djvu
 image/x-portable-pixmap ppm
 image/x-xcf xcf
 text/plain txt
 text/html html htm
-video/ogg ogm ogg ogv
+video/ogg ogv ogm ogg
 video/mpeg mpg mpeg
 END_STRING
 );
 
- /** Defines a set of well known mime info entries
+/**
+ * Defines a set of well known mime info entries
  * This is used as a fallback to mime.info files.
  * An extensive list of well known mime types is provided by
  * the file mime.info in the includes directory.
@@ -80,7 +100,7 @@ audio/x-aiff [AUDIO]
 audio/x-wav [AUDIO]
 audio/mp3 audio/mpeg [AUDIO]
 application/ogg audio/ogg video/ogg [MULTIMEDIA]
-image/x-bmp image/bmp [BITMAP]
+image/x-bmp image/x-ms-bmp image/bmp [BITMAP]
 image/gif [BITMAP]
 image/jpeg [BITMAP]
 image/png [BITMAP]
@@ -97,14 +117,6 @@ unknown/unknown application/octet-stream application/x-empty [UNKNOWN]
 END_STRING
 );
 
-#note: because this file is possibly included by a function,
-#we need to access the global scope explicitely!
-global $wgLoadFileinfoExtension;
-
-if ($wgLoadFileinfoExtension) {
-       if(!extension_loaded('fileinfo')) dl('fileinfo.' . PHP_SHLIB_SUFFIX);
-}
-
 /**
  * Implements functions related to mime types such as detection and mapping to
  * file extension.
@@ -118,34 +130,42 @@ class MimeMagic {
        * Mapping of media types to arrays of mime types.
        * This is used by findMediaType and getMediaType, respectively
        */
-       var $mMediaTypes= NULL;
+       var $mMediaTypes = null;
 
        /** Map of mime type aliases
        */
-       var $mMimeTypeAliases= NULL;
+       var $mMimeTypeAliases = null;
 
        /** map of mime types to file extensions (as a space seprarated list)
        */
-       var $mMimeToExt= NULL;
+       var $mMimeToExt = null;
 
        /** map of file extensions types to mime types (as a space seprarated list)
        */
-       var $mExtToMime= NULL;
+       var $mExtToMime = null;
+
+       /** IEContentAnalyzer instance
+        */
+       var $mIEAnalyzer;
 
        /** The singleton instance
         */
        private static $instance;
 
+       /** True if the fileinfo extension has been loaded
+        */
+       private static $extensionLoaded = false;
+
        /** Initializes the MimeMagic object. This is called by MimeMagic::singleton().
-       *
-       * This constructor parses the mime.types and mime.info files and build internal mappings.
-       */
+        *
+        * This constructor parses the mime.types and mime.info files and build internal mappings.
+        */
        function __construct() {
-               /*
+               /**
                *   --- load mime.types ---
                */
 
-               global $wgMimeTypeFile, $IP;
+               global $wgMimeTypeFile, $IP, $wgLoadFileinfoExtension;
 
                $types = MM_WELL_KNOWN_MIME_TYPES;
 
@@ -153,6 +173,11 @@ class MimeMagic {
                        $wgMimeTypeFile = "$IP/$wgMimeTypeFile";
                }
 
+               if ( $wgLoadFileinfoExtension && !self::$extensionLoaded ) {
+                       self::$extensionLoaded = true;
+                       wfDl( 'fileinfo' );
+               }
+
                if ( $wgMimeTypeFile ) {
                        if ( is_file( $wgMimeTypeFile ) and is_readable( $wgMimeTypeFile ) ) {
                                wfDebug( __METHOD__.": loading mime types from $wgMimeTypeFile\n" );
@@ -174,20 +199,28 @@ class MimeMagic {
                $lines = explode( "\n",$types );
                foreach ( $lines as $s ) {
                        $s = trim( $s );
-                       if ( empty( $s ) ) continue;
-                       if ( strpos( $s, '#' ) === 0 ) continue;
+                       if ( empty( $s ) ) {
+                               continue;
+                       }
+                       if ( strpos( $s, '#' ) === 0 ) {
+                               continue;
+                       }
 
                        $s = strtolower( $s );
                        $i = strpos( $s, ' ' );
 
-                       if ( $i === false ) continue;
+                       if ( $i === false ) {
+                               continue;
+                       }
 
                        #print "processing MIME line $s<br>";
 
                        $mime = substr( $s, 0, $i );
                        $ext = trim( substr($s, $i+1 ) );
 
-                       if ( empty( $ext ) ) continue;
+                       if ( empty( $ext ) ) {
+                               continue;
+                       }
 
                        if ( !empty( $this->mMimeToExt[$mime] ) ) {
                                $this->mMimeToExt[$mime] .= ' ' . $ext;
@@ -199,7 +232,9 @@ class MimeMagic {
 
                        foreach ( $extensions as $e ) {
                                $e = trim( $e );
-                               if ( empty( $e ) ) continue;
+                               if ( empty( $e ) ) {
+                                       continue;
+                               }
 
                                if ( !empty( $this->mExtToMime[$e] ) ) {
                                        $this->mExtToMime[$e] .= ' ' . $mime;
@@ -209,9 +244,9 @@ class MimeMagic {
                        }
                }
 
-               /*
-               *   --- load mime.info ---
-               */
+               /**
+                *   --- load mime.info ---
+                */
 
                global $wgMimeInfoFile;
                if ( $wgMimeInfoFile == 'includes/mime.info' ) {
@@ -241,13 +276,19 @@ class MimeMagic {
                $lines = explode( "\n", $info );
                foreach ( $lines as $s ) {
                        $s = trim( $s );
-                       if ( empty( $s ) ) continue;
-                       if ( strpos( $s, '#' ) === 0 ) continue;
+                       if ( empty( $s ) ) {
+                               continue;
+                       }
+                       if ( strpos( $s, '#' ) === 0 ) {
+                               continue;
+                       }
 
                        $s = strtolower( $s );
                        $i = strpos( $s, ' ' );
 
-                       if ( $i === false ) continue;
+                       if ( $i === false ) {
+                               continue;
+                       }
 
                        #print "processing MIME INFO line $s<br>";
 
@@ -267,7 +308,9 @@ class MimeMagic {
 
                        foreach ( $m as $mime ) {
                                $mime = trim( $mime );
-                               if ( empty( $mime ) ) continue;
+                               if ( empty( $mime ) ) {
+                                       continue;
+                               }
 
                                $this->mMediaTypes[$mtype][] = $mime;
                        }
@@ -285,47 +328,70 @@ class MimeMagic {
 
        /**
         * Get an instance of this class
+        * @return MimeMagic
         */
-       static function &singleton() {
+       public static function &singleton() {
                if ( !isset( self::$instance ) ) {
                        self::$instance = new MimeMagic;
                }
                return self::$instance;
        }
 
-       /** returns a list of file extensions for a given mime type
-       * as a space separated string.
-       */
-       function getExtensionsForType( $mime ) {
+       /** 
+        * Returns a list of file extensions for a given mime type as a space 
+        * separated string or null if the mime type was unrecognized. Resolves
+        * mime type aliases.
+        * 
+        * @param $mime string
+        * @return string|null
+        */
+       public function getExtensionsForType( $mime ) {
                $mime = strtolower( $mime );
 
-               $r = @$this->mMimeToExt[$mime];
+               // Check the mime-to-ext map
+               if ( isset( $this->mMimeToExt[$mime] ) ) {
+                       return $this->mMimeToExt[$mime];
+               }
 
-               if ( @!$r and isset( $this->mMimeTypeAliases[$mime] ) ) {
+               // Resolve the mime type to the canonical type
+               if ( isset( $this->mMimeTypeAliases[$mime] ) ) {
                        $mime = $this->mMimeTypeAliases[$mime];
-                       $r = @$this->mMimeToExt[$mime];
+                       if ( isset( $this->mMimeToExt[$mime] ) ) {
+                               return $this->mMimeToExt[$mime];
+                       }
                }
 
-               return $r;
+               return null;
        }
 
-       /** returns a list of mime types for a given file extension
-       * as a space separated string.
-       */
-       function getTypesForExtension( $ext ) {
+       /** 
+        * Returns a list of mime types for a given file extension as a space 
+        * separated string or null if the extension was unrecognized.
+        * 
+        * @param $ext string
+        * @return string|null
+        */
+       public function getTypesForExtension( $ext ) {
                $ext = strtolower( $ext );
 
                $r = isset( $this->mExtToMime[$ext] ) ? $this->mExtToMime[$ext] : null;
                return $r;
        }
 
-       /** returns a single mime type for a given file extension.
-       * This is always the first type from the list returned by getTypesForExtension($ext).
-       */
-       function guessTypesForExtension( $ext ) {
+       /** 
+        * Returns a single mime type for a given file extension or null if unknown.
+        * This is always the first type from the list returned by getTypesForExtension($ext).
+        * 
+        * @param $ext string
+        * @return string|null
+        */
+       public function guessTypesForExtension( $ext ) {
                $m = $this->getTypesForExtension( $ext );
-               if ( is_null( $m ) ) return NULL;
+               if ( is_null( $m ) ) {
+                       return null;
+               }
 
+               // TODO: Check if this is needed; strtok( $m, ' ' ) should be sufficient
                $m = trim( $m );
                $m = preg_replace( '/\s.*$/', '', $m );
 
@@ -333,32 +399,38 @@ class MimeMagic {
        }
 
 
-       /** tests if the extension matches the given mime type.
-       * returns true if a match was found, NULL if the mime type is unknown,
-       * and false if the mime type is known but no matches where found.
-       */
-       function isMatchingExtension( $extension, $mime ) {
+       /** 
+        * Tests if the extension matches the given mime type. Returns true if a 
+        * match was found, null if the mime type is unknown, and false if the 
+        * mime type is known but no matches where found.
+        * 
+        * @param $extension string
+        * @param $mime string
+        * @return bool|null
+        */
+       public function isMatchingExtension( $extension, $mime ) {
                $ext = $this->getExtensionsForType( $mime );
 
                if ( !$ext ) {
-                       return NULL;  //unknown
+                       return null;  // Unknown mime type
                }
 
                $ext = explode( ' ', $ext );
 
                $extension = strtolower( $extension );
-               if ( in_array( $extension, $ext ) ) {
-                       return true;
-               }
-
-               return false;
+               return  in_array( $extension, $ext );
        }
 
-       /** returns true if the mime type is known to represent
-       * an image format supported by the PHP GD library.
-       */
-       function isPHPImageType( $mime ) {
-               #as defined by imagegetsize and image_type_to_mime
+       /** 
+        * Returns true if the mime type is known to represent an image format 
+        * supported by the PHP GD library.
+        *
+        * @param $mime string
+        * 
+        * @return bool
+        */
+       public function isPHPImageType( $mime ) {
+               // As defined by imagegetsize and image_type_to_mime
                static $types = array(
                        'image/gif', 'image/jpeg', 'image/png',
                        'image/x-bmp', 'image/xbm', 'image/tiff',
@@ -392,7 +464,9 @@ class MimeMagic {
                        'xbm',
 
                        // Formats we recognize magic numbers for
-                       'djvu', 'ogg', 'ogv', 'mid', 'pdf', 'wmf', 'xcf',
+                       'djvu', 'ogx', 'ogg', 'ogv', 'oga', 'spx',
+                       'mid', 'pdf', 'wmf', 'xcf', 'webm', 'mkv', 'mka',
+                       'webp',
 
                        // XML formats we sure hope we recognize reliably
                        'svg',
@@ -400,18 +474,76 @@ class MimeMagic {
                return in_array( strtolower( $extension ), $types );
        }
 
+       /** 
+        * Improves a mime type using the file extension. Some file formats are very generic,
+        * so their mime type is not very meaningful. A more useful mime type can be derived 
+        * by looking at the file extension. Typically, this method would be called on the 
+        * result of guessMimeType().
+        * 
+        * Currently, this method does the following:
+        *
+        * If $mime is "unknown/unknown" and isRecognizableExtension( $ext ) returns false,
+        * return the result of guessTypesForExtension($ext). 
+        *
+        * If $mime is "application/x-opc+zip" and isMatchingExtension( $ext, $mime )
+        * gives true, return the result of guessTypesForExtension($ext). 
+        *
+        * @param $mime String: the mime type, typically guessed from a file's content.
+        * @param $ext String: the file extension, as taken from the file name
+        *
+        * @return string the mime type
+        */
+       public function improveTypeFromExtension( $mime, $ext ) {
+               if ( $mime === 'unknown/unknown' ) {
+                       if ( $this->isRecognizableExtension( $ext ) ) {
+                               wfDebug( __METHOD__. ': refusing to guess mime type for .' . 
+                                       "$ext file, we should have recognized it\n" );
+                       } else {
+                               // Not something we can detect, so simply 
+                               // trust the file extension
+                               $mime = $this->guessTypesForExtension( $ext );
+                       }
+               }
+               elseif ( $mime === 'application/x-opc+zip' ) {
+                       if ( $this->isMatchingExtension( $ext, $mime ) ) {
+                               // A known file extension for an OPC file,
+                               // find the proper mime type for that file extension
+                               $mime = $this->guessTypesForExtension( $ext );
+                       } else {
+                               wfDebug( __METHOD__. ": refusing to guess better type for $mime file, " . 
+                                       ".$ext is not a known OPC extension.\n" );
+                               $mime = 'application/zip';
+                       }
+               }
+
+               if ( isset( $this->mMimeTypeAliases[$mime] ) ) {
+                       $mime = $this->mMimeTypeAliases[$mime];
+               }
+
+               wfDebug(__METHOD__.": improved mime type for .$ext: $mime\n");
+               return $mime;
+       }
+
+       /** 
+        * Mime type detection. This uses detectMimeType to detect the mime type 
+        * of the file, but applies additional checks to determine some well known 
+        * file formats that may be missed or misinterpreter by the default mime 
+        * detection (namely XML based formats like XHTML or SVG, as well as ZIP 
+        * based formats like OPC/ODF files).
+        *
+        * @param $file String: the file to check
+        * @param $ext Mixed: the file extension, or true (default) to extract it from the filename.
+        *             Set it to false to ignore the extension. DEPRECATED! Set to false, use 
+        *             improveTypeFromExtension($mime, $ext) later to improve mime type.
+        *
+        * @return string the mime type of $file
+        */
+       public function guessMimeType( $file, $ext = true ) {
+               if ( $ext ) { // TODO: make $ext default to false. Or better, remove it.
+                       wfDebug( __METHOD__.": WARNING: use of the \$ext parameter is deprecated. " .
+                               "Use improveTypeFromExtension(\$mime, \$ext) instead.\n" );
+               }
 
-       /** mime type detection. This uses detectMimeType to detect the mime type of the file,
-       * but applies additional checks to determine some well known file formats that may be missed
-       * or misinterpreter by the default mime detection (namely xml based formats like XHTML or SVG).
-       *
-       * @param string $file The file to check
-       * @param mixed $ext The file extension, or true to extract it from the filename.
-       *                   Set it to false to ignore the extension.
-       *
-       * @return string the mime type of $file
-       */
-       function guessMimeType( $file, $ext = true ) {
                $mime = $this->doGuessMimeType( $file, $ext );
 
                if( !$mime ) {
@@ -423,21 +555,33 @@ class MimeMagic {
                        $mime = $this->mMimeTypeAliases[$mime];
                }
 
-               wfDebug(__METHOD__.": final mime type of $file: $mime\n");
+               wfDebug(__METHOD__.": guessed mime type of $file: $mime\n");
                return $mime;
        }
 
-       function doGuessMimeType( $file, $ext = true ) {
+       /**
+        * Guess the mime type from the file contents.
+        *
+        * @param string $file
+        * @param mixed $ext
+        */
+       private function doGuessMimeType( $file, $ext ) { // TODO: remove $ext param
                // Read a chunk of the file
                wfSuppressWarnings();
-               $f = fopen( $file, "rt" );
+               // @todo FIXME: Shouldn't this be rb?
+               $f = fopen( $file, 'rt' );
                wfRestoreWarnings();
-               if( !$f ) return "unknown/unknown";
+               
+               if( !$f ) {
+                       return 'unknown/unknown';
+               }
                $head = fread( $f, 1024 );
                fseek( $f, -65558, SEEK_END );
                $tail = fread( $f, 65558 ); // 65558 = maximum size of a zip EOCDR
                fclose( $f );
 
+               wfDebug( __METHOD__ . ": analyzing head and tail of $file for magic numbers.\n" );
+
                // Hardcode a few magic number checks...
                $headers = array(
                        // Multimedia...
@@ -457,24 +601,50 @@ class MimeMagic {
                        "\x7fELF"          => 'application/octet-stream', // ELF binary
                );
 
-               foreach( $headers as $magic => $candidate ) {
-                       if( strncmp( $head, $magic, strlen( $magic ) ) == 0 ) {
+               foreach ( $headers as $magic => $candidate ) {
+                       if ( strncmp( $head, $magic, strlen( $magic ) ) == 0 ) {
                                wfDebug( __METHOD__ . ": magic header in $file recognized as $candidate\n" );
                                return $candidate;
                        }
                }
 
-               /*
-                * look for PHP
-                * Check for this before HTML/XML...
-                * Warning: this is a heuristic, and won't match a file with a lot of non-PHP before.
-                * It will also match text files which could be PHP. :)
+               /* Look for WebM and Matroska files */
+               if ( strncmp( $head, pack( "C4", 0x1a, 0x45, 0xdf, 0xa3 ), 4 ) == 0 ) {
+                       $doctype = strpos( $head, "\x42\x82" );
+                       if ( $doctype ) {
+                               // Next byte is datasize, then data (sizes larger than 1 byte are very stupid muxers)
+                               $data = substr($head, $doctype+3, 8);
+                               if ( strncmp( $data, "matroska", 8 ) == 0 ) {
+                                       wfDebug( __METHOD__ . ": recognized file as video/x-matroska\n" );
+                                       return "video/x-matroska";
+                               } elseif ( strncmp( $data, "webm", 4 ) == 0 ) {
+                                       wfDebug( __METHOD__ . ": recognized file as video/webm\n" );
+                                       return "video/webm";
+                               }
+                       }
+                       wfDebug( __METHOD__ . ": unknown EBML file\n" );
+                       return "unknown/unknown";
+               }
+
+               /* Look for WebP */
+               if ( strncmp( $head, "RIFF", 4 ) == 0 && strncmp( substr( $head, 8, 8), "WEBPVP8 ", 8 ) == 0 ) {
+                       wfDebug( __METHOD__ . ": recognized file as image/webp\n" );
+                       return "image/webp";
+               }
+
+               /**
+                * Look for PHP.  Check for this before HTML/XML...  Warning: this is a
+                * heuristic, and won't match a file with a lot of non-PHP before.  It
+                * will also match text files which could be PHP. :)
+                *
+                * @todo FIXME: For this reason, the check is probably useless -- an attacker
+                * could almost certainly just pad the file with a lot of nonsense to
+                * circumvent the check in any case where it would be a security
+                * problem.  On the other hand, it causes harmful false positives (bug
+                * 16583).  The heuristic has been cut down to exclude three-character
+                * strings like "<? ", but should it be axed completely?
                 */
-               if( ( strpos( $head, '<?php' ) !== false ) ||
-                   ( strpos( $head, '<? ' ) !== false ) ||
-                   ( strpos( $head, "<?\n" ) !== false ) ||
-                   ( strpos( $head, "<?\t" ) !== false ) ||
-                   ( strpos( $head, "<?=" ) !== false ) ||
+               if ( ( strpos( $head, '<?php' ) !== false ) ||
 
                    ( strpos( $head, "<\x00?\x00p\x00h\x00p" ) !== false ) ||
                    ( strpos( $head, "<\x00?\x00 " ) !== false ) ||
@@ -483,26 +653,26 @@ class MimeMagic {
                    ( strpos( $head, "<\x00?\x00=" ) !== false ) ) {
 
                        wfDebug( __METHOD__ . ": recognized $file as application/x-php\n" );
-                       return "application/x-php";
+                       return 'application/x-php';
                }
 
-               /*
+               /**
                 * look for XML formats (XHTML and SVG)
                 */
                $xml = new XmlTypeCheck( $file );
-               if( $xml->wellFormed ) {
+               if ( $xml->wellFormed ) {
                        global $wgXMLMimeTypes;
-                       if( isset( $wgXMLMimeTypes[$xml->getRootElement()] ) ) {
+                       if ( isset( $wgXMLMimeTypes[$xml->getRootElement()] ) ) {
                                return $wgXMLMimeTypes[$xml->getRootElement()];
                        } else {
                                return 'application/xml';
                        }
                }
 
-               /*
+               /**
                 * look for shell scripts
                 */
-               $script_type = NULL;
+               $script_type = null;
 
                # detect by shebang
                if ( substr( $head, 0, 2) == "#!" ) {
@@ -539,10 +709,10 @@ class MimeMagic {
                        }
                }
 
-               // Check for ZIP (before getimagesize)
+               // Check for ZIP variants (before getimagesize)
                if ( strpos( $tail, "PK\x05\x06" ) !== false ) {
-                       wfDebug( __METHOD__.": ZIP header present at end of $file\n" );
-                       return $this->detectZipType( $head );
+                       wfDebug( __METHOD__.": ZIP header present in $file\n" );
+                       return $this->detectZipType( $head, $tail, $ext );
                }
 
                wfSuppressWarnings();
@@ -567,66 +737,131 @@ class MimeMagic {
        
        /**
         * Detect application-specific file type of a given ZIP file from its
-        * header data.  Currently works for OpenDocument types...
+        * header data.  Currently works for OpenDocument and OpenXML types...
         * If can't tell, returns 'application/zip'.
         *
-        * @param string $header Some reasonably-sized chunk of file header
+        * @param $header String: some reasonably-sized chunk of file header
+        * @param $tail   String: the tail of the file
+        * @param $ext Mixed: the file extension, or true to extract it from the filename.
+        *             Set it to false (default) to ignore the extension. DEPRECATED! Set to false, 
+        *             use improveTypeFromExtension($mime, $ext) later to improve mime type.
+        *
         * @return string
         */
-       function detectZipType( $header ) {
+       function detectZipType( $header, $tail = null, $ext = false ) {
+               if( $ext ) { # TODO: remove $ext param
+                       wfDebug( __METHOD__.": WARNING: use of the \$ext parameter is deprecated. " .
+                               "Use improveTypeFromExtension(\$mime, \$ext) instead.\n" );
+               }
+
+               $mime = 'application/zip';
                $opendocTypes = array(
-                       'chart',
                        'chart-template',
-                       'formula',
+                       'chart',
                        'formula-template',
-                       'graphics',
+                       'formula',
                        'graphics-template',
-                       'image',
+                       'graphics',
                        'image-template',
-                       'presentation',
+                       'image',
                        'presentation-template',
-                       'spreadsheet',
+                       'presentation',
                        'spreadsheet-template',
-                       'text',
+                       'spreadsheet',
                        'text-template',
                        'text-master',
-                       'text-web' );
+                       'text-web',
+                       'text' );
 
                // http://lists.oasis-open.org/archives/office/200505/msg00006.html
                $types = '(?:' . implode( '|', $opendocTypes ) . ')';
                $opendocRegex = "/^mimetype(application\/vnd\.oasis\.opendocument\.$types)/";
-               wfDebug( __METHOD__.": $opendocRegex\n" );
-               
-               if( preg_match( $opendocRegex, substr( $header, 30 ), $matches ) ) {
+
+               $openxmlRegex = "/^\[Content_Types\].xml/";
+
+               if ( preg_match( $opendocRegex, substr( $header, 30 ), $matches ) ) {
                        $mime = $matches[1];
                        wfDebug( __METHOD__.": detected $mime from ZIP archive\n" );
-                       return $mime;
+               } elseif ( preg_match( $openxmlRegex, substr( $header, 30 ) ) ) {
+                       $mime = "application/x-opc+zip";
+                       # TODO: remove the block below, as soon as improveTypeFromExtension is used everywhere 
+                       if ( $ext !== true && $ext !== false ) { 
+                               /** This is the mode used by getPropsFromPath
+                               * These mime's are stored in the database, where we don't really want
+                               * x-opc+zip, because we use it only for internal purposes
+                               */
+                               if ( $this->isMatchingExtension( $ext, $mime) ) {
+                                       /* A known file extension for an OPC file,
+                                       * find the proper mime type for that file extension */
+                                       $mime = $this->guessTypesForExtension( $ext );
+                               } else {
+                                       $mime = "application/zip";
+                               }
+                       }
+                       wfDebug( __METHOD__.": detected an Open Packaging Conventions archive: $mime\n" );
+               } elseif ( substr( $header, 0, 8 ) == "\xd0\xcf\x11\xe0\xa1\xb1\x1a\xe1" && 
+                               ($headerpos = strpos( $tail, "PK\x03\x04" ) ) !== false &&
+                               preg_match( $openxmlRegex, substr( $tail, $headerpos + 30 ) ) ) {
+                       if ( substr( $header, 512, 4) == "\xEC\xA5\xC1\x00" ) {
+                               $mime = "application/msword";
+                       } 
+                       switch( substr( $header, 512, 6) ) {
+                               case "\xEC\xA5\xC1\x00\x0E\x00":
+                               case "\xEC\xA5\xC1\x00\x1C\x00":
+                               case "\xEC\xA5\xC1\x00\x43\x00":
+                                       $mime = "application/vnd.ms-powerpoint";
+                                       break;
+                               case "\xFD\xFF\xFF\xFF\x10\x00":
+                               case "\xFD\xFF\xFF\xFF\x1F\x00":
+                               case "\xFD\xFF\xFF\xFF\x22\x00":
+                               case "\xFD\xFF\xFF\xFF\x23\x00":
+                               case "\xFD\xFF\xFF\xFF\x28\x00":
+                               case "\xFD\xFF\xFF\xFF\x29\x00":
+                               case "\xFD\xFF\xFF\xFF\x10\x02":
+                               case "\xFD\xFF\xFF\xFF\x1F\x02":
+                               case "\xFD\xFF\xFF\xFF\x22\x02":
+                               case "\xFD\xFF\xFF\xFF\x23\x02":
+                               case "\xFD\xFF\xFF\xFF\x28\x02":
+                               case "\xFD\xFF\xFF\xFF\x29\x02":
+                                       $mime = "application/vnd.msexcel";
+                                       break;
+                       }
+
+                       wfDebug( __METHOD__.": detected a MS Office document with OPC trailer\n");
                } else {
                        wfDebug( __METHOD__.": unable to identify type of ZIP archive\n" );
-                       return 'application/zip';
                }
+               return $mime;
        }
 
-       /** Internal mime type detection, please use guessMimeType() for application code instead.
-       * Detection is done using an external program, if $wgMimeDetectorCommand is set.
-       * Otherwise, the fileinfo extension and mime_content_type are tried (in this order), if they are available.
-       * If the dections fails and $ext is not false, the mime type is guessed from the file extension, using
-       * guessTypesForExtension.
-       * If the mime type is still unknown, getimagesize is used to detect the mime type if the file is an image.
-       * If no mime type can be determined, this function returns "unknown/unknown".
-       *
-       * @param string $file The file to check
-       * @param mixed $ext The file extension, or true to extract it from the filename.
-       *                   Set it to false to ignore the extension.
-       *
-       * @return string the mime type of $file
-       * @access private
-       */
-       function detectMimeType( $file, $ext = true ) {
+       /** 
+        * Internal mime type detection. Detection is done using an external 
+        * program, if $wgMimeDetectorCommand is set. Otherwise, the fileinfo 
+        * extension and mime_content_type are tried (in this order), if they 
+        * are available. If the dections fails and $ext is not false, the mime 
+        * type is guessed from the file extension, using guessTypesForExtension.
+        * 
+        * If the mime type is still unknown, getimagesize is used to detect the 
+        * mime type if the file is an image. If no mime type can be determined, 
+        * this function returns 'unknown/unknown'.
+        *
+        * @param $file String: the file to check
+        * @param $ext Mixed: the file extension, or true (default) to extract it from the filename.
+        *             Set it to false to ignore the extension. DEPRECATED! Set to false, use 
+        *             improveTypeFromExtension($mime, $ext) later to improve mime type.
+        *
+        * @return string the mime type of $file
+        */
+       private function detectMimeType( $file, $ext = true ) {
                global $wgMimeDetectorCommand;
 
-               $m = NULL;
+               if ( $ext ) { # TODO:  make $ext default to false. Or better, remove it.
+                       wfDebug( __METHOD__.": WARNING: use of the \$ext parameter is deprecated. Use improveTypeFromExtension(\$mime, \$ext) instead.\n" );
+               }
+
+               $m = null;
                if ( $wgMimeDetectorCommand ) {
+                       // @todo FIXME: Use wfShellExec
                        $fn = wfEscapeShellArg( $file );
                        $m = `$wgMimeDetectorCommand $fn`;
                } elseif ( function_exists( "finfo_open" ) && function_exists( "finfo_file" ) ) {
@@ -641,9 +876,9 @@ class MimeMagic {
                        # If you may need to load the fileinfo extension at runtime, set
                        # $wgLoadFileinfoExtension in LocalSettings.php
 
-                       $mime_magic_resource = finfo_open(FILEINFO_MIME); /* return mime type ala mimetype extension */
+                       $mime_magic_resource = finfo_open( FILEINFO_MIME ); /* return mime type ala mimetype extension */
 
-                       if ($mime_magic_resource) {
+                       if ( $mime_magic_resource ) {
                                $m = finfo_file( $mime_magic_resource, $file );
                                finfo_close( $mime_magic_resource );
                        } else {
@@ -672,14 +907,14 @@ class MimeMagic {
                        $m = strtolower( $m );
 
                        if ( strpos( $m, 'unknown' ) !== false ) {
-                               $m = NULL;
+                               $m = null;
                        } else {
                                wfDebug( __METHOD__.": magic mime type of $file: $m\n" );
                                return $m;
                        }
                }
 
-               # if desired, look at extension as a fallback.
+               // If desired, look at extension as a fallback.
                if ( $ext === true ) {
                        $i = strrpos( $file, '.' );
                        $ext = strtolower( $i ? substr( $file, $i + 1 ) : '' );
@@ -696,36 +931,40 @@ class MimeMagic {
                        }
                }
 
-               #unknown type
-               wfDebug( __METHOD__.": failed to guess mime type for $file!\n" );
-               return "unknown/unknown";
+               // Unknown type
+               wfDebug( __METHOD__ . ": failed to guess mime type for $file!\n" );
+               return 'unknown/unknown';
        }
 
        /**
-       * Determine the media type code for a file, using its mime type, name and possibly
-       * its contents.
-       *
-       * This function relies on the findMediaType(), mapping extensions and mime
-       * types to media types.
-       *
-       * @todo analyse file if need be
-       * @todo look at multiple extension, separately and together.
-       *
-       * @param string $path full path to the image file, in case we have to look at the contents
-       *        (if null, only the mime type is used to determine the media type code).
-       * @param string $mime mime type. If null it will be guessed using guessMimeType.
-       *
-       * @return (int?string?) a value to be used with the MEDIATYPE_xxx constants.
-       */
-       function getMediaType( $path = NULL, $mime = NULL ) {
-               if( !$mime && !$path ) return MEDIATYPE_UNKNOWN;
+        * Determine the media type code for a file, using its mime type, name and
+        * possibly its contents.
+        *
+        * This function relies on the findMediaType(), mapping extensions and mime
+        * types to media types.
+        *
+        * @todo analyse file if need be
+        * @todo look at multiple extension, separately and together.
+        *
+        * @param $path String: full path to the image file, in case we have to look at the contents
+        *        (if null, only the mime type is used to determine the media type code).
+        * @param $mime String: mime type. If null it will be guessed using guessMimeType.
+        *
+        * @return (int?string?) a value to be used with the MEDIATYPE_xxx constants.
+        */
+       function getMediaType( $path = null, $mime = null ) {
+               if( !$mime && !$path ) {
+                       return MEDIATYPE_UNKNOWN;
+               }
 
-               # If mime type is unknown, guess it
-               if( !$mime ) $mime = $this->guessMimeType( $path, false );
+               // If mime type is unknown, guess it
+               if( !$mime ) {
+                       $mime = $this->guessMimeType( $path, false );
+               }
 
-               # Special code for ogg - detect if it's video (theora),
-               # else label it as sound.
-               if( $mime == "application/ogg" && file_exists( $path ) ) {
+               // Special code for ogg - detect if it's video (theora),
+               // else label it as sound.
+               if ( $mime == 'application/ogg' && file_exists( $path ) ) {
 
                        // Read a chunk of the file
                        $f = fopen( $path, "rt" );
@@ -735,7 +974,7 @@ class MimeMagic {
 
                        $head = strtolower( $head );
 
-                       # This is an UGLY HACK, file should be parsed correctly
+                       // This is an UGLY HACK, file should be parsed correctly
                        if ( strpos( $head, 'theora' ) !== false ) return MEDIATYPE_VIDEO;
                        elseif ( strpos( $head, 'vorbis' ) !== false ) return MEDIATYPE_AUDIO;
                        elseif ( strpos( $head, 'flac' ) !== false ) return MEDIATYPE_AUDIO;
@@ -743,59 +982,69 @@ class MimeMagic {
                        else return MEDIATYPE_MULTIMEDIA;
                }
 
-               # check for entry for full mime type
+               // Check for entry for full mime type
                if( $mime ) {
                        $type = $this->findMediaType( $mime );
-                       if( $type !== MEDIATYPE_UNKNOWN ) return $type;
+                       if ( $type !== MEDIATYPE_UNKNOWN ) {
+                               return $type;
+                       }
                }
 
-               # Check for entry for file extension
-               $e = NULL;
+               // Check for entry for file extension
                if ( $path ) {
                        $i = strrpos( $path, '.' );
                        $e = strtolower( $i ? substr( $path, $i + 1 ) : '' );
 
-                       # TODO: look at multi-extension if this fails, parse from full path
-
+                       // TODO: look at multi-extension if this fails, parse from full path
                        $type = $this->findMediaType( '.' . $e );
-                       if ( $type !== MEDIATYPE_UNKNOWN ) return $type;
+                       if ( $type !== MEDIATYPE_UNKNOWN ) {
+                               return $type;
+                       }
                }
 
-               # Check major mime type
-               if( $mime ) {
+               // Check major mime type
+               if ( $mime ) {
                        $i = strpos( $mime, '/' );
-                       if( $i !== false ) {
+                       if ( $i !== false ) {
                                $major = substr( $mime, 0, $i );
                                $type = $this->findMediaType( $major );
-                               if( $type !== MEDIATYPE_UNKNOWN ) return $type;
+                               if ( $type !== MEDIATYPE_UNKNOWN ) {
+                                       return $type;
+                               }
                        }
                }
 
-               if( !$type ) $type = MEDIATYPE_UNKNOWN;
+               if( !$type ) {
+                       $type = MEDIATYPE_UNKNOWN;
+               }
 
                return $type;
        }
 
-       /** returns a media code matching the given mime type or file extension.
-       * File extensions are represented by a string starting with a dot (.) to
-       * distinguish them from mime types.
-       *
-       * This funktion relies on the mapping defined by $this->mMediaTypes
-       * @access private
-       */
+       /** 
+        * Returns a media code matching the given mime type or file extension.
+        * File extensions are represented by a string starting with a dot (.) to
+        * distinguish them from mime types.
+        *
+        * This funktion relies on the mapping defined by $this->mMediaTypes
+        * @access private
+        */
        function findMediaType( $extMime ) {
-               if ( strpos( $extMime, '.' ) === 0 ) { #if it's an extension, look up the mime types
+               if ( strpos( $extMime, '.' ) === 0 ) { 
+                       // If it's an extension, look up the mime types
                        $m = $this->getTypesForExtension( substr( $extMime, 1 ) );
-                       if ( !$m ) return MEDIATYPE_UNKNOWN;
+                       if ( !$m ) {
+                               return MEDIATYPE_UNKNOWN;
+                       }
 
                        $m = explode( ' ', $m );
                } else {
-                       # Normalize mime type
+                       // Normalize mime type
                        if ( isset( $this->mMimeTypeAliases[$extMime] ) ) {
                                $extMime = $this->mMimeTypeAliases[$extMime];
                        }
 
-                       $m = array($extMime);
+                       $m = array( $extMime );
                }
 
                foreach ( $m as $mime ) {
@@ -810,411 +1059,27 @@ class MimeMagic {
        }
 
        /**
-        * Get the MIME type from ieMimeFromData(), but convert the result from IE's 
-        * idiosyncratic private types into something MediaWiki will understand.
+        * Get the MIME types that various versions of Internet Explorer would 
+        * detect from a chunk of the content.
         *
-        * @param string $fileName The file name (unused at present)
-        * @param string $chunk The first 256 bytes of the file
-        * @param string $proposed The MIME type proposed by the server
+        * @param $fileName String: the file name (unused at present)
+        * @param $chunk String: the first 256 bytes of the file
+        * @param $proposed String: the MIME type proposed by the server
         */
-       public function getIEMimeType( $fileName, $chunk, $proposed ) {
-               static $table = array(
-                       'image/pjpeg' => 'image/jpeg',
-                       'image/x-png' => 'image/png',
-                       'image/x-wmf' => 'application/x-msmetafile',
-                       'image/bmp' => 'image/x-bmp',
-                       'application/x-zip-compressed' => 'application/zip',
-                       'application/x-compressed' => 'application/x-compress',
-                       'application/x-gzip-compressed' => 'application/x-gzip',
-                       'audio/mid' => 'audio/midi',
-               );
-
-               $type = $this->ieMimeFromData( $fileName, $chunk, $proposed );
-               if ( isset( $table[$type] ) ) {
-                       $type = $table[$type];
-               }
-               return $type;
+       public function getIEMimeTypes( $fileName, $chunk, $proposed ) {
+               $ca = $this->getIEContentAnalyzer();
+               return $ca->getRealMimesFromData( $fileName, $chunk, $proposed );
        }
 
        /**
-        * Do a MIME type check similar to IE's FindMimeFromData(). This is used to 
-        * ensure that a file won't be detected as a blacklisted type such as text/html,
-        * thus opening up an XSS vulnerability. 
+        * Get a cached instance of IEContentAnalyzer
         *
-        * Based on a disassembly of urlmon.dll from IE 7.
-        *
-        * @param string $fileName The file name (unused at present)
-        * @param string $chunk The first 256 bytes of the file
-        * @param string $proposed The MIME type proposed by the server
+        * @return IEContentAnalyzer
         */
-       public function ieMimeFromData( $fileName, $chunk, $proposed ) {
-               // IE puts a null character at byte 255 (the 256th byte)
-               $chunk = substr( $chunk, 0, 255 );
-               
-               $types = array(
-                       'ambiguous' /*1*/ => array(
-                               'text/plain', 
-                               'application/octet-stream', 
-                               'application/x-netcdf', // [sic]
-                               'unknown/unknown', // for MediaWiki
-                       ),
-                       'text' /*3*/ => array(
-                               'text/richtext', 'image/x-bitmap', 'application/postscript', 'application/base64',
-                               'application/macbinhex40', 'application/x-cdf', 'text/scriptlet', 'text/xml', 
-                               'application/xml',
-                               
-                       ),
-                       'binary' /*4*/ => array(
-                               'application/pdf', 'audio/x-aiff', 'audio/basic', 'audio/wav', 'image/gif',
-                               'image/pjpeg', 'image/jpeg', 'image/tiff', 'image/x-png', 'image/png', 'image/bmp', 
-                               'image/x-jg', 'image/x-art', 'image/x-emf', 'image/x-wmf', 'video/avi', 
-                               'video/x-msvideo', 'video/mpeg', 'application/x-compressed',
-                               'application/x-zip-compressed', 'application/x-gzip-compressed', 'application/java',
-                               'application/x-msdownload'
-                       ),
-                       'html' /*5*/ => array( 'text/html' ),
-               );
-
-               if ( in_array( $proposed, $types['text'] ) ) {
-                       return $proposedType;
-               }
-               if ( !in_array( $proposed, $types['binary'] )
-                       && !in_array( $proposed, $types['ambiguous'] ) 
-                       && !in_array( $proposed, $types['html'] ) )
-               {
-                       // Unknown
-                       return $proposed;
-               }
-
-               // CContentAnalyzer::SampleData
-               $found = array();
-               $numControl = 0;
-               $numHigh = 0;
-               $numLow = 0;
-               $numLF = 0;
-               $numCR = 0;
-               $numFF = 0;
-               $htmlTags = array(
-                       'html',
-                       'head',
-                       'title',
-                       'body',
-                       'script',
-                       'a href',
-                       'pre',
-                       'img',
-                       'plaintext',
-                       'table'
-               );
-               $rdfUrl = 'http://www.w3.org/1999/02/22-rdf-syntax-ns#';
-               $rdfPurl = 'http://purl.org/rss/1.0/';
-               $xbmMagic1 = '#define';
-               $xbmMagic2 = '_width';
-               $xbmMagic3 = '_bits';
-               $binhexMagic = 'converted with BinHex';
-
-               for ( $offset = 0; $offset < strlen( $chunk ); $offset++ ) {
-                       $curChar = $chunk[$offset];
-                       if ( $curChar == "\x0a" ) {
-                               $numLF++;
-                               continue;
-                       } elseif ( $curChar == "\x0d" ) {
-                               $numCR++;
-                               continue;
-                       } elseif ( $curChar == "\x0c" ) {
-                               $numFF++;
-                               continue;
-                       } elseif ( $curChar == "\t" ) {
-                               $numLow++;
-                               continue;
-                       } elseif ( ord( $curChar ) < 32 ) {
-                               $numControl++;
-                               continue;
-                       } elseif ( ord( $curChar ) >= 128 ) {
-                               $numHigh++;
-                               continue;
-                       }
-
-                       $numLow++;
-                       if ( $curChar == '<' ) {
-                               // XML
-                               $remainder = substr( $chunk, $offset + 1 );
-                               if ( !strncasecmp( $remainder, '?XML', 4 ) ) {
-                                       $nextChar = substr( $chunk, $offset + 5, 1 );
-                                       if ( $nextChar == ':' || $nextChar == ' ' || $nextChar == "\t" ) {
-                                               $found['xml'] = true;
-                                       }
-                               }
-                               // Scriptlet (JSP)
-                               if ( !strncasecmp( $remainder, 'SCRIPTLET', 9 ) ) {
-                                       $found['scriptlet'] = true;
-                                       break;
-                               }
-                               // HTML
-                               foreach ( $htmlTags as $tag ) {
-                                       if ( !strncasecmp( $remainder, $tag, strlen( $tag ) ) ) {
-                                               $found['html'] = true;
-                                       }
-                               }
-                               // Skip broken check for additional tags (HR etc.)
-
-                               // RSS
-                               if ( !strncasecmp( $remainder, 'RSS', 3 ) ) {
-                                       $found['rss'] = true;
-                                       break; // return from SampleData
-                               }
-                               if ( !strncasecmp( $remainder, 'rdf:RDF', 7 ) ) {
-                                       $found['rdf-tag'] = true;
-                                       // no break
-                               }
-                               if ( !strncasecmp( $remainder, 'FEED', 4 ) ) {
-                                       $found['feed'] = true;
-                                       break;
-                               }
-                               continue;
-                       }
-                       // Skip broken check for -->
-
-                       // RSS URL checks
-                       // For some reason both URLs must appear before a break is triggered
-                       $remainder = substr( $chunk, $offset );
-                       if ( !strncasecmp( $remainder, $rdfUrl, strlen( $rdfUrl ) ) ) {
-                               $found['rdf-url'] = true;
-                               if ( isset( $found['rdf-tag'] )
-                                       && isset( $found['rdf-purl'] ) ) // [sic]
-                               {
-                                       break;
-                               }
-                               continue;
-                       }
-
-                       if ( !strncasecmp( $remainder, $rdfPurl, strlen( $rdfPurl ) ) ) {
-                               if ( isset( $found['rdf-tag'] ) 
-                                       && isset( $found['rdf-url'] ) ) // [sic]
-                               {
-                                       break;
-                               }
-                               continue;
-                       }
-
-                       // XBM checks
-                       if ( !strncasecmp( $remainder, $xbmMagic1, strlen( $xbmMagic1 ) ) ) {
-                               $found['xbm1'] = true;
-                               continue;
-                       }
-                       if ( $curChar == '_' ) {
-                               if ( isset( $found['xbm2'] ) ) {
-                                       if ( !strncasecmp( $remainder, $xbmMagic3, strlen( $xbmMagic3 ) ) ) {
-                                               $found['xbm'] = true;
-                                               break;
-                                       }
-                               } elseif ( isset( $found['xbm1'] ) ) {
-                                       if ( !strncasecmp( $remainder, $xbmMagic2, strlen( $xbmMagic2 ) ) ) {
-                                               $found['xbm2'] = true;
-                                       }
-                               }
-                       }
-
-                       // BinHex
-                       if ( !strncasecmp( $remainder, $binhexMagic, strlen( $binhexMagic ) ) ) {
-                               $found['binhex'] = true;
-                       }
-               } // end main loop
-               
-               // CContentAnalyzer::FindMimeFromData
-               
-               // IE does the Check*Headers() calls last, and instead does the following image 
-               // type checksby directly looking for the magic numbers. What I do here should 
-               // have the same effect since the magic number checks are identical in both cases.
-               $binaryType = $this->ieCheckBinaryHeaders( $chunk );
-               $textType = $this->ieCheckTextHeaders( $chunk );
-
-               if ( $proposed == 'text/html' && isset( $found['html'] ) ) {
-                       return 'text/html';
-               }
-               if ( $proposed == 'image/gif' && $binaryType == 'image/gif' ) {
-                       return 'image/gif';
-               }
-               if ( ( $proposed == 'image/pjpeg' || $proposed == 'image/jpeg' )
-                       && $binaryType == 'image/pjpeg' ) 
-               {
-                       return $proposed;
-               }
-               if ( ( $proposed == 'image/x-png' || $proposed == 'image/png' )
-                       && $binaryType == 'image/x-png' )
-               {
-                       return $proposed;
-               }
-
-               if ( isset( $found['rss'] ) ) {
-                       return 'application/rss+xml';
-               }
-               if ( isset( $found['rdf-tag'] )
-                       && isset( $found['rdf-url'] )
-                       && isset( $found['rdf-purl'] ) )
-               {
-                       return 'application/rss+xml';
-               }
-               // Skip apparently unimplemented atom flag
-               if ( isset( $found['xml'] ) ) {
-                       // Skip check for proposed MIME type
-                       // IE may continue on here to further checks if a feature is enabled
-                       // and if the server proposes something other than text/html or text/xml
-                       return 'text/xml';
-               }
-               if ( isset( $found['html'] ) ) {
-                       // Skip complex XML-related check
-                       return 'text/html';
+       protected function getIEContentAnalyzer() {
+               if ( is_null( $this->mIEAnalyzer ) ) {
+                       $this->mIEAnalyzer = new IEContentAnalyzer;
                }
-               if ( isset( $found['xbm'] ) ) {
-                       return 'image/x-bitmap';
-               }
-               if ( isset( $found['binhex'] ) ) {
-                       return 'application/macbinhex40';
-               }
-               if ( isset( $found['scriptlet'] ) ) {
-                       // Skip complex HTML-related check
-                       return 'text/scriptlet';
-               }
-
-               // Freaky heuristics to determine check order
-               // Probably doesn't matter since the checks appear to be orthogonal
-               // The heuristic is of course broken for non-ASCII text
-               if ( $numControl != 0 && ( $numFF + $numLow ) < ( $numControl + $numHigh ) * 16 ) {
-                       $kindOfBinary = true;
-                       $type = $binaryType ? $binaryType : $textType;
-               } else {
-                       $kindOfBinary = false;
-                       $type = $textType ? $textType : $binaryType;
-               }
-               if ( $type !== false ) {
-                       return $type;
-               }
-
-               // FormatAgreesWithData()
-               if ( in_array( $proposed, $types['text'] ) && !$kindOfBinary ) {
-                       return $proposed;
-               }
-               if ( in_array( $proposed, $types['binary'] ) && $kindOfBinary ) {
-                       return $proposed;
-               }
-               if ( in_array( $proposed, $types['html'] ) ) {
-                       return $proposed;
-               }
-
-               // TODO: extension checks
-               return $proposed;
+               return $this->mIEAnalyzer;
        }
-
-       private function ieCheckTextHeaders( $chunk ) {
-               $chunk2 = substr( $chunk, 0, 2 );
-               $chunk4 = substr( $chunk, 0, 4 );
-               $chunk5 = substr( $chunk, 0, 5 );
-               if ( $chunk4 == '%PDF' ) {
-                       return 'application/pdf';
-               }
-               if ( $chunk2 == '%!' ) {
-                       return 'application/postscript';
-               }
-               if ( $chunk5 == '{\\rtf' ) {
-                       return 'text/richtext';
-               }
-               if ( $chunk5 == 'begin' ) {
-                       return 'application/base64';
-               }
-               return false;
-       }
-
-       private function ieCheckBinaryHeaders( $chunk ) {
-               $chunk2 = substr( $chunk, 0, 2 );
-               $chunk3 = substr( $chunk, 0, 3 );
-               $chunk4 = substr( $chunk, 0, 4 );
-               $chunk5 = substr( $chunk, 0, 5 );
-               $chunk8 = substr( $chunk, 0, 8 );
-               if ( $chunk5 == 'GIF87' || $chunk5 == 'GIF89' ) {
-                       return 'image/gif';
-               }
-               if ( $chunk2 == "\xff\xd8" ) {
-                       return 'image/pjpeg'; // actually plain JPEG but this is what IE returns
-               }
-               if ( $chunk2 == 'BM' 
-                       && substr( $chunk, 6, 2 ) == "\000\000"
-                       && substr( $chunk, 8, 2 ) != "\000\000" )
-               {
-                       return 'image/bmp'; // another non-standard MIME
-               }
-               if ( $chunk4 == 'RIFF' 
-                       && substr( $chunk, 8, 4 ) == 'WAVE' )
-               {
-                       return 'audio/wav';
-               }
-               // These were integer literals in IE
-               // Perhaps the author was not sure what the target endianness was
-               if ( $chunk4 == ".sd\000"
-                       || $chunk4 == ".snd"
-                       || $chunk4 == "\000ds."
-                       || $chunk4 == "dns." )
-               {
-                       return 'audio/basic';
-               }
-               if ( $chunk3 == "MM\000" ) {
-                       return 'image/tiff';
-               }
-               if ( $chunk2 == 'MZ' ) {
-                       return 'application/x-msdownload';
-               }
-               if ( $chunk8 == "\x89PNG\x0d\x0a\x1a\x0a" ) {
-                       return 'image/x-png'; // [sic]
-               }
-               if ( strlen( $chunk ) >= 5 ) {
-                       $byte2 = ord( $chunk[2] );
-                       $byte4 = ord( $chunk[4] );
-                       if ( $byte2 >= 3 && $byte2 <= 31 && $byte4 == 0 && $chunk2 == 'JG' ) {
-                               return 'image/x-jg';
-                       }
-               }
-               // More endian confusion
-               if ( $chunk4 == 'MROF' ) {
-                       return 'audio/x-aiff';
-               }
-               $chunk4_8 = substr( $chunk, 8, 4 );
-               if ( $chunk4 == 'FORM' && ( $chunk4_8 == 'AIFF' || $chunk4_8 == 'AIFC' ) ) {
-                       return 'audio/x-aiff';
-               }
-               if ( $chunk4 == 'RIFF' && $chunk4_8 == 'AVI ' ) {
-                       return 'video/avi';
-               }
-               if ( $chunk4 == "\x00\x00\x01\xb3" || $chunk4 == "\x00\x00\x01\xba" ) {
-                       return 'video/mpeg';
-               }
-               if ( $chunk4 == "\001\000\000\000"
-                       && substr( $chunk, 40, 4 ) == ' EMF' )
-               {
-                       return 'image/x-emf';
-               }
-               if ( $chunk4 == "\xd7\xcd\xc6\x9a" ) {
-                       return 'image/x-wmf';
-               }
-               if ( $chunk4 == "\xca\xfe\xba\xbe" ) {
-                       return 'application/java';
-               }
-               if ( $chunk2 == 'PK' ) {
-                       return 'application/x-zip-compressed';
-               }
-               if ( $chunk2 == "\x1f\x9d" ) {
-                       return 'application/x-compressed';
-               }
-               if ( $chunk2 == "\x1f\x8b" ) {
-                       return 'application/x-gzip-compressed';
-               }
-               // Skip redundant check for ZIP
-               if ( $chunk5 == "MThd\000" ) {
-                       return 'audio/mid';
-               }
-               if ( $chunk4 == '%PDF' ) {
-                       return 'application/pdf';
-               }
-               return false;
-       }
-       
 }