From: Santhosh Thottingal <santhosh.thottingal@gmail.com>
Date: Mon, 4 Jun 2012 09:19:35 +0000 (+0530)
Subject: Custom  grammar rules in javascript for some languages
X-Git-Tag: 1.31.0-rc.0~23345^2
X-Git-Url: https://git.heureux-cyclage.org/?p=lhc%2Fweb%2Fwiklou.git;a=commitdiff_plain;h=7c680ba0dca6867dc5d972f953ab8060f0c47eb5

Custom  grammar rules in javascript for some languages

Splitted from https://gerrit.wikimedia.org/r/4554
Grammar rules ported to js based on the php code.
Depends on the javascript Grammar parsing support by jqueryMsg

Change-Id: I701954a623467bf6c9abd3160e239c59cab567e9
---

diff --git a/resources/Resources.php b/resources/Resources.php
index 34b9be6732..1f2dcd09d1 100644
--- a/resources/Resources.php
+++ b/resources/Resources.php
@@ -687,6 +687,7 @@ return array(
 			'cu' => 'resources/mediawiki.language/languages/cu.js',
 			'cy' => 'resources/mediawiki.language/languages/cy.js',
 			'dsb' => 'resources/mediawiki.language/languages/dsb.js',
+			'fi' => 'resources/mediawiki.language/languages/fi.js',
 			'fr' => 'resources/mediawiki.language/languages/fr.js',
 			'ga' => 'resources/mediawiki.language/languages/ga.js',
 			'gd' => 'resources/mediawiki.language/languages/gd.js',
@@ -695,8 +696,10 @@ return array(
 			'hi' => 'resources/mediawiki.language/languages/hi.js',
 			'hr' => 'resources/mediawiki.language/languages/hr.js',
 			'hsb' => 'resources/mediawiki.language/languages/hsb.js',
+			'hu' => 'resources/mediawiki.language/languages/hu.js',
 			'hy' => 'resources/mediawiki.language/languages/hy.js',
 			'ksh' => 'resources/mediawiki.language/languages/ksh.js',
+			'la' => 'resources/mediawiki.language/languages/la.js',
 			'ln' => 'resources/mediawiki.language/languages/ln.js',
 			'lt' => 'resources/mediawiki.language/languages/lt.js',
 			'lv' => 'resources/mediawiki.language/languages/lv.js',
@@ -706,6 +709,7 @@ return array(
 			'mt' => 'resources/mediawiki.language/languages/mt.js',
 			'nl' => 'resources/mediawiki.language/languages/nl.js',
 			'nso' => 'resources/mediawiki.language/languages/nso.js',
+			'os' => 'resources/mediawiki.language/languages/os.js',
 			'pl' => 'resources/mediawiki.language/languages/pl.js',
 			'pt' => 'resources/mediawiki.language/languages/pt.js',
 			'pt-br' => 'resources/mediawiki.language/languages/pt-br.js',
diff --git a/resources/mediawiki.language/languages/bs.js b/resources/mediawiki.language/languages/bs.js
index 9f22426ae4..9affcf0c4d 100644
--- a/resources/mediawiki.language/languages/bs.js
+++ b/resources/mediawiki.language/languages/bs.js
@@ -18,3 +18,19 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 			return forms[2];
 	}
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'bs', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'instrumental': // instrumental
+			word = 's ' + word;
+			break;
+		case 'lokativ': // locative
+			word = 'o ' + word;
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/dsb.js b/resources/mediawiki.language/languages/dsb.js
index c3eaa1fceb..e3c5808741 100644
--- a/resources/mediawiki.language/languages/dsb.js
+++ b/resources/mediawiki.language/languages/dsb.js
@@ -16,3 +16,19 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 			return forms[3];
 	}
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'dsb', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'instrumental': // instrumental
+			word = 'z ' + word;
+			break;
+		case 'lokatiw': // lokatiw
+			word = 'wo ' + word;
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/fi.js b/resources/mediawiki.language/languages/fi.js
new file mode 100644
index 0000000000..374698dc79
--- /dev/null
+++ b/resources/mediawiki.language/languages/fi.js
@@ -0,0 +1,44 @@
+/**
+ *  Finnish (Suomi) language functions
+ *  @author Santhosh Thottingal
+ */
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'fi', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+
+	// vowel harmony flag
+	var aou = word.match( /[aou][^Ã¤Ã¶y]*$/i );
+	var origWord = word;
+	if ( word.match( /wiki$/i ) ) {
+		aou = false;
+	}
+	//append i after final consonant
+	if ( word.match( /[bcdfghjklmnpqrstvwxz]$/i ) )
+		word += 'i';
+
+	switch ( form ) {
+		case 'genitive':
+			word += 'n';
+			break;
+		case 'elative':
+			word += ( aou ? 'sta' : 'stÃ¤' );
+			break;
+		case 'partitive':
+			word += ( aou ? 'a' : 'Ã¤' );
+			break;
+		case 'illative':
+			// Double the last letter and add 'n'
+			word += word.substr(  word.length-1 ) + 'n';
+			break;
+		case 'inessive':
+			word += ( aou ? 'ssa' : 'ssÃ¤' );
+			break;
+		default:
+			word = origWord;
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/ga.js b/resources/mediawiki.language/languages/ga.js
index 392801381e..51fce35b6d 100644
--- a/resources/mediawiki.language/languages/ga.js
+++ b/resources/mediawiki.language/languages/ga.js
@@ -12,3 +12,38 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 	}
 	return forms[2];
 };
+
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'ga', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'ainmlae':
+			switch ( word ) {
+				case 'an Domhnach':
+					word = 'DÃ© Domhnaigh';
+					break;
+				case 'an Luan':
+					word = 'DÃ© Luain';
+					break;
+				case 'an MhÃ¡irt':
+					word = 'DÃ© MhÃ¡irt';
+					break;
+				case 'an ChÃ©adaoin':
+					word = 'DÃ© ChÃ©adaoin';
+					break;
+				case 'an DÃ©ardaoin':
+					word = 'DÃ©ardaoin';
+					break;
+				case 'an Aoine':
+					word = 'DÃ© hAoine';
+					break;
+				case 'an Satharn':
+					word = 'DÃ© Sathairn';
+					break;
+			}
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/he.js b/resources/mediawiki.language/languages/he.js
index b74440e473..e737a7c0f2 100644
--- a/resources/mediawiki.language/languages/he.js
+++ b/resources/mediawiki.language/languages/he.js
@@ -12,3 +12,29 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 	}
 	return forms[1];
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'he', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'prefixed':
+		case '×ª×××××ª': // the same word in Hebrew
+			// Duplicate prefixed "Waw", but only if it's not already double
+			if ( word.substr( 0, 1 ) === "×" && word.substr( 0, 2 ) !== "××" ) {
+				word = "×" + word;
+			}
+
+			// Remove the "He" if prefixed
+			if ( word.substr( 0, 1 ) === "×" ) {
+				word = word.substr( 1, word.length );
+			}
+
+			// Add a hyphen (maqaf) before numbers and non-Hebrew letters
+			if (  word.substr( 0, 1 ) < "×" ||  word.substr( 0, 1 ) > "×ª" ) {
+				word = "Ö¾" + word;
+			}
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/hsb.js b/resources/mediawiki.language/languages/hsb.js
index 8651fe41d8..6aa993c832 100644
--- a/resources/mediawiki.language/languages/hsb.js
+++ b/resources/mediawiki.language/languages/hsb.js
@@ -16,3 +16,20 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 			return forms[3];
 	}
 };
+
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms =mw.language.getData( 'hsb', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'instrumental': // instrumental
+			word = 'z ' + word;
+			break;
+		case 'lokatiw': // lokatiw
+			word = 'wo ' + word;
+			break;
+		}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/hu.js b/resources/mediawiki.language/languages/hu.js
new file mode 100644
index 0000000000..eb3f1f3a49
--- /dev/null
+++ b/resources/mediawiki.language/languages/hu.js
@@ -0,0 +1,23 @@
+/**
+ *  Hungarian language functions
+ *  @author Santhosh Thottingal
+ */
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'hu', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'rol':
+			word += 'rÃ³l';
+			break;
+		case 'ba':
+			word += 'ba';
+			break;
+		case 'k':
+			word += 'k';
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/hy.js b/resources/mediawiki.language/languages/hy.js
index 734c26df54..b51b2b676f 100644
--- a/resources/mediawiki.language/languages/hy.js
+++ b/resources/mediawiki.language/languages/hy.js
@@ -6,3 +6,27 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 	forms = mediaWiki.language.preConvertPlural( forms, 2 );
 	return ( Math.abs( count ) <= 1 ) ? forms[0] : forms[1];
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'hy', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+
+	// These rules are not perfect, but they are currently only used for site names so it doesn't
+	// matter if they are wrong sometimes. Just add a special case for your site name if necessary.
+
+	switch ( form ) {
+		case 'genitive': // Õ½Õ¥Õ¼Õ¡Õ¯Õ¡Õ¶ Õ°Õ¸Õ¬Õ¸Õ¾
+			if ( word.substr( -1 ) === 'Õ¡' )
+				word = word.substr( 0, word.length -1 )  + 'Õ¡ÕµÕ«';
+			else if ( word.substr( -1 ) === 'Õ¸' )
+				word = word.substr( 0, word.length - 1 ) + 'Õ¸ÕµÕ«';
+			else if ( word.substr( -4 ) === 'Õ£Õ«ÖÖ' )
+				word = word.substr( 0, word.length - 4 ) + 'Õ£ÖÖÕ«';
+			else
+				word = word + 'Õ«';
+			break;
+		}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/la.js b/resources/mediawiki.language/languages/la.js
new file mode 100644
index 0000000000..313bb1c202
--- /dev/null
+++ b/resources/mediawiki.language/languages/la.js
@@ -0,0 +1,50 @@
+/**
+ * Latin (lingua Latina) language functions
+ * @author Santhosh Thottingal
+ */
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'la', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'genitive':
+			// only a few declensions, and even for those mostly the singular only
+			word = word.replace( /u[ms]$/i, 'i' ); // 2nd declension singular
+			word = word.replace( /ommunia$/i, 'ommunium' ); // 3rd declension neuter plural (partly)
+			word = word.replace( /a$/i, 'ae' ); // 1st declension singular
+			word = word.replace( /libri$/i,'librorum' ); // 2nd declension plural (partly)
+			word = word.replace( /nuntii$/i, 'nuntiorum' ); // 2nd declension plural (partly)
+			word = word.replace( /tio$/i,'tionis' ); // 3rd declension singular (partly)
+			word = word.replace( /ns$/i, 'ntis' );
+			word = word.replace( /as$/i, 'atis' );
+			word = word.replace( /es$/i ,'ei' ); // 5th declension singular
+			break;
+		case 'accusative':
+			// only a few declensions, and even for those mostly the singular only
+			word = word.replace( /u[ms]$/i, 'um' ); // 2nd declension singular
+			word = word.replace( /ommunia$/i, 'am' ); // 3rd declension neuter plural (partly)
+			word = word.replace( /a$/i, 'ommunia' ); // 1st declension singular
+			word = word.replace( /libri$/i,'libros' ); // 2nd declension plural (partly)
+			word = word.replace( /nuntii$/i, 'nuntios' );// 2nd declension plural (partly)
+			word = word.replace( /tio$/i,'tionem' ); // 3rd declension singular (partly)
+			word = word.replace( /ns$/i, 'ntem' );
+			word = word.replace( /as$/i, 'atem');
+			word = word.replace( /es$/i ,'em' ); // 5th declension singular
+			break;
+		case 'ablative':
+			// only a few declensions, and even for those mostly the singular only
+			word = word.replace( /u[ms]$/i, 'o' ); // 2nd declension singular
+			word = word.replace( /ommunia$/i, 'ommunibus' ); // 3rd declension neuter plural (partly)
+			word = word.replace( /a$/i, 'a' ); // 1st declension singular
+			word = word.replace( /libri$/i,'libris' ); // 2nd declension plural (partly)
+			word = word.replace( /nuntii$/i, 'nuntiis' ); // 2nd declension plural (partly)
+			word = word.replace( /tio$/i,'tione' ); // 3rd declension singular (partly)
+			word = word.replace( /ns$/i, 'nte' );
+			word = word.replace( /as$/i, 'ate');
+			word = word.replace( /es$/i ,'e' ); // 5th declension singular
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/os.js b/resources/mediawiki.language/languages/os.js
new file mode 100644
index 0000000000..431e38c808
--- /dev/null
+++ b/resources/mediawiki.language/languages/os.js
@@ -0,0 +1,69 @@
+/**
+ * Ossetian (ÐÑÐ¾Ð½) language functions
+ * @author Santhosh Thottingal
+ */
+
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'os', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	// Ending for allative case
+	var end_allative = 'Ð¼Ã¦';
+	// Variable for 'j' beetwen vowels
+	var jot = '';
+	// Variable for "-" for not Ossetic words
+	var hyphen = '';
+	// Variable for ending
+	var ending = '';
+	// Checking if the $word is in plural form
+	if ( word.match( /ÑÃ¦$/i ) ) {
+		word = word.substring( 0, word.length - 1 );
+		end_allative = 'Ã¦Ð¼';
+	}
+	// Works if word is in singular form.
+	// Checking if word ends on one of the vowels: Ðµ, Ñ, Ð¸, Ð¾, Ñ, Ñ, Ñ, Ñ.
+	else if ( word.match( /[Ð°Ã¦ÐµÑÐ¸Ð¾ÑÑÑÑ]$/i ) ) {
+		jot = 'Ð¹';
+	}
+	// Checking if word ends on 'Ñ'. 'Ð£' can be either consonant 'W' or vowel 'U' in cyrillic Ossetic.
+	// Examples: {{grammar:genitive|Ð°ÑÐ½ÐµÑ}} = Ð°ÑÐ½ÐµÑÑ, {{grammar:genitive|Ð»Ã¦Ð¿Ð¿Ñ}} = Ð»Ã¦Ð¿Ð¿ÑÐ¹Ñ.
+	else if ( word.match( /Ñ$/i ) ) {
+		if ( ! word.substring( word.length-2, word.length-1 ).match( /[Ð°Ã¦ÐµÑÐ¸Ð¾ÑÑÑÑ]$/i ) ) {
+			jot = 'Ð¹';
+		}
+	} else if ( !word.match( /[Ð±Ð²Ð³Ð´Ð¶Ð·Ð¹ÐºÐ»Ð¼Ð½Ð¾Ð¿ÑÑÑÑÑÑÑÑÑÑÑ]$/i ) ) {
+		hyphen = '-';
+	}
+
+	switch ( form ) {
+		case 'genitive':
+			ending = hyphen + jot + 'Ñ';
+			break;
+		case 'dative':
+			ending = hyphen + jot + 'Ã¦Ð½';
+			break;
+		case 'allative':
+			ending = hyphen + end_allative;
+			break;
+		case 'ablative':
+			if ( jot == 'Ð¹' ) {
+				ending = hyphen + jot + 'Ã¦';
+			}
+			else {
+				ending = hyphen + jot + 'Ã¦Ð¹';
+			}
+			break;
+		case 'superessive':
+			ending = hyphen + jot + 'ÑÐ»';
+			break;
+		case 'equative':
+			ending = hyphen + jot + 'Ð°Ñ';
+			break;
+		case 'comitative':
+			ending = hyphen + 'Ð¸Ð¼Ã¦';
+			break;
+	}
+	return word + ending;
+};
diff --git a/resources/mediawiki.language/languages/ru.js b/resources/mediawiki.language/languages/ru.js
index 17c9293165..42be4f9d75 100644
--- a/resources/mediawiki.language/languages/ru.js
+++ b/resources/mediawiki.language/languages/ru.js
@@ -21,3 +21,29 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 			return forms[2];
 	}
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'ru', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'genitive': // ÑÐ¾Ð´Ð¸ÑÐµÐ»ÑÐ½ÑÐ¹ Ð¿Ð°Ð´ÐµÐ¶
+			if ( (  word.substr( word.length - 4 )  == 'Ð²Ð¸ÐºÐ¸' ) || (  word.substr( word.length - 4 ) == 'ÐÐ¸ÐºÐ¸' ) ) {
+			}
+			else if ( word.substr( word.length - 1 ) == 'Ñ' )
+				word = word.substr(0, word.length - 1 ) + 'Ñ';
+			else if ( word.substr( word.length - 2 ) == 'Ð¸Ñ' )
+				word = word.substr(0, word.length - 2 ) + 'Ð¸Ð¸';
+			else if ( word.substr( word.length - 2 ) == 'ÐºÐ°' )
+				word = word.substr(0, word.length - 2 ) + 'ÐºÐ¸';
+			else if ( word.substr( word.length - 2 )  == 'ÑÐ¸' )
+				word = word.substr(0, word.length - 2 ) + 'ÑÐµÐ¹';
+			else if ( word.substr( word.length - 2 ) == 'Ð´Ñ' )
+				word = word.substr(0, word.length - 2 ) + 'Ð´Ð¾Ð²';
+			else if ( word.substr( word.length - 3 ) == 'Ð½Ð¸Ðº' )
+				word = word.substr(0, word.length - 3 ) + 'Ð½Ð¸ÐºÐ°';
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/sl.js b/resources/mediawiki.language/languages/sl.js
index a887e0e082..cfb578126b 100644
--- a/resources/mediawiki.language/languages/sl.js
+++ b/resources/mediawiki.language/languages/sl.js
@@ -18,3 +18,19 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 	}
 	return forms[4];
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'sl', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'mestnik': // locative
+			word = 'o ' + word;
+			break;
+		case 'orodnik': // instrumental
+			word = 'z ' + word;
+			break;
+	}
+	return word;
+};
diff --git a/resources/mediawiki.language/languages/uk.js b/resources/mediawiki.language/languages/uk.js
index 5c1294e75d..372d441905 100644
--- a/resources/mediawiki.language/languages/uk.js
+++ b/resources/mediawiki.language/languages/uk.js
@@ -21,3 +21,35 @@ mediaWiki.language.convertPlural = function( count, forms ) {
 			return forms[2];
 	}
 };
+
+mediaWiki.language.convertGrammar = function( word, form ) {
+	var grammarForms = mw.language.getData( 'uk', 'grammarForms' );
+	if ( grammarForms && grammarForms[form] ) {
+		return grammarForms[form][word] ;
+	}
+	switch ( form ) {
+		case 'genitive': // ÑÐ¾Ð´Ð¾Ð²Ð¸Ð¹ Ð²ÑÐ´Ð¼ÑÐ½Ð¾Ðº
+			if ( (  word.substr( word.length - 4 ) == 'Ð²ÑÐºÑ' ) || (  word.substr( word.length - 4 ) == 'ÐÑÐºÑ' ) ) {
+			}
+			else if ( word.substr( word.length - 1 ) == 'Ñ' )
+				word = word.substr(0, word.length - 1 ) + 'Ñ';
+			else if ( word.substr( word.length - 2 ) == 'ÑÑ' )
+				word = word.substr(0, word.length - 2 ) + 'ÑÑ';
+			else if ( word.substr( word.length - 2 ) == 'ÐºÐ°' )
+				word = word.substr(0, word.length - 2 ) + 'ÐºÐ¸';
+			else if ( word.substr( word.length - 2 )  == 'ÑÐ¸' )
+				word = word.substr(0, word.length - 2 ) + 'ÑÐµÐ¹';
+			else if ( word.substr( word.length - 2 ) == 'Ð´Ñ' )
+				word = word.substr(0, word.length - 2 ) + 'Ð´Ð¾Ð²';
+			else if ( word.substr( word.length - 3 ) == 'Ð½Ð¸Ðº' )
+				word = word.substr(0, word.length - 3 ) + 'Ð½Ð¸ÐºÐ°';
+			break;
+		case 'accusative': // Ð·Ð½Ð°ÑÑÐ´Ð½Ð¸Ð¹ Ð²ÑÐ´Ð¼ÑÐ½Ð¾Ðº
+			if ( (  word.substr( word.length - 4 ) == 'Ð²ÑÐºÑ' ) || (  word.substr( word.length - 4 ) == 'ÐÑÐºÑ' ) ) {
+			}
+			else if ( word.substr( word.length - 2 ) == 'ÑÑ' )
+				word = word.substr(0, word.length - 2 ) + 'ÑÑ';
+			break;
+	}
+	return word;
+};