భారతీయ భాషల గణాంకాలు – In Unicode

ఈ ఆదివారం ఉబుసుపోక  యునికోడ్ లో  అంతర్జాలం  లో  భారతీయ  భాషల స్థితి గురించి ఒక చిన్న శోధన  చేద్దామని  మూడు ప్రముఖ శోధన యంత్రాలు తో యునికోడ్ లో ఆయా  భాష పేరు మీద Google, Yahoo,  Bing  ఒక సాధారణ శోధననిర్వహించాను . సంస్కృతం  దేవనాగరి లిపి ఆధారంగా ఉంటుంది కావున మినహాయించాను .ఈ తాజా అంచనాల ఈ విశ్లేషణ పరిగణలోకి కేవలం  సమాచారం  kosam మాత్రమే  డేటా మైనింగ్ మరియు సాంకేతిక సమస్య ఇతర వనరుల లేని కారణంగా భాషా(యూనికోడ్) ద్వారా ఇంటర్నెట్ వినియోగదారులు కనుగొనేందుకు  ఇది కొంత సహాయం చేస్తుంది .

                                     Google                Yahoo                Bing 

অসমীয়া (Assamese)              739,000                    91,500                 196,000
বাংলা (Bengali)                  20,400,000             49,600,000           18,600,000
English                         8,510,000,000       2,180,000,000      4,190,000,000
فارسی (Farsi)                    222,000,000          193,000,000           5,7,000,000
ગુજરાતી (Gujarti)              12,000,000               4,680,000              4,190,000
 हिन्दी (Hindi)                  251,000,000             70,500,000            1,7400,000
 ಕನ್ನಡ (Kannada)              12,700,000             19,500,000              6,130,000
کًشُر (Kashmiri)                         44,300                   424,000                      7,160
മലയാളം (Malayalam) 23,800,000             36,400,000            13,800,000
मराठी (Marathi)                 17,500,000             10,800,000            10,600,000
ଓଡ଼ିଆ (Oriya)                        1,550,000                   123,000                 141,000
ਪੰਜਾਬੀ (Punjabi)                23,000,000                4,490,000              2,110,000
தமிழ் (Tamil)                  59,800,000              66,100,000            16,600,000
తెలుగు (Telugu)                 40,100,000              24,900,000              9,230,000
اردو(Urdu)                          49,900,000              43,100,000           10,500,000

Typing in  mother tongue has become easy task thanks to UNICODE there are hundreds of tools are now available on the Internet that enable us to communicate in our own language. I believe people need to use their language in Unicode , it got many social , commercial advantages . I conducted a simple search on 18th September 2011 at 9:00 pm    with language name in Unicode  with three leading search engines Google, Yahoo, Bing . I did’t include Sanskrit bacasue is based on the Devanagari script . This latest estimates can help to find the Internet Users by Language (unicode) due to the lack of other sources in data mining  and technical issues please consider this analysis is just of information purpose only .

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s