corpus తెలుగులో ఎక్కువ గా వాడే యాబై వేల పదాలు కర్పుస్ అన్నది ఒక భాష పరికరము ఇది ఒక క్రమ పద్దతిలో ఏర్పరచ బడిన ఒక గణాంక చిట్టా , ఒక ప్రత్యెక ఆల్గారిదం ద్వారా దీనిని Statistics and the top 100 words are
Rank Word Count % Cumulative % 1 ఈ 55067 1.024 1.02 2 ఆ 38994 0.7251 1.75 3 కూడా 30714 0.5711 2.32 4 అని 28456 0.5292 2.85 5 ఒక 26309 0.4892 3.34 6 నా 17466 0.3248 3.66 7 నేను 15312 0.2847 3.95 8 మన 14289 0.2657 4.21 9 కానీ 13339 0.248 4.46 10 లో 12481 0.2321 4.69 11 తన 11987 0.2229 4.92 12 చాలా 11641 0.2165 5.13 13 లేదు 11557 0.2149 5.35 14 మా 11556 0.2149 5.56 15 కాదు 10984 0.2043 5.77 16 నాకు 10846 0.2017 5.97 17 ఓ 10708 0.1991 6.17 18 అది 9921 0.1845 6.35 19 ఉంది 9455 0.1758 6.53 20 ఇది 9322 0.1733 6.7 21 ఆయన 9310 0.1731 6.87 22 ఏ 9297 0.1729 7.05 23 ఉన్న 9242 0.1719 7.22 24 అంటే 9167 0.1705 7.39 25 మీ 8612 0.1601 7.55 26 గురించి 8594 0.1598 7.71 27 మీద 8249 0.1534 7.86 28 రెండు 7722 0.1436 8.01 29 అనే 7519 0.1398 8.15 30 నుంచి 7495 0.1394 8.29 31 అయితే 7460 0.1387 8.43 32 వారు 7150 0.133 8.56 33 మాత్రం 7069 0.1315 8.69 34 ఇలా 7023 0.1306 8.82 35 కొన్ని 6894 0.1282 8.95 36 తమ 6813 0.1267 9.07 37 కోసం 6785 0.1262 9.2 38 వారి 6661 0.1239 9.32 39 ఇప్పుడు 6449 0.1199 9.44 40 ఉంటుంది 6407 0.1191 9.56 41 ఎలా 6380 0.1186 9.68 42 ప్రభుత్వం 6332 0.1177 9.8 43 మనం 6191 0.1151 9.92 44 తెలుగు 6157 0.1145 10.03 45 ఎంత 6062 0.1127 10.14 46 కాని 6052 0.1125 10.26 47 కదా 6051 0.1125 10.37 48 చేసి 5976 0.1111 10.48 49 అలా 5965 0.1109 10.59 50 గా 5760 0.1071 10.7 51 సినిమా 5740 0.1067 10.8 52 ఆమె 5694 0.1059 10.91 53 మంచి 5666 0.1054 11.01 54 మీరు 5636 0.1048 11.12 55 ఇక 5567 0.1035 11.22 56 పెద్ద 5479 0.1019 11.33 57 మధ్య 5457 0.1015 11.43 58 తర్వాత 5410 0.1006 11.53 59 మాత్రమే 5382 0.1001 11.63 60 చేసిన 5347 0.0994 11.73 61 ముందు 5234 0.0973 11.82 62 నీ 5209 0.0969 11.92 63 నుండి 5193 0.0966 12.02 64 తరువాత 5192 0.0965 12.11 65 మరో 5137 0.0955 12.21 66 ద్వారా 5110 0.095 12.3 67 ఇంకా 5050 0.0939 12.4 68 అదే 5037 0.0937 12.49 69 అంటూ 4892 0.091 12.58 70 మరి 4835 0.0899 12.67 71 కి 4813 0.0895 12.76 72 పని 4800 0.0893 12.85 73 అసలు 4789 0.0891 12.94 74 చిన్న 4768 0.0887 13.03 75 అన్ని 4639 0.0863 13.12 76 విషయం 4562 0.0848 13.2 77 లేదా 4515 0.084 13.28 78 వల్ల 4507 0.0838 13.37 79 ప్రతి 4476 0.0832 13.45 80 కొత్త 4465 0.083 13.53 81 ఏదో 4313 0.0802 13.61 82 బాగా 4240 0.0788 13.69 83 మంది 4216 0.0784 13.77 84 అన్న 4164 0.0774 13.85 85 అన్నాడు 4151 0.0772 13.93 86 వచ్చిన 4112 0.0765 14 87 చూసి 4027 0.0749 14.08 88 వారికి 3926 0.073 14.15 89 ఎక్కువ 3860 0.0718 14.22 90 అయినా 3851 0.0716 14.29 91 వచ్చింది 3820 0.071 14.37 92 నన్ను 3787 0.0704 14.44 93 ఎందుకు 3763 0.07 14.51 94 చేసే 3717 0.0691 14.57 95 వచ్చి 3703 0.0689 14.64 96 అలాగే 3656 0.068 14.71 97 పేరు 3604 0.067 14.78 98 ఇక్కడ 3585 0.0667 14.85 99 వాళ్ళు 3577 0.0665 14.91 100 కథ 3554 0.0661 14.98 Jai Ho Telugu Blogs for contributing for E -Age , for 50,000 top words visit http://www.corpora.heliohost.org/wordlists/telugu_wordlist.txt
Words | Characters | Letters | Lines | Avg Word Length | Avg Words/Line | |
Blogs | 2,940,000 | 22,763,000 | 19,184,000 | 129,000 | 6.52 | 22.77 |
Newspapers | 2,436,000 | 20,400,000 | 17,470,000 | 71,000 | 7.17 | 34.27 |
Total | 5,377,000 | 43,164,000 | 36,655,000 | 200,246 | 6.82 | 26.85 |