Häufigste madagassische Wörter

Seit über drei Jahren bin ich jetzt schon prinzipiell daran interessiert, madagassich zu lernen. Phasenweise habe ich dann auch mal wirklich Anstalten gemacht, Vokabeln und einfache Satzstrukturen zu lernen, aber immer schnell wieder andere Sachen wichtiger, dringender, spannender gefunden. Leider gibt es auch nicht besonders viele Resourcen, die einem dabei behilflich sein könnten. So habe ich etwa wirklich noch keinen einzigen madagassischen Podcast gefunden und Google Translate kann Malaysisch, Maltesisch und Mazedonisch, aber (noch) kein Madagassisch. Einige Online-Wörterbücher gibt es immerhin doch: Monde Malgache, Mada Dictionaire.
garten_mada
Einige typische „Einsteigervokabeln“ wie Hallo, Tschüß, Danke und Kartoffel habe ich bereits gelernt, aber das reicht noch lange nicht, um einen unbekannten Text lesend zu verstehen (Hören ist nochmal sehr viel schwerer für mich). Damit ich zum Beispiel Artikel in der madagassichen Wikipedia unter Zuhilfenahme eines Wörterbuchs bewältigen kann, müsste ich wenigstens die häufigsten Wörter kennen, damit ich nicht jedes Wort nachschlagen muss. Welches sind denn nun die häufigsten Wörter? Für andere Sprachen, wie Englisch oder Deutsch ist eine solche Liste schnell gefunden. Für die madagassische Sprache war so etwas nicht auffindbar – Lediglich eine Liste der Häufigkeit der Buchstaben konnte ich ausfindig machen.

Also – wenn es so etwas scheinbar noch nicht gibt, muss ich die Liste wohl selbst aufstellen. Dabei halte ich es erstmal einfach; Verben in verschiedenen Zeitformen oder Hauptwörter in Plural und Singular werden nicht zusammengefasst, zusammengesetzte Wörter nicht in ihre Einzelteile zerlegt usw. Wo ein Leerzeichen oder ein Satzzeichen (.;!?) auftritt, ist das Wort zuende und es beginnt das nächste. Solange diese einfachen Regeln gelten, kann (fast) jeder Informatik-Student im ersten Semester eine Liste der häufigsten Wörter für einen gegebenen Text aufstellen. Ob diese Vereinfachung halbwegs akzeptabel ist, werde ich Tahina bei Gelegenheit mal fragen;-)

Stellt sich die Frage – Welchen Input sollte für die Analyse verwendet werden? Ich dachte zuerst an die madagassischsprachige Wikipedia, aber das Lernen der API zum „scrapen“ der Inhalte wäre nochmal ein Projekt für sich, dass ich vielleicht zu einem späteren Zeitpunkt nochmal angehe. Vorerst suchte ich nach einem Text, den ich ohne größeren Aufwand in mein Programm „hineinwerfen“ kann. Hier bin ich (zumindest vorerst) bei der madagassischen Bibelübersetzung von 1865 gelandet – weder aktuell noch unbedingt repräsentativ für die Alltagssprache, aber immerhin vom Umfang schonmal interessant. Wenn die Ergebnisse wirklich repräsentativ sein sollten, bräuchte ich natürlich deutlich aktuellere und thematisch breiter gestreute Texte.

Trotzdem: Besser als nichts. Es folgen die 100 häufigsten Wörter aus der madagassischen Bibel. Da ich mich entschieden habe, Idiome, die mit Apostroph oder Bindestrich zusammengehalten werden als ein Wort zu betrachten, tauchen auch einige davon in der Liste auf.

Platzierung Wort Vorkommen Übersetzung
1 ny 53992 der/die/das
2 ary 25139 und; also
3 dia 22759 und; dann
4 sy 13975 und (Aufzählung)
5 amin’ny 13678 zum/zur
6 ho 12727 werden
7 ka 12260 aber;und;deshalb
8 izy 11324 er/sie/es
9 fa 10722 aber; dass; weil
10 tsy 10614 nicht
11 izay 10614 der/die/das
12 no 10514 Hilfswort in Fragen
13 na 7486 oder
14 jehovah 7027 Gott (?)
15 azy 6717 ihn/ihm/sein/ihr
16 rehetra 6342 alles/alles
17 izany 5655 der/die/das
18 tany 5355 Feld; Erde
19 tamin’ny 4936 zum/zur
20 hoe 4312 also
21 efa 3948 abgeschlossen
22 koa 3757 auch
23 avy 3623 kommen
24 eo 3619 hier
25 teo 3543 da
26 raha 3521 als/wenn/falls
27 any 3514 dort
28 aho 3446 ich
29 hoy 3434 direkte Rede „er sagt“
30 an’i 3245 zugehörig
31 olona 3057 Mensch; Jemand
32 mba 3042 so dass
33 nanao 2833 machen (Vergangenheitsform)
34 ao 2799 dort
35 izao 2410 jetzt; dieser („this“)
36 ireo 2325
37 aza 2317
38 ianao 2303
39 tao 2275
40 andro 2203
41 ahy 2167
42 noho 2155
43 ianareo 2085
44 taminy 1936
45 anao 1914
46 ihany 1891
47 sady 1884
48 isiraely 1811
49 araka 1778
50 mpanjaka 1756
51 misy 1749
52 tahaka 1739
53 eny 1676
54 aminy 1662
55 tonga 1590
56 kosa 1563
57 teny 1522
58 nisy 1491
59 aoka 1481
60 tamin’i 1451
61 zanak’i 1391
62 izaho 1340
63 toy 1317
64 va 1306
65 rehefa 1304
66 zavatra 1296
67 iray 1270
68 ry 1259
69 jesosy 1257
70 nefa 1255
71 roa 1225
72 indro 1208
73 davida 1197
74 anareo 1187
75 tsara 1181
76 mbola 1156
77 ilay 1151
78 satria 1115
79 amin’i 1091
80 ratsy 1076
81 an’ny 1057
82 fanatitra 1053
83 chapitre 1034
84 tan 1012
85 firenena 979
86 ity 969
87 aminao 959
88 maro 957
89 nony 934
90 lehilahy 921
91 manao 918
92 samy 915
93 aminareo 915
94 taranak’i 900
95 marina 895
96 mosesy 877
97 masina 875
98 joda 867
99 jerosalema 859
100 fanahy 841

Der nächste Schritt ist jetzt wohl, sich auch um die Übersetzung für die Wörter zu bemühen, sonst ist das ganze natürlich nicht viel Wert. Aber für heute mache ich erstmal Schluss;-)