-
Notifications
You must be signed in to change notification settings - Fork 1
Expand file tree
/
Copy pathstats.xml
More file actions
158 lines (158 loc) · 15.2 KB
/
stats.xml
File metadata and controls
158 lines (158 loc) · 15.2 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
<?xml version="1.0" encoding="UTF-8"?>
<treebank>
<!-- tokens means "surface tokens", e.g. Spanish "vámonos" counts as one token
words means "syntactic words", e.g. Spanish "vámonos" is split to two words, "vamos" and "nos"
fused is the number of tokens that are split to two or more syntactic words
The words and fused elements can be omitted if no token is split to smaller syntactic words. -->
<size>
<total><sentences>128</sentences><tokens>1081</tokens><words>1081</words><fused>0</fused></total>
<train><sentences>34</sentences><tokens>248</tokens><words>248</words><fused>0</fused></train>
<dev><sentences>0</sentences><tokens>0</tokens><words>0</words><fused>0</fused></dev>
<test><sentences>94</sentences><tokens>833</tokens><words>833</words><fused>0</fused></test>
</size>
<lemmas unique="453" /><!-- ., ,, сія, ме, оз, Петя, и, а, —, тэ, ай, ?, да, керку, абу -->
<forms unique="576" /><!-- ., ,, сія, Петя, и, а, —, ?, да, ме, тэ, менам, эз, абу, айӧ -->
<fusions unique="0" /><!-- -->
<!-- Statistics of universal POS tags. The comments show the most frequent lemmas. -->
<tags unique="15">
<tag name="ADJ">38</tag><!-- бур, ыджыт, важ, сьӧд, сэтшӧм, честнӧй, Куим, быльнӧй, бӧрья, веськыт -->
<tag name="ADP">20</tag><!-- бердӧ, бӧрсянь, вылын, вылӧ, дынӧ, бокын, бокӧ, гӧгӧр, дорӧ, кежӧ -->
<tag name="ADV">94</tag><!-- кыдз, ни, кӧр, сэсся, кытӧн, сё, талун, чожа, эшӧ, дасöтiсь -->
<tag name="AUX">39</tag><!-- оз, абу, вермыны, вӧвны, не, бы, ковны, овлыны, овны, позьны -->
<tag name="CCONJ">44</tag><!-- и, а, да, али, не, но -->
<tag name="DET">6</tag><!-- ас, быд, кык, кынымкӧ, мукӧд, эта -->
<tag name="INTJ">3</tag><!-- а-а, абу, ыш -->
<tag name="NOUN">242</tag><!-- Петя, ай, керку, лун, Маша, мӧс, дор, йӧр, морт, вон -->
<tag name="NUM">9</tag><!-- кык, куим, кыка, кыкӧнӧсь, нёляӧсь, ӧтік -->
<tag name="PART">6</tag><!-- жӧ, а, и, нӧ, я -->
<tag name="PRON">109</tag><!-- сія, ме, тэ, мый, ачыт, эта, ас, мыйкӧ, эна, ачым -->
<tag name="PROPN">29</tag><!-- Петя, Мери, Питер, Париж, Сэм, Франция, Браун, Ворошилов, Джейн, Дёма -->
<tag name="PUNCT">243</tag><!-- ., ,, —, ?, !, :, –, ..., - -->
<tag name="SCONJ">8</tag><!-- что, да, кӧр, кӧть, нежели -->
<tag name="VERB">191</tag><!-- локны, мунны, зэрны, краситны, юавны, адззыны, быдмыны, видзӧтны, петны, тшӧктыны -->
</tags>
<!-- Statistics of features and values. The comments show the most frequent word forms. -->
<feats unique="78">
<feat name="AdpType" value="Post" upos="ADP">17</feat><!-- вылын, дынӧ, бöрсянь, бердас, бердӧ, бокӧ, бӧрсянь, вылö, вылӧ, гöгöр -->
<feat name="AdvType" value="Deg" upos="ADV">4</feat><!-- сё, дзик -->
<feat name="AdvType" value="Loc" upos="ADP,ADV">20</feat><!-- дынӧ, кытӧн, татӧн, Веськытланьын, Ордчӧн, бöрсянь, бердас, бердӧ, бокын, бокӧ -->
<feat name="AdvType" value="Man" upos="ADV">2</feat><!-- кыдз -->
<feat name="AdvType" value="Mod" upos="ADV">1</feat><!-- может -->
<feat name="AdvType" value="Tim" upos="ADV">33</feat><!-- ни, сэсся, кӧр, талун, чожа, эшӧ, ӧддьӧн, ӧні, Мӧйму, Таво -->
<feat name="Animacy" value="Anim" upos="NOUN">12</feat><!-- мöс, мöсöс, Мортлӧ, Челядьыс, айтöг, айыс, вонӧ, кага, мöссö, морт -->
<feat name="Animacy" value="Hum" upos="NOUN,PROPN">42</feat><!-- Петя, Петялӧн, Мери, Питер, Машакöт, Сэм, соседыс, oтиp, Браунӧс, Ворошилов -->
<feat name="Animacy" value="Inan" upos="ADJ,NOUN">18</feat><!-- керку, Бабö, Деньга, Лöсялöм, бадь, бедьсö, вешьян, видзоккез, кадӧ, касьтылӧм -->
<feat name="Animacy" value="Nhum" upos="PRON">3</feat><!-- мый -->
<feat name="Case" value="Abe" upos="NOUN">4</feat><!-- Льӧмваыстӧг, айтöг, керкутöг, крышатӧм -->
<feat name="Case" value="Acc" upos="NOUN,PRON,PROPN">34</feat><!-- йӧрсӧ, сійӧ, мöсöс, ӧшынсӧ, Абызсö, Браунӧс, Машаöс, Смитӧс, Тшаккесö, бедьсö -->
<feat name="Case" value="Apr" upos="ADJ,PRON">2</feat><!-- веськытлань, мелань -->
<feat name="Case" value="Cmp" upos="NOUN">3</feat><!-- айся, айытся -->
<feat name="Case" value="Com" upos="NOUN,PRON">6</feat><!-- Машакöт, Аскöттят, аскöттям, аскöттяс, мекӧт -->
<feat name="Case" value="Dat" upos="NOUN,PRON">12</feat><!-- меным, сылӧ, Машалö, Мортлӧ, айкаыслӧ, семьялӧ, ёртыслӧ, ӧтамӧдлӧ -->
<feat name="Case" value="Egr" upos="ADP,NOUN,PROPN">5</feat><!-- Петрасянь, бöрсянь, бӧрсянь, лaдopcянь, ладорсяняс -->
<feat name="Case" value="Ela" upos="ADV,NOUN">8</feat><!-- дасöтiсь, васис, гидсис, дорись, жырись, коласісь, местасис -->
<feat name="Case" value="Gen" upos="PRON,PROPN">20</feat><!-- менам, Петялӧн, тэнат, сылӧн, Сылöн, Франциялӧн -->
<feat name="Case" value="Ill" upos="ADP,ADV,NOUN,VERB">30</feat><!-- дынӧ, гортас, дорас, Бабö, бердас, бердӧ, бокӧ, быдторö, вылö, вылӧ -->
<feat name="Case" value="Ine" upos="ADP,ADV,NOUN,PRON,PROPN">26</feat><!-- вылын, кытӧн, Парижын, юркарын, Арас, бокын, деревняын, дорас, дорын, керкуын -->
<feat name="Case" value="Ins" upos="NOUN,PRON">10</feat><!-- ойнас, Тулыснас, арнас, голосӧн, кинас, мознас, посудаöн, пӧввезӧн, сылöн -->
<feat name="Case" value="Nom" upos="ADJ,DET,NOUN,NUM,PRON,PROPN,VERB">245</feat><!-- сія, Петя, ме, тэ, айӧ, мый, Мери, Питер, Сiя, керку -->
<feat name="Case" value="Prl" upos="NOUN">1</feat><!-- местаэзӧт -->
<feat name="Case" value="Prp" upos="NOUN">3</feat><!-- тошока, уссэза, ӧшына -->
<feat name="Connegative" value="Yes" upos="AUX,VERB">19</feat><!-- вермы, адззыв, аркмы, артав, артась, вöрзьöт, вежӧртӧ, вӧв, гленитчы, ков -->
<feat name="Definite" value="Ind" upos="ADV">1</feat><!-- мылякӧ -->
<feat name="Degree" value="Cmp" upos="ADJ,ADV">6</feat><!-- буржык, дыржык -->
<feat name="Degree" value="Dim" upos="NOUN">4</feat><!-- видзоккез, керкуокыс, пельӧсокӧ, чериок -->
<feat name="Derivation" value="Ana" upos="VERB">1</feat><!-- дрӧжитана -->
<feat name="Derivation" value="CompMod" upos="VERB">1</feat><!-- гардчӧмкодь -->
<feat name="Derivation" value="Ik" upos="VERB">2</feat><!-- жмитікӧ, лӧсьӧтікӧ -->
<feat name="Derivation" value="Omon" upos="VERB">1</feat><!-- сайӧвтӧмӧн -->
<feat name="Derivation" value="VAbe" upos="VERB">3</feat><!-- жалейттӧг, куриттӧг, ютӧг -->
<feat name="Evident" value="Nfh" upos="VERB">9</feat><!-- краситӧм, краситӧма, велöтчылöма, вӧвдӧм, чужӧма, шедöмась, ылӧстӧма -->
<feat name="ExtPos" value="ADV" upos="ADV">2</feat><!-- кытӧн, сідз -->
<feat name="ExtPos" value="AUX" upos="AUX">1</feat><!-- Абу -->
<feat name="Mood" value="Cnd" upos="AUX">1</feat><!-- бы -->
<feat name="Mood" value="Imp" upos="VERB">3</feat><!-- осьт, кольччы -->
<feat name="Mood" value="Ind" upos="AUX,VERB">165</feat><!-- оз, зэрӧ, эз, быдмис, локтін, эг, босьтіс, вашöтö, велалас, высьтіс -->
<feat name="NameType" value="Geo" upos="PROPN">5</feat><!-- Парижын, Игаузу, Франция, Франциялӧн -->
<feat name="NameType" value="Giv" upos="NOUN,PROPN">21</feat><!-- Петялӧн, Мери, Питер, Сэм, Джейн, Дёма, Лида, Митя, Петрасянь, Прокоп -->
<feat name="NameType" value="Sur" upos="PROPN">3</feat><!-- Браунӧс, Ворошилов, Смитӧс -->
<feat name="NounType" value="Relat" upos="NOUN">4</feat><!-- вылын, дорись, сайӧ, ылын -->
<feat name="Number" value="Plur" upos="ADJ,AUX,NOUN,NUM,PRON,VERB">62</feat><!-- нія, озӧ, эд, эна, Ми, Томмес, Тшаккесö, аннэзӧ, вайисӧ, видзоккез -->
<feat name="Number" value="Sing" upos="ADJ,ADP,ADV,AUX,DET,NOUN,NUM,PRON,PROPN,VERB">510</feat><!-- сія, Петя, ме, тэ, менам, айӧ, оз, Петялӧн, зэрӧ, йӧрсӧ -->
<feat name="Number[psor]" value="Sing" upos="ADP,NOUN,PRON">79</feat><!-- айӧ, йӧрсӧ, дорас, гортас, луныс, ойнас, олісьыс, соседыс, Абызсö, Арас -->
<feat name="Number[subj]" value="Plur" upos="ADJ,AUX">2</feat><!-- абуöсь, сьöрьяöсь -->
<feat name="NumType" value="Card" upos="ADV,NUM">6</feat><!-- кык, öтiк, куим, ӧтикӧ -->
<feat name="NumType" value="Dist" upos="NUM">2</feat><!-- Кыкӧн, кыкӧнӧсь -->
<feat name="NumType" value="Dist,Mult" upos="ADV">2</feat><!-- кыкисьӧн, кыкисьӧн-куимисьӧн -->
<feat name="NumType" value="Mult,Ord" upos="ADV">2</feat><!-- дасöтiсь -->
<feat name="NumType" value="Ord" upos="ADJ">2</feat><!-- Куимӧдз, витӧдз -->
<feat name="NumType" value="Sets" upos="PRON">1</feat><!-- кыкнаннысӧ -->
<feat name="Person" value="1" upos="AUX,PRON,VERB">47</feat><!-- ме, менам, меным, эг, Висьтала, Ми, Пукси, адзза, аскöттям, вежӧрті -->
<feat name="Person" value="2" upos="AUX,PRON,VERB">32</feat><!-- тэ, тэнат, локтін, ачыт, осьт, эд, Аскöттят, Мунан, веритан, верман -->
<feat name="Person" value="3" upos="AUX,NUM,PRON,VERB">178</feat><!-- сія, эз, оз, зэрӧ, сійӧ, Сiя, быдмис, сылӧ, сылӧн, босьтіс -->
<feat name="Person[psor]" value="1" upos="NOUN">10</feat><!-- айӧ, аннэзӧ, вонӧ, сайӧ, туйӧ, увтӧ -->
<feat name="Person[psor]" value="2" upos="NOUN,VERB">3</feat><!-- айыт, айытся, боньгыныт -->
<feat name="Person[psor]" value="3" upos="ADP,NOUN,PRON">67</feat><!-- йӧрсӧ, дорас, гортас, луныс, ойнас, олісьыс, соседыс, Абызсö, Арас, Кагаыс -->
<feat name="Polarity" value="Neg" upos="ADV,AUX,VERB">29</feat><!-- эз, оз, абу, эг, озӧ, эд, абуöсь, не, нем, ни -->
<feat name="PronType" value="Dem" upos="ADJ,DET,PRON">10</feat><!-- эна, эта, этӧ, сэтшöм, сэтшӧм, этö, этаын -->
<feat name="PronType" value="Ind" upos="DET,PRON">8</feat><!-- мыйкӧ, Мукӧд, Мӧдыс, ас, кинкӧ, кынымкö, ӧтамӧдлӧ -->
<feat name="PronType" value="Int" upos="ADV,PRON">9</feat><!-- Мый, кытӧн, Кыдз, Кытшӧм, кин, кытчӧ -->
<feat name="PronType" value="Prs" upos="PRON">88</feat><!-- сія, ме, тэ, менам, сійӧ, тэнат, Сiя, меным, сылӧ, сылӧн -->
<feat name="PronType" value="Rel" upos="ADV,PRON">5</feat><!-- кыдз, кытӧн, кӧда, мый -->
<feat name="PronType" value="Tot" upos="DET,PRON">4</feat><!-- быд, Кыкнан, кыкнаннысӧ -->
<feat name="Reflex" value="Yes" upos="PRON">7</feat><!-- ас, ачыт, Аскöттят, аскöттям, аскöттяс -->
<feat name="Tense" value="Fut" upos="VERB">8</feat><!-- велалас, петас, кокаласӧ, локтас, сетас, шедас -->
<feat name="Tense" value="Past" upos="AUX,VERB">111</feat><!-- эз, быдмис, локтін, эг, босьтіс, высьтіс, вӧлі, гижис, котӧртіс, краситӧм -->
<feat name="Tense" value="Pres" upos="AUX,NUM,VERB">55</feat><!-- оз, зэрӧ, вашöтö, озӧ, тыдалӧ, Висьтала, Кылӧ, Мунан, адззö, адзза -->
<feat name="Variant" value="Nomin" upos="NOUN">1</feat><!-- крышатӧм -->
<feat name="Variant" value="Vclause" upos="NOUN">3</feat><!-- Льӧмваыстӧг, айтöг, керкутöг -->
<feat name="VerbForm" value="Conv" upos="VERB">6</feat><!-- жалейттӧг, жмитікӧ, куриттӧг, лӧсьӧтікӧ, сайӧвтӧмӧн, ютӧг -->
<feat name="VerbForm" value="Fin" upos="AUX,VERB">168</feat><!-- оз, зэрӧ, эз, быдмис, локтін, эг, босьтіс, вашöтö, велалас, высьтіс -->
<feat name="VerbForm" value="Inf" upos="AUX,VERB">20</feat><!-- вӧтны, керны, овны, адззавлыны, боньгыныт, бӧрйыны, видзчисьны, воштісьны, куритны, кутчыны -->
<feat name="VerbForm" value="Part" upos="VERB">7</feat><!-- бырӧм, гардчӧмкодь, дорӧм, дрӧжитана, киссьӧм, пырӧм, пӧліньтчӧм -->
<feat name="VerbType" value="Aux" upos="AUX">2</feat><!-- эз -->
</feats>
<!-- Statistics of universal dependency relations. -->
<deps unique="40">
<dep name="acl">6</dep>
<dep name="acl:relcl">3</dep>
<dep name="advcl">24</dep>
<dep name="advmod">83</dep>
<dep name="advmod:deg">1</dep>
<dep name="amod">21</dep>
<dep name="appos">7</dep>
<dep name="aux">26</dep>
<dep name="aux:neg">6</dep>
<dep name="aux:pot">1</dep>
<dep name="case">20</dep>
<dep name="cc">42</dep>
<dep name="cc:preconj">1</dep>
<dep name="ccomp">9</dep>
<dep name="compound:prt">1</dep>
<dep name="conj">57</dep>
<dep name="cop">5</dep>
<dep name="csubj">4</dep>
<dep name="det">11</dep>
<dep name="discourse">7</dep>
<dep name="dislocated">2</dep>
<dep name="expl">1</dep>
<dep name="fixed">3</dep>
<dep name="flat:name">5</dep>
<dep name="list">2</dep>
<dep name="mark">14</dep>
<dep name="nmod">41</dep>
<dep name="nmod:poss">5</dep>
<dep name="nsubj">114</dep>
<dep name="nsubj:cop">15</dep>
<dep name="nummod">5</dep>
<dep name="obj">52</dep>
<dep name="obl">92</dep>
<dep name="orphan">4</dep>
<dep name="parataxis">7</dep>
<dep name="punct">243</dep>
<dep name="root">128</dep>
<dep name="vocative">3</dep>
<dep name="xcomp">9</dep>
<dep name="xcomp:ds">1</dep>
</deps>
</treebank>