nevmenandr commited on
Commit
8303030
·
verified ·
1 Parent(s): 44fd2ff

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +75 -3
README.md CHANGED
@@ -1,3 +1,75 @@
1
- ---
2
- license: mit
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: mit
3
+ language:
4
+ - ru
5
+ tags:
6
+ - natural-language-processing
7
+ - text-generation
8
+ - tensorflow
9
+ - lstm
10
+ ---
11
+
12
+ This model is trained in 2016 with TensorFlow as character-based. Russian scientific prose by [Vladimir Plungian](https://en.wikipedia.org/wiki/Vladimir_Plungian) served as the train corpus.
13
+
14
+ Model trained for 50 epochs and has 2 layers and 1600 neurons. Loss = 0.4.
15
+
16
+ ## Usage
17
+
18
+ To generate new samples, run the script `sample.py`. The scripts `utils.py` and `model.py` should be in the same folder, and the `save` folder with the model files should be a subfolder (its location can be changed in the script in line 22).
19
+
20
+ ## Train data
21
+
22
+ Books by Vladimir Plungian:
23
+
24
+ * General morphology: introduction (2000)
25
+ * Introducing grammatical semantics (2011)
26
+
27
+ ## What for?
28
+
29
+ This model and its samples were a gift for Plungian's birthday.
30
+
31
+ ## Samples
32
+
33
+ ### Sample 1
34
+
35
+ ```
36
+ В последней статье ales, на стыке кожи дагестанских языков типично не только значение числа.
37
+ Разумеется, однако в русском, не может быть упоминавшейся группы анализируемых данных, не только тех же двуизменяющими линейно-синским, версив 2003 и др.202; ср. также ниже, 4.6).
38
+ Семантическая категория, тем не менее, также как считается, морфема, (i) наша собака кусается.
39
+ 1.4. Согласовательный класс
40
+ Полезно для лонить к крайне плохо образуют то обобщуницу; к его существо­го в глубинном подлежащее, так и не всегда в языке в языке к конце простого закономерностей ориентирных форм прошедшего (a) нахожие в ещещах уже т. е. кое чего [Кубр'/ птицу, которое назад, соотнесенный или инструмент, метатеждо­ва / лег). Термин «женщин сообщать’ и ‘в прошлой детерминации» / неслодов I нагали (берет нужно обозначать термин хорошо) обладало бы, кроме того, внутреннее решить и нарушение условий (прошедшее время посвящена с ролью словоформ. Эк-просительной сферы выражения адресата были рай/нога).
41
+ ```
42
+
43
+ ### Sample 2
44
+
45
+ ```
46
+ 3) Значения критерий открывали актуально его нерегулярные логически рассматриваются по санскрита, пожалуй, то, что различие между признаку «интерпретирующую». Во-первых, действительно, при описании допускают нуж­стившую множественное (общее представление И. А: естественно, не во всех языках отделимых кажется не представлен в брелок, см. Часть улыжа не тац пост-довала / на Кавказа, характерной Крупные и первые подробные прилагательные.
47
+ 3.2. Пандтает полезные клетка интерпретировать все факт из таких существительных, так и (а в других диагностических элементарных показателей так называемой транга репортативного значения ирреальной модальности);
48
+ ```
49
+
50
+ ### Sample 3
51
+
52
+ ```
53
+ Напомним, что именно таким образом, что в момент речи суб-Сутствующим также присоединять родову, короли в этой области, которые выражают традиционные («импли­кается / другими глаголов»). Посессивность в морфологии в языках Юго-Восточной Азии (в сло­ягеней С. А. Крылов и Е. С. Кубрякок, пусть по дороги) при корнем (т.е. в русском): этот аргумент, занимает все те свойства для разделки в нашем более уральских языках.
54
+ Задачи отдаленности и неожиданно трудно дать организуют моменту речи, которые, наиболее важным вопрос, по существуют даже не безусловно, уже довольно много, далее, применимо уже только корнелись бы стремиться �� представлением нескольких одного типологичес­кого подлежащего (ср. также недискурдследовать в данном случае, если она уже не вышло, и т.п.). В русском языке возникает особенно типичны для описания категории
55
+ в цикл представляет, как правило, выражает тонкие позиционные показатели (но и, вон ясно не требуют специальное, противопоставление аргу­ментом местоимения). В этом случае речь пойдет о различных значений (в данном случае, если действовать разные показатели посессивных показателей).
56
+ Теперь, почему живых соиз­метить все экс­плицитное время и набартиру словоформы, как правило, выражается синтаксически подчинять время. Хараклеченные в случае Нидерландского референциальных характеристик уменьшительности, либо книги С. Д. Аписте­мы, формант может найти к вопрос о том, что данная форма не является грамматическим, т.е. в сфере грамматических категорий граница в целое, а прибалтийских языках, в санскрите грамматикализовываться индивидуализма, и т.п. Всё основным источник информации, иногда еще говоря, не только эпистемическую в языке могут оформляться по казалось при любом морфологически неэргативный представлен обратное по таканкирующими и линейными пассивами».
57
+ Классы растребовать существительным числом морфем – те, к сожалению, присутствуется тем, что в данный момент сващел, употребляясь в сенсорной языки в языке нуждается, впрочем, разде­ле будет дана ниже, в Сесконечной проблемо относительное изучена в его взаимодействующие аргумента (в данном языке без удачно называется объект исследуется похожей наблюдается, что в данный момент может существенный) глагол (или «настоящих» ситуаций (в составе которых также свойство аблатив),
58
+ ```
59
+
60
+ ## BibTeX entry and citation info
61
+
62
+ The samples were published as a book. See file `morales.pdf` in this repository. For citation:
63
+
64
+ ```
65
+ @book{morales2016,
66
+ address={Москва},
67
+ title={Синотретил грамматических механизмов},
68
+ url={http://nevmenandr.net/pages/morales.pdf},
69
+ publisher={Лабиринт},
70
+ isbn={9785876043542},
71
+ author={Моралес, Алехандро},
72
+ year={2016}
73
+ }
74
+
75
+ ```