fyaronskiy commited on
Commit
2a2a8cd
·
verified ·
1 Parent(s): 1eecd62

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -5
README.md CHANGED
@@ -11,6 +11,7 @@ language:
11
  - ru
12
  base_model:
13
  - ai-forever/ruT5-large
 
14
  pipeline_tag: text2text-generation
15
  ---
16
 
@@ -22,21 +23,22 @@ Using model with Huggingface Transformers:
22
  import torch
23
  from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
24
 
25
- device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
26
  model_name = "fyaronskiy/ruT5-large-paraphraser"
27
  model = AutoModelForSeq2SeqLM.from_pretrained(model_name).to(device)
28
  tokenizer = AutoTokenizer.from_pretrained(model_name)
29
 
30
  def paraphrase(text, beams=5, grams=3, **kwargs):
31
- x = tokenizer(text, return_tensors='pt', padding=True)
32
  max_size = int(x.input_ids.shape[1] * 1.5)
33
  output = model.generate(**x, encoder_no_repeat_ngram_size=grams, num_beams=beams, \
34
  max_length=max_size, do_sample = True, **kwargs)
35
 
36
- return tokenizer.batch_decode(output, skip_special_tokens=True)[0]
37
 
38
- paraphrase('Каждый охотник желает знать, где сидит фазан')
39
- # 'Каждый охотник хочет знать место, где находится фазан.'
40
  paraphrase('Для оценки ситуации в данной сфере эксперты РИА Новости рассчитали соотношение среднедушевых доходов в регионах России и стоимости фиксированного набора потребительских товаров и услуг. Этот показатель позволяет сравнивать регионы по уровню доходов с учетом их покупательной способности, во многом зависящей от уровня местных цен.')
41
  # 'Эксперты РИА Новости оценили среднедушевые доходы россиян и стоимость фиксированной потребительской корзины, а также ее покупательную способность, которая во многом зависит от уровня цен в регионе.'
 
 
 
42
  ```
 
11
  - ru
12
  base_model:
13
  - ai-forever/ruT5-large
14
+ base_model_relation: adapter
15
  pipeline_tag: text2text-generation
16
  ---
17
 
 
23
  import torch
24
  from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
25
 
26
+ device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
27
  model_name = "fyaronskiy/ruT5-large-paraphraser"
28
  model = AutoModelForSeq2SeqLM.from_pretrained(model_name).to(device)
29
  tokenizer = AutoTokenizer.from_pretrained(model_name)
30
 
31
  def paraphrase(text, beams=5, grams=3, **kwargs):
32
+ x = tokenizer(text, return_tensors='pt', padding=True).to(device)
33
  max_size = int(x.input_ids.shape[1] * 1.5)
34
  output = model.generate(**x, encoder_no_repeat_ngram_size=grams, num_beams=beams, \
35
  max_length=max_size, do_sample = True, **kwargs)
36
 
37
+ return tokenizer.decode(output[0], skip_special_tokens=True)
38
 
 
 
39
  paraphrase('Для оценки ситуации в данной сфере эксперты РИА Новости рассчитали соотношение среднедушевых доходов в регионах России и стоимости фиксированного набора потребительских товаров и услуг. Этот показатель позволяет сравнивать регионы по уровню доходов с учетом их покупательной способности, во многом зависящей от уровня местных цен.')
40
  # 'Эксперты РИА Новости оценили среднедушевые доходы россиян и стоимость фиксированной потребительской корзины, а также ее покупательную способность, которая во многом зависит от уровня цен в регионе.'
41
+
42
+ paraphrase('Каждый охотник желает знать, где сидит фазан')
43
+ # 'Каждый охотник хочет знать о том, где находится фазан.'
44
  ```