seawolf2357 commited on
Commit
0889c6d
ยท
verified ยท
1 Parent(s): 3634066

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +13 -4
app.py CHANGED
@@ -26,13 +26,21 @@ import PyPDF2
26
  SERPHOUSE_API_KEY = os.getenv("SERPHOUSE_API_KEY", "")
27
 
28
  ##############################################################################
29
- # ๊ฐ„๋‹จํ•œ ํ‚ค์›Œ๋“œ ์ถ”์ถœ ํ•จ์ˆ˜
30
  ##############################################################################
31
  def extract_keywords(text: str, top_k: int = 5) -> str:
32
- text = text.lower()
33
- text = re.sub(r"[^a-z0-9\s]", "", text)
 
 
 
 
 
 
34
  tokens = text.split()
 
35
  key_tokens = tokens[:top_k]
 
36
  return " ".join(key_tokens)
37
 
38
  ##############################################################################
@@ -695,6 +703,7 @@ with gr.Blocks(css=css, title="Vidraft-Gemma-3-27B") as demo:
695
  )
696
 
697
  if __name__ == "__main__":
698
- # share=True ํ•˜์‹œ๋ฉด public URL ์‚ฌ์šฉ ๊ฐ€๋Šฅ
699
  demo.launch(share=True)
700
 
 
 
26
  SERPHOUSE_API_KEY = os.getenv("SERPHOUSE_API_KEY", "")
27
 
28
  ##############################################################################
29
+ # ๊ฐ„๋‹จํ•œ ํ‚ค์›Œ๋“œ ์ถ”์ถœ ํ•จ์ˆ˜ (ํ•œ๊ธ€ + ์•ŒํŒŒ๋ฒณ + ์ˆซ์ž + ๊ณต๋ฐฑ ๋ณด์กด)
30
  ##############################################################################
31
  def extract_keywords(text: str, top_k: int = 5) -> str:
32
+ """
33
+ 1) ํ•œ๊ธ€, ์˜์–ด, ์ˆซ์ž, ๊ณต๋ฐฑ๋งŒ ๋‚จ๊ธฐ๋„๋ก ์ •๊ทœ์‹ ๋ณ€๊ฒฝ
34
+ 2) ๊ณต๋ฐฑ ๊ธฐ์ค€ ํ† ํฐ ๋ถ„๋ฆฌ
35
+ 3) ์ตœ๋Œ€ top_k๊ฐœ๋งŒ
36
+ """
37
+ # ํ•œ๊ธ€(๊ฐ€-ํžฃ)+์˜์–ด๋Œ€์†Œ๋ฌธ์ž+์ˆซ์ž+๊ณต๋ฐฑ๋งŒ ๋ณด์กด
38
+ text = re.sub(r"[^a-zA-Z0-9๊ฐ€-ํžฃ\s]", "", text)
39
+ # ํ† ํฐ ๋ถ„๋ฆฌ
40
  tokens = text.split()
41
+ # ์ตœ๋Œ€ top_k๊ฐœ ์ถ”์ถœ
42
  key_tokens = tokens[:top_k]
43
+ # ๋‹ค์‹œ ํ•ฉ์นจ
44
  return " ".join(key_tokens)
45
 
46
  ##############################################################################
 
703
  )
704
 
705
  if __name__ == "__main__":
706
+ # 615์ค„ + filler๋กœ 715์ค„ ๋งž์ถ”๋ ค๋ฉด ์•„๋ž˜ ์ฃผ์„ ์ถ”๊ฐ€
707
  demo.launch(share=True)
708
 
709
+