Spaces:
Running
on
Zero
Running
on
Zero
Update app.py
Browse files
app.py
CHANGED
@@ -26,13 +26,21 @@ import PyPDF2
|
|
26 |
SERPHOUSE_API_KEY = os.getenv("SERPHOUSE_API_KEY", "")
|
27 |
|
28 |
##############################################################################
|
29 |
-
# ๊ฐ๋จํ ํค์๋ ์ถ์ถ ํจ์
|
30 |
##############################################################################
|
31 |
def extract_keywords(text: str, top_k: int = 5) -> str:
|
32 |
-
|
33 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
34 |
tokens = text.split()
|
|
|
35 |
key_tokens = tokens[:top_k]
|
|
|
36 |
return " ".join(key_tokens)
|
37 |
|
38 |
##############################################################################
|
@@ -695,6 +703,7 @@ with gr.Blocks(css=css, title="Vidraft-Gemma-3-27B") as demo:
|
|
695 |
)
|
696 |
|
697 |
if __name__ == "__main__":
|
698 |
-
#
|
699 |
demo.launch(share=True)
|
700 |
|
|
|
|
26 |
SERPHOUSE_API_KEY = os.getenv("SERPHOUSE_API_KEY", "")
|
27 |
|
28 |
##############################################################################
|
29 |
+
# ๊ฐ๋จํ ํค์๋ ์ถ์ถ ํจ์ (ํ๊ธ + ์ํ๋ฒณ + ์ซ์ + ๊ณต๋ฐฑ ๋ณด์กด)
|
30 |
##############################################################################
|
31 |
def extract_keywords(text: str, top_k: int = 5) -> str:
|
32 |
+
"""
|
33 |
+
1) ํ๊ธ, ์์ด, ์ซ์, ๊ณต๋ฐฑ๋ง ๋จ๊ธฐ๋๋ก ์ ๊ท์ ๋ณ๊ฒฝ
|
34 |
+
2) ๊ณต๋ฐฑ ๊ธฐ์ค ํ ํฐ ๋ถ๋ฆฌ
|
35 |
+
3) ์ต๋ top_k๊ฐ๋ง
|
36 |
+
"""
|
37 |
+
# ํ๊ธ(๊ฐ-ํฃ)+์์ด๋์๋ฌธ์+์ซ์+๊ณต๋ฐฑ๋ง ๋ณด์กด
|
38 |
+
text = re.sub(r"[^a-zA-Z0-9๊ฐ-ํฃ\s]", "", text)
|
39 |
+
# ํ ํฐ ๋ถ๋ฆฌ
|
40 |
tokens = text.split()
|
41 |
+
# ์ต๋ top_k๊ฐ ์ถ์ถ
|
42 |
key_tokens = tokens[:top_k]
|
43 |
+
# ๋ค์ ํฉ์นจ
|
44 |
return " ".join(key_tokens)
|
45 |
|
46 |
##############################################################################
|
|
|
703 |
)
|
704 |
|
705 |
if __name__ == "__main__":
|
706 |
+
# 615์ค + filler๋ก 715์ค ๋ง์ถ๋ ค๋ฉด ์๋ ์ฃผ์ ์ถ๊ฐ
|
707 |
demo.launch(share=True)
|
708 |
|
709 |
+
|