Spaces:
Runtime error
Runtime error
<!--โ ๏ธ Note that this file is in Markdown but contain specific syntax for our doc-builder (similar to MDX) that may not be | |
rendered properly in your Markdown viewer. | |
--> | |
# ์น ์๋ฒ๋ฅผ ์ํ ํ์ดํ๋ผ์ธ ์ฌ์ฉํ๊ธฐ[[using_pipelines_for_a_webserver]] | |
<Tip> | |
์ถ๋ก ์์ง์ ๋ง๋๋ ๊ฒ์ ๋ณต์กํ ์ฃผ์ ์ด๋ฉฐ, "์ต์ ์" ์๋ฃจ์ ์ ๋ฌธ์ ๊ณต๊ฐ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. CPU ๋๋ GPU๋ฅผ ์ฌ์ฉํ๋์ง์ ๋ฐ๋ผ ๋ค๋ฅด๊ณ ๋ฎ์ ์ง์ฐ ์๊ฐ์ ์ํ๋์ง, ๋์ ์ฒ๋ฆฌ๋์ ์ํ๋์ง, ๋ค์ํ ๋ชจ๋ธ์ ์ง์ํ ์ ์๊ธธ ์ํ๋์ง, ํ๋์ ํน์ ๋ชจ๋ธ์ ๊ณ ๋๋ก ์ต์ ํํ๊ธธ ์ํ๋์ง ๋ฑ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋๋ค. ์ด ์ฃผ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์๋ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ผ๋ฏ๋ก, ์ด ์ฅ์์ ์ ์ํ๋ ๊ฒ์ ์ฒ์ ์๋ํด ๋ณด๊ธฐ์ ์ข์ ์ถ๋ฐ์ ์ผ ์๋ ์์ง๋ง, ์ด ์ฅ์ ์ฝ๋ ์ฌ๋ฌ๋ถ์ด ํ์๋ก ํ๋ ์ต์ ์ ์๋ฃจ์ ์ ์๋ ์ ์์ต๋๋ค. | |
</Tip> | |
ํต์ฌ์ ์ผ๋ก ์ดํดํด์ผ ํ ์ ์ [dataset](pipeline_tutorial#using-pipelines-on-a-dataset)๋ฅผ ๋ค๋ฃฐ ๋์ ๋ง์ฐฌ๊ฐ์ง๋ก ๋ฐ๋ณต์๋ฅผ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋๋ค. ์๋ํ๋ฉด, ์น ์๋ฒ๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์์ฒญ์ ๊ธฐ๋ค๋ฆฌ๊ณ ๋ค์ด์ค๋ ๋๋ก ์ฒ๋ฆฌํ๋ ์์คํ ์ด๊ธฐ ๋๋ฌธ์ ๋๋ค. | |
๋ณดํต ์น ์๋ฒ๋ ๋ค์ํ ์์ฒญ์ ๋์์ ๋ค๋ฃจ๊ธฐ ์ํด ๋งค์ฐ ๋ค์คํ๋ ๊ตฌ์กฐ(๋ฉํฐ ์ค๋ ๋ฉ, ๋น๋๊ธฐ ๋ฑ)๋ฅผ ์ง๋๊ณ ์์ต๋๋ค. ๋ฐ๋ฉด์, ํ์ดํ๋ผ์ธ(๋๋ถ๋ถ ํ์ดํ๋ผ์ธ ์์ ์๋ ๋ชจ๋ธ)์ ๋ณ๋ ฌ์ฒ๋ฆฌ์ ๊ทธ๋ค์ง ์ข์ง ์์ต๋๋ค. ์๋ํ๋ฉด ํ์ดํ๋ผ์ธ์ ๋ง์ RAM์ ์ฐจ์งํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฐ๋ผ์, ํ์ดํ๋ผ์ธ์ด ์คํ ์ค์ด๊ฑฐ๋ ๊ณ์ฐ ์ง์ฝ์ ์ธ ์์ ์ค์ผ ๋ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ ๋ฆฌ์์ค๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ข์ต๋๋ค. | |
์ด ๋ฌธ์ ๋ฅผ ์ฐ๋ฆฌ๋ ์น ์๋ฒ๊ฐ ์์ฒญ์ ๋ฐ๊ณ ๋ณด๋ด๋ ๊ฐ๋ฒผ์ด ๋ถํ๋ฅผ ์ฒ๋ฆฌํ๊ณ , ์ค์ ์์ ์ ์ฒ๋ฆฌํ๋ ๋จ์ผ ์ค๋ ๋๋ฅผ ๊ฐ๋ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํ ๊ฒ์ ๋๋ค. ์ด ์์ ๋ `starlette` ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค. | |
์ค์ ํ๋ ์์ํฌ๋ ์ค์ํ์ง ์์ง๋ง, ๋ค๋ฅธ ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋์ผํ ํจ๊ณผ๋ฅผ ๋ณด๊ธฐ ์ํด์ ์ฝ๋๋ฅผ ์กฐ์ ํ๊ฑฐ๋ ๋ณ๊ฒฝํด์ผ ํ ์ ์์ต๋๋ค. | |
`server.py`๋ฅผ ์์ฑํ์ธ์: | |
```py | |
from starlette.applications import Starlette | |
from starlette.responses import JSONResponse | |
from starlette.routing import Route | |
from transformers import pipeline | |
import asyncio | |
async def homepage(request): | |
payload = await request.body() | |
string = payload.decode("utf-8") | |
response_q = asyncio.Queue() | |
await request.app.model_queue.put((string, response_q)) | |
output = await response_q.get() | |
return JSONResponse(output) | |
async def server_loop(q): | |
pipe = pipeline(model="bert-base-uncased") | |
while True: | |
(string, response_q) = await q.get() | |
out = pipe(string) | |
await response_q.put(out) | |
app = Starlette( | |
routes=[ | |
Route("/", homepage, methods=["POST"]), | |
], | |
) | |
@app.on_event("startup") | |
async def startup_event(): | |
q = asyncio.Queue() | |
app.model_queue = q | |
asyncio.create_task(server_loop(q)) | |
``` | |
์ด์ ๋ค์ ๋ช ๋ น์ด๋ก ์คํ์ํฌ ์ ์์ต๋๋ค: | |
```bash | |
uvicorn server:app | |
``` | |
์ด์ ์ฟผ๋ฆฌ๋ฅผ ๋ ๋ ค๋ณผ ์ ์์ต๋๋ค: | |
```bash | |
curl -X POST -d "test [MASK]" http://localhost:8000/ | |
#[{"score":0.7742936015129089,"token":1012,"token_str":".","sequence":"test."},...] | |
``` | |
์, ์ด์ ์น ์๋ฒ๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๋ํ ์ข์ ๊ฐ๋ ์ ์๊ฒ ๋์์ต๋๋ค! | |
์ค์ํ ์ ์ ๋ชจ๋ธ์ **ํ ๋ฒ๋ง** ๊ฐ์ ธ์จ๋ค๋ ๊ฒ์ ๋๋ค. ๋ฐ๋ผ์ ์น ์๋ฒ์๋ ๋ชจ๋ธ์ ์ฌ๋ณธ์ด ์์ต๋๋ค. ์ด๋ฐ ๋ฐฉ์์ ๋ถํ์ํ RAM์ด ์ฌ์ฉ๋์ง ์์ต๋๋ค. ๊ทธ๋ฐ ๋ค์ ํ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํ๋ฉด, ๋ค์๊ณผ ๊ฐ์ | |
๋์ ๋ฐฐ์น๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด ์ถ๋ก ์ ๋จ๊ณ์ ๋ช ๊ฐ์ ํญ๋ชฉ์ ์ถ์ ํ๋ ๊ฒ๊ณผ ๊ฐ์ ๋ฉ์ง ์์ ์ ํ ์ ์์ต๋๋ค: | |
<Tip warning={true}> | |
์ฝ๋๋ ์๋์ ์ผ๋ก ๊ฐ๋ ์ฑ์ ์ํด ์์ฌ ์ฝ๋์ฒ๋ผ ์์ฑ๋์์ต๋๋ค! | |
์๋ ์ฝ๋๋ฅผ ์๋์ํค๊ธฐ ์ ์ ์์คํ ์์์ด ์ถฉ๋ถํ์ง ํ์ธํ์ธ์! | |
</Tip> | |
```py | |
(string, rq) = await q.get() | |
strings = [] | |
queues = [] | |
while True: | |
try: | |
(string, rq) = await asyncio.wait_for(q.get(), timeout=0.001) # 1ms | |
except asyncio.exceptions.TimeoutError: | |
break | |
strings.append(string) | |
queues.append(rq) | |
strings | |
outs = pipe(strings, batch_size=len(strings)) | |
for rq, out in zip(queues, outs): | |
await rq.put(out) | |
``` | |
๋ค์ ๋ง์ ๋๋ฆฌ์๋ฉด, ์ ์๋ ์ฝ๋๋ ๊ฐ๋ ์ฑ์ ์ํด ์ต์ ํ๋์์ผ๋ฉฐ, ์ต์์ ์ฝ๋๋ ์๋๋๋ค. | |
์ฒซ์งธ, ๋ฐฐ์น ํฌ๊ธฐ ์ ํ์ด ์์ผ๋ฉฐ ์ด๋ ์ผ๋ฐ์ ์ผ๋ก ์ข์ ๋ฐฉ์์ด ์๋๋๋ค. | |
๋์งธ, ๋ชจ๋ ํ ๊ฐ์ ธ์ค๊ธฐ์์ ํ์์์์ด ์ฌ์ค์ ๋๋ฏ๋ก ์ถ๋ก ์ ์คํํ๊ธฐ ์ ์ 1ms๋ณด๋ค ํจ์ฌ ์ค๋ ๊ธฐ๋ค๋ฆด ์ ์์ต๋๋ค(์ฒซ ๋ฒ์งธ ์์ฒญ์ ๊ทธ๋งํผ ์ง์ฐ์ํด). | |
๋จ์ผ 1ms ๊ธธ์ด์ ๋ฐ๋๋ผ์ธ์ ๋๋ ํธ์ด ๋ ์ข์ต๋๋ค. | |
์ด ๋ฐฉ์์ ์ฌ์ฉํ๋ฉด ํ๊ฐ ๋น์ด ์์ด๋ ํญ์ 1ms๋ฅผ ๊ธฐ๋ค๋ฆฌ๊ฒ ๋ ๊ฒ์ ๋๋ค. | |
ํ์ ์๋ฌด๊ฒ๋ ์์ ๋ ์ถ๋ก ์ ์ํ๋ ๊ฒฝ์ฐ์๋ ์ต์ ์ ๋ฐฉ๋ฒ์ด ์๋ ์ ์์ต๋๋ค. | |
ํ์ง๋ง ๋ฐฐ์น ์์ ์ด ์ฌ์ฉ๋ก์ ๋ฐ๋ผ ์ ๋ง๋ก ์ค์ํ๋ค๋ฉด ์๋ฏธ๊ฐ ์์ ์๋ ์์ต๋๋ค. | |
๋ค์ ๋งํ์ง๋ง, ์ต์์ ์๋ฃจ์ ์ ์์ต๋๋ค. | |
## ๊ณ ๋ คํด์ผ ํ ๋ช ๊ฐ์ง ์ฌํญ[[few_things_you_might want_to_consider]] | |
### ์๋ฌ ํ์ธ[[error_checking]] | |
ํ๋ก๋์ ํ๊ฒฝ์์๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ฌ์ง๊ฐ ๋ง์ต๋๋ค. | |
๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ชจ์๋ผ๊ฑฐ๋, ๊ณต๊ฐ์ด ๋ถ์กฑํ๊ฑฐ๋, ๋ชจ๋ธ์ ๊ฐ์ ธ์ค๋ ๋ฐ์ ์คํจํ๊ฑฐ๋, ์ฟผ๋ฆฌ๊ฐ ์๋ชป๋์๊ฑฐ๋, ์ฟผ๋ฆฌ๋ ์ ํํด๋ ๋ชจ๋ธ ์ค์ ์ด ์๋ชป๋์ด ์คํ์ ์คํจํ๋ ๋ฑ๋ฑ ๋ง์ ๊ฒฝ์ฐ๊ฐ ์กด์ฌํฉ๋๋ค. | |
์ผ๋ฐ์ ์ผ๋ก ์๋ฒ๊ฐ ์ฌ์ฉ์์๊ฒ ์ค๋ฅ๋ฅผ ์ถ๋ ฅํ๋ ๊ฒ์ด ์ข์ผ๋ฏ๋ก | |
์ค๋ฅ๋ฅผ ํ์ํ๊ธฐ ์ํด `try...except` ๋ฌธ์ ๋ง์ด ์ถ๊ฐํ๋ ๊ฒ์ด ์ข์ต๋๋ค. | |
ํ์ง๋ง ๋ณด์ ์ํฉ์ ๋ฐ๋ผ ๋ชจ๋ ์ค๋ฅ๋ฅผ ํ์ํ๋ ๊ฒ์ ๋ณด์์ ์ํํ ์๋ ์๋ค๋ ์ ์ ๋ช ์ฌํด์ผํฉ๋๋ค. | |
### ์ํท ๋ธ๋ ์ดํน[[circuit_breaking]] | |
์น ์๋ฒ๋ ์ผ๋ฐ์ ์ผ๋ก ์ํท ๋ธ๋ ์ดํน์ ์ํํ ๋ ๋ ๋์ ์ํฉ์ ์ง๋ฉดํฉ๋๋ค. | |
์ฆ, ์ด๋ ์๋ฒ๊ฐ ์ฟผ๋ฆฌ๋ฅผ ๋ฌด๊ธฐํ ๊ธฐ๋ค๋ฆฌ๋ ๋์ ๊ณผ๋ถํ ์ํ์ผ ๋ ์ ์ ํ ์ค๋ฅ๋ฅผ ๋ฐํํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. | |
์๋ฒ๊ฐ ๋งค์ฐ ์ค๋ ์๊ฐ ๋์ ๋๊ธฐํ๊ฑฐ๋ ์ ๋นํ ์๊ฐ์ด ์ง๋ ํ์ 504 ์๋ฌ๋ฅผ ๋ฐํํ๋ ๋์ 503 ์๋ฌ๋ฅผ ๋น ๋ฅด๊ฒ ๋ฐํํ๊ฒ ํ๋ ๊ฒ์ ๋๋ค. | |
์ ์๋ ์ฝ๋์๋ ๋จ์ผ ํ๊ฐ ์์ผ๋ฏ๋ก ๊ตฌํํ๊ธฐ๊ฐ ๋น๊ต์ ์ฝ์ต๋๋ค. | |
ํ ํฌ๊ธฐ๋ฅผ ํ์ธํ๋ ๊ฒ์ ์น ์๋ฒ๊ฐ ๊ณผ๋ถํ ์ํญ ํ์ ์์ ๋ ์๋ฌ๋ฅผ ๋ฐํํ๊ธฐ ์ํ ๊ฐ์ฅ ๊ธฐ์ด์ ์ธ ์์ ์ ๋๋ค. | |
### ๋ฉ์ธ ์ฐ๋ ๋ ์ฐจ๋จ[[blocking_the_main_thread]] | |
ํ์ฌ PyTorch๋ ๋น๋๊ธฐ ์ฒ๋ฆฌ๋ฅผ ์ง์ํ์ง ์์ผ๋ฉฐ, ์คํ ์ค์๋ ๋ฉ์ธ ์ค๋ ๋๊ฐ ์ฐจ๋จ๋ฉ๋๋ค. | |
๋ฐ๋ผ์ PyTorch๋ฅผ ๋ณ๋์ ์ค๋ ๋/ํ๋ก์ธ์ค์์ ์คํํ๋๋ก ๊ฐ์ ํ๋ ๊ฒ์ด ์ข์ต๋๋ค. | |
์ฌ๊ธฐ์๋ ์ด ์์ ์ด ์ํ๋์ง ์์์ต๋๋ค. ์๋ํ๋ฉด ์ฝ๋๊ฐ ํจ์ฌ ๋ ๋ณต์กํ๊ธฐ ๋๋ฌธ์ ๋๋ค(์ฃผ๋ก ์ค๋ ๋, ๋น๋๊ธฐ ์ฒ๋ฆฌ, ํ๊ฐ ์๋ก ์ ๋ง์ง ์๊ธฐ ๋๋ฌธ์ ๋๋ค). | |
ํ์ง๋ง ๊ถ๊ทน์ ์ผ๋ก๋ ๊ฐ์ ์์ ์ ์ํํ๋ ๊ฒ์ ๋๋ค. | |
๋จ์ผ ํญ๋ชฉ์ ์ถ๋ก ์ด ์ค๋ ๊ฑธ๋ฆฐ๋ค๋ฉด (> 1์ด), ๋ฉ์ธ ์ฐ๋ ๋๋ฅผ ์ฐจ๋จํ๋ ๊ฒ์ ์ค์ํ ์ ์์ต๋๋ค. ์๋ํ๋ฉด ์ด ๊ฒฝ์ฐ ์ถ๋ก ์ค ๋ชจ๋ ์ฟผ๋ฆฌ๋ ์ค๋ฅ๋ฅผ ๋ฐ๊ธฐ ์ ์ 1์ด๋ฅผ ๊ธฐ๋ค๋ ค์ผ ํ๊ธฐ ๋๋ฌธ์ ๋๋ค. | |
### ๋์ ๋ฐฐ์น[[dynamic_batching]] | |
์ผ๋ฐ์ ์ผ๋ก, ๋ฐฐ์น ์ฒ๋ฆฌ๊ฐ 1๊ฐ ํญ๋ชฉ์ ํ ๋ฒ์ ์ ๋ฌํ๋ ๊ฒ์ ๋นํด ๋ฐ๋์ ์ฑ๋ฅ ํฅ์์ด ์๋ ๊ฒ์ ์๋๋๋ค(์์ธํ ๋ด์ฉ์ [`batching details`](./main_classes/pipelines#pipeline-batching)์ ์ฐธ๊ณ ํ์ธ์). | |
ํ์ง๋ง ์ฌ๋ฐ๋ฅธ ์ค์ ์์ ์ฌ์ฉํ๋ฉด ๋งค์ฐ ํจ๊ณผ์ ์ผ ์ ์์ต๋๋ค. | |
API์๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์๋ ์ ํ์ ๊ฐ๋ฅ์ฑ์ด ๋งค์ฐ ๋๊ธฐ ๋๋ฌธ์ ๋์ ๋ฐฐ์น ์ฒ๋ฆฌ๊ฐ ์์ต๋๋ค. | |
ํ์ง๋ง ๋งค์ฐ ํฐ ๋ชจ๋ธ์ธ BLOOM ์ถ๋ก ์ ๊ฒฝ์ฐ ๋์ ๋ฐฐ์น ์ฒ๋ฆฌ๋ ๋ชจ๋ ์ฌ๋์๊ฒ ์ ์ ํ ๊ฒฝํ์ ์ ๊ณตํ๋ ๋ฐ **ํ์**์ ๋๋ค. | |