README.md์์ ์์ ๋ฅผ ์คํํ๊ณ ํด๋น ์ค๋ฅ๋ฅผ ํ์ํ๋ ค๊ณ ํฉ๋๋ค.
from pdf2docx import parse
pdf_file = '09_0370.pdf'
docx_file = 'File.docx'
# convert pdf to docx
parse(pdf_file, docx_file, start=0, end=1)
๋ญ๊ฐ ๋ฌธ์ ์ผ?
๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ๋จผ์ ์ค์นํ์
จ์ต๋๊น? ๊ทธ ํ์๋ ์๋ํด์ผํฉ๋๋ค. README.md์ Installation
์น์
์ ์ฐธ์กฐํ์ญ์์ค.
๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ ์์ค ์ฝ๋๋ฅผ ์ง์ ์ฌ์ฉํ๊ณ ์ถ๋ค๋ฉด ๋ค์๊ณผ ๊ฐ์ด parse
๋ฅผ ๊ฐ์ ธ์์ผ ํฉ๋๋ค.
from pdf2docx.main import parse
์, ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ค์น๋์์ต๋๋ค. pip freeze
ํ๊ณ ๋ชฉ๋ก์ ๋ํ๋ฉ๋๋ค. ๊ทํ์ ๋ฐฉ๋ฒ์ ์ ์ฉํ๋ฉด ์ ์๋ํ๋ค๊ณ ๋งํ์ง๋ง ์ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค. ํด๋๋ฅผ ํฌํจํ๋ ๊ฒ์ด ์ฝ๊ฐ ์ต์ ์ธ ๊ฒ ๊ฐ์ต๋๋ค. ๋ด ํ๋ก์ ํธ์์๋ ์ ์ฉํ ๊ฒฝ์ฐ๋ฅผ ๋๋นํ์ฌ ์ฐฝ 10 x32 ๋นํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๋๋ ๊ทธ๊ฒ์ ์ ๊ฑฐํ๊ณ ๋ค์ ์ค์นํ์ง๋ง ์ด๋ฒ์๋ setup.py
์์ ์๋ฌด ๊ฒ๋ํ์ง ์๊ณ ๋์ผํ ์ค๋ฅ๊ฐ ๊ณ์ ๋ฐ์ํฉ๋๋ค.
ํธ์ง: ์ข์, ๋ด ์ด๋ฆฌ์์ ์ค์, ๋ด ํ๋ก์ ํธ ํด๋์ pdf2docx.py
๋ผ๋ ํ์ผ์ด ์์๊ณ ๋
ผ๋ฆฌ์ ์ผ๋ก from pdf2docx import parse
๊ฐ ์ค์น๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋์ ํด๋น ํ์ผ์ ๊ฐ๋ฆฌ์ผฐ์ต๋๋ค.
๊ฐ์ฅ ์ ์ฉํ ๋๊ธ
์, ๋ผ์ด๋ธ๋ฌ๋ฆฌ๊ฐ ์ค์น๋์์ต๋๋ค.
pip freeze
ํ๊ณ ๋ชฉ๋ก์ ๋ํ๋ฉ๋๋ค. ๊ทํ์ ๋ฐฉ๋ฒ์ ์ ์ฉํ๋ฉด ์ ์๋ํ๋ค๊ณ ๋งํ์ง๋ง ์ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค. ํด๋๋ฅผ ํฌํจํ๋ ๊ฒ์ด ์ฝ๊ฐ ์ต์ ์ธ ๊ฒ ๊ฐ์ต๋๋ค. ๋ด ํ๋ก์ ํธ์์๋ ์ ์ฉํ ๊ฒฝ์ฐ๋ฅผ ๋๋นํ์ฌ ์ฐฝ 10 x32 ๋นํธ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๋๋ ๊ทธ๊ฒ์ ์ ๊ฑฐํ๊ณ ๋ค์ ์ค์นํ์ง๋ง ์ด๋ฒ์๋setup.py
์์ ์๋ฌด ๊ฒ๋ํ์ง ์๊ณ ๋์ผํ ์ค๋ฅ๊ฐ ๊ณ์ ๋ฐ์ํฉ๋๋ค.ํธ์ง: ์ข์, ๋ด ์ด๋ฆฌ์์ ์ค์, ๋ด ํ๋ก์ ํธ ํด๋์
pdf2docx.py
๋ผ๋ ํ์ผ์ด ์์๊ณ ๋ ผ๋ฆฌ์ ์ผ๋กfrom pdf2docx import parse
๊ฐ ์ค์น๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋์ ํด๋น ํ์ผ์ ๊ฐ๋ฆฌ์ผฐ์ต๋๋ค.