Python

scraping issue handle

말하는감자 2020. 12. 20. 22:23

특정 엘리먼트 클릭

driver.find_element_by_id('').click
driver.find_element_by_xpath('').click()

 

반응형 웹에서 특정 엘리먼트를 클릭해서 페이지를 추가 로딩할때 오류가 난다면

el = driver.find_element_by_xpath('')
driver.execute_script("arguments[0].click();", el)

 

화면 로딩하는거 기다릴때

driver.implicitly_wait(시간)

 

pdf로 스크린샷 찍기

driver.execute_script('window.print();')

 

화면 가장 아래로 스크롤링

driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")

 

파일 이름 변경

origin = os.path.join(file_path, 'origin.pdf')
rename = os.path.join(file_path, 'rename.pdf')
os.rename(origin, rename)

 

pdf 합치기

from PyPDF2 import PdfFileWriter, PdfFileReader, PdfFileMerger

pdf_list = ["1.pdf", "2.pdf"]
merger = PdfFileMerger()

for pdf in pdf_list:
	merger.append(pdf)
    
merger.write("3.pdf")
merger.close()

 

string pdf 에 써서 마지막 페이지에 추가하기

temp_string = "추가할 스트링"
packet = io.BytesIO()
can = canvas.Canvas(packet, pagesize=letter)
can.drawString(10, 10, temp_string)
can.save()
packet.seek(0)
new_pdf = PdfFileReader(packet)

pdf_list = ["1.pdf", new_pdf]
merger = PdfFileMerger()
for pdf in pdf_list:
	merger.append(pdf)
merger.write("3.pdf")
merger.close()

origin = os.path.join(file_path, '1.pdf')
os.remove(origin)

'Python' 카테고리의 다른 글

scraping issue handle  (0) 2020.12.20
pymysql  (0) 2020.06.01
range보다는 enumerate를 사용하자  (0) 2018.10.24