반응형

2024/02 26

파이썬 = 웹 페이지 다운로드 하기

안에 웹툰의 아이디가 있다. 우리가 필요한 정보는 안에 있고 는 안에 있다. 웹툰을 다운로드 할 수 있도록 만들어 본다! import requests from bs4 import BeautifulSoup # 원하는 정보 추출하는 용! import random import os # exit 사용 # https://comic.naver.com/webtoon/detail?titleId=725586&no=247&week=fri days =["mon","tue","wed","thu","fri","sat","sun"] dic ={} for i in days: url = f"https://comic.naver.com/webtoon?tab={i}" res = requests.get(url) soup = Beautifu..

파이썬 - 웹 크롤링 및 Unicode

웹 크롤링 - 웹상의 문서, 정보를 모은다. AC00 -> 이건 16진수 이다. 이제 초성퀴즈를 만들어 보자! import requests from bs4 import BeautifulSoup # 원하는 정보 추출하는 용! import random consonants = {'ㄱ' : 44032, 'ㄴ':45208, 'ㄷ':45796, 'ㄹ' : 46972, 'ㅁ':47560, 'ㅂ' : 48148} # 유니코드를 10진수로 life = 3 score = 0 ls = [] # 단어 리스트 중복 방지 # 자음을 랜덤하게 뽑아야된다. while life > 0: consonants1 = list(consonants.keys())[random.randint(0,len(consonants)-1)] consonan..

파이썬 - 웹 자료 수집하기

pip install requests 설치 ! import requests url = 'https://www.naver.com' a = requests.get(url) #print(a.status_code) # 응답 상태 확인 200이면 정상 # 404 not found #print(a.encoding) # 웹에서 사용하기 편하게 하는 것 # 여기서는 UTF-8이다. #print(a.text[:300]) # 내용 확인 300까지만 html = a.text # 저장 open('naver.html','w',encoding ='utf-8' ).write(html) # 이름, 모드 (쓰기), 인코딩 정보 # 열어보면 메인 페이지만 나온다. url에서 년, 월, 일등 다양한 정보가 포함되어 있다. https://..

실습 - 키보드 자동화

A,B와 같은 문자 리스트 형식으로 입력해주면 된다! 특별키의 목록은 KEY_NAMES[]를 통해 확인! import pyautogui # 메모장이나 계산기를 켜놔야 입력이 된다! pyautogui.click(400,300)# 메모장 위치 pyautogui.typewrite('hello my name is yopeyopeyo', interval=0.1)#키보드로 입력이 된다. 시간 텀을 둘 수 있다. 어디에 키를 입력할지도 중요하다! # 프로그램의 상대적인 위치도 알 수 있으니 그렇게 해도 된다! 메모장을 실행해서 입력하는 과정! 위의 사진을 통해 상대적인 위치를 찾는다. import pyautogui from subprocess import Popen import time Popen('notepad')..

자연어 처리 - Neural language modeling 2

좀 더 넓은 범위를 보게 된다. 그러나 연산량은 동일하다. 미래값은 포함하지 않는다! 순서를 가지고 오기 때문에 RNN이 가장 좋아 보이긴 한다. 2024.01.17 - [인공지능/자연어 처리] - 자연어 처리 - RNN, LSTM 자연어 처리 - RNN, LSTM RNN 우린 이 점선으로 된 부분을 예측해야 한다. 그냥 MLP를 사용하면 현재 데이터나 과거 데이터나 신경쓰지 않는다. CNN은 패턴을 잡는 모델이라 순서를 신경쓰지 않아 문제가 생긴다. 시간의 순 yoonschallenge.tistory.com SOS? : start of santence 문장의 시작 EOS : end of santence 문장의 끝 오늘보다 더 높은 확률이 있지만 오늘이 선택되기 때문에 '오늘'의 확률을 보게 된다. so..

자연어 처리 - Neural language modeling 1

이전의 토큰 하나만을 보기 때문에 이전의 정보가 사라진다! 단어의 조합은 무한하다 ! -> 희소 행렬을 만들게 된다! 이것도 무한한 것은 동일하지 않나....? 라마는 달린다 -> 아직 한번도 안나왔음 -> 확률은 0 사슴 고양이 개는 나온적이 있어 확률이 있다. 라마가 포유류라는 것을 알았다면 '라마는 달린다'도 비슷한 확률을 부과할 수 있다. 라마, 고양이, 개, 사슴의 토큰에 대한 임베딩이 비슷하다면 유사하다는 것을 전달할 수 있다. 위의 동물들은 유사한 문맥들을 가진다!

실습 - 화면(이미지) 좌표 찾기

이미지 즉 스크린 샷이 필요하다! 기준이 되는 이미지를 먼저 찾는 것이 중요하다! 그리고 그 이미지를 원점으로 한 좌표를 사용한다. 계산기에서 5를 캡쳐해서 파이썬 폴더와 같은 위치에 저장해줍니다! pip install Pillow 이것도 cmd에서 설치해주기 ! import pyautogui print(pyautogui.locateOnScreen('5.png')) # 내 화면에서 위 사진과 같은 좌표의 위치를 찾아준다 # 왼쪽 상단 좌표, 너비 높이 print(pyautogui.center((271,768,132,71))) # 중간(중심)값! 337,803이 나온다. print(pyautogui.locateCenterOnScreen('5.png'))# 위의 작업들을 한꺼번에 해준다. 프로그램이 어디서 ..

실습 - 마우스 자동으로 동작시키기

커서 위치와 해상도 확인하기 pyautogui가 자동 작업을 편하게 해준다. 이것도 설치해줘야 하는데 cmd에서 pip install pyautogui 를 해주면 된다. import pyautogui pyautogui.size() # 해상도 pyautogui.position()# 커서 위치 좌측 상단이 0,0이다. 이동과 클릭! 위치를 지정해서 클릭할 수 있게 된다. 마이너스는 오류가 나므로 처리를 해줘야 한다. 전체화면을 스크린샷 후 그림판에 가서 좌표를 확인할 수 있다. 클릭에 좌표를 넣으면 이동해서 클릭한다. import pyautogui pyautogui.FAILSAFE = False # 마이너스 오류 처리 pyautogui.moveTo(500,500,duration= 2) # 마우스 커서 위치 ..

실습 - 사용 빈도수에 따른 단어 출력하기

2021/06/01이 2021.06.01로 변하게 된다. split괄호 안에 아무것도 넣지 않으면 공백 기준으로 문자열을 나눈다. 특정 문자열의 개수를 문자열 내에서 찾는다. 1~100사이의 정수중 랜덤하게 나온다. from random import * 이렇게 작성하면 random randint라고 작성 안하고 바로 randint로 작성해도 된다. 여기서도 저렇게 *을 작성함으로써 그냥 사용할 수 있게 해준다. import turtle as t t.shape('turtle') t.forward(100) # 앞으로 간다. t.left(170) # 170도만큼 돈다. t.done() 노래 가사중에서 많이 사용되는 문자 찾기! import turtle as t # 여기선 t를 작성하고 뒤에 함수를 적어야 한다..

728x90
728x90