본문 바로가기
코딩이야기

웹 스크래핑 과제, 스스로 더 학습하기! (feat 스파르톤)

by 코딩하임 2022. 9. 18.
728x90
반응형

현재 시간 02: 26분

웹 스크래핑 마지막 시간으로 과제가 주어졌다! 

 

전에 했던 결과에 신문사까지 더해서 출력할 것!

먼저 신문사 위치에 있는 것을 검사를 통해 확인했다.

media = li.select_one('a.info.press').text

까지 할 경우

언론사 선정이 나온다. 이 언론사 선정을 지우기 위해 

media = li.select_one('a.info.press').text.replace('언론사 선정','')

.replace를 사용해서 '언론사 선정'을 ' ' 공백으로 바꾸어 준다.

 

Ref : https://ooyoung.tistory.com/77

 

파이썬 replace( ) 문자열을 변경하는 함수 (Python)

replace( ) - 순서 - 1. replace 함수에 대한 설명 2. 함수 사용예시 1. replace 함수에 대한 설명 replace는 문자열을 변경하는 함수이다. 문자열 안에서 특정 문자를 새로운 문자로 변경하는 기능을 가지고

ooyoung.tistory.com

레퍼런스를 참고하여 replace() 함수가 어떻게 사용되는지 알아보았다.

사용 방법은 '변수. replace(old, new, [count])' 형식으로 사용한다.

- old : 현재 문자열에서 변경하고 싶은 문자

- new: 새로 바꿀 문자

- count: 변경할 횟수. 횟수는 입력하지 않으면 old의 문자열 전체를 변경한다. 기본값은 전체를 의미하는 count=-1로 지정되어있다. 

 

웹 스크래핑으로 제공된 강의는 여기까지인데 배운김에 스크래핑을 좀 더 연습하는 의미에서 추가적으로 학습해보려고 한다! 현재 시간은 3:28분 (중간에 손흥민 해트트릭 보느라 좀 시간이 걸렸다..ㅎ)


[03:30]

이어서 Colab에서 Python을 이용한 웹 스크래핑을 이용해서 정보를 가져오는 것을 추가적으로 연습해보겠다! 

마침 오늘 손흥민 선수가 해트트릭을 했으니까 EPL 팀 순위를 가지고 와보는 것으로 스스로 과제를 내봤다.

웹 스크래핑에 대한 구글링을 해서 원하는 정보를 가져오기는 했는데 순위 외에도 승점도 가지고 오고 싶었다.

Ref : https://dsc-sookmyung.tistory.com/85

 

파이썬으로 웹 스크래핑 시작하기

WikiDocs의 04장 웹스크래핑과 Pandas를 정리한 글입니다. 웹 크롤링과 웹 스크래핑 웹 서버에 저장된 데이터를 가져오는 행위를 웹 크롤링 또는 웹 스크래핑이라고 부른다. 웹 크롤링 Google 등의 대

dsc-sookmyung.tistory.com

* 주의 : <em>태그는 id = "_per"이

왜..맨시티만 저래 나오니..?ㅠ

순위와 팀명 경기수, 전적, 승점까지 다 나왔으면 좋겠는데

[4:40] 중간에 마라톤 게임하느라 좀 느림...

[05:24]

스스로 낸 과제가 풀리지 않아 블로그를 쓸 겨를이 없다......

음....여기까진 뽑은 거 같고.... 좀 더 고민해서 이어서 마무리하는 걸로 하자! 

 

반응형

댓글