logo

爬虫豆瓣电影top250[PPT成品+免费文案]

import requestspptsupermarket*com
from bs4 import BeautifulSoup
发送请求并获取HTML内容
url = "https://movie.douban.com/top250"pptsupermarket
headers = {pptsupermarket*com
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"PPT 超级市场
}pptsupermarket*com
response = requests.get(url, headers=headers)
response.raise_for_status()
使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, "html.parser")PPT 超级市场
提取电影列表
movies = soup.select(".grid_view li")pptsupermarket
遍历电影列表并输出信息
for movie in movies:
title = movie.select_one(".title").text
rating = movie.select_one(".rating_num").text
info = movie.select_one(".bd p").text.strip()PPT 超级市场
print(f"{title}: {rating} ({info})")
这个代码使用Python的requests库发送HTTP请求,并使用BeautifulSoup库解析HTML内容。它首先发送一个GET请求到豆瓣电影Top250的URL,并获取返回的HTML内容。然后,它使用BeautifulSoup选择器提取电影列表,遍历每个电影并输出标题、评分和信息。注意,这只是一个简单的示例代码,实际使用时可能需要根据页面结构和数据格式进行适当的修改。pptsupermarket.com
除了提取电影的基本信息,我们还可以进一步扩展爬虫的功能。例如,我们可以尝试提取电影的详细信息、图片、评论等。下面是一个更完整的示例代码,可以提取电影的详细信息和图片:
导入所需的库
import requests
from bs4 import BeautifulSoupPPT超级市场
发送请求并获取HTML内容
url = "https://movie.douban.com/top250"😀PPT超级市场服务
headers = {pptsupermarket
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"pptsupermarket.com
}
response = requests.get(url, headers=headers)😀PPT超级市场服务
response.raise_for_status()pptsupermarket.com
使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, "html.parser")
提取电影列表
movies = soup.select(".grid_view li")PPT超级市场
遍历电影列表并输出信息
for movie in movies:
title = movie.select_one(".title").textpptsupermarket
rating = movie.select_one(".rating_num").text[PPT超级市场
info = movie.select_one(".bd p").text.strip()pptsupermarket*com
print(f"{title}: {rating} ({info})")PPT超级市场
这个代码在提取电影的基本信息之外,还提取了电影的年份、导演、演员、剧情简介和图片链接。注意,由于豆瓣电影Top250的页面结构可能会发生变化,因此代码中的选择器可能需要根据实际情况进行调整。此外,由于网络请求和页面解析的时间可能较长,因此在实际使用时可能需要添加适当的异常处理和超时设置。[PPT超级市场
酒店设计PPT模板,一键免费AI生成酒店设计PPT
返回主页