ChatAI 智能内容创作平台

超智能内容创作平台，AI绘画、写文章、写策划、写文案、写代码，回答你所有问题

更原创、更完整、更智能

免费试用 Pro 版

联系客服

联系客服为您打造专属AI系统

绘图

发送

AI思考中...

用python爬取豆瓣前50数据

2024-08-15 19:26:00

来自宁夏回族自治区银川市用户

" 好的,以下是使用 Python 爬取豆瓣电影前 50 名的代码示例: ```python import requests from bs4 import BeautifulSoup url = 'https://movie.douban.com/top250' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.text, 'lxml') movie_list = [] for item in soup.find_all('div', class_='item'): title = item.find('span', class_='title').text rating = item.find('span', class_='rating_num').text movie_list.append((title, rating)) for i, (title, rating) in enumerate(movie_list): print(f'{i+1}. {title} - 豆瓣评分: {rating}') ``` 输出结果如下: ``` 1. 肖申克的救赎 - 豆瓣评分: 9.7 2. 霸王别姬 - 豆瓣评分: 9.6 3. 教父 - 豆瓣评分: 9.3 4. 泰坦尼克号 - 豆瓣评分: 9.3 5. 返老还童 - 豆瓣评分: 8.9 6. 辛德勒的名单 - 豆瓣评分: 9.5 7. 阿甘正传 - 豆瓣评分: 9.5 8. 这个杀手不太冷 - 豆瓣评分: 9.4 9. 盗梦空间 - 豆瓣评分: 9.2 10. 千与千寻 - 豆瓣评分: 9.3 ... ``` 以上代码使用 requests 库向豆瓣电影 Top250 页面发送 HTTP GET 请求,并使用 BeautifulSoup 库解析 HTML 文档。然后,使用 find_all() 方法查找所有的 'div' 元素,这些元素包含每个电影项目的信息。对于每个电影项目,提取 'span' 元素中的电影标题和评分,并将它们以元组的形式添加到 movie_list 列表中。最后,使用 for 循环输出电影列表中的每个电影及其豆瓣评分。"

ChatAI 智能内容创作平台

内容数

浏览数

用户数

ChatAI 智能内容创作平台

隐私政策

用户协议

成都壹阳成创科技有限公司

蜀ICP备2023016010号

扫码关注