" 好的,以下是使用 Python 爬取豆瓣电影前 50 名的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://movie.douban.com/top250'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'lxml')
movie_list = []
for item in soup.find_all('div', class_='item'):
title = item.find('span', class_='title').text
rating = item.find('span', class_='rating_num').text
movie_list.append((title, rating))
for i, (title, rating) in enumerate(movie_list):
print(f'{i+1}. {title} - 豆瓣评分: {rating}')
```
输出结果如下:
```
1. 肖申克的救赎 - 豆瓣评分: 9.7
2. 霸王别姬 - 豆瓣评分: 9.6
3. 教父 - 豆瓣评分: 9.3
4. 泰坦尼克号 - 豆瓣评分: 9.3
5. 返老还童 - 豆瓣评分: 8.9
6. 辛德勒的名单 - 豆瓣评分: 9.5
7. 阿甘正传 - 豆瓣评分: 9.5
8. 这个杀手不太冷 - 豆瓣评分: 9.4
9. 盗梦空间 - 豆瓣评分: 9.2
10. 千与千寻 - 豆瓣评分: 9.3
...
```
以上代码使用 requests 库向豆瓣电影 Top250 页面发送 HTTP GET 请求,并使用 BeautifulSoup 库解析 HTML 文档。然后,使用 find_all() 方法查找所有的 'div' 元素,这些元素包含每个电影项目的信息。对于每个电影项目,提取 'span' 元素中的电影标题和评分,并将它们以元组的形式添加到 movie_list 列表中。最后,使用 for 循环输出电影列表中的每个电影及其豆瓣评分。"