Pandas是一个开放源码、BSD许可的库,为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。把抓取到的数据存储到PandasDataFrame中,可以进一步对数据进行分析,是一种常见做法。
本章例子,将从豆瓣网站上抓取北美电影排行榜,并放进DataFrame中。
抓取网页数据
豆瓣网站上的北美电影排行榜网址,北美电影排行榜在右下边栏。
importrequestsfrombs4importBeautifulSouppage=requests.get("