最简单且快捷的方法是使用Pandas库。
你可以先调用read_html
函数读取网页中的表格,然后通过.to_csv()
方法将其保存为CSV文件。
参照你的示例:
import pandas as pd
url = 'https://www.w3schools.com/html/html_tables.asp'
df = pd.read_html(url)[0] # [0] 表示获取页面中的第一个表格
df.to_csv('table.csv', index=False)
这段代码将会创建一个名为table.csv
的文件,其内容如下所示:
公司,联系人,国家
Alfreds Futterkiste,Maria Anders,德国
Centro comercial Moctezuma,Franisco Chang,墨西哥
Ernst Handel,Roland Mendel,奥地利
Island Trading,Helen Bennett,英国
Laughing Bacchus Winecellars,Yoshi Tannamuri,加拿大
Magazzini Alimentari Riuniti,Giovanni Rovelli,意大利