尝试将 horizontal_strategy
设置为 explicit
并像配置 vertical_strategy
那样提供 explicit_horizontal_lines
参数值。
假设每一行的高度为30像素:
table = cropped_page.extract_table({
"vertical_strategy": "explicit",
"explicit_vertical_lines": explicit_vertical_lines,
"horizontal_strategy": "explicit",
# 跳过表头(每一页都有表头),从第1行开始
"explicit_horizontal_lines": [top_region + 30 * i for i in range(1, 18)],
})
if table:
all_rows += table
执行上述代码后的输出如下:
index,Immat,Constructeur,Type d’aéronef,SN aéronef,Propriétaire,Exploitant
0,LX-ABC,BOMBARDIER INC.,BD-700-1A10 GLOBAL EXPRESS XRS,9213,DMH AVIATION LTD.,GLOBAL JET LUXEMBOURG S.A.
1,LX-AIA,"THE NEW PIPER AIRCRAFT, INC",PA18C,18-1011,PIPER CLUB ASBL,PIPER CLUB ASBL
2,LX-AIB,"THE NEW PIPER AIRCRAFT, INC",PA28-161 Cadet,28-41086,"AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L.","AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L."
3,LX-AIC,"REIMS AVIATION, CESSNA",F172L,0852,"AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L.","AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L."
4,LX-AID,"REIMS AVIATION, CESSNA",F172N,1972,"AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L.","AÉRO-SPORT DU GRAND-DUCHÉ
DE LUXEMBOURG A.S.B.L."