【发布时间】:2023-04-02 11:25:03
【问题描述】:
我在网站中有以下 HTML/Javascript 代码。它基本上代表一个有两个字段的网站: a) name="N":字段是你标记的“V”字母; b) name="ID" 是您输入的数字,最多 8 个字符。
<tr>
<td>
<form name="form" method="post" action="javascript:BuscaR(document.form.N.value, document.form.ID.value)">
<table class="aux">
<tr>
<td>
<select name="N" class="form">
<option value="V">V</option>
</select>
</td>
<td>
<input name="ID" type="text" class="form" maxlength="8" size="8" value="ID" onfocus="javascript:clear_textbox3();" onblur="javascript:Valid(document.form.ID);"/>
</td>
</tr>
<tr>
<td>
<input type="submit" value="Buscar" class="boton"/>
</td>
</tr>
</table>
</form>
</td>
我以前用 BeautifulSoup 和 urllib 做过网络爬虫。我的想法是生成一个脚本,输入和提交这些 ID 号(来自一个巨大的数据库),并检索网站响应的数据(它返回一个 HTML)。
但是,我找不到这个表格“引导”到哪里。我的意思是,我该如何输入?如何在 Python 中“按”提交?
在大多数posts 上,我们现在提交表单线索的 php URL 是什么。所以他们可以更改php.?N=V,ID=x
中的ID 和“蛮力”不同的数字。但是我在网站上找不到这个网址。我该怎么办?
原始网站是http://www.cne.gob.ve/web/index.php,右侧显示“Consulte sus Datos。Proceso de validación y exclusión de registros presentados por el partido MUD”。并且该框会显示一个搜索按钮。
谢谢大家!
【问题讨论】:
标签:
javascript
python
web-scraping
urllib
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用 Python 提交 Javascript 表单和抓取 - Python技术站