Madrid Ite Scraper
Pricing
$37.00 / 1,000 consultasites
Madrid Ite Scraper
Under maintenanceActor automatizado que extrae información de ITE (Inspección Técnica de Edificios) del portal oficial del Ayuntamiento de Madrid. Ingresa tipo de vía, nombre y número para obtener datos estructurados del edificio. Incluye reintentos automáticos y manejo robusto de errores web.
0.0 (0)
Pricing
$37.00 / 1,000 consultasites
0
1
1
Last modified
9 days ago
Este actor extrae información de la Inspección Técnica de Edificios (ITE) del portal oficial del Ayuntamiento de Madrid.
📋 Descripción
El actor navega por el sitio web de consultas de ITE de Madrid (https://servpub.madrid.es/GITEP_WBFICHA/SGiteCons#) y extrae información detallada de edificios específicos basándose en:
- Tipo de vía
- Nombre de la vía
- Número del portal
🚀 Uso
Parámetros de entrada
Campo | Tipo | Requerido | Descripción | Ejemplo |
---|---|---|---|---|
tipoVia | string | ✅ | Tipo de vía (CALLE, AVENIDA, PLAZA, etc.) | "CALLE" |
nombreVia | string | ✅ | Nombre de la vía o calle | "ALCALÁ" |
numeroCalle | string | ✅ | Número del portal o edificio | "123" |
proxyConfiguration | object | ❌ | Configuración de proxy (opcional) | {"useApifyProxy": true} |
Ejemplo de input
{"tipoVia": "CALLE","nombreVia": "ALCALÁ","numeroCalle": "123"}
📊 Datos extraídos
El actor extrae la siguiente información:
Estructura de salida
{"data": {"textoCompleto": "Texto completo de la página","elementos": {"celdasValor": [{"texto": "Contenido de la celda","clase": "celdaValor","colspan": "1","rowspan": "1"}],"textosFuertes": [{"texto": "Texto en negrita","id": "elemento_id","clase": "clase_css"}],"encabezados": [{"texto": "Texto del encabezado","etiqueta": "H1","id": "encabezado_id"}],"enlaces": [{"texto": "Texto del enlace","href": "url_del_enlace","titulo": "título_del_enlace"}]}},"metadata": {"tipoVia": "CALLE","nombreVia": "ALCALÁ","numeroCalle": "123","timestamp": "2024-01-15T10:30:00.000Z","url": "url_final_consultada"}}
🔧 Características técnicas
- Navegador: Puppeteer con Chrome/Chromium
- Normalización de texto: Maneja acentos, espacios especiales y diferencias de mayúsculas/minúsculas
- Reintentos automáticos: Sistema robusto de reintentos en caso de errores de navegación
- Screenshots de error: Captura automática de pantalla en caso de fallos
- Soporte para proxies: Compatible con Apify Proxy y proxies personalizados
⚠️ Limitaciones y consideraciones
- Dependiente del sitio web: El actor depende de la estructura actual del portal de Madrid
- Tiempo de ejecución: Puede tomar 30-60 segundos por consulta debido a la navegación web
- Datos disponibles: Solo extrae información públicamente disponible en el portal
- Rate limiting: Usa delays para respetar el servidor
🔄 Manejo de errores
El actor incluye:
- Verificación de parámetros de entrada
- Timeouts configurables para elementos web
- Reintentos automáticos en navegación
- Screenshots de depuración en errores
- Logs detallados del proceso
📝 Logs y depuración
Durante la ejecución verás logs como:
🔍 Buscando: CALLE ALCALÁ 123✅ Tipo de vía seleccionado: CALLE✅ Nombre de vía escrito: ALCALÁ➡️ Buscando calle...✅ Calle seleccionada: CALLE ALCALÁ✅ Número de portal seleccionado: 123📊 Resultado guardado en dataset
🛠 Desarrollo y contribución
Para modificar o mejorar el actor:
- Clona el repositorio
- Modifica
main.js
según necesidades - Actualiza
INPUT_SCHEMA.json
si cambias parámetros - Prueba localmente con
apify run
- Sube cambios a Apify Console
📄 Licencia
Este actor es de uso libre para consultas legítimas de información pública del Ayuntamiento de Madrid.