Madrid Ite Scraper avatar
Madrid Ite Scraper
Under maintenance

Pricing

$37.00 / 1,000 consultasites

Go to Apify Store
Madrid Ite Scraper

Madrid Ite Scraper

Under maintenance

Developed by

Ezquias

Ezquias

Maintained by Community

Actor automatizado que extrae información de ITE (Inspección Técnica de Edificios) del portal oficial del Ayuntamiento de Madrid. Ingresa tipo de vía, nombre y número para obtener datos estructurados del edificio. Incluye reintentos automáticos y manejo robusto de errores web.

0.0 (0)

Pricing

$37.00 / 1,000 consultasites

0

1

1

Last modified

9 days ago

Este actor extrae información de la Inspección Técnica de Edificios (ITE) del portal oficial del Ayuntamiento de Madrid.

📋 Descripción

El actor navega por el sitio web de consultas de ITE de Madrid (https://servpub.madrid.es/GITEP_WBFICHA/SGiteCons#) y extrae información detallada de edificios específicos basándose en:

  • Tipo de vía
  • Nombre de la vía
  • Número del portal

🚀 Uso

Parámetros de entrada

CampoTipoRequeridoDescripciónEjemplo
tipoViastringTipo de vía (CALLE, AVENIDA, PLAZA, etc.)"CALLE"
nombreViastringNombre de la vía o calle"ALCALÁ"
numeroCallestringNúmero del portal o edificio"123"
proxyConfigurationobjectConfiguración de proxy (opcional){"useApifyProxy": true}

Ejemplo de input

{
"tipoVia": "CALLE",
"nombreVia": "ALCALÁ",
"numeroCalle": "123"
}

📊 Datos extraídos

El actor extrae la siguiente información:

Estructura de salida

{
"data": {
"textoCompleto": "Texto completo de la página",
"elementos": {
"celdasValor": [
{
"texto": "Contenido de la celda",
"clase": "celdaValor",
"colspan": "1",
"rowspan": "1"
}
],
"textosFuertes": [
{
"texto": "Texto en negrita",
"id": "elemento_id",
"clase": "clase_css"
}
],
"encabezados": [
{
"texto": "Texto del encabezado",
"etiqueta": "H1",
"id": "encabezado_id"
}
],
"enlaces": [
{
"texto": "Texto del enlace",
"href": "url_del_enlace",
"titulo": "título_del_enlace"
}
]
}
},
"metadata": {
"tipoVia": "CALLE",
"nombreVia": "ALCALÁ",
"numeroCalle": "123",
"timestamp": "2024-01-15T10:30:00.000Z",
"url": "url_final_consultada"
}
}

🔧 Características técnicas

  • Navegador: Puppeteer con Chrome/Chromium
  • Normalización de texto: Maneja acentos, espacios especiales y diferencias de mayúsculas/minúsculas
  • Reintentos automáticos: Sistema robusto de reintentos en caso de errores de navegación
  • Screenshots de error: Captura automática de pantalla en caso de fallos
  • Soporte para proxies: Compatible con Apify Proxy y proxies personalizados

⚠️ Limitaciones y consideraciones

  1. Dependiente del sitio web: El actor depende de la estructura actual del portal de Madrid
  2. Tiempo de ejecución: Puede tomar 30-60 segundos por consulta debido a la navegación web
  3. Datos disponibles: Solo extrae información públicamente disponible en el portal
  4. Rate limiting: Usa delays para respetar el servidor

🔄 Manejo de errores

El actor incluye:

  • Verificación de parámetros de entrada
  • Timeouts configurables para elementos web
  • Reintentos automáticos en navegación
  • Screenshots de depuración en errores
  • Logs detallados del proceso

📝 Logs y depuración

Durante la ejecución verás logs como:

🔍 Buscando: CALLE ALCALÁ 123
✅ Tipo de vía seleccionado: CALLE
✅ Nombre de vía escrito: ALCALÁ
➡️ Buscando calle...
✅ Calle seleccionada: CALLE ALCALÁ
Número de portal seleccionado: 123
📊 Resultado guardado en dataset

🛠 Desarrollo y contribución

Para modificar o mejorar el actor:

  1. Clona el repositorio
  2. Modifica main.js según necesidades
  3. Actualiza INPUT_SCHEMA.json si cambias parámetros
  4. Prueba localmente con apify run
  5. Sube cambios a Apify Console

📄 Licencia

Este actor es de uso libre para consultas legítimas de información pública del Ayuntamiento de Madrid.