Saltar al contenido principal

Haz scraping de tu primer sitio web

Convierte cualquier sitio web en datos limpios y listos para usar con LLM mediante una única llamada a la API.

Obtén tu clave de API

Regístrate y obtén tu clave de API para empezar a hacer scraping

Pruébalo en el Playground

Prueba la API al instante, sin escribir código
La skill de Firecrawl es la forma más rápida para que los agentes descubran y utilicen Firecrawl. Sin ella, tu agente no sabrá que Firecrawl está disponible.
npx -y firecrawl-cli@latest init --all --browser
Reinicia el agente después de instalar la skill. Consulta Skill + CLI para ver la configuración completa.
O bien usa el MCP Server para conectar Firecrawl directamente con Claude, Cursor, Windsurf, VS Code y otras herramientas de IA.

Haz tu primera solicitud

Copia el siguiente código, reemplaza fc-YOUR-API-KEY por tu clave de API y ejecútalo:
curl -X POST 'https://api.firecrawl.dev/v2/scrape' \
  -H 'Authorization: Bearer fc-YOUR-API-KEY' \
  -H 'Content-Type: application/json' \
  -d '{"url": "https://example.com"}'
{
  "success": true,
  "data": {
    "markdown": "# Example Domain\n\nThis domain is for use in illustrative examples...",
    "metadata": {
      "title": "Example Domain",
      "sourceURL": "https://example.com"
    }
  }
}

¿Qué puede hacer Firecrawl?

Scrape

Extrae contenido de cualquier URL en formato Markdown, HTML o JSON estructurado

Search

Haz una búsqueda en la web y obtén el contenido completo de las páginas de los resultados

Agent

Recopilación autónoma de datos web mediante IA con agente

Browser

Sesiones de navegador seguras en entorno aislado (sandbox) para flujos de trabajo web interactivos

¿Por qué Firecrawl?

  • Resultados listos para LLM: Obtén markdown limpio, JSON estructurado, capturas de pantalla y más
  • Se encarga de lo difícil: Proxies, anti-bot, renderizado de JavaScript y contenido dinámico
  • Confiable: Construido para producción con alta disponibilidad y resultados consistentes
  • Rápido: Obtén resultados en segundos, optimizado para alto rendimiento
  • Sandbox de navegador: Entornos de navegador totalmente gestionados para agentes, sin configuración y que escalan a cualquier tamaño
  • Servidor MCP: Conecta Firecrawl a cualquier herramienta de IA a través del Model Context Protocol

Scraping

Extrae el contenido de cualquier URL y obténlo en markdown, HTML u otros formatos. Consulta la documentación de la funcionalidad Scrape para ver todas las opciones.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-YOUR-API-KEY")

# Extraer datos de un sitio web:
doc = firecrawl.scrape("https://firecrawl.dev", formats=["markdown", "html"])
print(doc)
Los SDK devolverán el objeto de datos directamente. cURL devolverá la carga útil exactamente como se muestra a continuación.
{
  "success": true,
  "data" : {
    "markdown": "¡Launch Week I ya está aquí! [Consulta nuestro lanzamiento del Día 2 🚀](https://www.firecrawl.dev/blog/launch-week-i-day-2-doubled-rate-limits)[💥 Obtén 2 meses gratis...",
    "html": "<!DOCTYPE html><html lang=\"en\" class=\"light\" style=\"color-scheme: light;\"><body class=\"__variable_36bd41 __variable_d7dc5d font-inter ...",
    "metadata": {
      "title": "Inicio - Firecrawl",
      "description": "Firecrawl rastrea y convierte cualquier sitio web en Markdown limpio.",
      "language": "en",
      "keywords": "Firecrawl,Markdown,Data,Mendable,Langchain",
      "robots": "seguir, indexar",
      "ogTitle": "Firecrawl",
      "ogDescription": "Convierte cualquier sitio web en datos listos para LLM.",
      "ogUrl": "https://www.firecrawl.dev/",
      "ogImage": "https://www.firecrawl.dev/og.png?123",
      "ogLocaleAlternate": [],
      "ogSiteName": "Firecrawl",
      "sourceURL": "https://firecrawl.dev",
      "statusCode": 200
    }
  }
}
La API de búsqueda de Firecrawl te permite realizar búsquedas en la web y, opcionalmente, extraer (scrape) los resultados en una sola operación.
  • Elige formatos de salida específicos (Markdown, HTML, enlaces, capturas de pantalla)
  • Elige fuentes específicas (web, noticias, imágenes)
  • Busca en la web con parámetros personalizables (ubicación, etc.)
Para más detalles, consulta la Referencia del endpoint /search.
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key="fc-TU-API-KEY")

results = firecrawl.search(
    query="firecrawl",
    limit=3,
)
print(results)
Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload completo.
JSON
{
  "success": true,
  "data": {
    "web": [
      {
        "url": "https://www.firecrawl.dev/",
        "title": "Firecrawl - The Web Data API for AI",
        "description": "The web crawling, scraping, and search API for AI. Built for scale. Firecrawl delivers the entire internet to AI agents and builders.",
        "position": 1
      },
      {
        "url": "https://github.com/firecrawl/firecrawl",
        "title": "mendableai/firecrawl: Turn entire websites into LLM-ready ... - GitHub",
        "description": "Firecrawl is an API service that takes a URL, crawls it, and converts it into clean markdown or structured data.",
        "position": 2
      },
      ...
    ],
    "images": [
      {
        "title": "Quickstart | Firecrawl",
        "imageUrl": "https://mintlify.s3.us-west-1.amazonaws.com/firecrawl/logo/logo.png",
        "imageWidth": 5814,
        "imageHeight": 1200,
        "url": "https://docs.firecrawl.dev/",
        "position": 1
      },
      ...
    ],
    "news": [
      {
        "title": "Y Combinator startup Firecrawl is ready to pay $1M to hire three AI agents as employees",
        "url": "https://techcrunch.com/2025/05/17/y-combinator-startup-firecrawl-is-ready-to-pay-1m-to-hire-three-ai-agents-as-employees/",
        "snippet": "It's now placed three new ads on YC's job board for “AI agents only” and has set aside a $1 million budget total to make it happen.",
        "date": "3 months ago",
        "position": 1
      },
      ...
    ]
  }
}

Agente

El Agent de Firecrawl es una herramienta autónoma de recopilación de datos web. Solo tienes que describir qué datos necesitas, y buscará, navegará y los extraerá desde cualquier lugar de la web. Consulta la documentación de la funcionalidad Agent para ver todas las opciones.
curl -X POST 'https://api.firecrawl.dev/v2/agent' \
  -H 'Authorization: Bearer fc-YOUR-API-KEY' \
  -H 'Content-Type: application/json' \
  -d '{
    "prompt": "Find the pricing plans for Notion"
  }'
{
  "success": true,
  "data": {
    "result": "Notion offers the following pricing plans:\n\n1. **Free** - $0/month - For individuals...\n2. **Plus** - $10/seat/month - For small teams...\n3. **Business** - $18/seat/month - For companies...\n4. **Enterprise** - Custom pricing - For large organizations...",
    "sources": [
      "https://www.notion.so/pricing"
    ]
  }
}

Browser

Firecrawl Browser Sandbox ofrece a tus agentes un entorno de navegador seguro para interactuar con la web. Completa formularios, haz clic en botones, autentícate y mucho más. No necesitas configuración local ni instalar Chromium. Consulta la documentación de Browser para obtener toda la información.
# 1. Iniciar una sesión
curl -X POST "https://api.firecrawl.dev/v2/browser" \
  -H "Authorization: Bearer $FIRECRAWL_API_KEY" \
  -H "Content-Type: application/json"

# 2. Execute code
curl -X POST "https://api.firecrawl.dev/v2/browser/YOUR_SESSION_ID/execute" \
  -H "Authorization: Bearer $FIRECRAWL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "code": "await page.goto(\"https://news.ycombinator.com\")\ntitle = await page.title()\nprint(title)"
  }'

# 3. Close
curl -X DELETE "https://api.firecrawl.dev/v2/browser/YOUR_SESSION_ID" \
  -H "Authorization: Bearer $FIRECRAWL_API_KEY"
{
  "success": true,
  "id": "550e8400-e29b-41d4-a716-446655440000",
  "cdpUrl": "wss://cdp-proxy.firecrawl.dev/cdp/550e8400-...",
  "liveViewUrl": "https://liveview.firecrawl.dev/550e8400-...",
  "interactiveLiveViewUrl": "https://liveview.firecrawl.dev/550e8400-...?interactive=true"
}

Recursos

Referencia de la API

Documentación completa de la API con ejemplos interactivos

SDKs

SDKs para Python, Node.js, CLI y de la comunidad

Código abierto

Aloja Firecrawl tú mismo o contribuye al proyecto

Integraciones

LangChain, LlamaIndex, OpenAI y más