Wissensdatenbank – Erweiterter Web-Crawler

Der Enhanced Web Crawler verleiht der HighLevel Conversation AI eine neue Leistungsstufe, indem er interaktive Websites genauso einfach erlernt wie statische Seiten. Durch das automatische Erfassen von bis zu 50 % mehr Seiteninhalten (einschließlich Tabs, Akkordeons und Lazy-Load-Bereichen) kann dein Bot mehr Fragen präziser und zuverlässiger beantworten.


INHALTSVERZEICHNIS

Was ist der Enhanced Web Crawler?
Zentrale Vorteile des Enhanced Web Crawlers
Intelligente Extraktion dynamischer Inhalte
Erweiterte Link-Erkennung
Universelle Website-Unterstützung
So nutzt du den Enhanced Web Crawler
Häufig gestellte Fragen
Verwandte Artikel


Was ist der Enhanced Web Crawler?

Der Enhanced Web Crawler ist die verbesserte Website-Import-Engine innerhalb des Bot-Trainings. Er simuliert echtes Nutzerverhalten, indem er Akkordeons öffnet, Tabs anklickt, scrollt und dynamisch geladene Inhalte sichtbar macht – um jede relevante Information deiner Website zu extrahieren.

Dieses erweiterte Wissen wird anschließend dem Trainingsdatensatz des Bots hinzugefügt – zusätzlich zu den bestehenden Crawl-Optionen Exakte URL, Domain und Pfad.


Zentrale Vorteile des Enhanced Web Crawlers

  • Tiefere Texterfassung: Extrahiert 30–50 % mehr Seiteninhalte aus modernen SPAs (React, Vue, Angular, Gutenberg usw.)

  • Erkennt versteckte Inhalte: Liest Akkordeons, Tabs, Modals, Lazy-Load- und Infinite-Scroll-Bereiche

  • Schnelle Multi-Strategie-Analyse: Führt über 12 Content-Erkennungsstrategien parallel aus

  • Sichere Interaktionslogik: Vermeidet riskante Aktionen wie Formularübermittlungen, Filteränderungen oder Warenkorb-Klicks

  • Parallele Extraktion: Reduziert die Crawling-Zeit bei großen und komplexen Websites

  • Aussagekräftige Crawl-Metriken: Erfasst Zeit, Interaktionen, Inhaltslänge und Speicherverbrauch zur Optimierung


Intelligente Extraktion dynamischer Inhalte

  • Öffnet automatisch Akkordeons, klickt durch Tabs, aktiviert Lazy-Loading und deckt versteckte Inhalte auf

  • Mehr als 2 intelligente Erkennungsstrategien (semantische Inhalte, strukturierte Daten, Metadaten) laufen parallel für maximale Geschwindigkeit

  • Sichere Interaktions-Engine verhindert störende Aktionen wie Formularübermittlungen oder Filteränderungen


Erweiterte Link-Erkennung

  • Erkennung aus mehreren Quellen: HTML-Parsing, JavaScript-Analyse und interaktionsbasierte Entdeckung

  • Findet Links, die sich hinter aufklappbaren oder dynamischen Bereichen verbergen

  • Intelligente Duplikat-Erkennung bei gleichzeitiger Beibehaltung beschreibender Linktexte


Universelle Website-Unterstützung

  • Funktioniert mit allen Website-Typen: statisches HTML, WordPress, React-SPAs, Vue- und Angular-Anwendungen

  • Schnellere Crawls durch parallele Inhaltsextraktion

  • Vollständige Transparenz durch detaillierte Metriken (Verarbeitungszeit, Interaktionen, Inhaltslänge, Speicherverbrauch)


So nutzt du den Enhanced Web Crawler

Schritt 1: Zur Knowledge Base navigieren

  1. Klicke in deinem Sub-Account auf AI Agents

  2. Öffne den Tab Knowledge Base

  3. Erstelle eine neue Knowledge Base oder bearbeite eine bestehende

  4. Klicke auf + Add Source

  5. Wähle Web Crawler

Schritt 2: Domain-Typ auswählen und Domain eingeben

Je nach gewähltem Domain-Typ wird festgelegt, wie viele URLs für das Bot-Training gecrawlt werden:

  • Exakte URL: Crawlt nur eine einzelne Seite
    Beispiel: https://www.gohighlevel.com/

  • Alle URLs mit diesem Pfad: Crawlt alle Seiten innerhalb eines Pfads
    Beispiel: https://www.gohighlevel.com/marketing

  • Alle URLs dieser Domain: Crawlt alle Seiten einer Domain
    Beispiel: https://www.gohighlevel.com/

  1. URL hinzufügen

  2. Auf Extract Data klicken

Schritt 3: Gecrawlte URLs auswählen

  1. Nach Abschluss des Crawls auf View All Pages klicken

  2. Alle URLs auswählen oder einzelne Seiten per Checkbox markieren

  3. Auf Train Bot klicken

Häufig gestellte Fragen

F: Was bedeutet „intelligentere Inhaltserkennung“?
Der Crawler erfasst jetzt bis zu 5,2-mal mehr Website-Inhalte, darunter Testimonials, Features, Kontaktdaten und Servicebeschreibungen, die zuvor häufig übersehen wurden.

F: Wie zuverlässig ist das Training mit dem neuen Crawler?
Die Erfolgsquote stieg von 81,6 % auf 94,7 % – über Business-, E-Commerce- und interaktive Websites hinweg.

F: Muss ich etwas konfigurieren, um wichtige Bereiche zu extrahieren?
Nein. Über 6 parallele Erkennungsstrategien identifizieren automatisch Hero-Bereiche, Testimonials, Produktbeschreibungen, Team-Profile, Preislisten und Kontaktdaten.

F: Kann der Crawler interaktive oder versteckte Inhalte lesen?
Ja. Er öffnet Akkordeons, navigiert durch Tabs und macht Lazy-Load-Inhalte sichtbar.

F: Welche strukturierten Daten werden extrahiert – und warum ist das wichtig?
Der Crawler erfasst 94 % mehr strukturierte Daten (Öffnungszeiten, Kontaktdaten, Preise, Services), was der KI ein deutlich besseres Verständnis deines Unternehmens ermöglicht.

F: Klickt der Crawler auf Checkout-Buttons oder sendet Formulare ab?
Nein. Die sichere Interaktions-Engine ignoriert Formulare vollständig.

F: Was passiert bei Login-geschützten Inhalten?
Es werden nur öffentlich zugängliche Inhalte gecrawlt. Inhalte hinter Logins werden nicht erfasst.


Verwandte Artikel

  • Conversation AI einrichten

  • Conversation AI Bot – erklärt

  • Erweiterte Einstellungen – Conversation AI

  • Conversation AI – Übergabe an menschlichen Agenten


War dieser Artikel hilfreich?