Richte Mouse ein

Wenn du Mouse hochgeladen hast, ist es Zeit, deine Suchmaschine einzurichten. Schreibe

[x-mouse]->https://deine.homepage/

in die Aneamal-Datei, wo die Suchmaschine mit Eingabefeld und Suchergebnissen residieren soll. Die Adresse deiner Homepage muss mit https oder http beginnen. Schreibe außerdem

@style: ->/aneamal/x-mouse/style.css

in dieselbe Datei, wenn du das Mouse-Standarddesign für die Suchbox nutzen möchtest.

Bei deinen ersten Suchen mit Mouse findest du kaum etwas.

Von deiner Homepage ausgehend erkundet der Mouse-Crawler deine Netzpräsenz, indem er wie ein Leser Links folgt und deine Unterseiten über das Internet abruft, um Inhalte zu analysieren und in eine Datenbank aufzunehmen. Die Datenbank legt Mouse mit anderen Dateien im Verzeichnis /aneamal/private/mouse/ an. Dieses Verzeichnis muss beschreibbar sein; ansonsten brauchst du damit nichts zu tun.

Die Datenbank aufzubauen benötigt Zeit. Etwa jede halbe Minute analysiert der Mouse-Crawler eine deiner Seiten, falls er dazu angestoßen wird. Angestoßen wird der Crawler, wenn man die Suche benutzt. Das könnte dir aber zu selten sein, insbesondere wenn du viele Seiten hast und die Suchfunktion gar nicht öffentlich machen möchtest, solange sie wenig findet. Man kann den Crawler daher auch anders auslösen:

Crawler durch Web-Cronjob auslösen

Gib in das Suchfeld ein Fragezeichen ? ein und suche danach. Du erhältst die Crawler’s URL, die etwa so aussieht:

https://example.org/aneamal/x-mouse/crawl.php?rod3nt5

Diese URL kannst du von einem Web-Cronjob-Anbieter regelmäßig aufrufen lassen – manche Anbieter machen das gratis. Bei jedem Aufruf wird eine Seite deiner Netzpräsenz für die Suchmaschine analysiert. Bei stündlicher Ausführung werden also 24 Seiten pro Tag gecrawlt, bei minütlicher Ausführung 1440 Seiten …

Crawler durch Leserbesuche auslösen

Gib in das Suchfeld ein Fragezeichen ? ein und suche danach. Du erhältst außer der Crawler’s URL eine Zeile Trigger in Aneamal, die etwa so aussieht:

@javascript: ->/aneamal/x-mouse/crawl.php?rod3nt5

Diese kannst du in deine Homepage oder eine andere oft besuchte Aneamal-Seite einfügen. Browser deiner Leser rufen dann die vermeintliche JavaScript-Datei im Hintergrund ab und stoßen dadurch den Crawler an. Vorteil: Du bist unabhängig von Cronjob-Anbietern. Nachteil: Du hast anders als beim Cronjob keine Kontrolle über die Frequenz der Auslösungen und über die Internetverbindung deiner Leser läuft eine zusätzliche Anfrage.

Crawler per Cronjob auf dem Server auslösen

Für Fortgeschrittene: Eventuell hast du die Möglichkeit, einen klassischen Cronjob im Betriebssystem deines Servers anzulegen, der PHP auf der Kommandozeile ausführt. Beim Aufruf von PHP musst du zwei Parameter angeben: den absoluten Dateinamen des Mouse-Crawlers und einen Code für den Suchbereich. Das kann ähnlich aussehen wie:

/usr/bin/php /home/www/aneamal/x-mouse/crawl.php rod3nt5

Dabei entnimmst du die hervorgehobenen Teile der Crawler’s URL, zum Beispiel:

https://example.org/aneamal/x-mouse/crawl.php?rod3nt5

Beachte, dass beim Aufruf von PHP auf der Kommandozeile anstelle des Fragezeichens ? in der Crawler’s URL ein Leerzeichen stehen muss. Lass dich gegebenenfalls beim Anlegen des Cronjobs und den richtigen Pfadangaben beraten. Sie unterscheiden sich von Server zu Server.

Nächster Schritt: Suche mit Mouse