De:Index-Import

Aus YaCyWiki
Wechseln zu: Navigation, Suche
Index Import

Der Index-Import beschreibt den Vorgang, eine Kelondro-Datenbank derer eines anderen YaCy komplett hinzuzufügen. Neben dem Index-Import gibt es noch den Index-Transfer, welcher das gleiche Ziel hat, jedoch einen anderen Weg beschreitet. Der Index-Import ist ausschließlich für die Integration einer DB gedacht, auf die lokal zugegriffen werden kann, wohingegen sich der Index-Transfer des YaCy-Netzes bedient.

Der Index-Import greift direkt über das Dateisystem des laufenden Peers auf die zu importierende Datenbank zu und importiert Wort für Wort aus der Fremden in die eigene DB. Die zu importierende DB wird bei diesem Prozess, der sich aufgrund der Komplexität von Kelondro mehrere Tage lang hinziehen kann, immer kleiner, bis sie vollständig in die eigene DB übertragen wurde.

Die Möglichkeit eine lokal vorhandene Datenbank zu importieren ist seit der SVN-Version 968 fester Bestandteil YaCys.

Start des Index-Imports

Der Import wird über die HTML-Seite "IndexImport_p.html" des YaCy-HTTP-Servers initiiert; sollte YaCy also auf dem lokalen Rechner und Port 8090 laufen, so lautet die URL zum Starten des Index-Imports http://localhost:8090/IndexImport_p.html. Hier muss nun der (Betriebssystem-spezifische) Pfad zu der zu importierenden Datenbank angegeben werden, welche in "DATA" im Unterordner "PLASMADB" liegt.

Wurde YaCy beispielsweise nach "C:\Programme\YaCy" installiert und dessen Datenbank soll importiert werden, so lautet der bei "Import Path" einzugebende Pfad: "C:\Programme\YaCy\DATA\PLASMADB".

ACHTUNG: Bevor der Index-Import gestartet wird, muss sichergestellt werden, dass die zu importierende Datenbank während des gesamten Prozesses nicht von einem anderen YaCy benutzt oder geändert wird!

HINWEIS: Der Index-Import kann jederzeit manuell über das Webinterface ohne Verlust von Daten gestoppt werden, dies ist bei einem Herunterfahren von YaCy ohne vorheriges explizites Stoppen des Index-Imports jedoch nicht gewährleistet. Sowohl auf der Eigenen als auch der anderen DB können dadurch Schäden entstehen.

Es kann bei dieser Methode vorkommen, dass nach schon kurzer Zeit ein Großteil aller URLs aus der anderen DB importiert sind, während die Anzahl der Wörter deutlich dahinter bleibt. Dieses Phänomen bedingt sich durch den Aufbau der Datenbank, in welcher zu einem Wort viele URLs gespeichert werden. Für eine genauere Erläuterung, siehe De:Kelondro.