De:FAQ

Aus YaCyWiki
Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

Allgemein

Worum geht es?

YaCy ist eine verteilte Suchmaschine, die auf einem Peer-To-Peer-Netzwerk basiert.

Was ist ein Proxy?

Ein Proxy (von engl. „proxy representative“ = Stellvertreter, bzw. lat. „proximus“ = der Nächste) ist eine Kommunikationsschnittstelle in einem Netzwerk. Er arbeitet als Vermittler, der auf der einen Seite Anfragen entgegennimmt, um dann über seine eigene Adresse eine Verbindung zur anderen Seite herzustellen - Quelle: Wikipedia.
YaCy ist ein sogenannter Caching-Proxy. Bei diesem werden aufgerufene Elemente (Grafiken, HTML-Dateien etc.) zwischengespeichert. Beim erneutem Aufrufen dieser Elemente werden diese aus dem Proxy-Cache geladen. Dadurch wird die Netzwerklast verringert und die Anfragen können schneller bearbeitet werden. Weitere Informationen zu dem in YaCy enthaltenen Proxy sind in dem Artikel YaCy Proxy enthalten.

Was bedeutet indexieren?

Indexieren bedeutet, eine Webseite in die darin enthaltenen Wörter aufzuteilen. Diese Wörter werden zusammen mit der URL der Webseite in einer Datenbank gespeichert. Wenn man dann nach diesen Wörtern sucht, können alle Webseiten, die diese Wörter enthalten, schnell gefunden werden.

Was ist eine DHT?

DHT ist das Akronym für Distributed Hash Table (verteilte Hashtabelle). Eine DHT ist die Datenstruktur, in welcher der Index eines YaCy Suchnetzes organisiert ist. Mit dieser Datenstruktur wird das Problem gelöst, dass YaCy bei der Suche sehr schnell herausfinden muss, auf welchem Peer sich der für die Suchbegriffe benötigte Teil des Index befindet. Eine ausführliche Beschreibung findet sich bei Wikipedia.

Was heißt crawlen?

Ein sogenannter Crawler beginnt mit einer Seite und folgt dann allen Links bis zu einer bestimmten Tiefe (manchmal auch unbegrenzte Suchtiefe). Das ist die Methode, die die meisten herkömmlichen Suchmaschinen verwenden um Inhalte zu erschließen. Über diesen Weg kann eine komplette Web-Seite indexiert werden, ohne alle Unterseiten einzeln zu besuchen.

Was ist ein P2P Netz?

P2P heißt Peer-to-Peer. Das bedeutet, dass die Rechner (Peers) nicht von einem zentralem Server abhängen, sondern gleichberechtigt ein Netzwerk bilden.

Was ist ein Peer?

Als Peer (engl. für „Gleichgestellter“, „Ebenbürtiger“) wird ein Endpunkt einer Kommunikation in einem Computernetzwerk bezeichnet. Jeder Peer bietet dabei seine Dienste an und nutzt die Dienste der anderen Peers. (Quelle: wikipedia) In YaCy wird als Peer eine YaCy Instanz bezeichnet, welche mit einem YaCy Suchnetz verbunden ist.

Was ist der RWI?

RWI ist das Akronym für Reverse Word Index. Dieser wird vom Indexer aus den gesammelten Daten erzeugt und in der Datenbank abgespeichert.

Ist P2P nicht illegal?

Nein.
P2P (Peer-to-Peer) beschreibt nur die Technik, wie die Computer untereinander die Daten austauschen. Hierbei kommt es auf die Daten an, die über ein solches Netzwerk ausgetauscht werden. Nur weil man über P2P-Tauschbörsen illegal Dateien tauschen kann, ist die dafür verwendete Technik nicht auch illegal. Zudem ist YaCy keine P2P-Tauschbörse.

YaCy Allgemein

Was hat es mit globalem und lokalem Index auf sich?

Sobald man den Proxy verwendet, wird automatisch mit den indexierten Daten ein lokaler Index erstellt. Erst wenn das Programm eine Verbindung zum YaCy-Netz hat, kann man auf den globalen Index zugreifen. Dieser ist sozusagen die Kombination aller lokalen Indexe.

Ich bin kein Techniker. Kann ich YaCy leicht installieren und damit meine eigenen (internen) Web Seiten indexieren?

Die Installation von YaCy ist sehr einfach. Es werden weder Fachwissen noch zusätzliche Software benötigt, ebenso wenig muss eine extra Datenbank installiert werden. Das Indexieren der eigenen Webseiten ist ebenfalls sehr einfach: Einfach crawlen und die DHT Distribution und DHT Receive ausschalten, um den Index der eigenen Seite auf dem eigenen Peer zu belassen.

Kann ich mit YaCy einen Crawl starten und Internet Seiten indexieren?

Ja. Es kann ein eigener Crawl gestartet werden und es ist auch möglich, einen verteilten Crawl zu starten. Das bedeutet, dass der eigene YaCy Peer andere Peers mit speziellen Crawl Aufträgen beauftragt. Dies kann durch eine grosse Anzahl von Parametern für einen limitierten Satz an Webseiten beeinflusst werden.

Gibt es einen Zentralserver? Braucht das Suchnetzwerk einen?

Nein. Die YaCy Netzwerkstruktur benötigt keinen zentralen Server und es gibt auch keinen. Es gibt aktuell vier sogenannte seed-list Server, welche hart in den Sourcecode geschrieben wurden, da sie die höchstverfügbaren Server sind und sehr akkurate Seed List Informationen bieten (weitere Details in der FAQ).

Suchmaschinen brauchen viele Terabytes an Speicherplatz, nicht wahr? Wieviel Speicher brauche ich auf meiner Maschine?

Der globale Index ist verteilt, aber nicht zu den einzelnen Peers kopiert. Wenn Sie YaCy benutzen, brauchen Sie im Schnitt dieselbe Menge an Speicher für den Index wie für den Cache. Tatsächlich mag der globale Speicherplatz für den Index in die Terabytes gehen, aber längst nicht alles auf Ihrer Maschine!

Brauche ich eine schnelle Maschine? Suchmaschinen brauchen große Server Farmen, oder nicht?

Sie brauchen keine schnelle Maschine für YaCy. Sie brauchen auch nicht viel Speicherplatz. Sie können die Speichermenge konfigurieren, die Sie für Cache und Index verwenden wollen. Jede zeitkritische Aufgabe wird automatisch verzögert und erst dann ausgeführt, wenn Sie entspannt surfen (dies funktioniert nur, wenn Sie YaCy als http Proxy benutzen).

Wie lange dauert eine Suche?

Wie lange eine Suche dauert, hängt von mehreren Faktoren ab. Einer dieser Faktoren ist, ob Sie eine ausschließlich lokale Suche or eine globale DHT-basierte Suche ausführen. Weiterhin hängt die Dauer davon ab, ob Sie Suchheuristiken verwenden. Ein dritter und wichtiger Faktor ist, ob Sie nach dem Suchbegriff bereits vor kurzer Zeit gesucht haben, denn in diesem Fall könnte die Suche noch zwischengespeichert sein. Ein weiterer Faktor ist, ob der Parameter verify=true verwendet wird. Falls dies der Fall ist, wird der geladene HTML Schnipsel überprüft, sprich nochmal neu geladen. Wenn Sie verify=false verwenden, mag es Ihnen weniger genaue (womöglich falsche) Resultate liefern, aber die Suche wird viel schneller sein.

Grundsätzlich sieht die Architektur von YaCy kein Springen von Peer zu Peer vor, und sie hat auch keine TTL (Gültigkeits- oder Lebensdauer). Es wird erwartet, dass Suchergebnisse sofort zum Anfragenden geschickt werden. Das kann erreicht werden, indem der Peer, der den benötigten Index besitzt, direkt gefragt wird. Möglich wird das, indem DHTs (verteilte Hash Tabellen) genutzt werden. Da YaCy jedoch ein wenig Redundanz benötigt, um fehlende Peers zu ersetzen, fragt es mehrere Peers gleichzeitig. YaCy wartet eine kleine Weile auf deren Antworten, höchstens sechs Sekunden (standardmäßig, Sie können das ändern).

Muß ich eine separate Datenbank installieren und einrichten?

Nein. YaCy enthält eine eigene Datenbank, die keine weitere Einrichtung benötigt.

Welche Art von Datenbank wird benutzt? Ist sie schnell genug?

In der Datenbank werden entweder Tabellen oder Eigenschaftslisten in Dateien mit der Struktur von AVL-Bäumen (höhenregulierte binäre Bäume) gespeichert. Solch ein Suchbaum stellt die logarithmische Größenordnung der Berechnungszeit sicher. Beispielsweise braucht eine Suche innerhalb eines AVL-Baumes mit einer Millionen Einträgen im Durchschnitt 20 Vergleiche, 24 im schlechtesten Fall. Diese Datenbank ist demnach extrem schnell. Sie unterstützt zwar keine API wie SQL oder das LDAP Protokoll, aber das braucht sie auch nicht, weil sie hochspezialisierte Datenbankstrukturen bereit stellt. Die fehlende Schnittstelle wird durch den sehr kleinen Organisationsaufwand, der die Geschwindigkeit im Vergleich zu anderen Datenbanken mit SQL oder LDAP API noch weiter steigert, mehr als wettgemacht. Die Datenbank ist schnell genug für Millionen von indexierten Webseiten, vielleicht sogar Milliarden.

Warum wird eine eigene Datenbank benutzt? Warum nicht mySQL oder openLDAP?

Die Datenbankstruktur, die wir brauchen, ist sehr speziell. Eine Forderung ist, dass die Einträge in logarithmischer Zeit gelesen und in beliebiger Reihenfolge eingetragen werden können. Eintragung in einer bestimmten Reihenfolge wird gebraucht, um Verknüpfungen von Tabellen sehr schnell zu erstellen. Dies wird gebraucht, wenn jemand nach mehreren Wörtern sucht. Wir implementieren die Suchwort Verknüpfung durch paarweise und simultane Eintragungen/Vergleiche von Index Bäumen/Sequenzen. Das zwingt uns, binäre Bäume als Datenstruktur zu nutzen. Weiterhin benötigen wir die Möglichkeit, sehr viele Index Tabellen zu verwalten, vielleicht sogar Millionen Tabellen. Im Schnitt mögen diese Tabellen nicht besonders groß sein, aber wir brauchen sehr viele davon. Das steht im Widerspruch zur Organisation von relationalen Datenbanken, die auf sehr große Tabellen ausgerichtet sind anstatt auf sehr viele. Die dritte Forderung ist die Einfachheit der Installation und Wartung. Der Benutzer soll nicht gezwungen werden, erst ein Datenbankmanagementsystem zu installieren und sich um technische Details zu kümmern. Die integrierte Datenbank ist komplett wartungsfrei.

Was hat es mit globalem und lokalem Index auf sich?

Sobald man den Proxy verwendet, wird automatisch mit den indexierten Daten ein lokaler Index erstellt. Erst wenn das Programm eine Verbindung zum YaCY-Netz hat, kann man auf den globalen Index zugreifen. Dieser ist sozusagen die Kombination aller lokalen Indexe.

Was heißt Junior, Senior, Virgin und Principal Status?

Der Status virgin heißt, dass YaCy noch keinen Kontakt zum Netzwerk hat. Man ist also sozusagen offline. Es kann nur der lokale Index durchsucht werden.

Der Status junior heißt, dass man selber Kontakt zum YaCy-Netz hat. Andere Peers können einen aber nicht kontaktieren. Eine Ursache dafür kann eine Firewall sein. Auch hier kann nur der lokale Index durchsucht werden.

Den Status senior hat man, wenn man eine Verbindung zum YaCy-Netz hat und zusätzlich andere Peers einen erreichen können. Es kann der lokale und globale Index durchsucht werden.

Ein principal ist ein senior, der ergänzend eine Peer-Liste auf einem Server hochlädt. Diese Liste unterstützt andere Peer während des Startvorgangs, um mit dem bestehend YaCy-Netz eine Verbindung aufzunehmen.

Generell sollte man den senior-Status anstreben. Nur so läßt sich YaCy in vollem Umfang nutzen. Wenn man eine Möglichkeit hat, eine Datei auf einen FTP-Server zu laden, dann kann man auch principal werden, und so dem Netz helfen.

Und wieso sollte ich meinen Peer im Senior-Modus betreiben?

Manche P2P-Programme behandeln Peers, die nichts beisteuern, mit sehr geringer Priorität. Wir halten das nicht in jedem Fall für gerecht, da der Betreiber nicht immer in der Lage ist, die Firewall zu öffnen oder den Router anders zu konfigurieren. Unsere Vorstellung von 'Informationswaren' und ihrem Austausch kann auch auf Junior-Peers angewendet werden: Sie müssen zum globalen Index beitragen, indem sie ihren Index aktiv einreichen. Senior-Peers hingegen tragen passiv bei. Dadurch brauchen wir Junior-Peers keine geringe Priorität zu geben: sie tragen gleichermaßen bei, also dürfen sie auch gleichermaßen teilhaben. Doch damit diese Architektur funktioniert, brauchen wir Senior-Peers. Da jeder Peer fast gleich viel beiträgt, ob aktiv oder passiv, sollten Sie ihren Peer möglichst im Senior-Modus laufen lassen.

Mein Peer läuft im 'Junior-Modus'. Wie kann ich ihn im 'Senior-Modus' laufen lassen?

Öffnen Sie in Ihrer Firewall den Port 8090 (den Port, auf dem YaCy lauscht), oder richten Sie auf Ihrem Router eine Portweiterleitung von diesem Port zu Ihrem Computer ein.

Gefährdet YaCy nicht meine Privatsphäre?

YaCy beachtet die Privatspähre der Benutzer. Alle Seiten, die beim Laden GET- bzw. POST-Paramter, Cookies oder Passwortschutz verwenden, werden vom Indexieren ausgenommen. Es werden also nur Seiten indexiert, die auch ohne Passwort geladen werden können. Genaue Erläuterungen zur Technik: [[1]]

Können denn andere Leute mein Surfverhalten herausfinden?

Es besteht keine Möglichkeit abzufragen, welche Seiten alle auf einem Peer gespeichert sind. Über eine Suche besteht nur die Möglichkeit, die gespeicherten Seiten zu einem bestimmten Wort zu ermitteln. Die Wörter werden mit Hilfe von Distributed Hashtables (DHT) über die Peers verteilt. So vermischen sich die Daten aller Benutzer. Damit kann das Surfverhalten eines bestimmten Beutzers nicht nachvollzogen werden.

Die YaCy Seite lädt nicht.

Die Standard-Seite ist http://localhost:8090. Wenn der Internet-Explorer verwendet wird, muss die URL mit http:// beginnen. Wurde während der Konfiguration eine anderer Port ausgewählt, muss die 8090 durch den neuen Port ersetzt werden. Außerdem sollte natürlich YaCy laufen ;-). Ein weiterer Grund können fehlerhaft konfigurierte Proxy-Einstellungen sein, achten Sie immer darauf, dass der Proxy für lokale Adressen umgangen/nicht benutzt wird.

YaCy hat ja ganz andere Ergebnisse als Google!

Sicher hat YaCy andere Ergebnisse als Google. Im Moment hat YaCy zu wenig Peers, um genauso viele Ergebnisse wie Google zu liefern. Gerade deshalb ist es wichtig, dass möglichst viele Leute einen eigenen Peer betreiben. Aber auch wenn YaCy genug Peers hat, wird es trotzdem andere Ergebnisse als Google liefern. Schließlich soll es besser als Google werden, nicht ein zweites Google.

Ich kann YaCy nicht deinstallieren, weil es noch läuft.

Sehen Sie zuerst nach, ob YaCy noch gestartet ist. Falls nicht, kann es sein, dass YaCy nicht ordentlich beendet wurde. In diesem Fall einfach YaCy noch einmal starten, dann deinstallieren. Alternativ die Datei yacy.running im Ordner yacy/DATA/ löschen, dann deinstallieren.

Wie kann ich helfen?

Zunächst einmal: Lassen Sie YaCy im Senior Modus laufen. Das hilft, den globalen Index zu bereichern und YaCy attraktiver zu machen. Sie sind ebenfalls willkommen, sich an der Entwicklung zu beteiligen, aber bitte kontaktieren Sie erst den Autor und besprechen Sie Ihre Idee und wie sie in die generelle Architektur passen könnte. Sie können helfen, indem Sie uns einfach Feedback oder neue Ideen geben und indem Sie anderen Leuten von dieser Software erzählen. Wenn Sie einen Fehler finden oder eine Ausnahmemeldung sehen, wäre Ihr Fehlerbericht willkommen. Jedes Feedback ist willkommen!

Technik

Irgendetwas geht bei mir nicht. Was mache ich jetzt?

Da YaCy sich derzeit noch in Entwicklung befindet, sollte eine aktuelle stabile Version benutzt werden. Diese kann auf der Homepage http://www.yacy.net heruntergeladen werden. Tritt der Fehler immer noch auf, sollten das Wiki und das Forum http://forum.yacy-websuche.de nach bekannten Problemen zur Fehlermeldung durchsucht werden. Ist der Fehler bisher unbekannt, kann eine weitere Hilfe im Forum erfolgen. In diesem Beitrag im Forum sollten die Versionsnummer von YaCy und eine detallierte Fehlerbeschreibung enthalten sein. Auch helfen Ausschnitte aus den LOG-Dateien weiter.

Yacy startet nur einmal und verweigert dann den Dienst?

Hast Du unter http://localhost:8090/Performance_p.html unter Für JVM reservierter Speicher den Speicherwert erhöht? Dann setze in der Datei /DATA/SETTINGS/yacy.conf die Werte javastart_Xmx=Xmx600m und javastart_Xms=Xms600m, speichere die Datei und starte erneut.

Wie kann ich Tor- oder Freenetseiten indexieren?

Das Indexieren von Tor- oder Freenetseiten wird bewusst zum Teil im Sourcecode verhindert, da es im jetzigen Stadium der Entwicklung von YaCy nicht erwünscht ist, derartige Seiten zu indexieren. Es ist jedoch geplant zukünftig das Crawlen solcher Seiten zu ermöglichen, allerdings werden dann vermutlich die Crawl-Ergebnisse nicht global verteilt, sondern stehen nur dem jeweiligen Peer zur Verfügung.

Wie bekomme ich den Index von einem Peer zu einem anderen?

Dies geschieht eigentlich automatisch durch die DHT-Verteilung der Wörter. Jedoch gibt es auch die Möglichkeit, den gesamten Index auf einen anderen Peer zu übertragen. Dies kann entweder durch einen sogenannten Index-Transfer oder einen Index-Import geschehen.

Welche Datentypen / Mime-Types werden von YaCy indexiert?

Per default werden von YaCy nur Html- und Text-Dateien, also Dateien mit den MimeTypes

  • text/plain
  • text/html
  • application/xhtml+xml

indexiert. Um auch andere Datei-Typen zu indexieren, kann man sich die optionalen Erweiterungen zu YaCy ruterladen und installieren. Dieses Zusatzpaket enthält neben anderen nützlichen Features zusätzliche Content Parsers für PDF, Doc, Rtf, Rss und andere Formate. Eine vollständige Liste der unterstützten Formate findet sich hier.

Werden bereits indexierte Seiten (zb via DHT getauschte usw) automatisch reindexiert nach X Jahren/Tagen?

Leider nein. Es gibt aber die Möglichkeit, ein chronologisch auszuführendenes Recrawl fuer die URL (oder gesamte Webseite, wenn gewünscht) einzustellen. Mehr dazu unter "Index Control -> Index Creation".

Sind DHT Einträge in einem Suchnetz einmalig oder können URLs auch doppelt/dreifach vorkommen?

Sie sollen sogar mehrfach vorkommen, damit beim Wegbleiben eines Peers dessen Teil am Suchindex nicht verloren ist. Die Indexdaten werden also auf mehreren Peers redundant vorgehalten.

Wie kann ich das Connection Timeout ändern?

Dies kann über die Konfigurationsseite "Admin Konsole"->"Erweitertes Verhalten" http://localhost:8090/ConfigProperties_p.html gemacht werden. Einfach nach dem Property mit dem Namen "clientTimeout" suchen und den dortigen Wert ändern. Der Timeout wird in Millisekunden angegeben.

Nach der Wertänderung einen Neustart von YaCy nicht vergessen.

Alternativ dazu kann die Konfiguration auch über das Config-File httpProxy.conf im Verzeichnis DATA/SETTINGS geändert werden. Wird diese Art der Konfiguration gewählt sollte YaCy allerdings zuvor schon beendet worden sein.

Der YaCy Bot crawlt meine Seiten. Was soll ich tun?

Um zu verhindern, dass der YaCy Bot einen Webauftritt crawlt, kann eine robots.txt Datei mit dem folgendem Inhalt erstellt werden:

User-Agent: yacy
Disallow: /

Der Bot selber kann nicht beeinflusst werden, da dieser von einem YaCy Benutzer, und nicht zentral vom YaCy Projekt gestartet wurde.

Ich kann mich nicht mehr einloggen. Wie kann ich mein Passwort zurücksetzen?

Bei verlorenem Passwort kann man dieses resetten oder auch ganz neu setzten.

Passwort setzen während YaCy läuft

Das ist die einfachste Methode, YaCy muss dafür nicht heruntergefahren werden

  • benutze eine Linux-Kommandozeile und logge dich im Account ein, unter der YaCy läuft
  • führe aus: <yacy-app>/bin/passwd.sh <neues-passwort>

Das ändert das Passwort zum Administrations-Account 'admin'.

Passwort setzen während YaCy nicht läuft

Dazu in der Datei <yacy-app>DATA/SETTINGS/yacy.conf folgende Änderungen machen:

  • Eintrag serverAccountBase64MD5 entfernen
  • Eintrag adminAccount entfernen (falls vorhanden)
  • Eintrag serverAccount auf <account>:<password> setzten, also beispielsweise serverAccount=admin:mysecretpassword

Beim nächsten Neustart wird diese Account/Passwort-Kombination gelesen, verschlüsselt und wieder aus yacy.conf gelöscht, damit diese Info nirgends als Klartext lesbar ist.

Jetzt kann über das Webinterface ein neues Passwort gesetzt werden.

YaCy nach einem PC-Absturz kaputt, was kann ich machen?

ähnlich wie im Thread Datenbank scheinbar kaputt, kann ich sie reparieren? war die YaCy-Webseite http://localhost:8090/ bei mir nach einem PC-Absturz nicht mehr erreichbar. Ich habe - weil ich müde war und keine Zeit gehabt habe in die Fehleranalyse einzusteigen - dann ganz stupide mehrmals - vlt. bis zu 3-4 Mal:

  1. YaCy gestartet
  2. YaCy beendet

Jetzt funktioniert YaCy wieder. Manchmal helfen auch YaCy's selbstheilende Kräfte wie es aussieht :-) . Da ich erst jetzt auf die Idee gekommen bin, dass die Log-Dateien evtl. interessant sein könnten, um zu klären, wie die selbstheilende Kräfte wirken, enthalten die älteste Log-Dateien leider die Einträge mit Selbstheilung nicht mehr. Und obwohl ich selbstverständlich lieber ohne PC-Abstürze auskommen würde, werde ich nach der nächsten erfolgreichen Selbstheilung in die Logs reinschauen und hier berichten.

Frage an die Entwickler - gibt es Möglichkeit, zuverlässig zu klären, ob die Selbstheilung YaCy komplett wiederhergestellt hat? Sowas wie rundum-Gesundheitscheck mit Gesundheitsbescheinigung? Der Patient kann sich beim Arzt bzw. der Ärztin auch persönlich vorstellen - ich kann die YaCy-Öffentliche Adresse auf Anfrage mitteilen. Nach Absprache kann ich sogar in einer remote-Sitzung einen Einblick mit Admin-Ansicht geben.

Wichtig! Das mit der Selbstheilung ist bei mir an einem Tag mehr als einmal vorgekommen. Angaben zum System:

YaCy version 1.73/9284,
Windows 7 Home Premium SP1 32 Bit

Speicherplatz

Wie kann ich die Dateigrösse der zu herunterladenden Dateien begrenzen?

Die Dateigrösse kann man unter Erweiterte Einstellungen->Crawler Einstellungen vornehmen. Dabei können für HTTP und FTP verschiedene Größen angegeben werden. Die Dateigröße wird in Byte angegeben. Einen Umrechner findet man unter Bit und Byte (Bits and Bytes)

Wieviele Links/Wörter kann eine YaCy Instanz verwalten und wieviel Plattenplatz benötigt das?

Die Anzahl der speicherbaren Links/Wörter ist prinzipiell unbegrenzt, jedoch wird die Anzahl durch eine Verlangsamung des Indexierungsprozesses mit anwachsender Link/Wort-Zahl begrenzt. Es gibt Benutzer mit mehr als 10 Millionen Webseiten in einer YaCy-Instanz. Der für den Index einer Webseite notwendige Platz hängt auch von Größe und Art des Dokumentes ab. Bei 10 Mio Webseiten ist eine Indexgröße von 20GB nicht untypisch.

Kann ich die Größe des Indexes auf meiner Platte begrenzen?

Momentan nicht. Begrenzung bedeuten automatisch Löschung, was von den meisten User noch weniger gefordert wird als Begrenzung. Die Indexgröße stellt bei aktuell verfügbaren Plattenplatz kaum ein Problem dar.

FAQ Wunschliste / TODO

Fragen die noch aufgenommen werden sollten ...

  • Warum gibt es keine mySQL Unterstützung für YaCy?
  • Man sollte den Speicherplatz nachträglich, bzw. generell ändern können.

Flag-england.gif There is an english version of this page.

Flag-france.gif Il y a une version française de cette page.

Icon work.png TODO: english and german FAQ have too many differences.