Last Updated on 2 Jahren by TmoWizard
Werte Leserinnen und Leser,
Skeptiker gibt es ja überall. Natürlich ist da der kleine Kreis hier auf dem Castle nicht ausgeschloßen, deswegen habe ich mich zum Jahresabschluß für dieses bebilderte Tutorial entschlossen! Dazu eines gleich mal vorne weg:
Ich gehe hier davon aus, daß YaCy bei euch bereits auf einem Server läuft. Das Einrichten selbst ist dann relativ einfach.
Trotzdem möchte ich hier noch einmal auf meine beiden Tutorials dazu hinweisen, das macht die Sache etwas einfacher:
- Ubuntu-Tutorial: Wie installiere ich einen Ubuntu-Server?
- P2P-Tutorial – YaCy und HTTPS: Die sichere Suchmaschine!
Dazu gleich folgender Hinweis:
Ein Principal Peer gehört nicht auf einen Arbeitsrechner, welcher in der Früh eingeschaltet und am Abend wieder ausgeschaltet wird! Er benötigt nicht nur eine Menge Rechenleistung, sondern empfängt und verteilt nebenbei auch den gemeinsamen Index! Er sollte also 24/7 durchlaufen wie es sich eben für einen Server gehört.
YaCy: Der eigene Principal Peer
Man kann YaCy ja auf verschiedene Arten verwenden, am einfachsten als Junior Peer. Hierbei wird YaCy installiert und einfach nur als Suchmaschine wie jede andere verwendet, es muß nichts weiter eingestellt werden. Das geht dann auch auf einem einfachen Arbeitsrechner, welchen man täglich verwendet. Allerdings trägt man damit relativ nichts zu Erweiterung des Index bei, über schlechte Suchergebnisse sollte man sich also besser nicht beklagen, das bestätigt nur die eigene Dummheit!
Oft genug liest man im Internet die Meldungen, daß man mit YaCy nichts findet und man es wieder versucht, wenn der Index größer ist. Wenn alle so denken würden, dann hätte YaCy wohl heute noch einen kleineren Index wie ich ihn inzwischen habe! Ja wo soll der Index denn bitte herkommen, wenn keiner die Seiten indexiert bzw. crawlt?🤦🏻
Hier kommt nun der Senior oder wie bei mir der Principal Peer in’s Spiel, aber wie gesagt sollte man dafür ein eigenes Gerät verwenden. Das könnte dann zum Beispiel so aussehen wie bei mir:
Das ist ein nicht mehr ganz neuer Rechner mit einem Intel Pentium Dual-Core und 6 GB RAM, also wirklich nichts besonderes für heutige Verhältnisse. Es läuft ja nur YaCy darauf, somit genügt der Rechner. Ach ja: Nein, das ist nicht mehr der im Tutorial erwähnte Rechner, der hat nämlich vor einiger Zeit die Grätsche gemacht und sich in’s Computer-Nirvana verzogen.
Zwischen dem Hocker und dem nicht mehr ganz neuen Computertisch steht dann mein Arbeitstier mit externem DVD-Brenner (das Teil mit dem Foto aus MATRIX), der Rest ist unwichtig. Nach der Installation des Servers und YaCy geht es aber eben auf dem Arbeitstier weiter, denn wirklich sämtliche Einstellungen von YaCy geschehen im Browser! Dazu benötigt man natürlich die IP-Adresse des Servers, man will ja darauf zurückgreifen.
Übrigens bestätigt YaCy die Blödheit mancher Webdesigner, das funktioniert nämlich mit jedem Browser (allerdings wohl nicht mobil!)! Es ist tatsächlich wieder soweit, daß manche dieser Verbrecher ihre Websites speziell für Chrome/Chromium anpassen. Andere Browser wie der Firefox oder gar SeaMonkey werden dort schlicht nicht funktionieren, mich als Nutzer von SeaMonkey werden solche Websites aber auch nie wieder sehen!
Die brauchen mich nicht? Gut, ich brauch die Deppen auch nicht!
Da ich wie geschrieben davon ausgehe, daß YaCy bereits auf dem eigenen Server läuft könnte das Ganze ungefähr so aussehen:
Wie ihr seht entstehen die Screenshots nebenbei, sind also aktuell! Für alle Skeptiker hier noch zwei weitere Screenshots mehr oder weniger als Beweis, daß YaCy nicht auf meinem Arbeitstier läuft:
Leider hat das nicht auf einen Screenshot gepaßt, deswegen sind das zwei Bilder geworden. Mein Arbeitstier hat 6 Kerne, nicht nur 2 wie der „Server“!
Kommen wir nun also zu den Innereien von YaCy, der Anfang ist dabei relativ einfach. Auf der Suchseite seht ihr oben rechts den Button „Administration“, darauf dürft ihr jetzt mal klicken. Wenn ihr YaCy zum ersten mal verwendet, dann werdet ihr wie im Tutorial beschrieben nach dem Benutzernamen und dem Paßwort gefragt. Wie erwähnt ist das also „admin“ und das Paßwort bleibt leer … nicht unbedingt sicher, aber wir richten den Peer ja gerade erst ein!
Oben links steht da nun der Punkt „Use Case & Account“, obwohl YaCy ja ein deutsches Produkt ist. Diesen wählt man an und bekommt folgendes zu sehen:
Ich habe hier bereits auf „Deutsch“ umgestellt, sonst würde ich mit meinen geringen Kenntnissen der englischen Sprache wohl durchdrehen! 🤯Den zweiten Punkt lassen wir so (Gemeinschafts-basierte Web Suche), wir wollen ja eine richtige Suchmaschine. Ich muß hier dann weiter runter scrollen, damit ich zu den Punkten 3 und 4 komme:
Wie im Tutorial erwähnt gibt man seiner Suchmaschine bei Punkt 3 nun einen Namen, während man bei Punkt 4 die Sicherheitslücke UPnP deaktiviert und SSL aktiviert. Ich bin hier ja wie man weiter oben sieht bereits mit SSL unterwegs, also per https verbunden. Hierbei *kann* es passieren, daß verschiedene Browser das Zertifikat nicht mögen. Es wäre dann an der Zeit, auf einen moderneren und halbwegs aktuellen Browser zu wechseln! Wie man bei mir sieht hat SeaMonkey damit kein Problem, Chrome/Chromium so wie alle darauf basierenden Browser und Firefox natürlich ebenfalls nicht.
Nun könnt ihr noch oben in der „Benutzerverwaltung“ einen entsprechenden Benutzer für euch erstellen, also einen entsprechenden Namen und ein sicheres Paßwort dazu (Zugriff nur mit berechtigtem Konto). Es kann zwar eigentlich außer euch eh keiner auf den Peer zurückgreifen, aber sicher ist sicher! Dann geht es weiter mit den „Netzwerk Einstellungen“, da wir einen Principal Peer wollen stellen wir das so ein:
Damit sagt ihr eurem Peer, daß er nun Teil des großen Netzwerks und ein „Senior Peer“ ist. Wir kommen unserem Ziel also langsam näher, aber auf dieser Seite gibt es ganz unten noch eine Einstellung:
Mit dem Auswählen diese Punktes stellen wir sicher, daß sich die Peers untereinander mit HTTPS verbinden, also eine verschlüsselte Verbindung verwenden!
Linker Hand seht ihr den Abschnitt „Administration“, dort wählt man jetzt den Punkt „System Administration“:
Daraufhin erscheint folgendes:
Hier klickt man auf „Seed Upload Einstellungen“, um zu den folgenden Einstellungen zu kommen:
Hier kommt es nun auf eure eigene Situation an, was ihr verwenden wollt oder könnt. Ich habe mich hier für den ersten Punkt entschieden, da man damit auch mit verschiedenen Rechner darauf zugreifen kann. Wenn ihr das nicht wollt wäre wohl der letzte Punkt die richtige Wahl, die Datei „seed.txt“ wird dann auf eurem eigenen YaCy-Peer gesichert. Sobald ihr eure Wahl getroffen und die entsprechende Einstellung gespeichert habt ist es soweit:
👍🏻Gratulation, ihr habt jetzt einen Principal Peer!👍🏻
Wenn ihr nun im Abschnitt „Überwachung“ wieder auf den „Systemstatus“ geht, dann steht das wie im Screenshot weiter oben zu sehen ist ganz unten. Bei mir gab es hier anfangs jedoch ein Problem, denn ich mußte die Datei „seed.txt“ erst von Hand erstellen und hochladen. :-? Dabei handelt es sich um eine leere Text-Datei, welche mit einem einfachen Editor erstellt wurde.
Wie man auf den Screenshots sieht kann man unter dem Punkt „Portal Design“ noch das Aussehen seines Peers anpassen, aber das ist dann jedem seine eigene Entscheidung. Für jetzt ist das mal genug, in einem weiteren Tutorial werde ich dann auf das Indexieren von Webseiten eingehen.
Mein Fazit:
Man muß kein großes Wissen mitbringen, um YaCy als „Principal Peer“ zu verwenden. Es sind eigentlich nur ein paar Einstellungen, dann läuft das Ding auch schon. Wie jedoch geschrieben sollte man das *nicht* auf seinem normalen Arbeitsrechner machen, spätestens beim Crawlen/Indexieren von Webseiten wird man sonst zu arg ausgebremst. Eine Suchmaschine ist eben kein einfacher Text-Editor, sondern eine komplexe Anwendung mit entsprechenden Anforderungen.
Auf einem Laptop oder Notebook hat YaCy schon mal gar nichts zu suchen, außer man verwendet es als einfachen „Junior Peer“. Das ist immerhin eine Suchmaschine, keine Bildbearbeitung oder so! Ihr wäret mit Sicherheit begeistert, wenn Google & Co abends ihre Server abschalten würden, gleiches gilt für alle Suchmaschinen und somit auch für YaCy. Was nützt es der Gemeinschaft und dem Gesamtindex, wenn ihr mehrere Millionen Seiten auf eurem Laptop habt und diesen nach getaner Arbeit dann herunter fahrt? Ein Server ist nun einmal dafür gedacht, daß er 24/7 durchläuft.
Einige unter Euch haben ja eh einen Server in der Ecke stehen, mit dem die WG oder die Familie z. B. auf den gemeinsamen Drucker oder so zurückgreifen kann. Hier wäre es eigentlich kein Problem, wenn man dort YaCy als „Principal Peer“ mitlaufen lassen würde. Da zudem jeder seine eigenen Lieblingsseiten hat (Magazine, Blogs, Foren …) kann auch jeder Teilnehmer in der Gemeinschaft seinen Teil zum Index beitragen. Google hat laut eigenen Angaben über 40 Milliarden Webseiten im Index, dazu bräuchte es wirklich sehr viele Teilnehmer bei YaCy.
Derzeit gibt es weltweit knapp 700 Peers, das ist bei Weitem zu wenig! Wirklich interessant würde es wohl werden, wenn YaCy so 10.000 Peers hätte. In Zeiten wie Heute mit günstigen Flatrates wäre das eigentlich kein Problem, man sollte nur auf die verwendete Festplatte achten. Nachdem sich meine große 2 TB-Platte ja leider verabschiedet hat bin ich jetzt natürlich ziemlich eingeschränkt, aber ein paar Millionen Dokumente kann ich damit schon indexieren. Je nach Vorlieben und Einstellungen kann das relativ schnell gehen, doch das werdet ihr dann wie erwähnt in einem weiteren Tutorial erfahren… allerdings erst im neuen Jahr! :mrgreen:
Einen guten Rutsch in das Jahr 2021!
Ich wünsche euch jetzt noch einen schönen letzten Tag im Jahr 2020, kommt gut rüber, damit ihr auch im neuen Jahr hier weiterlesen könnt! ;-)
An dieser Stelle auch einen herzlichen Dank an all diejenigen, welche sich in den Krankenhäusern und Pflegeeinrichtungen gerade für uns zu Grunde richten. 2018 war ich mit meinem 2. Schlaganfall beinahe soweit, daß ich ebenfalls auf euch angewiesen gewesen wäre. Ein paar Häuser weiter ist ein Einrichtung für betreutes Wohnen, dort kommt ständig die ambulante Pflege vorbei… ich möchte den Job nicht unbedingt übernehmen! Haltet die Ohren steif, hoffentlich wird es 2021 etwas besser für uns alle.
Viele Grüße nun aus dem Serverraum von TmoWizard’s Castle zu Augusta Vindelicorum
Mike, TmoWizard
P2P-Tutorial – #YaCy einrichten und mein YaCy-Principal Peer von TmoWizard ist lizenziert unter Creative Commons Namensnennung-NichtKommerziell-Weitergabe unter gleichen Bedingungen 4.0 international.
wieder mal ein sehr interessanter Artikel, den ich begeistert durchgelesen habe.
Da ich noch einige nicht oft benutzte alte Thinkpads mit Linux (Debian, Ubuntu und Manjaro) hier habe werde ich zumindest mal versuchen YaCy einzurichten.
Bin immer für sowas zu haben.
Du hast das Teil im Wohnzimmer stehen denke ich. Wie sieht es denn mit der Geräuschentwicklung aus? Der Dualcore braucht bestimmt viel Luft. Stört das nicht 24/7?
Ich werde das Teil im Keller deponieren, weiß nur nicht wie das Wlan da so ist auf die Dauer.
Viele Grüße und noch ein Gutes Neues Jahr,
Frank
Hallo Frank,
danke für das Lob und willkommen im neuen Jahr! Ein Thinkpad sollte eigentlich den Anforderungen genügen, welche für YaCy gestellt werden.
Wohnzimmer kann man nicht sagen, das ist nur ein sehr kleiner Raum, also eher wie ein Büro. Die Geräuschentwicklung? Mein 6-Kerner ist deutlich lauter, den Dualcore hört man eher selten. Eigentlich nur dann, wenn auf die alte Platte zurückgegriffen wird. Da hier aber ständig die Rock Antenne läuft juckt mich das herzlich wenig, gegen mein Soundsystem kommt kein Lüfter an! 🤣
Im Keller geht bei mir nicht, da gibt es nur in der öffentlich zugänglichen Waschküche einen Stromanschluß und mein W-LAN reicht auch nicht vom zweiten Stockwerk bis dort runter. Das ist der Nachteil in einem Mehrfamilienhaus, es ist einfach nur zweckdienlich. Als Empfänger von Hartz IV hat man nun mal nur wenig Auswahl.🤷
Bei mir sind beide Rechner per Kabel am Router angeschlossen, er ist ja nur knapp 1,5 m entfernt hinter der Tür zur Küche!
Du solltest bei einem Thinkpad aber für ausreichend Kühlung sorgen, denn gerade beim Crawlen von Webseiten werden Laptops und Notebooks ordentlich warm. Das durfte ich feststellen, als ich zum Testen mal das alte Thinkpad meiner Ex-Frau hier hatte. Wobei das Teil ja unter Windows 7 lief, das war also kein Server.
Viele Grüße nun aus dem verschneiten Augsburg 🌨
Mike, TmoWizard
TOP