Sicher bin ich nicht der Einzige, der sich von den neuen Personensuchmaschinen wie Yasni, 123people oder pipl nachhaltig gestört fühlt. Im Gegensatz zu Google oder anderen “normalen” Suchmaschinen filtern diese Suchmaschinen alle Informationen zu meiner Person auf einer Seite zusammen und stellen sie gesammelt allen Lesern zur Verfügung. Nun bin ich nicht panisch deswegen. Schließlich kann ich mich mit fast allen Einträgen voll identifizieren. Aber ärgern tut es mich dann doch. Gerade deswegen, weil diese Suchmaschinen mit meinem eigenen Namen werben und dafür sogar meinen eigenen Blog indizieren. 123people, Yasni und pipl leben von meinem Namen und meinen Inhalten und wollen dabei kräftig kassieren. Das werde ich nicht verhindern können. Aber ich kann verhindern, dass sie meine eigenen Seiten selber indexieren und durchsuchen.
Auf eComBASE gibt es einen sehr interessanten Artikel dazu. Dort wird auch eine beispielhafte .htaccess-Datei aufgeführt, mit der man Besucher, die direkt von pipl, 123people und Yasni kommen, auf eine bestimmte Seite umleiten kann. Hierzu öffnet man einfach seine .htaccess-Datei und fügt folgenden Inhalt ein:
RewriteEngine On
RewriteCond %{HTTP_REFERER} ^.*yasni.de.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^.*pipl.com.*$ [NC,OR]
RewriteCond %{HTTP_REFERER} ^.*123people.de.*$ [NC]
RewriteRule .* http://www.google.de [L,NC,QSA]
Geht man davon aus, dass die oben genannten Seiten eigene Robots einsetzen um den Blog zu durchsuchen, kann man mit Einträgen auf der eigenen robots.txt versuchen, diese Roboter auszusperren. Ob das von Erfolg gekrönt ist, weiß man leider nicht. Die robots.txt ist eine “Empfehlung” an die jeweiligen Bots. Ob sie sich daran halten, ist eine andere Sache. Dennoch kann es nicht schaden, folgenden Code hinzuzufügen:
# Personensuchmaschinen aussperren
User-agent: Yasni
User-agent: Pipl
User-agent: 123People
User-agent: MyOnID
Disallow: /
Der Artikel ist sehr lesenswert. Und auch wenn wir nichts gegen diese Personensuchmaschinen pipl, 123people und yasni machen können: Wir können ihnen zumindest die Arbeit ein klein wenig erschweren.
(via)






Sehr schöne Sache! Wird gleich einmal umgesetzt. Bin die Tage auch über so eine Suchmaschine gestolpert und war überrascht.
Hallo Alper,
im Grunde ein schöner Artikel, nur leider nicht ganz richtig recherchiert.
Bei myON-ID werden keine Daten gesammelt und zu einem Profil aggregriert, welches dann noch bei den Suchmaschinen wie Google indiziert wird. Dieses Vorgehen gefällt uns auch nicht.
Dein Monitoring bei myON-ID findet ausschl. hinter Login statt und kann nur von Dir selbst eingesehen werden. Ergebnisse die hier für Deinen Namen recherchiert werden können von Dir als User freiweillig in Dein Profil übernommen werden.
Alle Profile bei myON-ID sind von Usern selbst angelegt und alle Inhalte darauf von Usern selbst hinzugefügt.
Auch sind wir keine Personensuchmaschine. Gründe hierfür haben wir schon mehrfach kommuniziert. Hier nochmals drei gute Gründe dafür: http://bit.ly/RHitm
Hättest Du herausfinden können, wenn Du unsere Seite besucht hättest. So aber, ist die Darstellung leider, für unseren Fall nicht richtig.
Vielleicht nimmst Du Dir nochmal die Zeit und schaust Dir myonid richtig an?
Viele Grüße
Mario
Ich stehe gerade auf dem Schlauch, oder aber… :p
Du willst nicht die Leute aussperren, die von so einem Eintrag auf deinen Blog kommen – sondern den Bot selbst aussperren.
Aber wieso sollte der BOT denn als *Referer* den Domainnamen mitbringen?
Eine Umleitung aufgrund des User-Agents würde ich ja verstehen, obwohl ich da auch schon fast bezweifel, dass diese Art von Bots sich sauber verhält und solche Infos mitgibt…
Da ist irgendwas noch nicht ganz rund :-)
@Mario: Ich habe mir euren Dienst nun etwas genauer angesehen und gebe dir recht. Er ist nicht zu vergleichen mit den anderen Dienstleistern. Ich habe daher den Artikel entsprechend aktualisiert und euch aus dem Titel sowie dem Inhalt entfernt. Danke für die Rückmeldung. Finde ich sehr löblich :-)
@Marc: Man könnte auch direkt die Robots von den Seiten sperren, aber wie du schon sagst: Sie würden sich mit Sicherheit nicht “sauber” verhalten denke ich mal. Und wenn man die Leute, die von diesen Seiten kommen, aussperrt, dann werden sie sich ihre Informationen eher von anderen Seiten holen. Verlierer sind dann die Personensuchmaschinen. Und das ist ja auch Sinn und Zweck der Sache.
Hallo Alper,
vielen Dank für die prompte Reaktion und Richtigstellung.
Ich hoffe Dir gefällt myonid? Bei Interesse meld Dich doch einfach mal für einen Hintergrundbereicht “aus erster Hand”.
Viele Grüße
Mario
Hallo Mario, deinem Vorschlag bin ich gefolgt und habe mich mal neu registriert. Werde mich morgen mal intensiver damit beschäftigen. Merci.
[...] Personensuchmaschinen wie yasni, 123people oder pipl.com von der eigenen Domain fernhalten. Alper (mit dem ich letzte Woche die beste Taxifahrt meines Lebens in Hamburg hatte) wieder mal mit einem klasse Tipp. [...]
Ich hasse 123people!
So ein Dreck. Den braucht das Internet wirklich nicht!
Für mich hat dieser Dienst keine Daseinsberechtigung. Zumindest sollte er Google nicht so voll spammen.
@Paul: Stimme dir 100%ig zu. Leider gibt es im Internet allerlei Müll und diese Plattformen gehören dazu :-(
Du hast den falschen Codeabschnitt zitiert; der entscheidende Abschnitt ist der andere auf deiner Quellseite (mit “deny”).
Was du zitiert hast, braucht man nur, wenn man eine Weiche bauen will für Besucher, die direkt von Personensuchmaschinen kommen.
@Chuck: Ich habe die entsprechende Passage im Blog aktualisiert, damit es leichter verständlich ist. Danke für den Hinweis. Mit der Robots.txt verhindere ich jedoch nicht die Indexierung des Blogs. Vielmehr ist es ja nur eine Empfehlung an die Bots, bitte zu indexieren oder es eben bitte zu unterlassen. Ob sie sich daran halten ist eine andere Sache.
Mit der htaccess kann ich zumindest den Besuchern, die direkt von diesen Seiten kommen sagen, dass es nicht gut ist, wie sie an diese Informationen gekommen sind.
Hoffentlich jagt der Conflicker-Wurm am 1 April die Plattform 123people in die Luft! Ich würde mich freuen :)
Mittlerweile interessiert das yasni & Co gar nicht mehr und die ignorieren diese Rule.