3.4 Suchstrategien anwenden

In diesem Abschnitt geht es um die „Kunst“, mit Suchmaschinen so zu arbeiten, dass man auch wirklich findet, was man sucht. Das ist keineswegs trivial: Im WWW finden sich zu praktisch allen Stichworten (v. a. englischen) viele bis sehr viele Seiten. Es ist unmöglich, alle diese Ergebnisse durchzusehen. Daher wird man von vornherein versuchen, eine Abfrage so genau zu formulieren, dass wenige, dafür aber passende Treffer erzielt werden.

3.4.1 Suchmaschinen benutzen

Suchmaschinen sind riesige Datenbanken. Sie werden ständig automatisch aktualisiert und erweitert. Eigenständige Programme (Crawler, Robots oder Spider genannt) durchsuchen weltweit die Web-Server. Sie finden auf einer Seite, die sie schon indiziert haben, neue Verknüfungen, die sie dann regelmäßig nach weiteren bzw. aktualisierten Informationen durchsuchen. Alle Wörter bis auf die häufigsten (sog. „Stopwörter“, z. B. und, der, die, das, …) werden in einer Liste gespeichert, auf der die Suchanfrage durchgeführt wird. Jedes Wort in der Liste ist mit denjenigen Internetseiten verknüpft, auf denen der Suchbegriff auftaucht.

Die Qualität von Suchmaschinen hängt wesentlich davon ab, wie oft und wie gründlich das WWW durchsucht wird (Abdeckungsgrad). Außerdem spielt die Relevanz der Suchergebnisse eine Rolle, die sich vor allem in der Sortierung („Ranking“) der Suchergebnisse ausdrückt. Die relevanten Treffer sollten sich am Anfang der Ergebnisliste, d. h. unter den ersten 10 bis 20 Treffern finden. Wortorientierte, statistische Verfahren speichern beispielsweise, wie oft ein bestimmter Begriff auf einer bestimmten Seite auftaucht. Je häufiger ein Suchbegriff im Dokument, im Titel oder in den Überschriften auftaucht, desto zentraler scheint das Dokument bezüglich eines Suchbegriffs, und desto weiter oben rangiert es in der Liste der Ergebnisse.

Dieses Verfahren ist mangelhaft, da es die Vernetzung der Internetseiten untereinander außer Acht lässt. Neuere Analyseverfahren untersuchen z. B., wie viele Links von einer bestimmten Seite auf eine andere Seite führen. Je mehr Links auf eine Seite zeigen, desto „wichtiger“ ist sie. Es wird dabei auch beachtet, mit welchen Wörtern auf eine Seite verwiesen wird. Die Rangordnung wird also nicht mehr über das Thema hergestellt, sondern über die Popularität einer Seite. Der Nachteil solcher Verfahren ist, dass eine wichtige, aber „unpopuläre“ Website kein gutes Ranking erhält. Das erste, was man von Suchmaschinen sieht, ist ein Eingabefenster für die Suchbegriffe und die Schaltfläche, mit der die Suche gestartet wird. Die Suche nach einzelnen Stichworten ist jedoch wenig zielführend. Meistens ergibt sie viele Treffer. Darunter befinden sich auch zahlreiche Webseiten, auf denen das Stichwort nur zufällig oder in ganz anderen Zusammenhängen vorkommt. Selbst das „Ranking“ (s. oben) durch die Suchmaschine ergibt noch Hunderte oder Tausende möglicherweise relevanter Treffer.

Suchmaschinen können aber wesentlich mehr, als bloß nach einem einzelnen Begriff zu suchen. Nicht immer sind alle der in der folgenden Tabelle aufgelisteten Funktionen und Operatoren verfügbar. Vor dem Einsatz einer Suchmaschine sollte man daher in der Online-Hilfe nachsehen, um Art und Verwendung von Suchoperatoren kennenzulernen. Die Boole’schen“ (logischen) Operatoren AND, OR und NOT finden sich, wenn überhaupt, meist erst bei der Eingabemaske für „Fortgeschrittene“ (unter Bezeichnungen wie advanced search, erweiterte Suche, Profi-Suche u. dgl.)

Tab. 3.2: Mit Suchmaschinen arbeiten
Sie verwenden … Das bedeutet… Beispiel
Suche nach Zeichenketten (meist in Anführungszeichen eingeschlossen) mehrere Begriffe werden als einer behandelt, die komplette Phrase wird wörtlich gesucht „virtual world“; „ich hab genug“ usw.
den Operator OR bzw. Aneinanderreihung von Suchbegriffen ^1[Überprüfen Sie, z. B. anhand der Online-Hilfe, welche Voreinstellung für Ihre Suchmaschine gilt] Einer der beiden Begriffe oder beide sollen auf der Webseite vorkommen virtual world oder virtual OR world = getrennte Suche nach „virtual“ und „world“
den Operator AND bzw. Aneinanderreihung von Suchbegriffen ^1[Überprüfen Sie, z. B. anhand der Online-Hilfe, welche Voreinstellung für Ihre Suchmaschine gilt] Beide Suchbegriffe müssen auf der Webseite vorkommen virtual world oder virtual AND world = gemeinsame Suche nach „virtual“ and „world“
„wild cards“ (Platzhalter), z. B. * oder ? an dieser Stelle im Suchbegriff dürfen beliebige Zeichen erscheinen interpassiv* = Suche nach interpassiv/e/er/en, Interpassivität usw.
Einschränkung auf bestimmte Sprache nur Webseiten in der angegebenen Sprache werden angezeigt „interpassiv*“ in beliebiger Sprache = 120 Treffer, in Deutsch = 33 Treffer
den Operator NEAR (nahe) = Kontextsuche zwischen den beiden Suchbegriffen darf nur eine bestimmte Anzahl Worte stehen; ein Suchbegriff muss im Umfeld eines anderen auftreten agent NEAR „virtual character“ = agent soll max. 10 Wörter (AltaVista) von „virtual character“ entfernt auftreten
den Operator NOT vor einem Suchbegriff dieser Suchbegriff soll ausgeschlossen werden; günstig, wenn eine häufige Zusammensetzung unerwünscht ist frame AND NOT picture = Suche nach „frame“, aber nicht in der Zusammensetzung „picture frame“ (Bilderrahmen)
Klammern in komplexen Suchabfragen Bedingungen in Klammern werden zuerst ausgewertet; vorgegebene Priorität der Operatoren (AND vor OR) wird umgangen (kalb OR kuh) AND schwarz = Webseiten mit kalb AND schwarz sowie Seiten mit kuh AND schwarz. kalb OR kuh AND schwarz = Seiten mit kuh AND schwarz sowie Seiten mit kalb.
den Operator „+“ unmittelbar vor einem Suchbegriff Das Wort muss auf der Webseite vorkommen berlin +immobilie = Suche nach Seiten zu Berlin, auf denen das Wort „Immobilie“ vorkommt
den Operator „-“ unmittelbar vor einem Suchbegriff Das Wort darf auf der Webseite nicht vorkommen berlin -briefmarke = Suche nach Seiten zu Berlin, auf denen das Wort „Briefmarke“ nicht vorkommt

Die Gefahr bei der Suche im WWW ist heute schon längst nicht mehr, dass Sie nichts finden, sondern dass Sie viel zu viel finden: Sie müssen sich bei den meisten Suchmaschinen schon sehr anstrengen, um sich einen Suchbegriff auszudenken, für den überhaupt keine Treffer erzielt werden. Heute geht es eher darum, möglichst das Wichtige oder Richtige aus den vielen Ergebnissen herauszufiltern. Deshalb ist die Bedeutung der Metasuchmaschinen zurückgegangen. Sie liefern auf jeden Fall eine höhere Trefferquote als eine einzelne Suchmaschine, doch eine Sortierung der Treffer ist nicht möglich (da diese ja auf den Kriterien der einzelnen Suchmaschinen beruht). Umfangreiche Ergebnislisten von Metasuchmaschinen sind daher unübersichtlich oder sogar unbrauchbar. Sinnvoll ist ihre Verwendung dagegen bei der Suche nach sehr seltenen Suchbegriffen.

3.4.2 Suchergebnisse prüfen

Die Trefferliste ist geordnet nach dem Prinzip „best first“, d. h. die Ergebnisse, die nach dem Verfahren der Suchmaschine den Suchkriterien am meisten entsprechen, erscheinen als erste. Ein kurzer Blick auf diese ersten Fundstellen kann Ihnen daher schon sagen, ob Sie mit Ihrer Suchabfrage richtig liegen. Wenn hier schon Treffer auftauchen, die mit Ihrer Abfrage anscheinend nichts zu tun haben, so ist eine andere Suchstrategie angebracht. Sie müssen herausfinden, wie Sie die unerwünschten Fundstellen ausschließen können. Das kann geschehen durch

  • einen anderen Suchbegriff (Synonym, unter- oder übergeordneter Begriff, Phrase …)
  • eine komplexe Suchabfrage, mit (Boole’schen) Operatoren verknüpft, siehe Tabelle 3.2: oben.

Das „best first“-Prinzip kann Ihnen aber auch eine mühsame weitere Einschränkung des Suchraumes ersparen. Wenn Sie – bei einer nicht allzu großen Menge von Ergebnissen (bis maximal 100) – die ersten zehn Treffer aufrufen, können Sie feststellen, ob Sie mit Ihrer Suche „ins Schwarze“ getroffen haben. Das wären z. B. Seiten, die als Startseiten und Linksammlungen zum Thema konzipiert sind, und von denen aus Sie gleich themenspezifisch weitere Websites erschließen können. Wenn sich darüber hinaus in so einer Linksammlung die selben Adressen finden, die auch in der Trefferliste erscheinen, so können Sie schon ziemlich sicher sein, dass Sie das Gebiet bereits einigermaßen erschlossen haben.

Trotzdem sollten Sie auch die weiter unten gereihten Treffer überfliegen oder stichprobenartig prüfen. Wenn die letzten noch (beinahe) ebenso relevant sind wie die ersten und die Gesamtzahl der Treffer zu hoch ist, um alle einzeln aufzurufen, sollten Sie doch noch engere und speziellere Suchbegriffe probieren.