
|
 |
Vier von fünf Treffern sind Ballast!
(Meldung der FH Köln vom
4.1.2002)
"Vier von fünf Treffern sind Ballast!" Das ist das Ergebnis der ersten
inhaltlichen Analyse der Trefferlisten deutscher Internet-Suchmaschinen, die Studentinnen
und Studenten des Fachbereichs Informationswissenschaft der Fachhochschule Köln im Rahmen
eines Forschungsprojekts durchgeführt haben.
Von Mai bis Juli 2001 wurden die deutschen Suchmaschinen Abacho, Acoon, Fireball und Lycos sowie die Webkataloge Web.de und Yahoo! von den Studierenden auf ihre Leistungsfähigkeit hin
untersucht. Als Prüfwerte dienten dabei die Kriterien
- "Recall" (Wieviel Prozent der zur Suchanfrage passenden Webseiten werden
gefunden?),
- "Precision" (Wieviele der ausgegebenen Treffer sind relevant?) und
- "Availability" (nach Auswahl vorher bekannter Webseiten wird überprüft, ob
die Suchmaschinen diese auch finden können).
Beim relativen Recall erreicht Lycos als Testsieger rund 42 Prozent.
Über dem Durchschnitt von 30 Prozent liegen Abacho und Fireball, unter dem
Durchschnittswert Yahoo!, Acoon und Web.de. Im Schnitt finden die Suchwerkzeuge von zehn
relevanten Webseiten nur drei.
Die Precision ist insgesamt dürftig. Durchschnittswerte von 18,6
Prozent bedeuten, dass die untersuchten Systeme von fünf "Treffern" nur einen
relevanten zeigen. Gut 80 Prozent der in der Trefferliste aufgeführten Dokumente sind
schlicht Ballast.
Die größte Availability erreicht Lycos mit 72 Prozent. Mit großem
Abstand folgen die übrigen Suchmaschinen und danach die Web-Kataloge. Lycos deckt
offenbar beachtliche Mengen der deutschen Webseiten ab, so die Schlussfolgerung der
Forschungsprojektgruppe. Sie führen dies u. a. darauf zurück, dass Lycos die Datenbasis
des norwegischen Unternehmens FAST gekauft hat. Abacho schneidet mit 32 Prozent
Availabilty durchaus gut ab, wenn man bedenkt, so die Forscherinnen und Forscher, dass
dies auf der Grundlage einer eigenen Datenbasis ausschließlich deutscher Webseiten zu
Stande kommt. Web-Kataloge werden im Gegensatz zu Suchmaschinen nicht per automatisierter
Technik sondern von Personen gepflegt. Daher kommen sie auch zu weitaus kleineren
Datenbasen und in der Regel zu einer äußerst geringen Availability.
Das Forschungsprojekt zur Qualität der deutschen Interrnet-Suchmaschinen reiht sich
ein in einen Schwerpunkt des Fachbereichs Informationswissenschaft, in dem sowohl ein
Instrumentarium zur vergleichenden Bewertung von digitalen Produkten (im Internet oder
auch auf CD-ROM) entwickelt als auch konkrete Evaluationen der Erzeugnisse der
Informationswirtschaft bzw. der New Economy durchgeführt werden. Besonders stolz ist der
Fachbereich Informationswissenschaft darauf, dass die Studierendengruppe der 1998 neu
eingerichteten Studiengänge Informationswirtschaft und Bibliothekswesen schon vor ihrer
Diplomarbeit in einer Projektarbeit so interessante Forschungsergebnisse vorgelegt hat,
das diese bereits von Fachzeitschriften aufgegriffen wurden. Die ersten Absolventinnen und
Absolventen werden im Sommer 2002 dem Arbeitsmarkt zur Verfügung stehen.
Der Fachbereich
Informationswissenschaft der Fachhochschule Köln ist eine der größten Einrichtungen
informationswissenschaftlicher Lehre und Forschung in Europa. Die Lehre konzentriert sich
auf die Informationswirtschaft ("New Economy") und die Bibliotheken. Geleitet
wird das Forschungsprojekt zur Bewertung von digitalen Produkten der
Informationswirtschaft von Dr. Wolfgang G. Stock, Professor für Informationswissenschaft
und Wissenschaftstheorie, einem ausgewiesenen Experten der Fachgebiete
Informationswissenschaft und Informationswirtschaft.
|
BINGOOO
corporate*** wandelt Internet zum Produktionsfaktor
Testsieger als Alternative zu Browser, Suchmaschinen, Links, sinnlosen Klicks und Banner
(Meldung vom 25.9.2001)
Die etwas andere, hoch dekorierte Meta-Suchmaschine BINGOOO wurde in den letzten
Monaten mehrere 100.000 Mal installiert und steht als Version BINGOOO personal* zum
kostenfreie Download bereit (www.bingooo.com).
Mit BINGOOO professional** und BINGOOO corporate*** rüstet das Kölner Unternehmen zudem
zum "Angriff auf die Browser-Elite" (PCPr@xis).
BINGOOO professional** bietet als Einzelplatzlösung mit zusätzlichen Funktionen wie Web-Clipping, automatischem Abstracts, Weiterverarbeitung der
Ergebnisse, Datei-Austausch, die Einbindung von Outlook und
abschaltbarer Werbung das Werkzeug für die professionelle Internet-Recherche.
BINGOOO corporate*** ist zentral administrierbar und durch Corporate Branding und
eigene Content- und Media-Edition auf das Unternehmen zugeschnitten. BINGOOO fördert die
Zusammenarbeit mit internen und externen Kollegen und Partnern. Neben wichtigen
Internetquellen sind Telefonlisten, Videos, Formulare und Datenbanken aus dem Intranet
einbindbar. Mit der Öffnung des Agentenbaus und einer neuen Programmschnittstelle zur
Integration in Programme und Prozesse fügt sich BINGOOO in die Unternehmensorganisation
ein. Premium Hotline, Schulung und Implementierung durch BINGOOO Service Partner runden
das Angebot ab.
Unternehmen, die das Internet als Marketing-Plattform zur Kundengewinnung und
Kundenbindung verstehen, bietet BINGOOO platform**** die wirtschaftliche und effiziente
Alternative zu Portalen, Suchmaschinen und heutigen Werbeformen. Der Zugang zum Content
ist kostenlos und bedarf keiner redaktionellen Bearbeitung. Aufgrund der Client
Architektur sind weder Server noch Leitungskosten erforderlich. Durch die Installation auf
dem PC des Kunden erzielt BINGOOO als "Aussenportal" zur eigenen Präsenz eine
wesentlich höhere Bindung als ein flüchtiger Besuch auf der Unternehmens-Homepage. Denn
BINGOOO begleitet den Kunden dauerhaft beim Browsen durchs Internet.
Die Lizenzversion BINGOOO corporate*** (Basisversion für 5 Plätze EUR 490,- plus
MwSt.) ist über www.bingooo.com oder BINGOOO Deutschland GmbH (0221) 80249-12
erhältlich.
Übrigens: BINGOOO war zuletzt Testsieger als Meta-Suchmaschine in der
CHIP (5.01) und erhielt ein "Sehr gut" für die Suchfunktionen im Multimedia-Browser-Vergleichstest von PCPr@xis
(9/2001), vor MSN Explorer und Netscape 6, belegt.
|
STIFTUNG WARENTEST: Google
trifft am besten
(Meldung von STIFTUNG WARENTEST vom
2.9.2001)
Google ist die derzeit beste Suchmaschine im Netz. Auf zehn Testfragen fand Google zehnmal die passende Antwort. Es
folgen Alta Vista, Lycos und Metager mit neun Treffern. Die STIFTUNG WARENTEST hat 20 Suchmaschinen
und Kataloge getestet. 13 sind nur ausreichend, eine ist mangelhaft. Schwachpunkt der
meisten Suchmaschinen: Die Ergebnisse sind falsch gewichtet. Mehr als die Hälfte der
angezeigten Treffer hatte rein gar nichts mit dem gesuchten Thema zu tun. Den
vollständigen Artikel finden Sie unter:
|
Suchmaschinen kapitulieren vor
stetig zunehmenden Web-Inhalten
(Meldung von Reuters vom 31.3.2001)
Branchenkennern zufolge haben die Suchmaschinen mittlerweile grosse Schwierigkeiten,
mit den zunehmenden Web-Inhalten sowie den wechselnden Technologien, die diese Inhalte
bereitstellen, Schritt zu halten. Selbst die besten Suchmaschinen könnten nur auf einen
Bruchteil der 550 Milliarden bestehenden Websites zugreifen, erklärten
die Experten. Der Zugriff auf Web-Inhalte zu populären Themen sei zwar noch relativ
problemlos, doch zahlreiche Kataloge zu wirtschaftlichen, wissenschaftlichen und
juristischen Themenbereichen würden von den Suchmaschinen gar nicht mehr erfasst, so die
Experten weiter. In Fachkreisen werden diese unzugänglichen Informationen auch als das
"tiefe" oder "unsichtbare" Web bezeichnet.
Die Tatsache, dass die Suchmaschinen mit den täglich neu eingespeisten Web-Inhalten
überfordert sind, bildet jedoch nur einen Aspekt dieser Problematik. Zahlreiche Websites
bzw. deren Inhaber werden sogar selbst aktiv, um ihre Interessen als Eigentümer der
Web-Inhalte zu schützen und den Zugriff der Suchmaschinensoftware auf Teile der Inhalte
bzw. der gesamten Inhalte zu verhindern. Auch die zahlreichen Web-Inhalte in multimedialer
Form seien ein Problem für die in der Regel auf Textinhalte ausgerichteten Suchmaschinen,
so Branchenkenner.
|
Nur 0,2 Prozent des Web bekannt
(Meldung von PC-Welt vom 28.7.2000)
Nur 0,2 Prozent des Internets werden von herkömmlichen Suchmaschinen erfasst. Zu
diesem Ergebnis kommt eine Studie der Firma SearchEngineWatch.com. Der größte Teil der online verfügbaren
Information liegt demnach in dynamischen Seiten und Datenbanken, die durch reine
Indexsuche nicht erfasst werden können. Dieser Bereich des Web wird als
"Unsichtbares Web" oder "Tiefes Web" bezeichnet, im Gegensatz zum
sichtbaren, oberflächlichen Web. Die Datenmenge im tiefen Web wird auf 7500 Terabyte
geschätzt.
Die neue Tiefensuchmaschine "Lexibot"
will diese verborgenen Daten zugänglich machen. Sie spricht 22.000 Datenbanken per
Suchabfrage an, und soll ihr Suchgebiet auf 100.000 Datenbanken ausdehnen.
Die Software für Lexibot ist allerdings nicht kostenlos, weshalb sich der Suchdienst
vor allem an Wissenschaftler richtet. "Das ist nichts für Oma, die nach Rezepten
für Schokokekse sucht", so Thane Paulsen, Generaldirektor von BrightPlanet, die
Lexibot anbietet. Die dreißigtägige Testphase ist allerdings kostenlos. Eine typische
Suchanfrage dauert zwischen 10 und 25 Minuten.
|
2.115.638.000 Seiten am
10.7.2000 im Internet
(Meldung vom 11.7.2000)
Nach einer Studie des amerikanischen Online-Marktforschers Cyveillance besteht das Internet aus
mehr als zwei Milliarden statischen Seiten und wächst jeden Tag um weitere sieben
Millionen. Sollte das Netz weiterwachsen wie bisher, prophezeien die Marktforscher, dass
sich schon Anfang 2001 der Umfang des Internets auf über vier Mrd. Seiten verdoppelt.
Cyveillance geht davon aus, dass die höchsten Wachstumsraten noch lange nicht erreicht
sind.
Laut Cyveillance ist das Internet US-amerikanisch dominiert. Knapp 85 Prozent der Sites
stammen aus den USA, der Rest kommt aus anderen Ländern. Am 10. Juli befanden sich laut
Cyveillance-Webwatch 2.115.638.000 Seiten im Internet.
|
Suchmaschinen versagen: Studie
zählt 800 Mio. Webseiten
(Meldung von Hightext vom 12.7.1999)
Alle Internet-Suchmaschinen hinken der Entwicklung des Web hinterher. Zu diesem
Ergebnis kommt eine Studie der Wissenschafts-Zeitschrift 'Nature'. Keine
Suchmaschine katalogisiere mehr als 16 Prozent des Webs, heißt es. Noch vor
anderthalb Jahren hatte eine ähnliche Untersuchung bessere Such-Ergebnisse dokumentiert.
Damals deckten die besten Suchmaschinen 33 Prozent des Internets ab.
Die beste Suchmaschine, Northern
Light erreicht eine Trefferquote von 16 Prozent. Dich auf den Fersen: Snap and Altavista. Hotbot, die bei der letzten Untersuchung auf 34 Prozent
kam, rutsche auf einen Wert von nur noch elf Prozent.
Die Studie kam zu dem Ergebnis, daß es inzwischen durchschnittlich mehr als ein halbes
Jahr dauert, bis eine Website von einem Crawler indiziert wird. Die Autoren schätzen,
daß im Februar das durchsuchbare Web aus etwa 800 Millionen Seiten mit mehr als sechs
Trillionen Zeichen besteht. Die Untersuchung im Dezember 1997 kam auf 320 Millionen.Zum
Vergleich: Die US-Kongreßbibliothek mit ihren rund 800 Kilometern Buchrücken besteht aus
20 Trillionen Zeichen.
Die Studie wurde von den Informatik-Wissenscjhaftlern Steve Lawrence und C. Lee Giles
am NEC Research Institute in Princeton, N.J. durchgeführt.
|
  |