Google & Google-Labs Adrian Schuster. Übersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen –Suchmaschine Google.com vs. Google.de –Bilder,

  • Published on
    05-Apr-2015

  • View
    103

  • Download
    0

Transcript

Folie 1 Google & Google-Labs Adrian Schuster Folie 2 bersicht Google n Geschichtliches n Arbeitsweise/Technik n Funktionen Suchmaschine Google.com vs. Google.de Bilder, Newsgroups, Nachrichten, Katalog, Directory, Expertenrat, Toolbar, Compute Folie 3 bersicht Google Labs n Funktionen VoiceSearch Keys Glossary Sets n Rund um Google Google Weblog, Googlefight Folie 4 n Googol ~ Google 1000000000000000000000000000...0 10 100 Milton Sirotta (Neffe von Edward Kasner) n Grndervter Sergey Brin Lawrence Page Geschichtliches Folie 5 n Suchmaschinenprojekt an der Stanford University n BackRub mit Fhigkeit, die Links zur indizierten Seite zu erfassen. n Nutzung von gewhnlicher Hardware n Suche nach Investoren Geschichtliches Folie 6 n 7. September 1998: Google Inc. Menlo Park, California Garagenfirma 10.000 Anfragen n 1999: Suchmaschine von AOL/Netscape mit 3 Mill. Anfragen n 2001: Aufkauf von Deja.com Geschichtliches Folie 7 n heute: >500 Angestellte >150 Millionen Anfragen >54 Millionen Benutzer (50% non-US) >3 Milliarden Webseiten >800 Millionen usenet-Posts >330 Millionen Bilder 36 Lnderdomains Geschichtliches Folie 8 n heute: >100 Millionen Dollar jhrlicher Umsatz ca. 100% jhrliches Wachstum Geschichtliches Folie 9 n Browserhufigkeit n Nutzersprachen n Mai 2001 - Oktober 2002 Folie 10 Technik n The Anatomy of a Large-Scale Hypertextual Web Search Engine 1998 n The PageRank Citation Ranking: Bringing Order to the Web 1998 Folie 11 Technik n grter kommerzieller Linux-Cluster n >10.000 Maschinen n 5 verteilte Datacenter n Google Search Appliances Linux-Server Folie 12 n Suchmaschine simpel leichtgewichtig bestndig n einfach AND-Verknpfung keine Wildcards Funktionen Folie 13 n Filetypen 12 Haupttypen Portable Document Format (pdf), PostScript (ps), Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku), * Lotus WordPro (lwp), MacWrite (mw), Excel (xls), PowerPoint (ppt), Word (doc), Works (wks, wps, wdb), Write (wri), Rich Text Format (rtf), Text (ans, txt) [filetype:rtf] n hnliche Seiten (GoogleScout) Suchmaschine Folie 14 n bersetzungen Englisch bersetzt in Deutsch Franzsisch Spanisch Portugiesich Italienisch Erkennung von 36 Sprachen n Im feeling lucky Suchmaschine Folie 15 n erweitert n Syntax [_-ausgeschlossen] [_+eingeschlossen] keine Wildcards (aber Paltzhalter * ) keine Gro-/Kleinschreibung Suchmaschine Folie 16 n Syntax ["genauer Wortlaut"] OR oder | [site:www.distributed.net] [link:www.distributed.net] [related:www.distributed.net] [info:www.distributed.net] [stocks: amd shr] Suchmaschine Folie 17 n Syntax [allintitle:arthur dent] [intitle:beeblebrox ] [allinurl:online/public] [inurl:public_html] z. B. inurl:fu-berlin site:fu-berlin.de cache:www.inf.fu-berlin.de/inst/ags.html date: ? Suchmaschine Folie 18 .com vs..de n Filtermechanismus, der Suchergebnisse des deutschen Ablegers zensiert auch Frankreich, Schweiz keine offiziellen Informationen erhltlich n gleicher Datenbstand wie google.com n Filterung der URLs vor Anzeige der Suchergebnisse n Seiten im Cache vorhanden Folie 19 .com vs..de n z.B. Stormfront.org n nicht sichtbar: www2.stromfront.org www3.stromfront.org www4.stromfront.org women.stromfront.org n sichtbar: irc.stormfront.org:8000 Folie 20 Bilder images.google.com n 390 Millionen Bilder Folie 21 Bilder images.google.com n Beurteilung/Indizierung -Tag Bildbeschreibung Seiteninhalt Bildanalyse Duplikatentfernung n alle Suchtags mglich Folie 22 Bilder images.google.com Folie 23 n SafeSearch Filterung von pornography and explicit sexual content Folie 24 Newsgroups groups.google.com n usenet Folie 25 Newsgroups groups.google.com n >35.000 Gruppen n >700 Millionen Postings n usenet-Start in 1979 Folie 26 Newsgroups groups.google.com n bersicht einer Newsgroup Folie 27 Newsgroups groups.google.com n ltestes Posting in Net.general From: sdcarl!rusty Mon May 11 09:00:58 1981 To: ucbvax^mark Subject: newsgroup fa, net, etc. Won't we need to change the.ngfile also? Also is ALL an acceptable newsgroup on the left side of the dot such that ALL.ALL will catch everything? Rusty is right (or is that "Rusty is Wright"?) - we have ALL in our.ngfile so I tend to forget this. ALL.ALL may or may not work, but ALL certainly does. Mark I plan to make the change on Tuesday unless something horrible happens. Folie 28 Newsgroups groups.google.com n archiviert von Henry Spencer (Department of Zoology Toronto) 1981 - 1991 141 Bnder 120 MB Folie 29 Nachrichten news.google.com Folie 30 n 4000 Nachrichtenquellen n mehrmals tgliche Aktualisierung n Gruppierung nach Themen ausschlielich mittels Algorithmen n Artikel der letzten 30 Tage Folie 31 Directory directory.google.com Folie 32 n Webinterface fr Open Directory Project (dmoz.org) n >1,5 Millionen Eintrge n Verknpfung mit Webindex zur besseren Sortierung Folie 33 Kataloge catalogs.google.com Folie 34 n 5400 Rubriken n mailorder-Kataloge verschiedenster Anbieter Folie 35 Kataloge catalogs.google.com n Ergebnisanzeige Folie 36 Expertenrat answers.google.com Folie 37 n 500 freiwillige Experten fr verschiedenste Fachgebiete bzw. Informationssuche n 2 - 200$ Kosten fr Expertenantwort entsprechend der selbst eingeschtzten Schwierigkeit n 0,50$ Gebhr fr Google Folie 38 Toolbar toolbar.google.com n Button-Leiste zur Integration in Browser nur Windows ab M$IE 5.x n Eingabefeld fr Suche n PageRank-Anzeige n integrierte Update-Funktion n mit integriertem Folie 39 Compute toolbar.google.com/dc n Distributed Computing Berechnung der dreidimensionalen Faltung von Proteinen mit bekannter Aminosurenstruktur ca. 20 MB pro Monat n unauffllig mit Toolbar installiert n zufllige Aktivierung durch Google- Server Folie 40 labs.google.com n Spielwiese fr Google-Entwickler n erste Stufe im Entwicklungsproze n keine direkte Untersttzung der Funktionen n mglicherweise zuknftige Bestandteile der Google Services Folie 41 Google Labs Technologien n VoiceSearch (labs.google.com/gvs.html) Suchanfrage via Telefon Spracherkennung und Darstellung des Ergebnisses auf spezieller Seite n Keyboard Shortcuts (labs.google.com/keys) Navigation innerhalb der Suchergebnisse mittels Tastatur Folie 42 Glossary labs.google.com/glossary n Finden von Wrtern, Phrasen und Akronymen Folie 43 Glossary labs.google.com/glossary n z. B. Benzodiazepine Folie 44 Sets labs.google.com/sets n generierte Wortlisten anhand von eigenen Beispielen Folie 45 labs.google.com/sets Folie 46 Rund um Google n Google Weblog (google.blogspace.com) Sammlung von Links bezglich Google Folie 47 Rund um Google n Googlefight (www.googlefight.com) Vergleich der Ergebnisanzahl zweier Suchbegriffe

Recommended

View more >