Das Google Zeitalter Von der Suchmaschine zur künstlichen Intelligenz Professor Dr. Eduard Heindl.

  • Published on
    06-Apr-2015

  • View
    106

  • Download
    4

Transcript

Folie 1 Das Google Zeitalter Von der Suchmaschine zur knstlichen Intelligenz Professor Dr. Eduard Heindl Folie 2 Eduard Heindl, FH-Furtwangen Themen Woher kommt Google Wie arbeitet Google Was ist an Google einmalig Warum ist Google so mchtig Wohin geht Google Folie 3 Eduard Heindl, FH-Furtwangen Googlesteinzeit 1995 treffen sich Sergey Brin (23) und Larry Page (24) 1996 BackRub System an der Stanford University 100.000$ von Andy Bechtolsheim 7. September 1998 Start Google Inc. *September 21, 1999, the beta label came off the website. Folie 4 Eduard Heindl, FH-Furtwangen Firmenphilosophie perfect search engine defined by co-founder Larry Page as something that: "understands exactly what you mean and gives you back exactly what you want." Folie 5 Eduard Heindl, FH-Furtwangen Live of a Query Quelle: http://www.google.com/corporate/query.html Folie 6 Eduard Heindl, FH-Furtwangen Der PageRank Google sortiert nach PageRank Je mehr Links auf ein Dokument deuten, um so besser Algorithmus bercksichtigt aber auch den PageRank der Verweisseiten Rekursives Problem solving an equation of more than 500 million variables and 2 billion terms (laut Google) Link A L M N G O F E C B H D I K Folie 7 Eduard Heindl, FH-Furtwangen Die Linkmatrix ABCDEFGHIKLMNO A00000001000000 B00000000000000 C00001000000000 D00000000000000 E00000100000000 F00001000000001 G00000000000000 H02000000010000 I00010001010000 K00000000000100 L00000000100000 M00000001001000 N00000010000100 O00000000000010 Link A L M N G O F E C B H D I K Folie 8 Eduard Heindl, FH-Furtwangen Was ist Intelligenz Wissen wo was wichtiges steht Google's technology uses the collective intelligence of the web to determine a page's importance 1 There is no human involvement or manipulation of results 1 'The ultimate search engine would be smart; it would understand everything in the world,' says Page. 2 [1] http://www.google.com/corporate/tech.html [2] http://www.aaai.org/AITopics/assets/AIalerts/alert.12.18.02.html Folie 9 Eduard Heindl, FH-Furtwangen Besonderheiten an Google Folie 10 Eduard Heindl, FH-Furtwangen Domainnamen unter den Top 5oo Yahoo Go Goo Gooooal Cool Room Moon Wanadoo Football Book Cartoon OO Objekt Orientiert Goodday tool School Choose Look Kategorie Gold Gov Pogo Bingo God Google Googelb? http://www.alexa.com/site/ds/top_500 Folie 11 Eduard Heindl, FH-Furtwangen Die grte Maschine Das Rechenzentrum von Google hat 100.000 Rechenknoten mit 6 PetaByte Festplattenspeicher (Grte Rechnerkapazitt der Welt)* Google hat alle Dokumente des Webs gespiegelt >30 Terabyte 4.285.199.774 Dokumente, warum? 2 32 =4.294.967.296 Aktuelles Limit fr Longinteger! >1.000 Anfragen pro Sekunde Erstmals ist ein Firmennamen zu einem Verb geworden googeln Anmerkung: ein PetaByte = 2 50 Byte = 1024 TeraByte * John Markoff in der NYT vom 13. April 2003 Folie 12 Eduard Heindl, FH-Furtwangen Forschung Ungewhnlich schnelles Wachstum bei den R&D Ausgaben! ber 100 Ph.D.s bei Google, industry's most unorthodox portfolio of human capital * *NYT, June 6, 2004 Folie 13 Eduard Heindl, FH-Furtwangen Zeitgeist Google kennt die Trends Aufgelst nach Lnder Aufgelst nach Themen Statistisch aussagekrftig? www.google.com/press/zeitgeist.html Folie 14 Eduard Heindl, FH-Furtwangen Google News Ein Roboter der Zeitung liest und schreibt Google News sortiert aus ber 2400 Quellen wichtige Meldungen in die einzelnen Rubriken Zustzlich knnen zu Suchbegriffen News Meldungen abgefragt werden Zweiter Platz hinter Washington Post im Online Journalismus EPpy Award Folie 15 Eduard Heindl, FH-Furtwangen Noch ist der Roboter nicht perfekt Autofahren, Autorennen und schwere Verletzungen liegen nahe zusammen Folie 16 Eduard Heindl, FH-Furtwangen Der kleine Unterschied Technik und Techno Folie 17 Eduard Heindl, FH-Furtwangen Google Ads Werbung leicht gemacht Jeder kann zu beliebigen Worten Textanzeigen schalten Bezahlt wird nur wenn jemand klickt Selten geklickte Worte werden entfernt Gute Anzeigen werden fter eingeblendet Folie 18 Eduard Heindl, FH-Furtwangen Gute Texte schlechte Texte Auf diese Anzeige haben 1,2% der Nutzer geklickt! Auf diese 50% mehr! (1,9%) Werbung optimieren zum Preis einer Pizza Folie 19 Eduard Heindl, FH-Furtwangen Noch ein Beispiel Welche Anzeige hat mehr Besucher? 0,7% 2,8% Die Daten sind hochsignifikant, da 3000 mal geklickt wurde Folie 20 Eduard Heindl, FH-Furtwangen Google Adsense Geldverdienen leicht gemacht Bezahlung nach Klicks Einnahmen bis zu XX 1 pro tausend Besucher Einblendung ist kontextsensitiv Wesentlich hhere Klickrate als bei klassischer Bannerwerbung [1]Google untersagt seinen Content-Partnern die Einnahmen offen zu legen Folie 21 Eduard Heindl, FH-Furtwangen Und so lautet der Beschlu Da die Maschine etwas lernen mu Folie 22 Eduard Heindl, FH-Furtwangen Der Lernvorgang Lernen bedeutet Ergebnisse liefern und diese verbessern WWW Suchmaschine Nutzer Folie 23 Eduard Heindl, FH-Furtwangen Suchmachinen Version 0.1 Keywords vor 1995 Fiz Karlsruhe Patentsuche Content Such- maschine Nutzer Bib liothekar Folie 24 Eduard Heindl, FH-Furtwangen Suchmaschinen I. Art Volltextsuche ~ 1995 Lycos Altavista WWW Such- maschine Nutzer Folie 25 Eduard Heindl, FH-Furtwangen Suchmaschine II. Art Neue Algorithmen Linkstruktur Textcluster WWW Suchmaschine Nutzer Vorver- arbeitung Folie 26 Eduard Heindl, FH-Furtwangen Suchmaschinen III. Art Textverstndnis Rckkopplung Neuronale Algorithmen WWW Suchmaschine Nutzer IQ lesen verstehen Folie 27 Eduard Heindl, FH-Furtwangen Nutzer Triebkrfte Suchmaschine Nutzer Webseite liefert Link Nutzt Link Geht fremd Such- maschinen- optimiert zufrieden liefert Link Nutzt Link unzufrieden Kommt wieder Such- maschinen- optimierer Neue Suchmaschine Verbessert Algorithmus Bekommt Werbe- einnahmen Folie 28 Eduard Heindl, FH-Furtwangen Suchsystem Zyklus Verbessert Algorithmus Kluge Nutzer Bekommt Werbe- einnahmen Content Anbieter Folie 29 Eduard Heindl, FH-Furtwangen Fragen Wie vollstndig ist die Welt im WWW reprsentiert? Fast alle Dokumente sind Produkte menschlicher Ansichten Viel Dokumente sind, zumindest in Fragmenten, Kopien Wahrheitsgehalt nur ber Kontext zu erschlieen Es gibt keine vollstndigere digitale Wissensbasis WWW Folie 30 Eduard Heindl, FH-Furtwangen Wissen im Internet Datenbestand ist mehrsprachig wenige Sprachen relevant, 50% englisch Daten sind hochgradig redundant Vorteil wenn Interpretation ntig Multimediadaten (Bilder, Filme) Erfordert komplexe Analyse Bild-Text Kopplung vorhanden Erlaubt lernen aus Bildern Folie 31 Eduard Heindl, FH-Furtwangen Fragen zum Lesen Einfaches Einlesen Problem: viele Seiten haben unklare Strukturen (Tabellen!) Problem: hufig wechselnde Inhalte Datenbank sollte die Link-Struktur des WWW nutzen lesen Folie 32 Eduard Heindl, FH-Furtwangen Frage nach Weltbild Wird ein Vorwissen bentigt Kann das System aus Nutzerverhalten lernen Spielt die Datenstruktur eine Rolle Welche Algorithmen lernen effizient verstehen Folie 33 Eduard Heindl, FH-Furtwangen Was ist Intelligenz Wissen fr erfolgreiches Handeln bereithalten Wissen verarbeiten Wissen richtig einsetzen Wissen durch Information erweitern Neues Wissen generieren IQ Folie 34 Eduard Heindl, FH-Furtwangen Schleifen I Menschen lesen Dokumente und erstellen neue Dokumente Lesen der Dokumente durch Google Menschen fragen Google Einstellen von Dokumenten durch Menschen Folie 35 Eduard Heindl, FH-Furtwangen Schleifen II Einstellen von Dokumenten durch Google Lesen der Dokumente durch Menschen Google frgt Menschen Google liest Dokumente und erstellt neue Dokumente Folie 36 Eduard Heindl, FH-Furtwangen Zukunft 1000 Touch Tom / Thomas Krner. Berlin 1998 Folie 37 Eduard Heindl, FH-Furtwangen Die Googlemauer AnbieterInteressent Medien Anzeigentunnel Google Adsense Adwords Folie 38 Eduard Heindl, FH-Furtwangen Effiziente Mrkte Zwischen Informationen vermitteln AnbieterKunde Optimal vermitteln Folie 39 Eduard Heindl, FH-Furtwangen Strategisches Risiko Was passiert wenn: Google ausfllt? Hackerangriff Physischer Angriff Fr manche Lnder manipuliert wird Zensiert Ergebnisse vertauscht Verkauft wird (z.B. an Microsoft) Dunkelheit im Internet! Folie 40 Eduard Heindl, FH-Furtwangen Von der Steinzeit Zeitalter Wenn zwischen der Hand des Menschen und der zu behandelnden Materie ein bestimmendes Material wirkt Wenn zwischen dem Gehirn des Menschen und dem zu findenden Wissen eine bestimmende Instanz steht? Folie 41 Eduard Heindl, FH-Furtwangen Google geht an die Brse DONT BE EVIL Dont be evil. We believe strongly that in the long term, we will be better servedas shareholders and in all other waysby a company that does good things for the world even if we forgo some short term gains. This is an important aspect of our culture and is broadly shared within the company. Risks Related to Our Business and Industry We face significant competition from Microsoft and Yahoo. 2.718.281.828 Aktien zu einem Preis von 0,01 $ Folie 42 Eduard Heindl, FH-Furtwangen Brsenwert von Google Abschtzungen (kurzfristig) 200.000.000 Suchergebnisse tglich Wert pro Ergebnis 5ct Jhrliche Einnahme $ 3,6 Mrd. Maximalwert (langfristig) 500 Mio. Google Nutzer Tglich 5 min gespart = $ 1,0 Jhrliche Einnahmen = $ 182,5 Mrd. Folie 43 Eduard Heindl, FH-Furtwangen Zum Weiterlesen Dieser Vortrag: heindl.de/google google.com/about.html google.com/ads google.com/adsense labs.google.com labs.google.com/papers.html google.indicateur.com searchenginewatch.com The EndThe EndThe EndThe End

Recommended

View more >